Internetin tiedonhakuohjelmat. Ammattimainen tiedonhaku Internetistä. Henkilön nimen määrittäminen sähköpostitse

AMMATILLINEN TIEDONHAKU INTERNETISSÄ

Internet-haku on tärkeä osa Internet-työskentelyä. Tuskin kukaan tietää varmasti nykyaikaisen Internetin verkkoresurssien tarkkaa määrää. Joka tapauksessa luku on miljardeissa. Jotta voisit käyttää kulloinkin tarvittavaa tietoa työ- tai viihdetarkoituksiin, sinun on ensin löydettävä se tästä jatkuvasti täydentyvasta resurssien valtamerestä.

Internet-haun onnistuminen edellyttää kahden ehdon täyttymistä: kyselyjen on oltava hyvin muotoiltuja ja niitä tulee kysyä sopivista paikoista. Toisin sanoen käyttäjältä vaaditaan yhtäältä kyettävä kääntämään kiinnostuksen kohteet hakukyselyn kielelle ja toisaalta hänellä on oltava hyvät tiedot. hakukoneet, käytettävissä olevat hakutyökalut, niiden edut ja haitat, joiden avulla voit valita sopivimmat hakutyökalut kuhunkin tapaukseen.

Tällä hetkellä ei ole olemassa yhtä resurssia, joka täyttäisi kaikki Internet-hakuvaatimukset. Siksi, jos otat haun vakavasti, sinun on väistämättä käytettävä erilaisia ​​​​työkaluja, joista jokaista käytetään sopivimmassa tapauksessa.

Perus Internet-hakutyökalutvoidaan jakaa seuraaviin pääryhmiin:

Hakukoneet;

Web-hakemistot;

Ohjeresurssit;

Paikalliset ohjelmat Internetistä etsimiseen.

Suosituimmat hakutyökalut ovathakukoneet– niin sanotut Internet-hakukoneet (Search Engines). Kolme parasta johtajaa globaalissa mittakaavassa ovat melko vakaita - Google, Yahoo! ja Bing. Monissa maissa omat paikalliset hakukoneet, jotka on optimoitu työskentelemään paikallisen sisällön kanssa, lisätään tähän luetteloon. Heidän avullaan voit teoriassa löytää minkä tahansa tietyn sanan monien miljoonien sivustojen sivuilta. Käyttäjän näkökulmasta hakukoneiden suurin haittapuoli on väistämätön läsnäolotiedon melutuloksissa. Tämä on tavanomainen nimi tuloksille, jotka syystä tai toisesta sisältyvät hakuluetteloon ja jotka eivät vastaa pyyntöä.

Monista eroista huolimatta kaikki Internetin hakukoneet toimivat samanlaisilla periaatteilla ja koostuvat teknisestä näkökulmasta samanlaisista alijärjestelmistä. Hakukoneen ensimmäinen rakenteellinen osa on erityisiä ohjelmia, jota käytetään automaattiseen hakuun ja verkkosivujen myöhempään indeksointiin. Tällaisia ​​ohjelmia kutsutaan yleensä roboteiksi tai roboteiksi. He katsovat verkkosivujen koodia, löytävät niillä olevia linkkejä ja löytävät siten uusia verkkosivuja. Siellä on myös vaihtoehtoinen tapa sivuston sisällyttäminen hakemistoon. Monet hakukoneet tarjoavat resurssien omistajille mahdollisuuden lisätä itsenäisesti sivusto tietokantaansa. Verkkosivut kuitenkin ladataan, analysoidaan ja indeksoidaan. Ne korostavat rakenteellisia elementtejä, etsivät avainsanoja ja määrittävät niiden yhteydet muihin sivustoihin ja verkkosivuihin. Suoritetaan myös muita toimintoja, joiden tuloksena muodostuu hakukoneen indeksitietokanta. Tämä tietokanta on minkä tahansa hakukoneen toinen pääelementti. Tällä hetkellä ei ole olemassa yhtä täysin täydellistä hakemistotietokantaa, joka sisältäisi tiedot kaikesta Internetin sisällöstä. Koska eri hakukoneet käyttävät erilaisia ​​verkkosivujen hakuohjelmia ja rakentavat hakemistonsa eri algoritmeilla, hakukoneiden hakemistotietokannat voivat vaihdella huomattavasti. Useat hakukoneet indeksoivat joitakin sivustoja, mutta vain yhden hakukoneen tietokantaan sisältyy aina tietty prosenttiosuus resursseista. Tällaisen alkuperäisen ja ei-päällekkäisen hakemiston osan läsnäolo jokaisessa hakukoneessa antaa meille mahdollisuuden tehdä tärkeä käytännön johtopäätös: jos käytät vain yhtä hakukonetta, jopa suurinta, menetät varmasti tietyn prosenttiosuuden hyödyllisistä linkeistä. .

Internet-hakukoneen seuraava osa on varsinaiset haku- ja lajitteluohjelmat. Nämä ohjelmat ratkaisevat kaksi pääongelmaa: ensin ne etsivät tietokannasta sivut ja tiedostot, jotka vastaavat saapuvaa pyyntöä, ja lajittelevat sitten tuloksena olevan tietotaulukon eri kriteerien mukaan. Menestys hakutavoitteiden saavuttamisessa riippuu suurelta osin heidän työn tehokkuudestaan.

Internet-hakukoneen viimeinen elementti on käyttöliittymä. Kaikille verkkosivuille tavanomaisten esteettisyys- ja käyttömukavuusvaatimusten lisäksi hakukoneiden käyttöliittymillä on toinen tärkeä vaatimus: niiden tulee tarjota erilaisia ​​työkaluja kyselyjen laatimiseen ja selkeyttämiseen sekä tulosten lajitteluun ja suodattamiseen. Hakukoneiden etuja ovat erinomainen lähteiden kattavuus, suhteellisen nopea tietokantasisällön päivitys ja hyvä valinta lisätoimintoja.

Hakukoneiden kanssa työskentelyn tärkein työkalu on kysely.

Internet-hauissa käytetään myös erityisiä sovelluksia, jotka on asennettu paikalliseen tietokoneeseen. Se voisi olla kuin yksinkertaisia ​​ohjelmia ja melko monimutkaiset tiedonhaun ja -analyysin kompleksit. Yleisimmät ovat hakulaajennukset selaimille, selainpaneelit, jotka on suunniteltu toimimaan tietyn hakupalvelun kanssa, ja metahakupaketit, joissa on kyky analysoida tuloksia.

Web-hakemistot – Nämä ovat resursseja, joissa sivustot on jaettu temaattisiin luokkiin. Jos käyttäjä työskentelee hakukoneiden kanssa vain kyselyiden kautta, luettelossa on mahdollista tarkastella temaattisia osia kokonaisuudessaan. Toinen perustavanlaatuinen ero hakemistojen ja automaattisten hakukoneiden välillä on, että ihmiset ovat yleensä suoraan mukana niiden täyttämisessä, resurssien katselemisessa ja sivuston luokittelussa johonkin luokkaan. Verkkohakemistot jaetaan yleensä yleisiin ja temaattisiin. Universaalit pyrkivät kattamaan mahdollisimman monta aihetta. Löydät niistä mitä tahansa: runoutta käsittelevistä verkkosivustoista tietokoneresurssit. Toisin sanoen heidän hakuleveys on suurin. Temaattiset hakemistot ovat erikoistuneet tiettyyn aiheeseen ja tarjoavat maksimaalisen hakusyvyyden vähentämällä resurssien kattavuutta.

Luetteloiden edut ovat verrattavissa korkealaatuinen resursseja, koska henkilö tarkastelee ja valitsee jokaisen sen sivuston. Sivustojen temaattinen ryhmittely mahdollistaa samankaltaisten aiheiden sivustojen järjestämisen kätevästi. Tämä toimintatapa on hyvä löytää sinulle uusia sivustoja kiinnostavasta aiheesta - se on tarkempaa kuin hakukoneen käyttäminen. On suositeltavaa käyttää verkkoluetteloita ensimmäiseen tutustumiseen minkä tahansa aihealueen kanssa sekä epämääräisten kyselyiden etsimiseen - sinulla on mahdollisuus "vaeltaa" luettelon osien läpi ja määrittää tarkemmin, mitä tarvitset.

Verkkohakemistojen haitat ovat tiedossa. Ensinnäkin tämä on tietokannan hidas täydennys, koska sivuston sisällyttäminen luetteloon vaatii ihmisen osallistumista. Tehokkuuden kannalta verkkohakemisto ei ole hakukoneiden kilpailija. Lisäksi verkkohakemistot ovat tietokannan koon suhteen huomattavasti huonompia kuin hakukoneet.

Internet-hausta puhuttaessa emme voi sivuuttaa useita termejä, jotka liittyvät läheisesti tähän alueeseen ja joita käytetään usein kuvaamaan ja arvioimaan hakukoneita. Esimerkiksi: leveys ja syvyys Internet-haku. Laaja haku on sellainen, joka kaappaa mahdollisimman monta tietolähdettä. Tässä tapauksessa vähintään maininta pyynnölle sopivasta sivustosta katsotaan riittäväksi. Haun syvyys viittaa kunkin tietyn resurssin indeksoinnin ja myöhemmän haun yksityiskohtiin. Esimerkiksi monet hakukoneet lähestyvät eri sivustojen indeksointia eri tavalla. Suuret ja suositut sivustot indeksoidaan mahdollisimman suuressa määrin. Samanaikaisesti muilla sivustoilla voidaan indeksoida vain otsikkosivu ja muutama sisältösivu. Nämä olosuhteet vaikuttavat luonnollisesti myöhempään etsintään. Syvähaku toimii periaatteella "on parempi sisällyttää tuloksiin tarpeetonta tietoa kuin jättää väliin mitään hakuaiheeseen liittyvää tietoa."

Melko usein voit kohdata sellaisia ​​​​käsitteitä kuin globaali ja paikallinen Internet-haku. Paikalliset Internet-haut ottavat huomioon käyttäjän maantieteellisen sijainnin ja suosivat tuloksia, jotka liittyvät jotenkin tiettyyn maahan tai paikkakuntaan. Globaalin haun aikana näitä tietoja ei oteta huomioon, vaan haku suoritetaan kaikista käytettävissä olevista resursseista.

Kun kirjoitat kyselyä Internetin hakukoneissa, käytössä on erilaisia ​​hakutiloja. Tyypillisiä useimmissa Internet-koneissa olevia hakutiloja ovat: yksinkertainen ja edistyksellinen Hae. Yksinkertaisen haun avulla voit määrittää vain yhden hakutoiminnon yhdessä pyynnössä. Tarkennettu haku mahdollistaa kyselyn luomisen useista ehdoista linkittämällä ne loogisilla operaattoreilla.

Tarkenna hakukyselyitä, erilaisia suodattimet . Suodattimet ovat sellaisia ​​tai muita apuvälineitä kyselyn laatimiseen, jotka eivät liity kyselyehtojen sisältöpuoleen, vaan rajoittavat hakutuloksia jollakin muodollisella ominaisuudella. Joten esimerkiksi käyttäessään tiedostotyyppisuodatinta etsiessään, käyttäjä ei anna järjestelmälle pyyntönsä aiheeseen liittyviä tietoja, vaan yksinkertaisesti rajoittaa saadut tulokset tiettyyn pyyntönsä ehdossa määritettyyn tiedostotyyppiin.

Useimmille käyttäjille yleiset hakukoneet ovat tärkein ja usein ainoa Internet-haun keino. Ne tarjoavat hyvän kattavuuden lähteistä sekä joukon työkaluja, jotka riittävät perushakuongelmien ratkaisemiseen.

Yleisten hakukoneiden markkinat ovat melko suuret. Yritimme analysoida tunnetuimpia hakukoneita ja esitimme tulokset taulukossa 1.

Universaalin hakukoneen valinnassa sen avulla löydettyjen resurssien laadulla on tärkeä rooli. Voit määrittää tietyille tehtäville ensisijaisen hakukoneen käyttämällä "merkkimenetelmää". Sen ydin on, että ensin tietty teema hakulauseke, jonka jälkeen joukko ihmisiä - alan asiantuntijoita - tutkitaan löytääkseen heidän mielestään parhaat Internet-resurssit valitusta aiheesta. Tutkimustietojen perusteella luodaan luettelo merkintäkohteista, jotka ovat taatusti relevantteja pyyntöön ja sisältävät laadukasta tietoa. Pyyntö lähetetään sitten testatuille hakukoneille. Arvioinnin logiikka on yksinkertainen: mitä korkeammalle merkitsijät sijaitsevat hakutuloksissa, sitä paremmin tietty resurssi soveltuu koeaiheen tiedon etsimiseen.


Vuoden 2015 puoliväliin mennessä maailmanlaajuinen Internet oli yhdistänyt jo 3,2 miljardia käyttäjää, mikä on lähes 43,8 prosenttia planeetan väestöstä. Vertailun vuoksi: 15 vuotta sitten vain 6,5% väestöstä oli Internetin käyttäjiä, eli käyttäjien määrä on kasvanut yli 6-kertaiseksi! Mutta vaikuttavampaa ei ole määrälliset, vaan laadulliset indikaattorit Internet-teknologioiden käyttöönoton laajentumisesta ihmisen toiminnan eri alueilla: sosiaalisten verkostojen maailmanlaajuisesta viestinnästä kotitalouksien Internet-asioihin. Mobiili internet tarjosi käyttäjille mahdollisuuden olla verkossa toimiston ulkopuolella ja kotona: tien päällä, kaupungin ulkopuolella luonnossa.
Tällä hetkellä Internetissä on satoja järjestelmiä tiedonhakuun. Suosituimmat niistä ovat saatavilla suurimmalle osalle käyttäjistä, koska ne ovat ilmaisia ​​ja helppokäyttöisiä: Google, Yandex, Nigma, Yahoo!, Bing..... Kokeneemmille käyttäjille "tarkennetun haun" käyttöliittymät ja erikoistuneet " sosiaalinen verkosto” hakuja on saatavilla uutisvirtojen ja osto- ja myyntiilmoitusten mukaan... Mutta kaikilla näillä upeilla hakukoneilla on yksi merkittävä haitta, jonka toin jo yllä etuna: ne ovat ilmaisia.
Jos sijoittajat sijoittavat miljardeja dollareita hakukoneiden kehittämiseen, herää täysin sopiva kysymys: mistä he tienaavat rahaa?
Ja he tienaavat rahaa erityisesti antamalla vastauksena käyttäjien pyyntöihin ei niin paljon tietoa, joka olisi hyödyllistä käyttäjän kannalta, vaan sitä, mitä hakukoneiden omistajat pitävät käyttäjälle hyödyllisenä. Tämä tehdään muokkaamalla järjestystä, jossa käyttäjien hakukyselyiden vastausluettelot esitetään. Tässä on tiettyjen avointa mainontaa Internet-resurssit ja vastausten osuvuuden piilotettu manipulointi hakukoneiden omistajien kaupallisiin, poliittisiin ja ideologisiin etuihin perustuen.
Siksi Internetistä tietoa etsivien ammattiasiantuntijoiden keskuudessa hakukoneiden tulosten asianmukaisuuden ongelma on erittäin tärkeä.
Relevanssilla tarkoitetaan tiedonhakujärjestelmän löytämien asiakirjojen vastaavuutta käyttäjän tietotarpeisiin riippumatta siitä, kuinka kattavasti ja tarkasti tämä tiedontarve on ilmaistu tietopyynnön tekstissä. Tämä on hyödyllisen tiedon määrän suhde vastaanotetun tiedon kokonaismäärään. Karkeasti sanottuna tämä on hakutehokkuutta.
Asiantuntijoiden, jotka tekevät pätevää tiedonhakua Internetistä, on ponnisteltava hakutulosten suodattamiseksi, mikä karsii pois tarpeettoman tiedon "melua". Ja tähän käytetään ammattitason hakutyökaluja.
Yksi näistä ammattijärjestelmistä on venäläinen ohjelma FileForFiles & SiteSputnik (SiteSputnik).
Kehittäjä Aleksei Mylnikov Volgogradista.

"FileForFiles & SiteSputnik -ohjelma (SiteSputnik) on suunniteltu järjestämään ja automatisoimaan Internetiin lähetettyjen tietojen ammattimaista hakua, keräämistä ja seurantaa. Erityistä huomiota kiinnitetään uuden saapuvan tiedon saamiseen kiinnostavista aiheista. Tietojen analysointitoimintoja on otettu käyttöön useita."


Tietovirtojen seuranta ja luokittelu


Ensin muutama sana aiheesta seurata tietovirtoja, jonka erikoistapaus on median ja sosiaalisten verkostojen seuranta:

  • käyttäjä ilmoittaa lähteet, jotka voivat sisältää tarvittavat tiedot, ja näiden tietojen valintasäännöt;

  • ohjelma lataa tuoreita linkkejä lähteistä, vapauttaa niiden sisällön roskista ja toistoista ja järjestää ne Osioihin Sääntöjen mukaisesti.

  • Voit nähdä livenä yksinkertaisen mutta todellisen seurantaprosessin, joka sisältää 6 lähdettä ja 4 otsikkoa:
  • avaa ohjelman demoversio;


  • Napsauta sitten avautuvassa ikkunassa painiketta Yhdessä;

  • ja milloin VerkkosivustoSputnik toteuttaa tämän projektin reaaliajassa, sinä:
    - "Puhdas stream" -luettelossa näet kaikki uudet tiedot lähteistä,
    - "Pyynnön jälkeinen" -osiossa - vain talous- ja rahoitusuutiset, jotka täyttävät säännön,
    - otsikoissa "Presidentti", "Tietoja ensi-ilta" ja "Keskuspankki" - tiedot asiaan liittyvistä kohteista.

  • Oikeissa projekteissa voit käyttää melkein mitä tahansa lähteitä ja rubriikkeja.
    Voit luoda ensimmäiset työprojektisi muutamassa tunnissa ja parantaa niitä käytön aikana.
    Kuvattu tietojenkäsittely on saatavilla SiteSputnik Pro+News -paketissa ja uudemmissa.

2. Yksinkertainen ja erähaku, tiedonkeruu

Tutustua mahdollisuuksiin SiteSputnik Pro(ohjelman perusversio) :

  • avaa ohjelman demoversio;

  • kirjoita ensimmäinen pyyntösi, esimerkiksi koko nimesi, kuten tein:

    ja napsauta painiketta Hae.


  • Ohjelma (katso kyltti, jonka SiteSputnik rakensi) tekee kyselyn muutamassa sekunnissa 7 lähteet, avautuvat niissä 24 hakusivut, löydät 227 asiaankuuluvat linkit, poistaa päällekkäiset linkit ja jäljellä olevista 156 ainutlaatuinen linkkien luettelo "yhdistys".

    Nimi
    Lähde

    Tilattu
    sivuja

    Ladattu
    sivuja

    Löytyi
    linkkejä

    Aika
    Hae

    Tehokkuus
    Hae

    Linkit
    Uusi

    Tehokkuus
    Uusi
    Yandex 5 5 50 0:00:05 32% 0 0
    Google 5 5 44 0:00:03 28% 0 0
    Yahoo 5 5 50 0:00:05 32% 0 0
    Rambler 5 4 56 0:00:07 36% 0 0
    MSN (Bing) 5 3 23 0:00:04 15% 0 0
    Yandex.Blogit 5 1 1 0:00:01 1% 0 0
    Google.Blogit 5 1 3 0:00:01 2% 0 0
    Kaikki yhteensä: 35 24 227 0:00:26 0 0
    Yhteensä: yksilöllisten linkkien määrä - 156 , päällekkäiset linkit - 46 %.

  • (! ) Toista pyyntösi muutaman tunnin tai päivän kuluttua, niin näet vain uusia linkkejä joka ilmestyi Lähteissä tälle ajanjaksolle. Taulukon kahdesta viimeisestä sarakkeesta näet, kuinka monta uutta linkkiä kukin lähde toi ja sen tehokkuuden "uutuuden" suhteen. Kun kysely suoritetaan useita kertoja, luettelo sisältää vain uusia linkkejä , luodaan suhteessa kaikkiin tämän pyynnön aikaisempiin suorituksiin. Se vaikuttaisi alkeelliselta ja vaadittu toiminto, mutta kirjoittaja ei ole tietoinen mistään ohjelmasta, jossa se on toteutettu.

  • (!! ) Kuvattuja ominaisuuksia tuetaan yksittäisten pyyntöjen lisäksi myös kokonaisuudessaan pyytää paketteja :

    Näkemäsi paketti koostuu seitsemästä eri kyselystä, jotka keräävät tietoa Vasily Shukshinista useista lähteistä, mukaan lukien hakukoneet, Wikipedia, tarkka haku Yandex-uutisista, metahaku sekä TV- ja radioasemien mainintojen haku. Käsikirjoitukseen TV ja radio sisältää: "Channel One", "TV Russia", NTV, RBC TV, "Echo of Moscow", radioyhtiö "Mayak", ... ja muut tietolähteet. Jokaisella lähteellä on oma haku- tai selaussyvyytensä sivuilla. Se on lueteltu kolmannessa sarakkeessa.

    Erähaun avulla voit tehdä kattavia hakuja yhdellä napsautuksella tiedon kerääminen tietystä aiheesta.
    Erillinen lista uusia linkkejä, kun paketti suoritetaan toistuvasti, sisältää vain linkkejä, joita ei aiemmin löydetty.
    Muista mitä ja milloin kysyit Internetistä ja mitä se vastasi sinulle Ei tarvetta- kaikki tallennetaan automaattisesti kirjastoihin ja ohjelmatietokantoihin.
    Toistan, että tässä kappaleessa kuvatut ominaisuudet sisältyvät täysin pakettiin SiteSpunik Pro.


  • Tarkemmat tiedot ohjeista: SiteSputnik Pro aloittelijoille.

3. Esineiden ja etsintävalvonta

Usein käyttäjä kohtaa seuraavan tehtävän. Sinun on selvitettävä, mitä Internetissä on tietystä kohteesta: henkilöstä tai yrityksestä. Esimerkiksi kun palkkaat uutta työntekijää tai kun uusi vastapuoli ilmaantuu, tiedät aina koko nimen, yrityksen nimen, puhelinnumerot, INN, OGRN tai OGRNIP, voit ottaa myös ICQ:n, Skypen ja joitain muita tietoja. Seuraavaksi käyttämällä vetoomusta erikoistoiminto ohjelmia VerkkosivustoSputnik "Tietojen kerääminen kohteesta" (laitteet SiteSputnik Pro+Objects):

Syötät tiedot, jotka tiedät, ja yhdellä hiiren napsautuksella suoritat tarkka Ja koko etsi tiettyjä tietoja sisältäviä linkkejä. Haku suoritetaan useilla hakukoneilla kerralla, käyttämällä kaikkia tietoja kerralla, käyttämällä useita mahdollisia tallennustietojen yhdistelmiä kerralla: muista kuinka voit kirjoittaa puhelinnumeron muistiin eri tavoilla. Tietyn ajan kuluttua, ilman tylsää rutiinityötä, saat luettelon linkeistä, jotka on puhdistettu toistoista ja mikä tärkeintä, järjestettynä etsimäsi kohteen osuvuuden mukaan. Relevanssi (merkittävyys) saavutetaan, koska SiteSputnik-hakutuloksissa ensimmäisinä ovat ne linkit, joissa Suuri määrä määrittämäsi tiedot, eivät niitä, jotka siirtyivät Webmasterin hakukonetuloksissa ylöspäin.

Tärkeä .
SiteSputnik-ohjelma poimii muita ohjelmia paremmin todellinen, mutta ei virallinen tietoa Objektista. Esimerkiksi virallisessa tietokannassa matkapuhelinoperaattori voidaan tallentaa, että puhelin kuuluu Vasily Terekhinille, mutta todellisuudessa tämä puhelin sisältää tietoa, että Alexander myi Ford Focus -auton vuonna 2013, mikä on lisäinformaatio ajatukseksi.

Haun seuranta .
Haun valvonta tarkoittaa seuraavaa. Jos haluat seurata tapahtumaa uusia linkkejä, tietyn kohteen tai mielivaltainen kyselypakettia, sinun tarvitsee vain toistaa vastaava haku säännöllisesti. Sama kuin yksinkertaisessa pyynnössä, ohjelma SiteSputnik luo "Uusi" -luettelon, johon se sijoittaa vain ne linkit, joita ei löytynyt missään aikaisemmissa hauissa.

Haun seuranta mielenkiintoinen ei vain sinänsä. Se voi olla mukana median, sosiaalisten verkostojen seuranta ja muut uutislähteet, jotka mainittiin edellä kohdassa 1. Toisin kuin muut ohjelmat, joissa on mahdollista saada uutta tietoa vain RSS-syötteistä, ohjelmassa VerkkosivustoSputnik voidaan käyttää tähän verkkosivuille sisäänrakennetut haut Ja hakukoneet . Myös mahdollista emulointi(itseluominen) useita RSS-syötteet mielivaltaisilta sivuilta, lisäksi RSS-syötteen emulointi pyynnöstä ja jopa joukko pyyntöjä.


  • Saadaksesi kaikki irti ohjelmasta, käytä sen päätoimintoja, nimittäin:

    • pyytää paketteja, paketteja parametreillä, käyttää Assembleria (assembler), useiden tehtävien tulosten "Analyyttinen yhdistäminen" -toimintoa, tarvittaessa soveltaa perushakutoimintoja näkymätön Internetissä;

    • yhdistä lähteesi ohjelman sisäänrakennettuihin tietolähteisiin : muut hakukoneet ja sivustoihin sisäänrakennetut haut, luomasi olemassa olevat RSS-syötteet omia RSS-syötteitä Kanssa mielivaltainen sivuja, käytä hakutoimintoa uusien lähteiden etsimiseen;

    • käyttää seuraavan tyyppisiä ominaisuuksia seurantaa: Media, sosiaaliset verkostot ja muut lähteet, seuranta kommentteja uutisiin ja viesteihin, seurata uuden tiedon ilmestymistä olemassa oleville sivuille;

    • sitoutua Luokat , Ulkoiset toiminnot, Task Scheduler, postituslista, useita tietokoneita, Project Instructor, asennus hälytys Voit ilmoittaa sinulle merkittävistä tapahtumista käyttämällä muita alla lueteltuja toimintoja.



4. SiteSputnik-ohjelma (SiteSputnik): vaihtoehtoja ja ominaisuuksia

- Ohjelma SiteSputnik paranee jatkuvasti seuraavilla alueilla: "Minun täytyy löytää kaikki ja takuulla".
"Internetin kuulusteluohjelmisto", - toinen käyttäjän määritelmä ohjelman määrittämiseksi.

A. Toiminnot tiedon etsimiseen ja keräämiseen.

. Pyydä paketti - useiden kyselyjen suorittaminen kerralla, yhdistämällä hakutuloksia tai erikseen. Yhdistettyä tulosta luotaessa toistuvasti löydetyt linkit poistetaan. Lisätietoja paketeista löytyy SiteSputnikin johdannosta ja visuaalisesti videosta: liitos Ja erillinen pyyntöjen toteuttaminen. Kotimaisessa ja ulkomaisessa kehityksessä ei ole analogeja.

. Paketit parametreillä. Kaikki kyselyt ja kyselypaketit, jotka on suunniteltu ratkaisemaan tavallisia hakutehtäviä, esimerkiksi hakuperusteena puhelinnumero, koko nimi tai sähköposti, - voidaan parametroida, tallentaa ja suorittaa valmiiden kyselyiden kirjastosta korvaamalla todelliset (tarvittavat) parametriarvot. Jokainen parametripaketti on oma erikoisuutensa tarkennettu hakulomake . Se voi käyttää ei yhtä, vaan useita hakukoneita. Voit luoda lomakkeita, jotka ovat toiminnallisesti erittäin monimutkaisia. On erittäin tärkeää, että lomakkeita käyttäjät voivat luoda itse, ilman ohjelman tekijän tai ohjelmoijan osallistumista. Tämä on kirjoitettu hyvin yksinkertaisesti ohjeissa, lisätietoja erillisessä julkaisussa hakuparametreista ja foorumilla, selvästi videossa: etsi kaikki vaihtoehdot numeron tallentamiseen kerralla kännykkä ja useiden osoitteen tallennusvaihtoehtojen mukaan Sähköposti. Analogeja ei ole.

. Kokoonpanija UUSI- hakutehtävän kokoaminen useista valmiista : pyynnöt, pyyntöpaketit ja parametripaketit. Pakettien tekstissä voi olla muita paketteja. Pakettien sisäkkäisyyden syvyys on rajoittamaton. Voit luoda useita hakutehtäviä esimerkiksi useista juridisista ja yksityishenkilöistä ja suorittaa nämä tehtävät samanaikaisesti. Lisätietoja foorumilta ja erillisessä julkaisussa Assemblerista, selvästi osoitteessa video. Analogeja ei ole.

. Metahaku - tietyn pyynnön suorittaminen samanaikaisesti tietyllä haun "syvyydellä" kullekin niistä. Metahaku on mahdollista sisäänrakennetuilla hakukoneilla, joihin kuuluvat Yandex, Rambler, Google, Yahoo, MSN (Bing), Mail, Yandex ja Google blogit sekä yhdistetyt hakutyökalut. Työskentely useiden hakukoneiden kanssa näyttää työskentelyltäsi yksi hakukone . Uudelleen löydetyt linkit poistetaan. Tee visuaalisesti metahaku kolmessa yhteydessä olevaan sosiaaliseen verkostoon: VKontakte, Twitter ja Youtube - näytetään video.

. Metahaku sivustolta - sivustohaun yhdistäminen Googlessa, Yahoossa, Yandexissä, MSN:ssä (Bing). Selvästi päällä video.

. Metahaku toimiston asiakirjoista - Haun yhdistäminen tiedostoista PDF-muodossa, XLS, DOC, RTF, PPT, FLASH Googlessa, Yahoossa, Yandexissä, MSN:ssä (Bing). Voit valita minkä tahansa tiedostomuotojen yhdistelmän.

. Välimuistikopioiden metahaku linkit Yandexissä, Googlessa, Yahoossa, MSN:ssä (Bing). Luettelo kootaan, jonka jokainen kohta sisältää kaikki kunkin hakukoneen jokaisesta linkistä löytämät katkelmat. Analogeja ei ole.

. Deep Search Yandexin, Googlen ja Ramblerin avulla voit yhdistää yhdeksi luetteloksi kaikki linkit tavallisesta hausta ja kaikki linkit, vastaavasti luetteloista "Lisää sivustolta", "Lisätuloksia sivustolta" ja "Haku sivustolta (yhteensä ...)". Lue lisää syvähausta foorumilta. Analogeja ei ole.

. Tarkka ja täydellinen haku . Tämä tarkoittaa seuraavaa. Toisaalta jokainen kysely voidaan suorittaa sillä ja vain lähteellä, jonka kyselykielellä se on kirjoitettu. Tämä tarkka haku. Toisaalta tällaisia ​​pyyntöjä ja lähteitä voi olla mielivaltainen määrä. Tämä tarjoaa täysi haku. Lue lisää erillisestä menettelyhausta koskevasta postauksesta. Analogeja ei ole.

. Näkymättömästä Internetistä etsiminen .

    Se sisältää seuraavat perusominaisuudet:

    Erityinen pyyntöpaketti, jota käyttäjä voi parantaa,
    - etsi näkymättömiä linkkejä hämähäkin avulla,
    - etsi näkymättömiä linkkejä näkyvän linkin tai kansion läheisyydestä "kuvan ja kaltaisuuden" perusteella,
    - erikoishakuja avoimille kansioille,
    - etsi näkymättömiä linkkejä ja kansioita vakionimillä erityisten sanakirjojen avulla,
    - sivustoihin sisäänrakennettujen omien hakujesi käyttö.

    Lisätietoja erillisessä SiteSputnik Invisible -julkaisussa. Perustoiminnot ovat "hyvin tunnettuja kapeissa piireissä", mutta niiden käyttötavalla ei ole analogeja. Tämän menetelmän ydin on rakentaa Internetistä näkyvä sivustokartta (eli materialisoida näkyvä Internet) ja vain näkyvien linkkien perusteella ja etsiä niihin liittyviä näkymättömiä linkkejä. Jo näkyvien linkkien etsimistä "näkymättömillä" menetelmillä ei suoriteta.

B. Tietojen seurantatoiminnot.

. Valvonta Internetissä esiintymistä varten Uusi linkit tiettyyn aiheeseen. Monitorin ulkonäkö Uusi linkkejä voidaan käyttää kokonaislukujen avulla pyytää paketteja , jotka sisältävät mitä tahansa yllä mainituista hakumenetelmistä yksittäisten hakukoneiden etusivujen sijaan. Toteutettu liitto ja risteys Uusi linkit useista erillisistä hauista. Tarkemmat tiedot seurantajulkaisussa (ks. § 1) ja foorumilla. Analogeja ei ole.

. Kollektiivinen tiedonkäsittely . Luominen yritys- tai ammattiverkosto tietojen kollektiiviseen keräämiseen, seurantaan ja analysointiin. Tällaisen verkoston osallistujat ja luojat ovat yrityksen työntekijöitä, ammattiyhteisön tai sidosryhmien jäseniä. Osallistujien maantieteellisellä sijainnilla ei ole väliä. Tarkemmat tiedot erillisessä julkaisussa tiedon kollektiivisen keräämisen, seurannan ja analysoinnin verkoston järjestämisestä.

. Valvonta linkit (web-sivut) havaitakseen muutokset niiden sisällössä. Beta-versio. Löydetyt muutokset on korostettu värillä ja erikoissymboleilla. Tarkemmat tiedot erillisessä seurantajulkaisussa (ks. § 2 ja 3).

SISÄÄN. Tietojen analysointitoiminnot.

. Materiaaliluokat edellä jo kuvattu. Lisätietoja löytyy erillisestä Rubrics-julkaisusta. Rubriikkien syöttämistä koskevien sääntöjen avulla voit määrittää avainsanoja ja niiden välisen etäisyyden, asettaa loogiset "AND", "OR" ja "NOT", käyttää monitasoista hakasulkerakennetta ja sanakirjoja (lisää tiedostoja), joihin voidaan soveltaa loogisia operaatioita.

. VF-tekniikkaa - lähes mielivaltainen materiaalien luokittelumahdollisuuden laajentaminen toteuttamalla ulkoisia toimintoja, jotka on orgaanisesti integroitu Rubrics-sääntöihin ja jotka ohjelmoija voi toteuttaa itsenäisesti ilman ohjelman tekijän osallistumista.

. Numeerinen analyysi Rubriksien käyttöaste, asennus hälytys ja ilmoittaa merkittävistä tapahtumista korostamalla Rubriikit värillisesti ja/tai lähettämällä hälytysraportin sähköpostitse.

. Tosiasiallinen relevanssi. On mahdollisuus järjestää linkit järjestykseen lähellä merkitystä nämä linkit liittyvät ratkaistavaan ongelmaan, ohittaen käyttävien verkkovastaavien temput eri tavoilla nostaa verkkosivujen sijoitusta hakukoneissa. Tämä saavutetaan analysoimalla useiden "erilaisten" kyselyiden suorittamisen tuloksia tietystä aiheesta. Sanan kirjaimellisessa merkityksessä linkit sisältävät vaaditut enimmäistiedot . Lue lisää optimaalisen toimittajan löytämisestä ja foorumilta. Analogeja ei ole.

. Objektisuhteiden laskeminen - Etsi linkkejä, resursseja (sivustoja), kansioita ja verkkotunnuksia, joissa objektit mainitaan samanaikaisesti. Yleisimmät kohteet ovat ihmiset ja yritykset. Yhteyksien etsimiseen voidaan käyttää kaikkia tällä sivulla mainittuja ohjelmatyökaluja SiteSputnik, mikä lisää merkittävästi tekemäsi työn tehokkuutta. Toiminto suoritetaan mille tahansa määrälle objekteja. Tarkemmat tiedot ohjelman johdannossa sekä kuvauksessa uusi ominaisuus"esineitä ja niiden yhteyksiä". Analogeja ei ole.

. Tietovirtojen muodostuminen, integrointi ja risteys eri aiheista, lankojen vertailu. Tarkemmat tiedot erillisessä viestiketjussa.

. Verkkokarttojen rakentaminen sivustot, resurssit, kansiot ja haetut objektit niiden perusteella, jotka löytyvät Internetistä milloin Google apua, Yahoo, Yandex, MSN (Bing) ja Altavista linkit, jotka kuuluvat sivustolle. Asiantuntijat voivat selvittää: onko se näkyvissä "ylimääräinen" Internetistä saatuja tietoja verkkosivuillaan sekä tutkia kilpailijoiden verkkosivustoja tästä aiheesta. Web-sivustokartta on näkyvän internetin toteutuminen . Tarkemmat tiedot erillisessä julkaisussa web-karttojen rakentamisesta, visuaalisesti osoitteessa video. Analogeja ei ole.

. Uusien tietolähteiden löytäminen tietystä aiheesta, jonka avulla voidaan sitten seurata uuden asiaankuuluvan tiedon syntymistä. Tarkemmat tiedot osoitteessa.

G. Palvelutoiminnot.

. Tehtävien ajoitus tarjoaa työtä Aikataulutettu: suorittaa tiettyjä ohjelmatoimintoja tiettynä aikana. Tarkemmat tiedot erillisessä Planner-julkaisussa.

. Projektin ohjaaja UUSI- Tämä on avustaja luomiseen ja ylläpitoon Projektit tiedon etsimiseen, keräämiseen, seurantaan ja analysointiin (luokittelu ja signalointi). Tarkemmat tiedot foorumilla.

. Automaattinen arkistointi. SISÄÄN tietokannat Kaikki työsi tulokset muistetaan automaattisesti, nimittäin: pyynnöt, pyyntöpaketit, haku- ja valvontaprotokollat, kaikki muut yllä mainitut toiminnot ja niiden suorittamisen tulokset. Voi rakenne työstää aiheita ja alaaiheita.

. Tietokanta sisältää lajittelun, yksinkertaisen haun ja mukautetun haun SQL-kyselyn mukaan. Jälkimmäistä varten on olemassa ohjattu toiminto SQL-kyselyiden laatimiseen. Näiden työkalujen avulla voit etsiä ja tarkastella eilen, viime kuussa, vuosi sitten tekemääsi työtä, määrittää aiheen hakukriteeriksi tai asettaa toisen hakukriteerin tietokannan sisällön perusteella.

. Tekniset rajoitukset hakukoneet. Jotkut rajoitukset, kuten kyselymerkkijonon pituus, voidaan voittaa. Se varmistaa ei yhden, vaan usean kyselyn suorittamisen yhdistämällä hakutuloksia tai erikseen. Voit lukea tavasta, jolla voidaan voittaa suurten hakukoneiden additiivisuuslain rikkominen. Yhdelle lainausmerkeissä olevalle sanalle tai lauseelle toteutetaan hakukoneissa isot ja pienet kirjaimet, erityisesti haku lyhenteellä.

Sisäänrakennettu selain . Navigaattori sivun mukaan. Monivärinen merkki korostaa keskeisiä ja mielivaltaisia ​​sanoja. Listaus ja N-listaus luoduista asiakirjoista.

. Purku uutissyötteet taulukkonäkymään, johon keskitytään tuonti Excelissä, MySQL:ssä, Accessissa, Kronosissa ja muissa sovelluksissa.


5. Ohjelman asennus ja käynnistäminen, tietokonevaatimukset.

Voit asentaa ja suorittaa ohjelman seuraavasti:

  • Lataa tiedosto, kopioi FileForFiles-kansio siitä omallesi HDD esimerkiksi päällä D:\;

  • Ohjelman demo-versio asennetaan ja se aukeaa.

  • Ohjelma toimii kaikilla tietokoneilla, joihin se on asennettu Windows mikä tahansa versiot.

    Puhukaa siitä, mitä meidän aikanamme tietotekniikat sekä yksilön ja yhteiskunnan saatavilla olevan tiedon määrän loputon kasvu, tiedon käsittelyssä ja etsimisessä on monia ongelmia - tämä on jo jumalanpilkkaa. Kukapa ei ota tätä aihetta esille? Ja jotta en rasittaisi sinua subjektiivisilla ja osittain objektiivisilla päätelmillä, jotka on vedetty eri tietolähteistä ongelmasta, siirryn suoraan sen ratkaisuun. Tänään puhumme hausta. Eli ohjelmista ja vakavista tietojärjestelmistä, jotka etsivät tarvitsemiamme asiakirjoja ja tietoja.

    Päivitä "suora haku"

    Ei niin kauan sitten, kun puut olivat isoja ja tietoa jopa sisällä paikallinen verkko yrityksiä ei ollut niin paljon, kaikki haut suoritettiin banaalilla haulla kourallisesta käytettävissä olevista tiedostoista ja niiden nimien ja sisällön peräkkäisellä tarkistuksella. Tällaista hakua kutsutaan suoraksi, ja suorahakutekniikkaa käyttävät ohjelmat (apuohjelmat) ovat perinteisesti läsnä kaikissa käyttöjärjestelmät ja työkalupaketit. Mutta jopa voimaa nykyaikaiset tietokoneet ei riitä nopeaan ja riittävään hakuun jättimäisistä tietomääristä suoran haun aikana. Parin sadan asiakirjan etsiminen levyltä ja valtavasta kirjastosta ja useista kymmenistä postilaatikoista etsiminen ovat kaksi eri asiaa. Siksi suorahakuohjelmat ovat nykyään selvästi hiipumassa taustalle - jos me puhumme universaaleista keinoista.

    Tietenkin tämäntyyppiselle haulle ei ole ollut kysyntää pitkään aikaan yrityssektorilla. Volyymit eivät ole samat. Ja siksi jo useiden vuosien ajan ja viime aikoina selvästi tekniikat, jotka pystyvät etsimään nopeasti ja tarkasti eri muotoisia asiakirjoja ja eri lähteistä, ovat enemmän kuin merkityksellisiä. Ei niin kauan sitten Microsoftin "isä" Bill Gates, joka ilmeisesti oli kateellinen Internet-hakukoneen Googlen ilmiömäisestä menestyksestä, ilmoitti yhdessä lehdistötilaisuudessa ohjelmistoteollisuuden (eikä vain) halusta osallistua kaikin mahdollisin tavoin, kehittää ja syventää hakukoneiden ja tekniikoiden luomista. Mutta on liian aikaista luoda mitään ilmiömäisesti toimivaa ohjelmaa Microsoftilta tai kilpailukykyiseltä Internet-palvelimelta (MSN ei vieläkään tavoita Googlea). Siirrytään siis nykyiseen kehitykseen. Hakemisto, kysely, osuvuus

    Ytimessä nykyaikaiset tekniikat on kaksi perusprosessia. Ensinnäkin se indeksoi saatavilla olevat tiedot ja käsittelee pyynnön tulosten myöhemmin. Mitä tulee ensimmäiseen, mikä tahansa ohjelma (olipa se sitten työpöytähakukone, yritys Tietojärjestelmä tai Internet-hakukone) luo oman hakualueen. Toisin sanoen se käsittelee asiakirjoja ja luo näistä asiakirjoista indeksin (järjestetty rakenne, joka sisältää tietoja käsitellyistä tiedoista). Jatkossa työssä käytetään luotua hakemistoa - saadakseen nopeasti luettelon tarvittavista asiakirjoista pyynnön mukaan. Seuraava, vaikka se ei suinkaan ole teknisesti yksinkertaista, on keskivertokäyttäjälle varsin ymmärrettävää. Ohjelma käsittelee pyynnön (käyttäen avainsanailmausta) ja näyttää luettelon asiakirjoista, jotka sisältävät tämän avainsanailmauksen. Koska tiedot sisältyvät strukturoituun hakemistoon, kyselyn käsittely on huomattavasti (kymmeniä ja satoja kertoja!) nopeampaa kuin suorahaussa (asiakirjojen valinta ei tapahdu tiedostoista etsimällä, vaan analysoimalla). tekstitietoa hakemistossa).

    Ohjelma näyttää löydetyt dokumentit tuloksena olevassa luettelossa relevanssin mukaan - asiakirjan yhteensopivuuden kyselytekstin kanssa. Eri tekniikoissa on tietysti erilaisia ​​menetelmiä asiakirjan etsimiseen ja merkityksen määrittämiseen (sanan "esiintymistiheys" ja sen mainintatiheys asiakirjassa, näiden parametrien suhde sanojen kokonaismäärään asiakirjassa, kyselylauseen sanojen välinen etäisyys etsityissä tiedostoissa ja niin edelleen). Näiden parametrien perusteella määritetään asiakirjan "paino" ja siitä riippuen tietty tiedosto näkyy tulosluettelossa tietyssä paikassa. Internet-haun tapauksessa tilanne on vielä monimutkaisempi. Tässä tapauksessa on todellakin otettava huomioon monet muut tekijät (Googlen PageRank on esimerkki tästä). Mutta tämä on erillisen artikkelin aihe, joten emme koske Internetiin

    Tässä materiaalissa tarkastellaan useiden suosittujen hakuohjelmien ominaisuuksia, jotka tarjoavat sekä kohtuullisen nopeuden että hyvän toimivuuden. Mutta esitteiden esittely on yksi asia, mutta asiantuntijan katseen alla seisominen on aivan eri asia. Eikä ollut enää asiantuntijoita, ei vähempää toimistoa täynnä ihmisiä, jotka halusivat puuhata ohjelmistoa sen käytettävyyden vuoksi. Kokeellisella tietokoneella (Athlon 2,2 MHz, kapasiteetti RAM-muisti 1 Gt, 160 Gt Seagate 7200 rpm IDE-kiintolevy ja Windows-järjestelmä XP) asennettiin joukko ohjelmia: dtSearch Desktop, Ischeyka Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Testejä varten koottiin tekstitietokanta asiakirjoista doc, txt ja html yleinen koko ei ole enempää eikä vähemmän, vaan 20 gigatavua. Ryhmä tovereita vaatimattoman palvelijasi johdolla testasi, vertasi ja jakoi subjektiivisia vaikutelmiaan jokaisesta ohjelmistosta. Lue alta yhteenveto havainnoista. dtSearch Desktop

    Ohjelma, joka kehittäjien mukaan väittää olevansa nopein, kätevin ja paras hakukone. Kuten yleensä kaikki muutkin tämä arvostelu. dtSearch-käyttöliittymä on melko yksinkertainen, mutta jotkin ikkunat tai välilehdet ovat hieman ylikuormitettuja elementeillä, mikä vaikeuttaa sen käyttöä. Mutta todellisuudessa ei ole erityisiä vaikeuksia. Ainoa todella epämiellyttävä kohta on ohjelmiston tuen puute venäjän kielelle (huolimatta siitä, että ohjelma voi etsiä asiakirjoja useilla kielillä, sen käyttöliittymä on yksinomaan englanti).

    Mutta dtSearch on yksi harvoista ohjelmista, jotka voivat indeksoida verkkosivut käyttäjän määrittelemään "syvyyteen" (tosin ottaen huomioon dtSearch Spider -lisäpaketin "lisäostoksen"). Tämä on lisäksi erilaisten tekstimuotojen levytiedostojen ja sähköpostien tukeminen postilaatikko Näkymät. Samaan aikaan ohjelma ei voi toimia tietokantojen kanssa, jotka ovat hakukoneille niin maukkaita herkkuja niiden sisältämien suurten tietomäärien ja laajan leviämisen vuoksi yrityksissä ja siten yritysverkoissa. DtSearch-asiakirjojen indeksoinnin nopeus osoittautui sopivaksi. Tulevaisuudessa sanon, että tämä ohjelma selviytyi tietyn tietomäärän indeksoinnista tasolla toisen kilpailijan - iSYS:n - kanssa ja jakoi sen kanssa toiseksi suurimman listan. nopeat järjestelmät. dtSearch indeksoi testin 20 gigatavua tietoa 6 tunnissa ja 13 minuutissa ja loi 7,9 Gt:n indeksin myöhempiä hakutarpeita varten.

    Mitä tulee hakuominaisuuksiin, tässä ne ovat oikealla tasolla. Ensinnäkin dtSearchilla on morfologinen haku (sanan etsiminen kaikissa morfologisissa muodoissaan). Käyttämällä Tämä mahdollisuus, vapautat itsesi esimerkiksi sellaisista ajatuksista kuin "missä tapauksessa jotain sanaa käytettiin tarvitsemassani asiakirjassa?" Morfologisen haun käyttö on lähes aina perusteltua, joten sen tulisi olla läsnä kaikissa ammattihakukoneissa.

    Äänihaku on epätyypillinen ominaisuus jopa ammattihakukoneille. Sen ydin on, että ohjelma etsii sanoja, jotka kuulostavat samalta kuin kirjoittamasi sana. Ja mikä parasta, tämä toiminto toimii myös venäjän kielellä! Kun esimerkiksi kirjoitat sanan "korva" hakukyselyyn, näet tuloksena sanojen "korva" lisäksi myös "korva".

    Haku virheenkorjauksella on erittäin tärkeä toiminto. Sitä käytetään etsimään sanoja, jotka sisältävät syntaktisia virheitä - nämä voivat olla joko kirjoitusvirheitä tai virheitä esimerkiksi merkintunnistusjärjestelmillä hankituissa asiakirjoissa. Yksinkertainen esimerkki - etsit sanaa näppäimistö. Joissakin dokumenteissa on sana "näppäimistö", on selvää, että tämä on itse asiassa sana "näppäimistö", henkilö teki vain kirjoitusvirheen kirjoittaessaan. Joten virheenkorjaushaku havaitsee ja sisällyttää tulokseen asiakirjan, jossa on sana "näppäimistö". dtSearchissa on myös asetus, jonka avulla voit määrittää mahdollisten virheellisten merkkien laajuuden.

    Hae synonyymeillä. Tämä ominaisuus käyttää eri sanojen synonyymien luetteloa. Joten esimerkiksi syöttämällä sana "nopea", ohjelma löytää myös sanat "high-speed" ja muut, jotka ovat sanan "nopea" synonyymejä, jos ne tietysti ovat synonyymiluettelossa . Valmiita synonyymiluetteloita ei toimiteta dtSearch-ohjelman mukana, mutta luetteloita on mahdollista käyttää Internetissä (vastaavasti tarvitaan yhteys, mikä ei aina ole kätevää), tai voit luoda oman luettelon synonyymeistä .

    Listattujen ominaisuuksien lisäksi dtSearch voi etsiä lauseita, jotka koostuvat loogisilla operaatioilla yhdistetyistä sanoista. Jokaiselle kyselyn sanalle voidaan määrittää oma "painonsa" eli merkitys. Hyödyllinen vaihtoehto on käyttää sanakirjaa, joka koostuu merkityksettömistä sanoista, jotta niitä ei oteta huomioon haussa, mutta tämä sanakirja on myös tyhjä ja sinun on täytettävä se itse.

    Seuraavaksi tarkastellaan ohjelman ominaisuuksia, kun työskentelet verkossa. Itse asiassa dtSearch ei tarjoa mitään erityisiä ominaisuuksia verkon kanssa työskentelemiseen. On kuitenkin täysin mahdollista käyttää sitä verkossa. Vaihtoehtoisesti voit luoda jonkinlaisen indeksin ja laittaa sen julkiseen (jaettuun) kansioon. Itse ohjelma voidaan asentaa jokaisen käyttäjän tietokoneelle tai se voidaan sijoittaa myös avoimeen kansioon julkinen pääsy, ja luo erityisiä pikakuvakkeita kullekin käyttäjälle erikseen käyttämällä parametreja komentorivi, jonka tarkoitus on kuvattu ohjelman mukana toimitetussa ohjetiedostossa. Lisäksi on mahdollisuus automaattinen asennus ohjelmia verkkoon käyttämällä MSI-tiedosto. Tämä ottaa huomioon kunkin yhdistetyn käyttäjän asetukset.

    Yleensä se on hyvä ohjelma ammattimaisten hakukoneiden luokasta. Se voi saada hyvän arvosanan, mutta dtSearchin luottamuksen ja kunnioituksen saaminen ei välttämättä ole helppoa tietyistä tekijöistä johtuen (kaikki ei ole sujuvaa käyttöliittymän kanssa, venäläiset käyttäjät ovat vailla, verkon kanssa työskentelyyn ei ole kirkkaita ominaisuuksia) . Mitä tulee asiakirjojen suoraan etsimiseen, ohjelmalla ei ollut ongelmia venäjänkielisen tekstin kanssa. Kuten niitä ei ollut ilmoitetulla morfologialla tai sumealla haulla. Järjestelmä löysi varsin riittävästi tarvittavat asiakirjat sekä yksinkertaisella yksisanaisella kyselyllä että käyttämällä paria kappaletta tai dokumenttia avaimena.

    Virallinen sivusto:
    Jakelun koko: 23 MbIschika Prof Deluxe

    Nimen perusteella voit arvata, että tässä ohjelmassa on tuki venäjän kielelle. Tämä on jo mukavaa. Mitä tulee käyttöliittymään, se on yleensä hieman epätavallinen, mutta ulkonäöltään se on erittäin houkutteleva. Toinen asia on mukavuus. Erittäin kiistanalainen kriteeri, mutta silti luultavasti moniikkunaratkaisu ei ole menestynein vaihtoehto (pyyntö syötetään yhteen ikkunaan, tulos näytetään toisessa ja vastaavat).

    Snoop käyttää samoja indeksejä pikahakujen suorittamiseen, mutta indeksointi on paljon hitaampaa kuin muut ohjelmat. Tämä on hyvin outoa, varsinkin kun otetaan huomioon, että sen hakukyselyiden käsittelymahdollisuudet ovat erittäin heikot, ja siksi hakemistorakenne ei ole monimutkainen. Todennäköisesti tämä johtuu optimoimattomista algoritmeista. Tämä ohjelma osoittautui selkeäksi ulkopuoliseksi indeksoinnissa ja hakunopeuksissa: indeksin luomiseen käytetty aika on kuusi kertaa pidempi kuin dtSearchilla ja iSYS:llä. Verikoiralle 20 gigatavun tekstien indeksointi johti 38 tunnin ja 46 minuutin työaikaan. Ja luotu "hakualue" otti kiintolevyllä saman koon kuin alkuperäiset tiedot pienellä miinuksella - 19 gigatavua.

    Bloodhound voidaan esittää vaihtoehtona tavalliselle haulle Windowsissa, se ei todennäköisesti pysty enempään. Se tosiasia, että Snooperin ensisijainen tehtävä on yksinkertaisin tiedostojen haku, osoittaa paitsi hakukyselyiden tekstin analysointitoimintojen vähäisyys ja tarkennettu haku tiedostoattribuuttien perusteella, vaan jopa tulosikkuna, joka tarjoaa suoria linkkejä löydetyt tiedostot sekä nämä tiedostot sisältävät kansiot. Tulosikkuna ei ole kovin informatiivinen siinä mielessä, että voit lukea koko löydetyn tiedoston vain suorittamalla sen, eli siinä ei ole sisäänrakennettua tiedostojen katseluohjelmaa. Mutta ote tiedostosta, josta etsitty sana löydettiin, näytetään yleensä, tämä näyttöjärjestelmä muistuttaa hyvin Internet-hakukoneita.

    Kun puhutaan hakukyselyiden käsittelyn erityisominaisuuksista, on syytä huomata, että "hakutekstiä" ei ole olemassa, maksimi haettava on lause, jos vain siksi, että siinä ei ole monirivistä tekstinsyöttökenttää. Voit kuitenkin analysoida syötetyn lauseen, ja Snoop tarjoaa meille vakiohakusarjan täällä: loogiset operaatiot, maskihaku ja lainaushaku... ei paljon. Ohjelma sisältää joitain morfologisen haun alkeita, mutta se on luultavasti niin karkea, että se todennäköisesti häiritsee oikeaa toimintaa (testien aikana havaittiin monia virheitä morfologian väärinkäytöstä).

    Mutta ohjelman avulla voit määrittää haettaessa tiedostoattribuutteja (asiakirjan päivämäärä, tiedostonimi, kansion nimi), ja näissä kyselyissä voit myös käyttää samaa hakujoukkoa. Voit myös etsiä kirjaimia määrittämällä parametrit (From, Subject... jne.).

    Joten selvitimme itse haun, mitä muuta mielenkiintoista on ohjelmassa, josta se sai niin monia palkintoja virallisen verkkosivuston tietojen mukaan? On vaikea sanoa, mikä siinä on niin erikoista, että Bloodhoundin käyttöliittymä on houkutteleva (täsmälleen ulkonäöltään, käytettävyydestä puhumattakaan).

    Toiminnot indeksien kanssa ovat hyvin tavallisia. Mukava ominaisuus on kyky päivittää indeksejä aikataulun mukaan. Lisäksi indeksejä voidaan käyttää myös verkossa. Tästä eteenpäin tarvitsemme lisätietoja.

    Hakukyselyiden primitiivisyydestä huolimatta ohjelmaa voidaan käyttää tiedostojen etsimiseen, joten sen käyttö voi olla perusteltua verkoissa. Tosin suurella venyydellä, koska suuressa verkossa ensisijainen tehtävä on Pikahaku dataa käyttämällä monimutkaisia ​​hakukyselyitä valtavan tietomäärän vuoksi - ja haun ja ohjelman nopeudessa on selvästi ongelmia. Minun on sanottava, että työ Izhishkan verkon kanssa on suunniteltu niin kuin sen pitäisi olla. Erillinen sovellus on suunniteltu erityisesti tätä varten - Bloodhound Server. Se toimii samalla tavalla kuin pelkkä Snooper (heillä on sama hakukone), vain asiakirjoille, joita isännöidään keskuspalvelimella tai yhteiset resurssit V yritysverkosto. Snooper Server luo uusia indeksejä jaetuille resursseille tai käyttää aiemmin luotuja. Kuka tahansa yritysverkon käyttäjä voi muodostaa yhteyden hakupalvelimeen ja käyttää sitä mihin tahansa asiakirjaan (joka sijaitsee nykyisessä hakemistossa) Internet-selaimella. Hyväksy, tämä järjestelmä on erittäin kätevä: käy ilmi, että omassa verkossasi olevia tiedostoja voidaan etsiä samalla tavalla kuin tietoa Internetistä esimerkiksi Googlen kautta.

    Arvioimalla tämän ohjelman kaikkia etuja ja haittoja, johtopäätös viittaa siihen, että sen ominaisuudet eivät todennäköisesti riitä yritysverkkoihin (huolimatta hyvästä verkon kanssa työskentelyn organisoinnista), vaan kotitietokoneelle tai jopa kotiverkko Periaatteessa se voisi olla sopiva. Vaikka työn nopeus tai hakumahdollisuudet eivät herätä optimismia...

    Virallinen verkkosivusto venäjäksi:
    Jakelun koko: 6 Mt Google Desktop Search + GDS Enterprise

    Emme tietenkään voineet sivuuttaa niin kuuluisaa kehittäjää. Nimi Google jo kertoo paljon. Ihmiset, jotka ovat käyttäneet tehokkainta Internet-hakukonetta vuosia, päättävät luultavasti epäilemättä asentaa tämän hakukoneen tietokoneelleen. Ajattele vain: Google kotitietokoneellasi! Antamatta kuitenkaan periksi provokaatioille laajasti mainostetun brändin kanssa, yritetään harkita raittiisti ja mikä tärkeintä objektiivisesti Googlen "työpöytähakukoneen" ominaisuuksia.

    Ensimmäinen asia, joka pistää silmään, on oman kuoren puute ohjelmalle. Google Desktop Search sijaitsee edelleen selainikkunassa, vastaavasti, koko työpöytäversion käyttöliittymä on peritty ohjelmistolta sen vanhemmalta Internet-veljeltä. Se, onko tämä hyvä vai huono asia, on kiistanalainen: jotkut ihmiset pitävät tämän hakukoneen suunnittelun minimalismista, kun taas toiset haluavat nähdä täysimittaisen sovelluksen, joka on täynnä kaikenlaisia ​​painikkeita ja niin edelleen.

    Mikä pistää silmään heti suunnittelun jälkeen? Ja se tosiasia, että tämä sama Google Desktop Search alkaa indeksoida kaikkea tietokoneella ilman mitään tarvetta! Ja mikä mielenkiintoisinta, on se, että on mahdotonta valita indeksointipolkuja Google Desktop Searchin avulla. Sinun on ladattava erillinen ohjelma (TweakGDS), jonka avulla voit hieman laajentaa Google-asetukset Työpöytä, mukaan lukien indeksointiin tarvittavien paikkojen määrittäminen. Vaikka kun ymmärrät kaiken tämän, se indeksoi jo tavallisen kiintolevyn, joten tätä asetusta tarvitaan todennäköisemmin käytettäessä suuria tietomääriä, mikä on erittäin tärkeää, kun sitä käytetään yritysverkoissa (yritysversiot). . Ei kuitenkaan ole tosiasia, että TweakGDS:n lataamisen jälkeen ongelmasi ratkaistaan. Loppujen lopuksi hän tarvitsee Microsoftin toimiakseen. NET Framework ja Microsoft Scripting Runtime. Joo... asennuksen, samoin kuin pääsyn asetuksiin, olisi voitu yksinkertaistaa, vaikka kehittäjät varmaan ymmärtävät: miksi kirjoittaa jotain uutta, kun on valmis hakukone, siirretty se paikallinen tietokone ja anna käyttäjän "nauttia" ja anna kuuluisan nimen tehdä "tästä" toinen mestariteos. No, lopetetaan tämä lyyrinen poikkeama ja siirrytään etsimään.

    Mitä tulee hakukyselyjen analysointiin ja tulosten toimittamiseen, kaikki täällä on täysin identtistä Googlen kanssa Internetissä: sama tulosten näyttöjärjestelmä, samat standardit loogiset toiminnot hakukyselyille. Yleensä Google Desktop Search, kuten edellinen ohjelma, on suunniteltu yksinomaan tiedostojen etsimiseen - sillä ei tietenkään ole sisäistä katseluohjelmaa näille tiedostoille. Google Desktop Searchin tukemien tiedostomuotojen määrä on varsin riittävä, ja on myös mukavaa, että se hakee vierailtuja Internet-sivuja ottamalla tietoja välimuistista. Haku- ja indeksointinopeudet ovat melko hyväksyttäviä. Totta, kotikäyttöön. Vaikuttavalla 20 gigatavulla Google tekstit Desktop Search suoritti tehtävän 8 tunnissa ja 17 minuutissa. Useiden päivien käyttäminen suuren yrityksen yritysverkosta tulevien tietojen käsittelyyn ei ole asia, jota kukaan järjestelmänvalvoja haluaisi tehdä. Hyvä puoli: luodun hakemiston koko oli samalla tasolla (4,5 Gt) kuin toinen tässä katsauksessa testattu hakukone - SearchInform.

    Google Desktop Searchin suuri etu (tai haitta - sinä päätät) on, että se tukee laajennuksia, jotka voivat muuttua paljon parempaan suuntaan. Toinen asia on, että laajennusten yhdistäminen ja niiden määrittäminen vaikeuttaa hakukoneen asennusta niin paljon, että alat miettiä, onko tämä kaikki välttämätöntä, kun voit asentaa normaalin, täysimittaisen ohjelman, jossa kaikki on jo olemassa. Loppujen lopuksi jokaisen ominaisuuden käyttämiseksi sinun on asennettava uusi laajennus. Jopa jotta ohjelma toimisi täysin arkistojen kanssa, tarvitaan erillinen gadget. On kiehtovaa ja viettelevää, että kaikki nämä lisämoduulit ovat ilmaisia. Jos et kuitenkaan ota huomioon hakukoneen työpöytäversiota, GDS Enterprisen pätevä konfigurointi ei välttämättä ole sinun voimasi - eihän se ole turhaan, että Googlen asiantuntijat tarjoavat palveluitaan oman omien määrittämiseensä. ohjelmisto verkkoosi vain 10 000 dollarilla.

    Jos käyt läpi asennus- ja asennusprosessin (tai maksat 10 000 dollaria Googlen pikavastaustiimille), ymmärrät, että asennuksen monimutkaisuus on enemmän kuin kompensoitu erittäin joustavilla asetuksilla, kun niitä käytetään yritysverkoissa. Tärkeä pointti Google työ Työpöytä yritysverkossa on ryhmäkäytäntöjen käyttöä, joka mahdollistaa asetusten asettamisen kullekin käyttäjälle.

    Yhteenvetona voidaan todeta, että tämän ohjelman järkevin käyttö on koti- tai työtietokone. Loppujen lopuksi tavalliselle tietokoneelle riittää vain ohjelman asentaminen - se tekee loput itse (se ei edes kysy sinulta mitään).

    Google Desktop Search Enterprise hyväksytään kuitenkin tapauksissa, joissa on kiireellisesti tarpeen määrittää joustava verkkokäytäntö hakukoneen käyttöä varten, kun taas kyky käsitellä hakukyselyitä on toisella sijalla tärkeyden ja ajan (tai rahan) suhteen. ), joka on käytetty ohjelman perustamiseen, on ensimmäisellä sijalla.

    Virallinen sivusto:
    Jakelukoko mukaan lukien TweakGDS: 1,2 MbCopernic Desktop Search

    Klikkaa kuvaa suurentaaksesi

    Ohjelman käyttöliittymä herättää erittäin positiivisia tunteita - kaikki tehdään yleisesti hyväksyttyjen standardien mukaisesti, ei mitään tarpeetonta, sanalla sanoen miellyttävä muotoilu. Aloittelijalle Copernic Desktop Search -käyttöliittymän ymmärtäminen on erittäin helppoa. On kuitenkin hieman hämmentävää, että suunnittelijat loivat ohjelman käyttöliittymän selkeästi ottaen huomioon sen, että ohjelma toimii Windows XP:n vakioteemassa. Klassista teemaa käytettäessä ohjelma ei näytä niin hyvältä. Mutta tämä on enemmän makuasia.

    Ensimmäisellä käynnistyksellä ohjelma kehottaa luomaan hakemistoja hakua varten. Tuntui hieman epätavalliselta, että indeksoitavien kansioiden valinnan jälkeen ohjelma ei tarjonnut painaa mitään painiketta, kuten "Aloita indeksointi", eikä indeksointi käynnistynyt automaattisesti, vasta sitten havaittiin, että Copernic yritti aloittaa indeksoinnin tietokoneen ollessa käynnissä. oli käyttämättömänä. Sinun on kaivettava hieman syvemmälle ohjelman asetuksia, jotta voit määrittää kaiken oikein. On huomattava, että automaattisen indeksin luomisen asettamiseen on melko laajat mahdollisuudet: sisäänrakennettu ajastin, mahdollisuus indeksoida tietokoneen ollessa käyttämättömänä, tausta, alhaisella prioriteetilla. Indeksointi ei ollut liian nopeaa - 10 tuntia 51 minuuttia - tämä on hitaampaa kuin muissa hakukoneissa (paitsi Isle of Bloodhound, mutta Copernic on silti suuruusluokkaa nopeampi kuin iSleuthHound Technologiesin kehitys).

    Nyt indeksin rakenteesta. Yleisesti ottaen siinä ei ole mitään erikoista. On mahdollista valita tiedostotyyppejä sekä yleisessä että yksityiskohtaisessa muodossa. Eli aluksi voit valita, mitä haluat indeksoida - asiakirjat, kuvat, videot, musiikki. Asetusikkunan toisessa välilehdessä voit valita tiettyjä tiedostotyyppejä laajennuksen mukaan. Lisäksi voit määrittää indeksin siten, että esimerkiksi alle 16x16 kokoisia kuvia ei indeksoida tai alle 10 sekuntia pitkiä äänitiedostoja ei indeksoida. Kansioiden tiedostojen indeksoinnin lisäksi Copernic voi käsitellä sähköpostiviestejä ja yhteystietoja osoitekirjasta Microsoft Outlook ja Microsoft Outlook Express, suosikkeja ja historiaa indeksointi Internet Explorerista on mahdollista.

    Mitä tulee hakuominaisuuksiin, ne ovat täällä erittäin heikkoja. Testien aikana jopa paljastettiin, että ohjelma ei etsi asiakirjoja txt- ja html-muodoissa venäjäksi, joten voit löytää ne vain otsikoiden, ei sisällön perusteella. Ainoa asia, jonka ohjelma tarjoaa haun tehokkuuden parantamiseksi, on standardien loogisten operaatioiden käyttö, ja silloinkin tämä ominaisuus löydettiin kokeellisesti, koska sitä ei dokumentoitu. Muuten, ohjelman apu ei myöskään ole kunnossa - se on saatavilla vain Internetin kautta, mikä, näet, on erittäin hankalaa, eikä Internetissä ole liikaa apua. Ilmeisesti kehittäjät päättivät, että ohjelman yksinkertainen käyttöliittymä ei tarkoita normaalin avun läsnäoloa. Jatkamalla keskustelua hakuominaisuuksista, on huomattava, että kyselyiden heikosta analyysistä huolimatta ohjelma tarjoaa mielenkiintoisen hakujärjestelmän - käyttäjä voi valita tiedostotyypin (kuvat, videot, musiikki jne.), kirjoittaa haun kysely ja valitse valitulle tiedostotyypille ominaiset attribuutit. Esimerkiksi äänitiedostoille nämä voivat olla arvoja mp3-tunnisteista (esittäjä, albumi, päivämäärä jne.), kuville esimerkiksi voit valita niiden koon (resoluutiolla), yleensä jokaisella tyypillä on omat arvonsa. omat asetukset. Kun olet etsinyt tietyn tiedostotyypin, ohjelma näyttää tulosikkunassa erittäin informatiivisen luettelon, ja jos pyyntösi sisältää muun tyyppisiä tiedostoja, voit avata ne napsauttamalla tiettyä linkkiä.

    Erikseen kannattaa mainita tulosten näyttöikkuna. Löydettyjen tiedostojen luettelon alla näkyy näiden tiedostojen sisältö (samalaista järjestelmää käytetään usein sähköpostiohjelmissa). Totta, tekstin katselu voidaan tehdä vain alkuperäisessä muodossa, eikä pelkkää tekstin näyttötilaa ole, mikä ei ole aina kätevää, koska asiakirjan avaaminen vie tässä tapauksessa enemmän aikaa. Mutta koska Copernic voi etsiä kuvia ja musiikkia, on mahdollista tarkastella näitä multimediatiedostoja.

    Tämän ohjelman perusperiaatteet on kuvattu, katsotaan nyt mitä Copernic Desktop Search voi tarjota meille verkon kanssa työskentelyyn... Periaatteessa voit katsoa hyvin pitkään, mutta tuskin näet mitään . Toisin sanoen tätä ohjelmaa ei ollut tarkoitettu verkkopohjaiseksi. Copernic Desktop Search on yksinomaan kotihakukone.

    Ilmeisesti tämän ohjelman ainoa (loogisin) sovellus on kotitietokone. Täällä se selviytyy täysin kaikista yksinkertaisista yhdestä tai kahdesta sanasta koostuvista käyttäjien hakukyselyistä, löytää tarvittavat tiedot ja haun jakamisen tiedostotyypin mukaan ja tukee multimediatiedostoja sekä taustan indeksointia alhaisen prioriteetin tilassa yhdistettynä miellyttävään käyttöliittymä, anna ohjelmalle vain voimaa saavuttaa luottamus kokemattomien käyttäjien keskuudessa.

    Virallinen sivusto
    Jakelukoko: 2,6 MbISYS Desktop

    Klikkaa kuvaa suurentaaksesi

    Erittäin tehokas ohjelma. Varustetasoltaan kaikenlaisilla toiminnoilla se on jossain lähellä listan seuraavaa SearchInform-hakujärjestelmää. Lisäksi asennustiedoston koko on yli 40 Mt! Vaikea sanoa, mitä tällaisiin mittoihin voisi puristaa, koska sama SearchInform samanlaisilla toiminnoilla vie 15 Mt.

    Myöskään asennusprosessi ei ole kovin miellyttävä, tai pikemminkin ei edes asennusprosessi. Jo ennen ohjelman lataamista sinua pyydetään rekisteröitymään, muuten ei ole mahdollista. Seuraavaksi käyttöliittymä. Se on tehty erittäin kauniisti, mikään turha ei jää silmään, mutta nämä ovat vaikutelmia ihmisestä, joka on jo jonkin verran tottunut siihen. Aloittelijan ei ole helppoa selvittää, missä ja mikä sijaitsee, mistä napsauttaa ja mistä lopulta etsiä. On erittäin suositeltavaa lukea ohje ennen työn aloittamista - säästät paljon hermoja ja aikaa. Kaikkeen muuhun on lisätty venäjän kielen tuen täydellinen puute ohjelmassa. Ei hyvä. Lisäksi täällä olevat ikkunat eivät ole ylikuormitettuja säätimillä, mutta jouduimme maksamaan tästä monimoduuleilla ja lisäikkunoiden käytöllä. Esimerkiksi hakukyselyt syötetään käynnistämällä yksi ohjelma ja indeksinhallinta suoritetaan toisella ohjelmalla. Hakukyselyt syötetään myös tähän erillisiin ponnahdusikkunoihin. On vaikea sanoa, kumpi on parempi - ylikuormitettu käyttöliittymä vai kaikkialla esiintyvät useat ikkunat, se on pikemminkin makuasia.

    Mitä tulee indeksien luomiseen, ohjelma tarjoaa ominaisuuksia, jotka yksinkertaistavat uuden indeksin asetusten määrittämistä. Nämä ominaisuudet sisältävät useita valmiita malleja luoda hakemistoja kansioihin "Omat asiakirjat", "Mail", "Mail and Documents", "Specific Folder", "Kansio, jossa on valikoima tiedostotyyppejä" jne. Tällaiset mallit yksinkertaistavat hakemistojen luomista ensimmäisessä vaiheessa. Indeksien kanssa työskentelyn apuohjelmalla ei ole kovin hyvää käyttöliittymää, mikä pelottaa monimutkaisuudella (tämä on erittäin subjektiivinen arvio, ollakseni rehellinen), mutta jos katsot sitä, se tarjoaa monia hyödyllisiä vaihtoehtoja ja yleensä , sen käyttö ei aiheuta suuria vaikeuksia. ISYS Desktop voi indeksoida tietoja useista tietolähteistä ja tarjoaa myös monia joustavia asetuksia tällaiseen indeksointiin. Muita indeksointiominaisuuksia ovat: tuki SQL:lle, FTP:lle, TRIM Contextille, WORLDOX 2002:lle ja skripteille. Jos valitsit hakemistoa luodessasi kohdan "Kansio tiedostotyyppien valinnalla", sinulla on mahdollisuus valita tiedostotyypit indeksoitaviksi manuaalisesti (laajennuksella). On sanottava, että tuettuja tiedostotyyppejä on yksinkertaisesti valtava määrä, mutta et voi lisätä omaa tyyppiäsi (laajennusta) olemassa olevaan luetteloon. Voit myös huomata indeksoinnin ajastimen olemassaolon. Indeksin luominen ja 20 gigatavun tiedon käsittely vei ISYS Desktopilta 6 tuntia ja 13 minuuttia, mikä lopulta osoitti hyvää aikaa ja luodun tiedoston kokoa - 7,9 Gt.

    Tämän ohjelman hakuominaisuudet ovat melko hyvät. Se, mitä ISYS:ssä käytetään, on paljon tehokkaampi kuin perinteinen loogisten toimintojen tuki. Tarkennetuista hakuominaisuuksista ohjelma tarjoaa synonyymien käytön ja lajittelusuodattimen (polun, nimen ja tiedoston luontipäivämäärän mukaan). Loogisten operaattorien joukko on jonkin verran laajempi kuin standardijoukko. Loogisten operaatioiden lisäksi ohjelman avulla voit työskennellä monien muiden operaattoreiden kanssa, jotka periaatteessa voivat korvata tietyn tyyppisiä hakuja, esimerkiksi haun jäsennys voidaan korvata kokonaan käyttämällä erityisiä operaattoreita. Olin hyvin yllättynyt siitä, että ohjelmassa ei ole morfologiaa käyttävää hakua. Tämä on vakava puute, koska haun tehokkuus paranee huomattavasti morfologista analyysiä käytettäessä. Lisäksi ei ole luetteloa merkittävistä sanoista, mutta on laaja luettelo merkityksettömistä sanoista. Mainitaan myös sellaiset hakutoiminnot kuin "likimääräinen haku" ja "heuristinen analyysi".

    ISYS tarjoaa useita erilaisia ​​hakukyselytyyppejä, nimittäin visuaalisia tyyppejä. Tämä tehdään käyttämällä erityyppisiä ikkunoita hakukyselyiden syöttämiseen, mutta itse asiassa mikään ikkuna ei salli muiden kuin yllä lueteltujen teknologioiden käyttöä.

    Hakutulokset ovat erittäin informatiivisia, ja ne näytetään asiakirjojen luettelona, ​​joka on lajiteltu osuvuuden mukaan. Valitun asiakirjan esikatselu näkyy alla. Toisin kuin Copernic Desktop Search, esikatselu on käytettävissä vain pelkkänä tekstinä, ei ole mahdollista näyttää asiakirjoja alkuperäisessä muodossaan, oli se sitten Word, HTML tai PDF, vaikka tämä ei periaatteessa ole liian kriittinen. Ohjelman avulla voit jakaa löydetyt asiakirjat ryhmiin tiettyjen kriteerien mukaan (oletusarvoisesti ne on jaettu merkityksen mukaan). Voit myös tarkastella jo löydettyjä asiakirjoja valitsemalla yksittäisiä kansioita (tämä on kätevää, kun tulos tuottaa erittäin suuren määrän asiakirjoja).

    Ohjelman käyttäminen yritysverkossa on myös erittäin perusteltua, koska se tarjoaa hyvät mahdollisuudet verkkohaun järjestämiseen. Hakujärjestelmä perustuu julkisen indeksin luomiseen, joka sisältää indeksoituja tietoja julkisista verkkoresursseista.

    Itse asiassa ISYS:n ohjelma on huomion arvoinen, ainakin siihen tutustuminen. Tämä ohjelma on kypsä projekti, jossa on valtava määrä toimintoja (ei aina eivätkä kaikki tietenkään tarvitse niitä, mutta silti). Todennäköisyyttä, että ohjelma näkee joitain parannuksia hakukyselyjen käsittelyssä, ei ole tiedossa, mutta tällä hetkellä sitä voidaan suositella melkein yleiseen käyttöön. Ja koska se on edelleen liian raskas kotijärjestelmiin, sen tärkeimmät asennuspaikat ovat yritysverkot.

    Virallinen sivusto:
    Jakelun koko: 40 MbSearchInform

    Klikkaa kuvaa suurentaaksesi

    Ei luultavasti kannata aloittaa heti SearchInform-käyttöliittymän kuvauksella. Meidän pitäisi ensin kuvata asennusprosessi, tai pikemminkin yksi sen yksityiskohdista: et voi asentaa ohjelmaa ilman Internet-yhteyttä. Tosiasia on, että ennen ensimmäistä käynnistystä ohjelma vaatii käyttäjän rekisteröinnin (ilmainen) ja lähettää kaikki syötetyt tiedot palvelimelle. Ilmeisesti kehittäjien oli ryhdyttävä tällaisiin toimenpiteisiin piratismin torjunnassa, mutta tällä ei ollut positiivista vaikutusta asennuksen helppouteen.

    Ohjelman käyttöliittymä on suunniteltu noudattaen kaikkia yleisesti hyväksyttyjä sääntöjä, mutta ensi silmäyksellä se on hieman hankala. Ohjelmaa ensimmäistä kertaa käytettäessä se näyttää liian monimutkaiselta, joskus ei ole helppo muistaa, missä valikossa tai välilehdellä haluttu vaihtoehto sijaitsee, mutta pidemmällä käytöllä käyttöliittymä ei enää vaikuta niin hirveän monimutkaiselta . Tärkeintä on lukea todistus ensin.

    Kun olet ymmärtänyt käyttöliittymän hieman, voit aloittaa indeksin luomisen. Itse prosessi on hyvin yksinkertainen ja indeksointinopeus, jopa silmällä, on huomattavasti suurempi kuin kaikilla muilla tarkastelun hakukoneilla. Selkeät testinumerot osoittavat, että SearchInform on indeksointinopeudessa kaksi kertaa nopeampi kuin dtSearch ja iSYS! Ohjelma indeksoi toimitetut tiedot 20 gigatavua ennätysajassa 3 tuntia 17 minuuttia. Ja luodun indeksin koko osoittautui pienimmäksi 4,4 Gt - 100 megatavua vähemmän kuin Google Desktop Search.

    Ohjelma tukee tavallisten tiedostojen ja kansioiden lisäksi myös sähköpostien indeksointia, tietokantojen yhdistämistä ja indeksointia (!) ja muita ulkoisista lähteistä(DMS, CRM), heti indeksoinnin aikana voit määrittää sanakirjan morfologisen haun suorittamista varten ja kaikki tiedostoattribuutit voidaan indeksoida. Kun olet luonut hakemiston, kun yrität tehdä ensimmäistä testihakua asiakirjoille, saatat hämmentyä: "tässä on kahdenlaisia ​​hakuja, mutta kumman tarvitsen?" Kuten aiemmin mainittiin, tärkeintä on lukea ohje, niin kaikki tulee selväksi. Ohjelma voi itse asiassa suorittaa kahdenlaisia ​​hakuja - lausehaun ja etsiä asiakirjoja, jotka ovat sisällöltään samanlaisia ​​kuin kyselyn teksti.

    Yllä annettiin kuvaus kaikista tärkeimmistä hakukyselyn analysoinnin toiminnoista, joten nyt luetellaan vain tämän ohjelman tarjoamat hakuominaisuudet. Aloitetaan lausehakulla: tietysti morfologinen haku, lainaushaku, loogiset operaatiot, haku sanan jäsentämisellä (haku sanan alusta, lopusta, keskiosasta tai täydellinen haku), sekaviittaushaku ( kun kaikki kyselyn sanat on oltava dokumentissa, mutta eivät välttämättä syötetyssä järjestyksessä), haku virheenkorjauksella, synonyymien käyttö, "melkein lainaushaku" (hae syötetty lause sitaattina, mutta muut sanat voivat olla läsnä syötettyjen sanojen välissä) jne. Joillakin luetelluista vaihtoehdoista on omat erityisasetukset. Lisäksi on mahdollista käyttää merkityksettömien sanojen sanakirjaa, ja ohjelmalla on jo valmis luettelo näistä sanoista, voit myös käyttää hakua varten ensisijaisten sanojen sanakirjaa (tietenkin sinun on täytettävä se). sinä itse).

    Tässä periaatteessa tarkastelimme lyhyesti kaikkia lausehaun pääpiirteitä.

    Siirrytään tarkastelemaan tämän ohjelman ominaisuuksia - vastaavien asiakirjojen etsimistä. Kehittäjät väittävät, että tämä ei suinkaan ole yksinkertainen tekstihaku, se on nimenomaan "samankaltaisten haku" - juuri näin sitä kuvataan kaikkialla, mutta no, voit kutsua sitä miksi haluat - pääasia on . Pikahaku Internetissä paljastaa nopeasti, että niin sanottu "samanlainen haku" on uusi kehitysaskel tekstianalyysin alalla. Tämän järjestelmän avulla voit löytää semanttisesti sisällöltään samankaltaisia ​​tekstejä. Kaikkein miellyttävintä oli, että koehakukyselyjen jälkeen kävi ilmi, että teoria osuu aika hyvin yhteen käytännön kanssa! Ohjelma etsii asiakirjoja, joilla on samanlainen sisältö, ja näyttää ne luettelossa lajittelemalla ne samankaltaisuusprosenttien mukaan.

    Katsotaan seuraavaksi, mitä SearchInform (erityisesti sen yritysversio SearchInform Corporate) tarjoaa työskentelyyn yritysverkossa. Sovelluksia on kahdenlaisia: palvelinpuoli ja käyttäjäpuoli. Palvelinosa käsittelee erikseen määritellyt indeksit, ja käyttäjät voivat käyttää niitä hakuun, riippuen niille myönnetyistä käyttöoikeuksista. Käyttäjät voidaan määrittää automaattisesti käyttämällä Tilit Windows (ammattimaisesti SearchInform käyttää NTFS Windows -todennusta) ja manuaalisesti (käyttäjät on lisättävä erikseen). Jokaiselle käyttäjälle voidaan sallia tai evätä pääsy tiettyihin indekseihin, ja käyttäjät voidaan myös yhdistää ryhmiin. Yleisesti ottaen SearchInformin verkkotyöskentelyasetukset ovat joustavuuden suhteen edellä Googlea ja mukavuuden ja yksinkertaisuuden suhteen Ishhound Serveriä.

    Virallinen sivusto:
    Jakelun koko: 14,7 Mb Indeksointinopeuksien vertailu

    HakujärjestelmäIndeksointiaikaIndeksin koko
    Bloodhound Prof Deluxe 4.538 tuntia 46 minuuttia19 GB
    Isys Desktop 7.06 tuntia 13 minuuttia7,9 Gt
    DtSearch 7.06 tuntia 3 minuuttia8,6 Gt
    Google Desktop Search Enterprise8 tuntia 17 minuuttia4,5 Gt
    Copernic Desktop Search *10 tuntia 51 minuuttia7 Gt
    SearchInform 1.5.023 tuntia 17 minuuttia4,4 Gt

    * Suurin osa venäjänkielistä tekstiä sisältävistä document.html- ja .txt-tiedostoista oli mahdotonta löytää paitsi niiden nimien perusteella, vaikka ne oli indeksoitu

    Kaikki ohjelmat ovat huomion arvoisia.

    Testien ja jokaisen katsauksessa esitetyn ohjelman huolellisen tarkastelun perusteella voidaan tehdä tiettyjä johtopäätöksiä. Joten Google Desktop Search Copernic Desktop Search sopii kokemattomalle käyttäjälle kodin tiedonhakujärjestelmäksi. Ne selviävät hyvin yksinkertaisista kyselyistä, eivät ylikuormita käyttäjää asetuksilla ja ovat lisäksi täysin ilmaisia. Googlen yritys päästä yrityshakukonemarkkinoille ei ole vielä kovin perusteltua: for täysipainoista työtä ohjelma on ladattava lisämoduuleilla, eikä sen käyttöönotto ole helppoa. Siksi itsestään selvät nimet Desktop Search, Copernic ja Google varaavat taakseen "työpöytähakukoneiden" markkinaraon.

    Totta, tehokkaammat ratkaisut - dtSearch, iSYS ja SearchInform eivät myöskään ole idioottivarmoja ja tarjoavat käyttäjille heidän "työpöytäversionsa". Mutta kohtuulliseen hintaan, toisin kuin Googlen ja Copernicin ilmaiset ohjelmistot. Tietysti joudut maksamaan tehosta, nopeudesta ja toimivuudesta. Mutta dtSearchin, iSYS:n ja SearchInformin kehittäjien pääpaino on tietysti yrityssektorilla. Verkottuminen, toiminnallisuus, indeksointi ja hakunopeus erottavat nämä tuotteet "kilpailijoistaan". Testitulosten perusteella löydettiin suosikki - SearchInform. Ohjelma tarjoaa mahdollisuuden etsiä samanlaisia ​​asiakirjoja, sillä on suurin indeksointi- ja hakunopeus hyvä setti toimintoja.

    Aleksei Kutovenko

    Ammattimainen Internet-haku

    Johdanto

    Internet-haku on tärkeä osa Internet-työskentelyä. Tuskin kukaan tietää varmasti nykyaikaisen Internetin verkkoresurssien tarkkaa määrää. Joka tapauksessa luku on miljardeissa. Jotta voisit käyttää kulloinkin tarvittavaa tietoa työ- tai viihdetarkoituksiin, sinun on ensin löydettävä se tästä jatkuvasti täydentyvasta resurssien valtamerestä. Tämä ei ole ollenkaan helppo tehtävä, koska nykyaikaisen Internetin tiedot eivät ole jäsenneltyjä, mikä aiheuttaa ongelmia sen löytämisessä. Ei ole sattumaa, että Internetin hakukoneista on tullut ainutlaatuisia "ikkunoita" tähän tietoavaruuteen.

    On epätodennäköistä, että Internetin käyttäjien joukossa on ihmisiä, jotka eivät ole koskaan käyttäneet suuria universaaleja hakukoneita. Nimet Google, Yandex ja pari muuta suurta konetta ovat kaikkien huulilla. Ne selviävät erittäin hyvin päivittäisistä Internet-hakutehtävistä, eivätkä käyttäjät usein edes yritä etsiä korvaavaa. Samaan aikaan Internet-hakukoneiden määrä meidän aikanamme on tuhansia. Vaihtoehtoisten koneiden valikoiman syillä on erilaiset juuret. Jotkut hankkeet yrittävät kilpailla suoraan maailmanlaajuisten markkinajohtajien kanssa tekemällä huolellista työtä kansallisten Internet-resurssien kanssa. Toiset tarjoavat kyselyominaisuuksia, joita ei ole saatavilla tunnetuista hakukoneista. Merkittävä osa vaihtoehtoisista moottoreista on erikoistunut tietyn aihealueen tai tietyntyyppisen sisällön etsimiseen, mikä saavuttaa vaikuttavia tuloksia näiden ongelmien ratkaisemisessa. Oli miten oli, tällaisten hakukoneiden sisällyttäminen käyttäjän omaan Internet-hakutyökalujen arsenaaliin voi parantaa merkittävästi sen laatua. Tässä on kuitenkin yksi vivahde: ​​sinun on tiedettävä tällaisista koneista ja kyettävä käyttämään niiden ominaisuuksia.

    Oletamme, että tämän kirjan lukijat tuntevat jo melko hyvin yleisiä hakukoneita käyttävät hakutekniikat. Niin hyvä, että he tunsivat käyttöön liittyvät rajoitukset. Todennäköisesti tällaiset ihmiset ovat jo yrittäneet etsiä ja käyttää tiettyjä lisätyökaluja. Painettu sana ei sivuuta Internet-haun aihetta: artikkeleita ilmestyy säännöllisesti ja kirjoja julkaistaan. Mutta heidän sankarinsa ovat yleensä samat - useita johtavia universaaleja hakukoneita. Kirjasta eroaa se, että se yrittää kattaa kaikki modernit hakuratkaisut. Täältä löydät kuvauksia ja suosituksia parhaan käyttöön nykyaikaiset palvelut suuntautunut yleisimpien hakuongelmien ratkaisemiseen. Tämä kirja on tarkoitettu ihmisille, jotka työskentelevät paljon Internetin parissa ja käyttävät verkostoa löytääkseen tarvitsemansa tiedon - olipa kyseessä sitten liike, opiskelu tai harrastus.

    Internet-haun onnistuminen edellyttää kahden ehdon täyttymistä: kyselyjen on oltava hyvin muotoiltuja ja niitä tulee kysyä sopivista paikoista. Toisin sanoen käyttäjältä edellytetään toisaalta kykyä kääntää kiinnostuksen kohteet hakukyselyn kielelle ja toisaalta hyvää tietoa hakukoneista, käytettävissä olevista hakutyökaluista, niiden eduista ja haittoja, joiden avulla hän voi valita sopivimmat hakutyökalut kussakin tapauksessa .

    Tällä hetkellä ei ole olemassa yhtä resurssia, joka täyttäisi kaikki Internet-hakuvaatimukset. Siksi, jos otat haun vakavasti, sinun on väistämättä käytettävä erilaisia ​​​​työkaluja, joista jokaista käytetään sopivimmassa tapauksessa.

    Käytettävissä on monia hakutyökaluja. Ne voidaan yhdistää useisiin ryhmiin, joista jokaisella on tiettyjä etuja ja haittoja. Kirjamme luvut on omistettu nykyaikaisten Internet-hakukoneiden pääryhmille.

    Luku 1, "Universaalit Internet-hakukoneet", on omistettu suurille yleisille järjestelmille tiedon hakemiseen Webistä. Pääpaino on heidän edistyneimmissä instrumenteissaan, jotka yleensä jäävät suuren yleisön tutkan alle. Tunnettujen koneiden ominaisuuksien tarkastelu antaa meille eräänlaisen lähtökohdan ja antaa meille mahdollisuuden kuvitella selkeästi vaihtoehtoisten hakuratkaisujen soveltamisalaa.

    Luku 2, "Pystysuuntainen haku", puhuu järjestelmistä, jotka ovat erikoistuneet tiettyihin aihealueisiin tai tietyntyyppiseen sisältöön.

    Luku 3, "Metahaku", tutkii metahakukoneita, jotka voivat lähettää kyselyn samanaikaisesti useille Internet-hakukoneille ja sitten kerätä ja käsitellä tulokset yhdessä käyttöliittymässä.

    Luku 4, "Semanttiset ja visuaaliset Internet-hakukoneet", on yleiskatsaus kokeellisista järjestelmistä, jotka tarjoavat alkuperäisiä käyttöliittymät, sekä mielenkiintoisia lähestymistapoja kyselyjen käsittelyyn.

    Luku 5, "Suosituskoneet", esittelee äskettäin uusia hakupalvelut, englanniksi osuvasti nimeltään "Discovery Engines", eli "löytökoneet". Niiden avulla voit käsitellä useita kyselyitä, jotka ovat liian vaikeita muun tyyppisille Internet-hakukoneille.

    Jos mikään valmis tuote ei sovi sinulle, voit luoda oman Internet-hakukoneesi. Luku 6, "Henkilökohtaiset hakukoneet", on omistettu tällaisten henkilökohtaisten koneiden luomiselle.

    Useat kirjamme luvut on omistettu etsimiselle erilaisia ​​tyyppejä verkon sisältöä. Luku 7, "Kuvanhaku", esittelee Internet-kuvahaun tämänhetkiset suuntaukset sekä siihen liittyvien kokeellisten järjestelmien ominaisuudet. Luku 8, "Videohaku", tarjoaa yleiskatsauksen johtavien yleisten Internet-hakukoneiden videohakutyökaluista sekä tämän alueen parhaista erikoisjärjestelmistä.

    Luku 9, "Piilotetun sisällön löytäminen" on yleiskatsaus järjestelmiin, joiden avulla voit etsiä sisältöä, jota yleiset hakukoneet eivät näe. Tällaista "piilotettua" sisältöä ovat esimerkiksi torrentit tai FTP-palvelimilla ja tiedostojen isännöintisivustoilla isännöidyt tiedostot.

    Luku 10, "Search for Web 3.0", esittelee Internet-hakutyökalut semanttisen Webin muodoissa oleville tiedoille.

    Haku ei pääty vain tulosten saamiseen yhdestä tai toisesta hakukoneesta. Kirjamme viimeinen luku, luku 11, "Apuohjelmat", on omistettu tulosten käsittelyn ja tallentamisen työkaluille.

    Ennen kuin aloitat tarinan tietyistä tuotteista, on järkevää ymmärtää luokittelu nykyaikaiset keinot Internet-haku sekä määritellä termit, jotka näkyvät jatkuvasti kirjamme sivuilla.

    Tärkeimmät Internet-hakutyökalut voidaan jakaa seuraaviin pääryhmiin:

    Hakukoneet;

    Web-hakemistot;

    Ohjeresurssit;

    Paikalliset ohjelmat Internetistä etsimiseen.

    Suosituimmat hakuvälineet ovat hakukoneet - niin sanotut Internet-hakukoneet (Search Engines). Kolme parasta johtajaa globaalissa mittakaavassa ovat melko vakaita - Google, Yahoo! ja Bing. Monissa maissa omat paikalliset hakukoneet, jotka on optimoitu työskentelemään paikallisen sisällön kanssa, lisätään tähän luetteloon. Heidän avullaan voit teoriassa löytää minkä tahansa tietyn sanan monien miljoonien sivustojen sivuilta.

    Monista eroista huolimatta kaikki Internetin hakukoneet toimivat samanlaisilla periaatteilla ja koostuvat teknisestä näkökulmasta samanlaisista alijärjestelmistä.

    Hakukoneen ensimmäinen rakenteellinen osa on erikoisohjelmat, joita käytetään automaattiseen hakuun ja sitä seuraavaan verkkosivujen indeksointiin. Tällaisia ​​ohjelmia kutsutaan yleensä roboteiksi tai roboteiksi. He katsovat verkkosivujen koodia, löytävät niillä olevia linkkejä ja löytävät siten uusia verkkosivuja. On olemassa vaihtoehtoinen tapa sisällyttää sivusto hakemistoon. Monet hakukoneet tarjoavat resurssien omistajille mahdollisuuden lisätä itsenäisesti sivusto tietokantaansa. Verkkosivut kuitenkin ladataan, analysoidaan ja indeksoidaan. Ne korostavat rakenteellisia elementtejä, etsivät avainsanoja ja määrittävät niiden yhteydet muihin sivustoihin ja verkkosivuihin. Suoritetaan myös muita toimintoja, joiden tuloksena muodostuu hakukoneen indeksitietokanta. Tämä tietokanta on minkä tahansa hakukoneen toinen pääelementti. Tällä hetkellä ei ole olemassa yhtä täysin täydellistä hakemistotietokantaa, joka sisältäisi tiedot kaikesta Internetin sisällöstä. Koska eri hakukoneet käyttävät erilaisia ​​verkkosivujen hakuohjelmia ja rakentavat hakemistonsa eri algoritmeilla, hakukoneiden hakemistotietokannat voivat vaihdella huomattavasti. Useat hakukoneet indeksoivat joitakin sivustoja, mutta vain yhden hakukoneen tietokantaan sisältyy aina tietty prosenttiosuus resursseista. Tällaisen alkuperäisen ja ei-päällekkäisen hakemiston osan läsnäolo jokaisessa hakukoneessa antaa meille mahdollisuuden tehdä tärkeä käytännön johtopäätös: jos käytät vain yhtä hakukonetta, jopa suurinta, menetät varmasti tietyn prosenttiosuuden hyödyllisistä linkeistä. .

    Ammattimainen Internet-haku vaatii erikoisohjelmistoja sekä erikoistuneita hakukoneita ja hakupalveluita.

    OHJELMAT

    http://dr-watson.wix.com/home – ohjelma on suunniteltu tutkimaan tekstitiedon joukkoja kokonaisuuksien ja niiden välisten yhteyksien tunnistamiseksi. Työn tuloksena on raportti tutkittavasta kohteesta.

    http://www.fmsasg.com/ - yksi maailman parhaista ohjelmista yhteyksien ja suhteiden visualisointiin Sentinel Vizualizer. Yritys on venäläistänyt tuotteet kokonaan ja yhdistänyt venäjänkielisen hotlinen.

    http://www.newprosoft.com/ – "Web Content Extractor" on tehokkain, helppokäyttöisin ohjelmisto tietojen poimimiseen web-sivustoilta. Siinä on myös tehokas Visual Web -hämähäkki.

    SiteSputnik sillä ei ole analogia maailmassa ohjelmistopaketti, jonka avulla voit etsiä ja käsitellä sen tuloksia näkyvässä ja näkymättömässä Internetissä käyttämällä kaikkia käyttäjän tarvitsemia hakukoneita.

    WebSite-Watcher – voit seurata verkkosivuja, mukaan lukien salasanalla suojatut, seurantafoorumit, RSS-syötteet, uutisryhmät, paikalliset tiedostot. Omistaa tehokas järjestelmä suodattimet. Valvonta suoritetaan automaattisesti ja toimitetaan käyttäjäystävällisessä muodossa. Edistyneillä toiminnoilla varustettu ohjelma maksaa 50 euroa. Päivitetään jatkuvasti.

    http://www.scribd.com/ on maailman suosituin alusta ja sitä käytetään yhä enemmän Venäjällä erilaisten asiakirjojen, kirjojen jne. lähettämiseen. ilmainen pääsy erittäin kätevällä hakukoneella otsikoille, aiheille jne.

    http://www.atlasti.com/ on tehokkain ja tehokkain työkalu laadulliseen tiedon analysointiin yksittäisten käyttäjien, pienten ja jopa keskisuurten yritysten käytettävissä. Ohjelma on monikäyttöinen ja siksi hyödyllinen. Siinä yhdistyvät kyky luoda yhtenäinen tietoympäristö erilaisten teksti-, taulukko-, ääni- ja videotiedostojen käsittelyä varten yhtenä kokonaisuutena sekä työkalut laadulliseen analysointiin ja visualisointiin.

    Ashampoo ClipFinder HD – yhä suurempi osa tiedonkulusta tulee videosta. Näin ollen kilpailevat tiedusteluvirkailijat tarvitsevat työkaluja, joiden avulla he voivat työskennellä tämän muodon kanssa. Yksi tällainen tuote on tarjoamamme ilmainen apuohjelma. Sen avulla voit etsiä videoita määritettyjen kriteerien perusteella videotiedostojen tallennussivustoilta, kuten YouTube. Ohjelma on helppokäyttöinen, näyttää kaikki hakutulokset yhdelle sivulle, jossa on yksityiskohtaiset tiedot, otsikot, kesto, aika, jolloin video on ladattu tallennustilaan jne. Siellä on venäläinen käyttöliittymä.

    http://www.advego.ru/plagiatus/ – ohjelman ovat tehneet SEO-optimoijat, mutta se soveltuu varsin hyvin Internetin tiedustelutyökaluksi. Plagiointi osoittaa tekstin ainutlaatuisuuden asteen, tekstin lähteet ja tekstin osuvuuden prosenttiosuuden. Ohjelma tarkistaa myös määritetyn URL-osoitteen ainutlaatuisuuden. Ohjelma on ilmainen.

    http://neiron.ru/toolbar/ – sisältää lisäosan yhdistämistä varten Google haku ja Yandex, ja mahdollistaa myös kilpailuanalyysin, joka perustuu sivustojen tehokkuuden arviointiin ja kontekstuaalista mainontaa. Toteutettu FF:n ja GC:n liitännäisenä.

    http://web-data-extractor.net/ on universaali ratkaisu minkä tahansa Internetistä saatavilla olevan tiedon hankkimiseen. Tietojen leikkaamisen määrittäminen miltä tahansa sivulta tapahtuu muutamalla hiiren napsautuksella. Sinun tarvitsee vain valita data-alue, jonka haluat tallentaa, ja Datacol valitsee automaattisesti kaavan tämän lohkon leikkaamiseksi.

    CaptureSaver on ammattimainen Internet-tutkimustyökalu. Yksinkertaisesti korvaamaton työohjelma, jonka avulla voit kaapata, tallentaa ja viedä mitä tahansa Internet-tietoa, mukaan lukien ei vain verkkosivut, blogeja, mutta myös RSS-uutisia, sähköpostia, kuvia ja paljon muuta. Siinä on laajin toiminnallisuus, intuitiivinen käyttöliittymä ja naurettava hinta.

    http://www.orbiscope.net/en/software.html – web-seurantajärjestelmä edulliseen hintaan.

    http://www.kbcrawl.co.uk/ – ohjelmisto työhön, mukaan lukien "Invisible Internet".

    http://www.copernic.com/en/products/agent/index.html – ohjelman avulla voit tehdä hakuja yli 90 hakukoneella yli 10 parametrin avulla. Voit yhdistää tuloksia, poistaa päällekkäisyyksiä, estää rikkinäiset linkit ja näyttää osuvimmat tulokset. Saatavilla ilmaisina, henkilökohtaisina ja ammattimaisina versioina. Käyttää yli 20 miljoonaa käyttäjää.

    Maltego on täysin uusi ohjelmisto, jonka avulla voit määrittää kohteiden, tapahtumien ja esineiden suhteen tosielämässä ja Internetissä.

    PALVELUT

    Uusi - nettiselain kymmenillä esiasennetuilla OSINT-työkaluilla.

    – tehokas hakukone-aggregaattori ihmisten löytämiseen päävenäläisellä kielellä sosiaalisissa verkostoissa.

    https://hunter.io/ on tehokas palvelu sähköpostin tunnistamiseen ja tarkistamiseen.

    https://www.whatruns.com/ on helppokäyttöinen mutta tehokas skanneri, jonka avulla voit selvittää, mikä verkkosivustolla toimii ja mikä ei ja mitkä sen tietoturva-aukot ovat. Toteutettu myös Chromin laajennuksena.

    https://www.crayon.co/ on amerikkalainen budjettialusta markkinoiden ja kilpailutiedon saamiseksi Internetissä.

    http://www.cs.cornell.edu/~bwong/octant/ – isäntätunniste.

    https://iplogger.ru/ – yksinkertainen ja kätevä palvelu jonkun toisen IP-osoitteen määrittämiseen.

    http://linkurio.us/ on tehokas uusi tuote talousturvatyöntekijöille ja korruptiotutkijoille. Käsittelee ja visualisoi valtavia määriä jäsentämätöntä tietoa rahoituslähteistä.

    http://www.intelsuite.com/en – englanninkielinen verkkoalusta kilpailutiedon ja -valvontaan.

    http://yewno.com/about/ on ensimmäinen käyttöjärjestelmä tiedon muuntamiseen tiedoksi ja jäsentämättömän tiedon visualisoimiseen. Tukee tällä hetkellä englantia, ranskaa, saksaa, espanjaa ja portugalia.

    https://start.avalancheonline.ru/landing/?next=%2F – Andrey Masalovitšin ennuste- ja analyyttiset palvelut.

    https://www.outwit.com/products/hub/ – täydellinen sarja itsenäisiä ohjelmia ammattimaiseen web 1 -työskentelyyn.

    https://github.com/search?q=user%3Acmlh+maltego – Maltegon laajennukset.

    http://www.whoishostingthis.com/ – hakukone isännöinnille, IP-osoitteille jne.

    http://appfollow.ru/ – sovellusten analyysi arvosteluihin, ASO-optimointiin, App Storen, Google Playn ja Windows Phone Storen hakutuloksiin, top-sijoituksiin ja hakutuloksiin.

    http://spiraldb.com/ on Chromin laajennukseksi toteutettu palvelu, jonka avulla voit saada paljon arvokasta tietoa mistä tahansa sähköisestä resurssista.

    https://millie.northernlight.com/dashboard.php?id=93 - ilmainen palvelu, kerätä ja jäsentää keskeisiä tietoja toimialan ja yrityksen mukaan. On mahdollista käyttää tekstianalyysiin perustuvia tietopaneeleja.

    http://byratino.info/ – asiatietojen kerääminen julkisesti saatavilla olevista Internetin lähteistä.

    http://www.datafox.co/ – CI-alusta kerää ja analysoi tietoja asiakkaita kiinnostavista yrityksistä. Siellä on demo.

    https://unwiredlabs.com/home - erikoissovellus, jossa on API, jonka avulla voidaan etsiä minkä tahansa Internetiin yhdistetyn laitteen maantieteellisen sijainnin perusteella.

    http://visualping.io/ – palvelu sivustojen ja ennen kaikkea niillä olevien valokuvien ja kuvien seurantaan. Vaikka valokuva näkyisi hetken, se tulee olemaan sähköposti tilaaja Sisältää laajennuksen Google Chromelle.

    http://spyonweb.com/ on tutkimustyökalu, joka mahdollistaa minkä tahansa Internet-resurssin syvällisen analyysin.

    http://bigvisor.ru/ – palvelun avulla voit seurata tiettyjen tavara- ja palvelusegmenttien tai tiettyjen organisaatioiden mainoskampanjoita.

    http://www.itsec.pro/2013/09/microsoft-word.html – Artem Ageevin käyttöohjeet Windows-ohjelmat kilpailutiedon tarpeisiin.

    http://granoproject.org/ on avoimen lähdekoodin työkalu lähdekoodi tutkijoille, jotka seuraavat yksilöiden ja organisaatioiden välisiä yhteysverkostoja politiikan, talouden, rikollisuuden jne. Voit yhdistää, analysoida ja visualisoida eri lähteistä saatua tietoa sekä näyttää merkittäviä yhteyksiä.

    http://imgops.com/ – palvelu metatietojen poimimiseen graafiset tiedostot ja työskentelemään heidän kanssaan.

    http://sergeybelove.ru/tools/one-button-scan/ – pieni online-skanneri verkkosivustojen ja muiden resurssien tietoturva-aukkojen tarkistamiseen.

    http://isce-library.net/epi.aspx – palvelu ensisijaisten lähteiden etsimiseen käyttämällä englanninkielistä tekstiä

    https://www.rivaliq.com/ on tehokas työkalu kilpailutiedon suorittamiseen Länsi-, ensisijaisesti Euroopan ja Amerikan tavara- ja palvelumarkkinoilla.

    http://watchthatpage.com/ on palvelu, jonka avulla voit automaattisesti kerätä uusia tietoja valvotuista Internet-resursseista. Palvelu on ilmainen.

    http://falcon.io/ on eräänlainen Rapportive for the Web. Se ei korvaa Rapportivea, mutta tarjoaa lisätyökaluja. Sitä vastoin Rapportive tarjoaa yleisen profiilin henkilöstä, ikään kuin se olisi liimattu yhteen sosiaalisten verkostojen tiedoista ja maininnoista http://watchthatpage.com/ - palvelu, jonka avulla voit kerätä automaattisesti uusia tietoja valvotuista resursseista Internetissä. Palvelu on ilmainen.

    https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – Firefoxin lisäosa. Valvoo verkkosivujen päivityksiä. Hyödyllinen verkkosivustoille, joilla ei ole uutissyötteitä (Atom tai RSS).

    http://agregator.pro/ – uutis- ja mediaportaalien kokoaja. Markkinoijat, analyytikot jne. analysoida tiettyjä aiheita koskevia uutisvirtoja.

    http://price.apishops.com/ – automaattinen verkkopalvelu valittujen tuoteryhmien, tiettyjen verkkokauppojen ja muiden parametrien hintojen seurantaan.

    http://www.la0.ru/ on kätevä ja asianmukainen palvelu Internet-resurssien linkkien ja käänteisten linkkien analysointiin.

    www.recordedfuture.com on tehokas työkalu tietojen analysointiin ja visualisointiin, joka toteutetaan pilvilaskentaan rakennettuna verkkopalveluna.

    http://advse.ru/ on palvelu, jonka iskulause on "Ota selvää kilpailijoistasi". Mahdollistaa kilpailijoiden verkkosivustojen hankkimisen hakukyselyiden mukaisesti ja kilpailijoiden mainoskampanjoiden analysoinnin Googlessa ja Yandexissä.

    http://spyonweb.com/ – palvelun avulla voit tunnistaa sivustot, joilla on samat ominaisuudet, mukaan lukien ne, jotka käyttävät samoja Google Analytics -tilastopalvelun tunnisteita, IP-osoitteita jne.

    http://www.connotate.com/solutions – tuotevalikoima kilpailutiedon hallintaan, tietovirtojen hallintaan ja tiedon muuntamiseen tietovaroiksi. Se sisältää sekä monimutkaisia ​​alustoja että yksinkertaisia, halpoja palveluita, jotka mahdollistavat tehokkaan seurannan, tiedon pakkaamisen ja vain tarvittavien tulosten saamisen.

    http://www.clearci.com/ - kilpailukykyinen tietoalusta erikokoisille yrityksille aloittavista ja pienistä yrityksistä Fortune 500 -yrityksiin.

    http://startingpage.com/ on Googlen lisäosa, jonka avulla voit tehdä hakuja Googlessa tallentamatta IP-osoitettasi. Tukee täysin kaikkia hakukoneita Googlen ominaisuudet, myös venäjäksi.

    http://newspapermap.com/ on ainutlaatuinen palvelu, joka on erittäin hyödyllinen kilpailukykyiselle tiedusteluviranomaiselle. Yhdistää maantieteellisen sijainnin online-mediahakukoneeseen. Nuo. valitset kiinnostavan alueen tai jopa kaupungin tai kielen, näet paikan kartalta ja luettelon sanoma- ja aikakauslehtien verkkoversioista, napsautat sopivaa painiketta ja luet. Tukee venäjän kieltä, erittäin käyttäjäystävällinen käyttöliittymä.

    http://infostream.com.ua/ on erittäin kätevä uutistenseurantajärjestelmä "Infostream", joka erottuu ensiluokkaisesta valikoimasta ja joka on helppokäyttöinen kaikille lompakoille, yhdestä Internet-haun klassikoista, D.V.

    http://www.instapaper.com/ on erittäin yksinkertainen ja tehokas työkalu tarvittavien web-sivujen tallentamiseen. Voidaan käyttää tietokoneissa, iPhoneissa, iPadeissa jne.

    http://screen-scraper.com/ – voit automaattisesti poimia kaikki tiedot verkkosivuilta, ladata suurimman osan tiedostomuodoista ja syöttää tiedot automaattisesti eri lomakkeisiin. Se tallentaa ladatut tiedostot ja sivut tietokantoihin ja suorittaa monia muita erittäin hyödyllisiä toimintoja. Toimii kaikilla tärkeimmillä alustoilla, sillä on täysin toimivat ilmaiset ja erittäin tehokkaat ammattiversiot.

    http://www.mozenda.com/ - joilla on useita tariffisuunnitelmat sekä verkkopalvelu monitoimiseen web-seurantaan ja käyttäjälle tarpeellisen tiedon toimittamiseen valituilta sivustoilta, jopa pienyritysten käytettävissä.

    http://www.recipdonor.com/ - palvelun avulla voit automaattisesti seurata kaikkea, mitä kilpailijoiden verkkosivuilla tapahtuu.

    http://www.spyfu.com/ – ja tämä on jos kilpailijasi ovat ulkomaisia.

    www.webground.su on Internet-hakuammattilaisten luoma palvelu Runetin seurantaan, mukaan lukien kaikki tärkeimmät tiedon, uutisten jne. tarjoajat, jotka pystyvät yksittäisiä asetuksia seurantaa käyttäjän tarpeiden mukaan.

    HAKUKONEET

    https://www.idmarch.org/ on laadultaan paras hakukone maailman pdf-dokumenttien arkiston löytämiseen. Tällä hetkellä yli 18 miljoonaa pdf-dokumenttia on indeksoitu kirjoista salaisiin raportteihin.

    http://www.marketvisual.com/ on ainutlaatuinen hakukone, jonka avulla voit etsiä omistajia ja ylintä johtoa koko nimen, yrityksen nimen, aseman tai näiden yhdistelmän perusteella. Hakutuloksissa ei ole vain etsimiäsi kohteita, vaan myös niiden yhteyksiä. Suunniteltu ensisijaisesti englanninkielisille maille.

    http://worldc.am/ on hakukone vapaasti saatavilla oleville valokuville, jotka on linkitetty maantieteelliseen sijaintiin.

    https://app.echosec.net/ on julkinen hakukone, joka kuvailee itseään edistyneimmäksi analyyttiseksi työkaluksi lainvalvonta- ja turvallisuus- ja tiedustelualan ammattilaisille. Mahdollistaa eri sivustoilla, sosiaalisilla alustoilla ja sosiaalisilla verkostoilla julkaistujen valokuvien etsimisen suhteessa tiettyihin maantieteellisiin koordinaatteihin. Tällä hetkellä on yhdistetty seitsemän tietolähdettä. Vuoden loppuun mennessä heidän lukumääränsä on yli 450. Kiitos Dementylle vinkistä.

    http://www.quandl.com/ on seitsemän miljoonan rahoitus-, talous- ja sosiaalisen tietokannan hakukone.

    http://bitzakaz.ru/ – hakukone tarjouksille ja valtion tilauksille, joissa on lisätoimintoja

    Website-Finder - mahdollistaa sivustojen löytämisen, joita Google ei indeksoi hyvin. Ainoa rajoitus on, että se hakee vain 30 verkkosivustolta kullakin avainsanalla. Ohjelma on helppokäyttöinen.

    http://www.dtsearch.com/ on tehokas hakukone, jonka avulla voit käsitellä teratavuja tekstiä. Toimii työpöydällä, webissä ja intranetissä. Tukee sekä staattista että dynaamista dataa. Mahdollistaa haun kaikista MS Office -ohjelmista. Haku suoritetaan käyttämällä lauseita, sanoja, tunnisteita, indeksejä ja paljon muuta. Ainoa saavutettava järjestelmä liittoutunut haku. Siitä on sekä maksullinen että ilmainen versio.

    http://www.strategator.com/ – etsii, suodattaa ja kokoaa tietoa yrityksestä kymmenistä tuhansista verkkolähteistä. Hakuja Yhdysvalloissa, Isossa-Britanniassa ja suurimmissa ETY-maissa. Se on erittäin relevantti, käyttäjäystävällinen ja sisältää ilmaisia ​​ja maksullisia vaihtoehtoja (14 dollaria kuukaudessa).

    http://www.shodanhq.com/ – epätavallinen hakukone. Välittömästi ilmestymisensä jälkeen hän sai lempinimen "Google hakkereille". Se ei etsi sivuja, mutta määrittää IP-osoitteet, reitittimien tyypit, tietokoneet, palvelimet ja työasemat, jotka sijaitsevat tietyssä osoitteessa, ja jäljittää ketjuja DNS-palvelimet ja voit toteuttaa monia muita mielenkiintoisia toimintoja kilpailukykyä varten.

    http://search.usa.gov/ on kaikkien Yhdysvaltain hallituksen virastojen verkkosivustojen ja avoimien tietokantojen hakukone. Tietokannat sisältävät paljon käytännöllistä, hyödyllistä tietoa myös maassamme käytettäväksi.

    http://visual.ly/ – visualisointia käytetään nykyään yhä enemmän tiedon esittämiseen. Tämä on ensimmäinen infografiikkahakukone verkossa. Hakukoneen ohella portaalissa on tehokkaat tiedon visualisointityökalut, jotka eivät vaadi ohjelmointitaitoja.

    http://go.mail.ru/realtime – etsi keskusteluja aiheista, tapahtumista, objekteista, aiheista reaaliajassa tai muokattavassa ajassa. Aiemmin paljon kritisoitu haku Mail.ru:ssa toimii erittäin tehokkaasti ja tarjoaa mielenkiintoisia, osuvia tuloksia.

    Zanran on juuri lanseerattu, mutta toimii jo hyvin. Se on ensimmäinen ja ainoa hakukone, joka hakee tietoja PDF-tiedostoja, EXCEL-taulukot, tiedot HTML-sivuilla.

    http://www.ciradar.com/Competitive-Analysis.aspx on yksi maailman parhaista tiedonhakujärjestelmistä syväverkon kilpailutiedon saamiseksi. Hakee lähes kaikentyyppisiä tiedostoja kaikissa muodoissa kiinnostavasta aiheesta. Toteutettu verkkopalveluna. Hinnat ovat enemmän kuin kohtuullisia.

    http://public.ru/ – Tehokas haku ja ammatillinen tiedon analysointi, media-arkisto vuodesta 1990. Verkkomediakirjasto tarjoaa laajan valikoiman tietopalveluita venäjänkielisten mediajulkaisujen sähköisistä arkistoista ja valmiista temaattisista lehdistökatsauksista yksilölliseen seurantaan ja lehdistömateriaaliin perustuvaan eksklusiiviseen analyyttiseen tutkimukseen.

    Cluuz on nuori hakukone, jolla on runsaasti mahdollisuuksia kilpailukykyiseen älykkyyteen erityisesti englanninkielisessä Internetissä. Sen avulla voit paitsi etsiä, myös visualisoida ja luoda yhteyksiä ihmisten, yritysten, verkkotunnusten, sähköpostien, osoitteiden jne. välillä.

    www.wolframalpha.com – huomisen hakukone. Vastauksena hakupyyntöön se tarjoaa tilastollisia ja tosiasiallisia tietoja, jotka ovat saatavilla pyyntöobjektista, mukaan lukien visualisoidut tiedot.

    www.ist-budget.ru – yleinen haku julkisten hankintojen, tarjouskilpailujen, huutokauppojen jne. tietokannoista.




Yläosa