Hem › Internet › Program för att söka på internet. Professionell sökning efter information på Internet. Bestämma en persons namn via e-post

Program för att söka på internet. Professionell sökning efter information på Internet. Bestämma en persons namn via e-post

PROFESSIONELL INFORMATIONSÖKNING PÅ INTERNET

Internetsökning är en viktig del av arbetet på Internet. Knappast någon vet med säkerhet det exakta antalet webbresurser på det moderna Internet. Hur som helst handlar det om miljarder. För att kunna använda den information som behövs vid ett givet ögonblick, oavsett för arbete eller underhållning, måste du först hitta den i denna ständigt påfyllda ocean av resurser.

För att en internetsökning ska bli framgångsrik måste två villkor vara uppfyllda: frågorna måste vara välformulerade och de måste ställas på lämpliga platser. Det krävs med andra ord att användaren å ena sidan ska kunna översätta sina sökintressen till sökfrågans språk och å andra sidan ha goda kunskaper sökmotorer, tillgängliga sökverktyg, deras fördelar och nackdelar, vilket gör att du kan välja de mest lämpliga sökverktygen i varje specifikt fall.

För närvarande finns det ingen enskild resurs som uppfyller alla krav på internetsökning. Därför, om du tar din sökning på allvar, måste du oundvikligen använda olika verktyg och använda varje i det mest lämpliga fallet.

Grundläggande Sökverktyg på Internetkan delas in i följande huvudgrupper:

Sökmotorer;

Webbkataloger;

Hjälpresurser;

Lokala program för att söka på Internet.

De mest populära sökverktygen ärsökmotorer– de så kallade sökmotorerna på Internet (Search Engines). De tre bästa ledarna på global nivå är ganska stabila - Google, Yahoo! och Bing. I många länder läggs deras egna lokala sökmotorer, optimerade för att arbeta med lokalt innehåll, till denna lista. Med deras hjälp kan du teoretiskt hitta vilket specifikt ord som helst på sidorna på många miljoner webbplatser. Ur användarens synvinkel är den största nackdelen med sökmotorer den oundvikliga närvaroninformationsbrusi resultaten. Detta är det vanliga namnet för resultat som av en eller annan anledning ingår i söklistan och som inte motsvarar förfrågan.

Trots många skillnader fungerar alla sökmotorer på Internet enligt liknande principer och består ur teknisk synvinkel av liknande delsystem. Den första strukturella delen av sökmotorn är specialprogram, används för automatisk sökning och efterföljande indexering av webbsidor. Sådana program brukar kallas spindlar eller bots. De tittar på webbsidors kod, hittar länkar på dem och upptäcker därigenom nya webbsidor. Det finns också alternativt sätt inkludering av webbplatsen i indexet. Många sökmotorer erbjuder resursägare möjligheten att självständigt lägga till en webbplats i sin databas. Men webbsidorna laddas sedan ner, analyseras och indexeras. De lyfter fram strukturella element, hittar nyckelord och bestämmer deras kopplingar till andra webbplatser och webbsidor. Andra operationer utförs också, vars resultat är bildandet av en sökmotorindexdatabas. Denna databas är det andra huvudelementet i alla sökmotorer. För närvarande finns det ingen enda absolut komplett indexdatabas som skulle innehålla information om allt innehåll på Internet. Eftersom olika sökmotorer använder olika sökprogram för webbsidor och bygger sitt index med olika algoritmer, kan sökmotorindexdatabaser variera avsevärt. Vissa webbplatser indexeras av flera sökmotorer, men det finns alltid en viss procentandel av resurserna som ingår i databasen för endast en sökmotor. Närvaron av en sådan original och icke-överlappande del av indexet i varje sökmotor gör att vi kan dra en viktig praktisk slutsats: om du bara använder en sökmotor, även den största, kommer du definitivt att förlora en viss procentandel av användbara länkar .

Nästa del av internetsökmotorn är själva sök- och sorteringsprogrammen. Dessa program löser två huvudproblem: för det första hittar de sidor och filer i databasen som matchar den inkommande begäran, och sorterar sedan den resulterande datamatrisen i enlighet med olika kriterier. Framgång med att uppnå sökmål beror till stor del på effektiviteten i deras arbete.

Det sista elementet i en sökmotor på Internet är användargränssnittet. Utöver de vanliga kraven på estetik och bekvämlighet för alla webbplatser, har sökmotorgränssnitt ett annat viktigt krav: de måste erbjuda olika verktyg för att komponera och förtydliga frågor, samt sortera och filtrera resultat. Fördelarna med sökmotorer är utmärkt täckning av källor, relativt snabb uppdatering av databasinnehåll och ett bra val ytterligare funktioner.

Det huvudsakliga verktyget för att arbeta med sökmotorer är en fråga.

För internetsökningar används även speciella applikationer som är installerade på den lokala datorn. Det kan vara som enkla program, och ganska komplexa komplex av datasökning och analys. De vanligaste är sökplugins för webbläsare, webbläsarpaneler utformade för att fungera med en specifik söktjänst och metasökpaket med möjligheter att analysera resultat.

Webbkataloger – det här är resurser där webbplatser är indelade i tematiska kategorier. Om användaren bara arbetar med sökmotorer genom frågor, är det i katalogen möjligt att se tematiska avsnitt i sin helhet. Den andra grundläggande skillnaden mellan kataloger och automatiska sökmotorer är att människor som regel är direkt involverade i deras fyllning, som tittar på resurser och klassificerar webbplatsen i en eller annan kategori. Webbkataloger är vanligtvis indelade i universella och tematiska. Universella sådana försöker täcka så många ämnen som möjligt. Du kan hitta allt i dem: från webbplatser om poesi till datorresurser. Med andra ord är deras sökbredd maximal. Tematiska kataloger är specialiserade på ett specifikt ämne och ger maximalt sökdjup genom att minska bredden på resurstäckningen.

Fördelarna med kataloger är jämförelsevis hög kvalitet resurser, eftersom varje webbplats på den ses och väljs av en person. Tematisk gruppering av webbplatser gör att du enkelt kan ordna webbplatser med liknande ämnen. Detta funktionssätt är bra för att upptäcka webbplatser som är nya för dig om ett ämne av intresse - det är mer exakt än att använda en sökmotor. Det rekommenderas att använda webbkataloger för den första bekantskapen med något ämnesområde, såväl som att söka efter vaga frågor - du kommer att ha möjlighet att "vandra" genom katalogens avsnitt och mer exakt bestämma vad du behöver.

Nackdelarna med webbkataloger är kända. Först och främst är detta en långsam påfyllning av databasen, eftersom inkluderingen av en webbplats i katalogen kräver mänskligt deltagande. När det gäller effektivitet är en webbkatalog inte en konkurrent till sökmotorer. Dessutom är webbkataloger betydligt sämre än sökmotorer när det gäller databasstorlek.

När vi pratar om internetsökning kan vi inte bortse från ett antal termer som är nära besläktade med detta område och som ofta används för att beskriva och utvärdera sökmotorer. Till exempel: bredd och djup Internetsökning. En bred sökning är en som fångar så många informationskällor som möjligt. I det här fallet anses åtminstone ett omnämnande av en eller annan plats lämplig för begäran vara tillräckligt. Sökdjup hänvisar till detaljerna i indexering och efterföljande sökning av varje specifik resurs. Till exempel, många sökmotorer närmar sig indexering av olika webbplatser på olika sätt. Stora och populära webbplatser indexeras maximalt. Robotar försöker att inte missa en enda sida av en sådan resurs. Samtidigt kan bara titelsidan och ett par innehållssidor på andra webbplatser indexeras. Dessa omständigheter påverkar naturligtvis efterföljande sökningar. Djupsökning fungerar enligt principen "det är bättre att inkludera onödig information i resultaten än att missa någon information som är relevant för sökämnet."

Ganska ofta kan man stöta på sådana begrepp som globala och lokala Internetsökning. Lokala internetsökningar tar hänsyn till användarens geografiska plats och ger företräde till resultat som på något sätt är relaterade till ett specifikt land eller ort. Vid en global sökning tas inte hänsyn till denna information, och sökningen utförs i alla tillgängliga resurser.

När du skriver en fråga på internetsökmotorer fungerar olika söklägen. Typiska söklägen som finns på de flesta internetmaskiner inkluderar: enkelt och avancerat Sök. En enkel sökning låter dig ange endast en sökfunktion i en begäran. Avancerad sökning gör det möjligt att skapa en fråga från flera villkor, koppla dem till logiska operatorer.

För att förfina sökfrågor, olika filter . Filter är sådana eller andra hjälpmedel för att skapa en fråga som inte relaterar till innehållssidan i frågevillkoren, utan begränsar sökresultaten med någon formell funktion. Så, till exempel, när man använder ett filtypsfilter vid sökning, förser användaren inte systemet med information relaterad till ämnet för hans begäran, utan begränsar helt enkelt resultaten som erhålls till en viss filtyp som anges i villkoret för hans begäran.

För de flesta användare är universella sökmotorer det främsta, och ofta det enda sättet att söka på Internet. De erbjuder bra täckning av källor, samt en uppsättning verktyg som är tillräckliga för att lösa grundläggande sökproblem.

Marknaden för universella sökmotorer är ganska stor. Vi försökte analysera de mest kända sökmotorerna och presenterade resultaten i tabell 1.

När du väljer en universell sökmotor spelar kvaliteten på de resurser som hittas med dess hjälp en viktig roll. Du kan bestämma den föredragna sökmotorn för specifika uppgifter med hjälp av "markeringsmetoden". Dess kärna är att först en viss tematisk Sök fråga, varefter en grupp människor - experter på detta område - undersöks för att identifiera de bästa, enligt deras åsikt, internetresurser om det valda ämnet. Baserat på undersökningsdata genereras en lista över markörplatser som garanterat är relevanta för begäran och innehåller information av hög kvalitet. Förfrågan skickas sedan till de testade sökmotorerna. Logiken i bedömningen är enkel: ju högre markörsidorna är placerade i sökresultaten, desto bättre är en viss resurs lämplig för att söka information om ett testämne.

I mitten av 2015 hade det globala Internet redan anslutit 3,2 miljarder användare, det vill säga nästan 43,8 % av jordens befolkning. Som jämförelse: För 15 år sedan var endast 6,5 % av befolkningen Internetanvändare, det vill säga antalet användare har ökat mer än 6 gånger! Men vad som är mer imponerande är inte de kvantitativa, utan de kvalitativa indikatorerna för utbyggnaden av implementeringen av internetteknik inom olika områden av mänsklig aktivitet: från global kommunikation av sociala nätverk till hushållsinternetsaker. Mobilt internet gav användare möjlighet att vara online utanför kontoret och hemma: på resande fot, utanför staden i naturen.
För närvarande finns det hundratals system för att söka information på Internet. De mest populära av dem är tillgängliga för de allra flesta användare eftersom de är gratis och lätta att använda: Google, Yandex, Nigma, Yahoo!, Bing..... För mer erfarna användare, "avancerad sökning"-gränssnitt och specialiserade " sociala nätverk” sökningar är tillgängliga , enligt nyhetsflöden och köp- och försäljningsannonser... Men alla dessa underbara sökmotorer har en betydande nackdel, som jag redan noterat ovan som en fördel: de är gratis.
Om investerare investerar miljarder dollar i utvecklingen av sökmotorer, så uppstår en helt lämplig fråga: var tjänar de pengar?
Och de tjänar pengar, i synnerhet genom att tillhandahålla som svar på användarförfrågningar inte så mycket information som skulle vara användbar ur användarens synvinkel, utan den som ägarna av sökmotorer anser vara användbar för användaren. Detta görs genom att manipulera ordningen i vilken listor med svar på användarnas sökfrågor presenteras. Här är öppen reklam av vissa Internetresurser, och dold manipulation av svarens relevans baserat på sökmotorägarnas kommersiella, politiska och ideologiska intressen.
Därför, bland professionella specialister på att söka efter information på Internet, är problemet med relevanta sökmotorresultat mycket relevant.
Relevans är överensstämmelsen mellan dokument som hittats av ett informationshämtningssystem och användarens informationsbehov, oavsett hur fullständigt och hur exakt detta informationsbehov uttrycks i texten i själva informationsbegäran. Detta är förhållandet mellan mängden användbar information och den totala mängden mottagen information. Grovt sett är detta sökeffektivitet.
Specialister som gör kvalificerade sökningar efter information på Internet måste göra vissa ansträngningar för att filtrera sökresultaten och rensa bort onödig information "brus". Och för detta används sökverktyg på professionell nivå.
Ett av dessa professionella system är det ryska programmet FileForFiles & SiteSputnik (SiteSputnik).
Utvecklare Alexey Mylnikov från Volgograd.

"Programmet FileForFiles & SiteSputnik (SiteSputnik) är utformat för att organisera och automatisera professionell sökning, insamling och övervakning av information som publiceras på Internet. Särskild uppmärksamhet ägnas åt att få ny inkommande information om ämnen av intresse. Flera informationsanalysfunktioner har implementerats."

Övervakning och kategorisering av informationsflöden

Först några ord om övervaka informationsflöden, varav ett specialfall är övervakning av media och sociala nätverk:

användaren anger de källor som kan innehålla den nödvändiga informationen och reglerna för att välja denna information;

programmet laddar ner färska länkar från källor, befriar deras innehåll från skräp och upprepningar och ordnar dem i sektioner enligt reglerna.

För att se live en enkel men verklig övervakningsprocess, som involverar 6 källor och 4 rubriker:
öppna demoversionen av programmet;

klicka sedan på knappen i fönstret som visas Tillsammans;

och när WebbplatsSputnik kommer att genomföra detta projekt i realtid, du:
— i listan "Clean Stream" kommer du att se all ny information från källor,
- i avsnittet "Efter begäran" - endast ekonomiska och finansiella nyheter som uppfyller regeln,
- i rubrikerna "Om presidenten", "Om premiären" och "Centralbanken", - information om relevanta objekt.

I riktiga projekt kan du använda nästan valfritt antal källor och rubriker.
Du kan skapa dina första fungerande projekt på några timmar och förbättra dem under drift.
Den beskrivna informationsbehandlingen är tillgänglig i SiteSputnik Pro+News-paketet och högre.

2. Enkel och batchsökning, informationsinsamling

Att bekanta sig med möjligheterna SiteSputnik Pro(grundläggande version av programmet) :

öppna demoversionen av programmet;

ange din första begäran, till exempel ditt fullständiga namn, som jag gjorde:
och klicka på knappen Sök.

Programmet (se skylten som SiteSputnik byggde) kommer att ställa frågor om några sekunder 7 källor, öppnas i dem 24 söksidor, kommer att hitta 227 relevanta länkar, kommer att ta bort dubbletter av länkar och från de återstående 156 unik lista med länkar "En förening".

namn
Källa
Beordrade
sidor
Nedladdat
sidor
Hittades
länkar
Tid
Sök
Effektivitet
Sök
Länkar
Ny
Effektivitet
Ny
Yandex 5 5 50 0:00:05 32% 0 0
Google 5 5 44 0:00:03 28% 0 0
Yahoo 5 5 50 0:00:05 32% 0 0
Vandrare 5 4 56 0:00:07 36% 0 0
MSN (Bing) 5 3 23 0:00:04 15% 0 0
Yandex.Bloggar 5 1 1 0:00:01 1% 0 0
Google.Bloggar 5 1 3 0:00:01 2% 0 0
Total: 35 24 227 0:00:26 — 0 0
Totalt: antal unika länkar - 156 , dubbletter av länkar - 46 %.

(! ) Upprepa din begäran efter några timmar eller dagar, så ser du bara nya länkar som förekom i källorna för denna tidsperiod. I de två sista kolumnerna i tabellen kan du se hur många nya länkar varje källa kom med och dess effektivitet i termer av "nyhet". När en fråga exekveras flera gånger, en lista som endast innehåller nya länkar , skapas i förhållande till alla tidigare exekveringar av denna begäran. Det verkar elementärt och önskad funktion, men författaren känner inte till något program där det är implementerat.

(!! ) De beskrivna funktionerna stöds inte bara för individuella förfrågningar, utan också för hela begära paket :
Paketet som du ser består av sju olika frågor som samlar information om Vasily Shukshin från flera källor, inklusive sökmotorer, Wikipedia, exakt sökning i Yandex-nyheter, metasökning och sökning efter omnämnanden på TV- och radiostationer. Till manuset TV och radio inkluderar: "Channel One", "TV Russia", NTV, RBC TV, "Echo of Moscow", radiobolaget "Mayak", ... och andra informationskällor. Varje källa har sitt eget sök- eller surfdjup på sidor. Det är listat i den tredje kolumnen.
Med batchsökning kan du utföra omfattande sökningar med ett klick insamling av information på ett givet ämne.
Separat lista nya länkar, vid upprepade körningar av paketet, kommer endast att innehålla länkar som inte tidigare hittades.
Kom ihåg vad och när du frågade Internet och vad det svarade dig Behövs inte- allt sparas automatiskt i bibliotek och i programdatabaser.
Jag upprepar att de funktioner som beskrivs i det här stycket är helt inkluderade i paketet SiteSpunik Pro.

Mer information i instruktionerna: SiteSputnik Pro för nybörjare.

namn Källa	Beordrade sidor	Nedladdat sidor	Hittades länkar	Tid Sök	Effektivitet Sök
*Yandex*	5	5	50	0:00:05	32%
*Google*	5	5	44	0:00:03	28%
*Yahoo*	5	5	50	0:00:05	32%
*Vandrare*	5	4	56	0:00:07	36%
*MSN (Bing)*	5	3	23	0:00:04	15%
*Yandex.Bloggar*	5	1	1	0:00:01	1%
*Google.Bloggar*	5	1	3	0:00:01	2%
*Total:*	35	24	227	0:00:26	—

3. Objekt och sökövervakning

Ganska ofta ställs användaren inför följande uppgift. Du måste ta reda på vad som finns på Internet om ett specifikt objekt: en person eller ett företag. Till exempel när du anställer en ny medarbetare eller när en ny motpart dyker upp så vet du alltid hela namnet, företagsnamnet, telefonnummer, INN, OGRN eller OGRNIP, du kan även ta ICQ, Skype och lite annan data. Nästa, med hjälp av en vädjan till speciell funktion program WebbplatsSputnik "Samla information om objektet" (Utrustning SiteSputnik Pro+Objekt):
Du anger de uppgifter du känner till, och med ett musklick utför du exakt Och full söka efter länkar som innehåller specificerad information. Sökningen utförs på flera sökmotorer samtidigt, med alla detaljer på en gång, med flera möjliga kombinationer av inspelningsdetaljer samtidigt: kom ihåg hur du kan skriva ner ett telefonnummer på olika sätt. Efter en viss tid, utan att göra tråkigt rutinarbete, kommer du att få en lista med länkar, rensade från upprepningar och, viktigast av allt, sorterade efter relevans för objektet du letar efter. Relevans (signifikans) uppnås på grund av det faktum att den första i SiteSputniks sökresultat kommer att vara de länkar som stor kvantitet uppgifterna du angav, och inte de som flyttade upp sökmotorns resultat för den webbansvariga.
Viktig .
SiteSputnik-programmet är bättre än andra program på att extrahera verklig, men inte officiell information om objektet. Till exempel i den officiella databasen Mobil operatör det kan registreras att telefonen tillhör Vasily Terekhin, men i verkligheten innehåller den här telefonen information om att Alexander sålde en Ford Focus-bil 2013, vilket är ytterligare information till eftertanke.
Sökövervakning .
Sökövervakning innebär följande. Om du behöver spåra händelsen nya länkar, av ett givet objekt eller slumpmässig paket med frågor, då behöver du bara periodvis upprepa motsvarande sökning. Samma som för en enkel begäran, programmet SiteSputnik kommer att skapa en "Ny" lista, där den endast kommer att placera de länkar som inte hittades i någon av de tidigare sökningarna.
Sökövervakning intressant inte bara i sig. Det kan vara inblandat i övervakning av media, sociala nätverk och andra nyhetskällor, som nämndes ovan i punkt 1. Till skillnad från andra program, där det är möjligt att få ny information endast från RSS-flöden, i programmet WebbplatsSputnik kan användas för detta sökningar inbyggda i webbplatser Och sökmotorer . Också möjligt tävlan(självskapande) flera RSS-flöden från godtyckliga sidor, dessutom emulering av ett RSS-flöde på begäran och till och med en grupp förfrågningar.

För att få ut så mycket som möjligt av programmet, använd dess huvudfunktioner, nämligen:

begära paket, paket med parametrar, använd Assembler (assembler), operationen "Analytisk sammanslagning" av resultaten av flera uppgifter, om nödvändigt, tillämpa grundläggande sökfunktioner på det osynliga Internet;

koppla dina källor till de informationskällor som är inbyggda i programmet : andra sökmotorer och sökningar inbyggda i webbplatser, befintliga RSS-flöden skapade av dig egna RSS-flöden Med slumpmässig sidor, använd sökfunktionen för nya källor;

använda följande typer av funktioner övervakning: Media, sociala nätverk och andra källor, övervakning kommentarer för nyheter och meddelanden, spåra utseendet på ny information på befintliga sidor;

förlova sig Kategorier , Externa funktioner, Schemaläggare, e-postlista, flera datorer, Projektinstruktör, installera larm För att meddela dig om händelsen av betydande händelser, använd de andra funktionerna nedan.

4. SiteSputnik-program (SiteSputnik): alternativ och funktioner

- Program SiteSputnik förbättras ständigt inom följande områden: "Jag måste hitta allt och med garanti".
"Frågeprogram för Internet", - en annan definition av Användaren för att tilldela programmet.
A. Funktioner för att söka och samla in information.
. Begär paket - körning av flera frågor samtidigt, kombinerande sökresultat eller separat. När det kombinerade resultatet genereras tas länkar som hittas upprepade gånger bort. Mer information om paket finns i introduktionen till SiteSputnik och visuellt i videon: en led Och separat verkställande av förfrågningar. Det finns inga analoger i inhemsk och utländsk utveckling.
. Paket med parametrar. Alla frågor och frågepaket utformade för att lösa vanliga sökuppgifter, till exempel sök efter telefonnummer, fullständigt namn eller e-post, - kan parametriseras, sparas och exekveras från ett bibliotek av färdiga frågor med ersättning av faktiska (nödvändiga) parametervärden. Varje paket med parametrar är sin egen specialitet avancerat sökformulär . Den kan använda inte en utan flera sökmotorer. Du kan skapa formulär som är mycket komplexa i sitt funktionella syfte. Det är oerhört viktigt att formulär kan skapas av användarna själva, utan deltagande av programförfattaren eller programmeraren. Detta är mycket enkelt skrivet i instruktionerna, mer detaljer i en separat publikation om sökparameterisering och på forumet, tydligt i videon: sök efter alla alternativ för att spela in ett nummer på en gång mobiltelefon och enligt flera alternativ för att registrera adressen E-post. Det finns inga analoger.
. Assemblerare NY- sammanställa en sökuppgift från flera färdiga sådana : förfrågningar, förfrågningspaket och parameterpaket. Paketen kan innehålla andra paket i sin text. Djupet av paketkapsling är obegränsat. Du kan skapa flera sökuppgifter, till exempel om flera juridiska personer och individer, och utföra dessa uppgifter samtidigt. Mer information på forumet och i en separat publikation om Assembler, tydligt på video. Det finns inga analoger.
. Metasök - exekvering av en specifik begäran samtidigt på ett givet "djup" av sökningen för var och en av dem. Metasearch är möjligt med hjälp av inbyggda sökmotorer, som inkluderar Yandex, Rambler, Google, Yahoo, MSN (Bing), Mail, Yandex och Google-bloggar och anslutna sökverktyg. Att arbeta med flera sökmotorer ser ut som att du arbetar med en sökmotor . Återhittade länkar raderas. Visuellt metasök på tre anslutna sociala nätverk: VKontakte, Twitter och Youtube - visas på video.
. Metasök på sajten - kombinera webbplatssökning i Google, Yahoo, Yandex, MSN (Bing). Klart på video.
. Metasökning i kontorsdokument - kombinera sökning i filer PDF-format, XLS, DOC, RTF, PPT, FLASH i Google, Yahoo, Yandex, MSN (Bing). Du kan välja vilken kombination av filformat som helst.
. Metasök efter cache-kopior länkar i Yandex, Google, Yahoo, MSN (Bing). En lista sammanställs, vars varje objekt innehåller alla utdrag som hittas för varje länk av varje sökmotor. Det finns inga analoger.
. Deep Search för Yandex, Google och Rambler låter dig kombinera till en lista alla länkar från den vanliga sökningen respektive alla länkar från listorna "Mer från webbplatsen", "Ytterligare resultat från webbplatsen" och "Sök på webbplatsen (Totalt) ...)”. Läs mer om djupsökning på forumet. Det finns inga analoger.
. Exakt och fullständig sökning . Det betyder följande. Å ena sidan kan varje fråga exekveras på det och endast på den källa på vars frågespråk den är skriven. Detta exakt sökning. Å andra sidan kan det finnas ett godtyckligt antal sådana förfrågningar och källor. Detta ger fullständig sökning. Läs mer i ett separat inlägg om procedursökning. Det finns inga analoger.
. Söker på det osynliga internet .
Den innehåller följande grundläggande funktioner:
Ett speciellt paket med förfrågningar som kan förbättras av användaren,
- sök efter osynliga länkar med en spindel,
- sök efter osynliga länkar i närheten av en synlig länk eller mapp med "bild och likhet",
- speciella sökningar efter öppna mappar,
- sök efter osynliga länkar och mappar med standardnamn med hjälp av speciella ordböcker,
- användning av dina egna sökningar inbyggda i webbplatser.
Mer information i en separat publikation på SiteSputnik Invisible. De grundläggande funktionerna är "välkända i snäva kretsar", men sättet de används på har inga analoger. Kärnan i denna metod är att bygga en webbplatskarta som är synlig från Internet (med andra ord materialisera det synliga Internet), och endast på basis av synliga länkar och söka efter osynliga länkar i förhållande till dem. Sökning efter redan synliga länkar med "osynliga" metoder utförs inte.
B. Informationsövervakningsfunktioner.
. Övervakning för framträdande på Internet ny länkar om ett visst ämne. Övervaka utseendet ny länkar kan användas med heltal begära paket , som involverar någon av sökmetoderna som nämns ovan, snarare än enskilda sökmotors förstasidor. Genomfört förbund och korsning ny länkar från flera separata sökningar. Mer information finns i publikationen om övervakning (se § 1) och på forumet. Det finns inga analoger.
. Kollektiv informationsbehandling . Skapande företags- eller professionellt nätverk för kollektiv insamling, övervakning och analys av information. Deltagarna och skaparna av ett sådant nätverk är företagsanställda, medlemmar av en professionell community eller intressegrupper. Det geografiska läget för deltagarna spelar ingen roll. Mer information i en separat publikation om att organisera ett nätverk för kollektiv insamling, övervakning och analys av information.
. Övervakning länkar (webbsidor) för att upptäcka ändringar i deras innehåll (innehåll). Betaversion. Hittade ändringar markeras med färg och specialsymboler. Mer information i en separat publikation om övervakning (se 2 och 3 §).
I. Informationsanalysfunktioner.
. Kategorier av material redan beskrivits ovan. Mer information finns i en separat publikation om Rubrics. Regler för att ange rubriker låter dig ange nyckelord och avståndet mellan dem, ställa in logiska "AND", "ELLER" och "NOT", tillämpa en parentesstruktur på flera nivåer och ordlistor (infoga filer) som logiska operationer kan tillämpas på.
. VF-teknik - nästan godtycklig expansion av möjligheten att kategorisera material genom implementering av externa funktioner som är organiskt integrerade i reglerna för inmatning av rubriker och kan implementeras av programmeraren självständigt utan deltagande av programförfattaren.
. Numerisk analys inflyttning av Rubriks, installation larm och meddelande om förekomsten av betydande händelser genom att markera rubrikerna i färg och/eller skicka en larmrapport via e-post.
. Saklig relevans. Det finns en möjlighet att ordna länkarna i ordning nära betydelse dessa länkar i förhållande till problemet som ska lösas, förbi tricks av webbansvariga som använder olika sättöka webbplatsrankingen i sökmotorerna. Detta uppnås genom att analysera resultaten av att utföra flera "mångfaldiga" frågor om ett givet ämne. I ordets bokstavliga bemärkelse, länkar som innehåller maximal information som krävs . Läs mer i beskrivningen av hur du hittar den optimala leverantören och på forumet. Det finns inga analoger.
. Beräkna objektrelationer - söka efter länkar, resurser (sajter), mappar och domäner där objekt nämns samtidigt. De vanligaste föremålen är människor och företag. För att söka efter anslutningar kan alla programverktyg som nämns på denna sida användas SiteSputnik, vilket avsevärt ökar effektiviteten i det arbete du utför. Operationen utförs på valfritt antal objekt. Mer detaljer i introduktionen till programmet, samt i beskrivningen ny funktion"objekt och deras kopplingar." Det finns inga analoger.
. Bildande, integration och korsning av informationsflöden om en mängd olika ämnen, jämförelse av trådar. Mer information i ett separat inlägg på trådar.
. Bygga webbkartor webbplatser, resurser, mappar och genomsökta objekt baserat på de som finns på Internet när Google hjälp, Yahoo, Yandex, MSN (Bing) och Altavista länkar som hör till webbplatsen. Experter kan ta reda på: är det synligt "extra" information från Internet på deras webbplatser, såväl som undersökningskonkurrenters webbplatser om detta ämne. Webbplatskarta är materialisering av det synliga internet . Mer information i en separat publikation om att bygga webbkartor, visuellt på video. Det finns inga analoger.
. Att hitta nya informationskällor om ett givet ämne, som sedan kan användas för att spåra uppkomsten av ny relevant information. Mer information på.
G. Servicefunktioner.
. Schemaläggaren ger arbete Schemalagd: utför specificerade programfunktioner vid en given tidpunkt. Mer information i en separat publikation om Planeraren.
. Projektinstruktör NY- det här är en assistent skapande och underhåll Projekt för att söka, samla in, övervaka och analysera information (kategorisering och signalering). Mer information på forumet.
. Automatisk arkivering. I databaser Alla resultat av ditt arbete kommer automatiskt ihåg, nämligen: förfrågningar, förfrågningspaket, sök- och övervakningsprotokoll, någon annan av ovanstående funktioner och resultaten av deras exekvering. Burk strukturera arbeta med ämnen och underämnen.
. Databas inkluderar sortering, enkel sökning och anpassad sökning med SQL-fråga. För det senare finns en guide för att skapa SQL-frågor. Med hjälp av dessa verktyg kan du hitta och granska det arbete du gjorde igår, förra månaden, för ett år sedan, definiera ett ämne som ett sökkriterium eller ställa in ett annat sökkriterium baserat på innehållet i databasen.
. Tekniska begränsningar sökmotorer. Vissa begränsningar, som längden på frågesträngen, kan övervinnas. Det säkerställer att inte en, utan flera sökfrågor utförs, kombinerade sökresultat eller separat. Du kan läsa om ett sätt att övervinna brott mot lagen om additivitet för stora sökmotorer. För ett ord eller en fras inom citattecken genomförs en skiftlägeskänslig sökning i sökmotorer, i synnerhet sökning med förkortningar.
Inbyggt webbläsare . Navigatör per sida. Flerfärgad markör för att markera nyckelord och godtyckliga ord. Bilisting och N-listning från genererade dokument.
. Avlastning nyhetsflöden till en tabellvy fokuserad på importera i Excel, MySQL, Access, Kronos och andra applikationer.

5. Installation och start av programmet, datorkrav.

För att installera och köra programmet:

Ladda ner filen, kopiera mappen FileForFiles från den till din HDD till exempel på D:\;

Demoversion av programmet kommer att installeras och den kommer att öppnas.

Programmet fungerar på alla datorer som det är installerat på Windows vilket som helst versioner.
Prata om vad i vår tid informationsteknik och den oändliga tillväxten i mängden data som är tillgänglig för både individen och samhället, det finns många problem med att bearbeta information och söka efter den - detta är redan hädelse. Vem tar inte upp detta ämne? Och för att inte belasta dig med subjektiva och delvis objektiva bedömningar hämtade från olika informationskällor angående problemet, kommer jag att gå direkt till dess lösning. Idag ska vi prata om sökning. Det vill säga om program och seriösa informationssystem som söker efter de dokument och data vi behöver.
Uppgradera "direktsökning"
För inte så länge sedan, när träden var stora, och information även in lokalt nätverk det fanns inte så många företag, någon sökning utfördes genom en banal sökning av en handfull tillgängliga filer och en sekventiell kontroll av deras namn och innehåll. En sådan sökning kallas direkt, och program (verktyg) som använder direktsökningsteknik finns traditionellt i alla operativsystem och verktygspaket. Men även kraften moderna datorer inte tillräckligt för snabb och adekvat sökning i gigantiska datamängder vid direktsökning. Att söka igenom ett par hundra dokument på en disk och söka i ett enormt bibliotek och flera dussin brevlådor är två olika saker. Därför bleknar direktsökningsprogram idag tydligt i bakgrunden - if vi pratar om om universella medel.
Naturligtvis har denna typ av sökning inte efterfrågats på länge inom företagssektorn. Volymerna är inte desamma. Och därför är tekniker som snabbt och exakt kan söka efter dokument i olika format och från olika källor mer än relevanta i många år nu, och nyligen helt klart. För inte så länge sedan tillkännagav Microsofts "far" Bill Gates, uppenbarligen avundsjuk på den fenomenala framgången för internetsökmotorn Google, vid en av presskonferenserna mjukvaruindustrins (och inte bara) önskan att bidra på alla möjliga sätt, utveckla och fördjupa skapandet av sökmotorer och tekniker. Men det är för tidigt att skapa något fenomenalt fungerande program från Microsoft eller en konkurrerande server på Internet (MSN når fortfarande inte Google). Låt oss därför vända oss till befintlig utveckling. Index, fråga, relevans
I kärnan modern teknik det finns två grundläggande processer. För det första är det att indexera den tillgängliga informationen och bearbeta begäran med efterföljande utdata av resultaten. När det gäller det första, vilket program som helst (vare sig det är en sökmotor för stationära datorer, företag Informationssystem eller Internetsökmotor) skapar sitt eget sökområde. Det vill säga att den bearbetar dokument och genererar ett index över dessa dokument (en organiserad struktur som innehåller information om de behandlade uppgifterna). I framtiden är det det skapade indexet som används för arbete - snabbt få en lista över nödvändiga dokument enligt begäran. Vad som följer, även om det inte på något sätt är enkelt när det gäller teknik, är ganska förståeligt för den genomsnittlige användaren. Programmet behandlar begäran (med hjälp av en nyckelordsfras) och visar en lista över dokument som innehåller denna nyckelordsfras. Eftersom informationen finns i ett strukturerat index går frågebehandlingen betydligt (tiotals och hundratals gånger!) snabbare än vid direktsökning (valet av dokument görs inte genom att söka igenom filer utan genom att analysera textinformation i indexet).
Programmet visar de hittade dokumenten i den resulterande listan efter relevans - dokumentets överensstämmelse med frågetexten. I olika tekniker finns det naturligtvis olika metoder för att söka och bestämma relevansen av ett dokument (antalet "förekomster" av ett ord och dess omnämningsfrekvens i dokumentet, förhållandet mellan dessa parametrar och det totala antalet ord i dokumentet, avståndet mellan orden i frågefrasen i de sökta filerna och så vidare). Baserat på dessa parametrar bestäms dokumentets "vikt" och beroende på den visas en viss fil i resultatlistan på en viss position. När det gäller internetsökning är situationen ännu mer komplicerad. Faktum är att i det här fallet måste många andra faktorer beaktas (Googles Page Rank är ett exempel på detta). Men det här är ett ämne för en separat artikel, så vi kommer inte att röra Internet Granskning av sökmotorer
Detta material undersöker kapaciteten hos flera populära sökprogram som kan skryta med både anständiga hastigheter och bra funktionalitet. Men att visa upp sig i broschyrer är en sak, men att stå under en experts blick är en helt annan. Och det fanns inga fler experter, inte mindre ett kontor fullt av människor som gillade att mixtra med programvaran för dess användbarhet. På en experimentdator (Athlon 2,2 MHz, med en kapacitet random access minne 1 GB, 160 GB Seagate 7200 rpm IDE-hårddisk och Windows-system XP) installerades en uppsättning program: dtSearch Desktop, Ischeyka Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. För tester sammanställdes en textdatabas med dokument i doc, txt och html allmänt storleken är varken mer eller mindre, utan 20 gigabyte. En grupp kamrater under ledning av din ödmjuka tjänare testade, jämförde och delade med sig av sina subjektiva intryck av varje programvara. Läs en sammanfattning av resultaten nedan. dtSearch Desktop
Ett program som, enligt utvecklarna, säger sig vara den snabbaste, bekvämaste och bästa sökmotorn. Som i allmänhet alla andra från denna recension. Gränssnittet för dtSearch är ganska enkelt, men vissa fönster eller flikar är något överbelastade med element, vilket gör att det verkar svårt att använda. Men i verkligheten finns det inga särskilda svårigheter. Den enda riktigt obehagliga punkten är programvarans brist på stöd för det ryska språket (trots att programmet kan söka efter dokument på flera språk är dess gränssnitt uteslutande engelska).
Men dtSearch är ett av få program som kan indexera webbsidor till ett användarspecificerat "djup" (om än med hänsyn till "extra köp" av dtSearch Spider-tilläggssatsen). Detta är förutom att stödja diskfiler av olika textformat och e-postmeddelanden från brevlåda Syn. Samtidigt kan programmet inte fungera med databaser, som är en så läcker bit för sökmotorer på grund av de stora mängderna information som finns i dem och deras breda spridning i företag, och därför i företagsnätverk. Hastigheten för att indexera dtSearch-dokument visade sig vara på rätt nivå. Framöver kommer jag att säga att detta program klarade indexeringen av en given mängd information på nivå med en annan konkurrent - iSYS - och delade med den andra platsen i listan över de mest snabba system. dtSearch indexerade ett test på 20 gigabyte information på 6 timmar och 13 minuter, vilket skapade ett index på 7,9 GB för efterföljande sökbehov.
När det gäller sökfunktionerna, här är de på rätt nivå. För det första har dtSearch en morfologisk sökning (sökning efter ett ord i alla dess morfologiska former). Använder sig av den här möjligheten, frigör du dig från, säg, sådana tankar som "i vilket fall användes ett visst ord i dokumentet jag behövde?" Användningen av morfologisk sökning är nästan alltid motiverad, så den bör finnas i alla professionella sökmotorer.
Sök efter ljud är en icke-standardfunktion även för professionella sökmotorer. Dess kärna är att programmet kommer att söka efter ord som låter likadant som det ord du skrev in. Och det bästa är att den här funktionen också fungerar för det ryska språket! När du till exempel skriver ordet "öra" i en sökfråga ser du inte bara orden "öra" utan också "öra" som ett resultat.
Sökning med felkorrigering är en mycket viktig funktion. Det används för att söka efter ord som innehåller syntaktiska fel - dessa kan vara antingen stavfel eller fel i dokument som erhållits med hjälp av teckenigenkänningssystem, till exempel. Ett enkelt exempel - du letar efter ordet tangentbord. Vissa dokument innehåller ordet "tangentbord", det är uppenbart att detta faktiskt är ordet "tangentbord", personen gjorde precis ett stavfel när han skrev. Så en felkorrigeringssökning kommer att upptäcka och inkludera ett dokument med ordet "tangentbord" i resultatet. Det finns också en inställning i dtSearch som låter dig bestämma graden av möjliga felaktiga tecken.
Sök med synonymer. Den här funktionen använder en lista med synonymer för olika ord. Så, till exempel, genom att ange ordet "snabb", kommer programmet också att hitta orden "höghastighet" och andra som är synonymer för ordet "snabb", om de, naturligtvis, finns i listan över synonymer . En färdig lista med synonymer medföljer inte dtSearch-programmet, men det är möjligt att använda listor på Internet (därför krävs en anslutning, vilket inte alltid är bekvämt), eller så kan du skapa din egen lista med synonymer .
Utöver de listade funktionerna kan dtSearch söka med fraser som består av ord kopplade med logiska operationer. Varje ord i en fråga kan tilldelas sin egen "vikt", det vill säga betydelse. Ett användbart alternativ är att använda en ordbok som består av oviktiga ord för att inte ta hänsyn till dem vid sökning, men även denna ordbok är tom och du måste fylla i den själv.
Låt oss sedan titta på programmets möjligheter när du arbetar på nätverket. Faktum är att dtSearch inte erbjuder några specifika funktioner för att arbeta med nätverket. Det är dock fullt möjligt att använda det online. Alternativt kan du skapa något slags index och lägga det i en offentlig (delad) mapp. Själva programmet kan installeras på varje användares dator, eller det kan också placeras i en mapp som är öppen för allmänhetens tillgång, och skapa speciella genvägar för varje användare separat med hjälp av parametrarna kommandorad, vars syfte beskrivs i hjälpfilen som medföljer programmet. Det finns också en möjlighet automatisk installation program till nätverket med hjälp av MSI-fil. Detta kommer att ta hänsyn till inställningarna för varje ansluten användare.
Generellt sett är det ett bra program från kategorin professionella sökmotorer. Det kan kvalificera sig för ett bra betyg, men att få förtroende och respekt från användare kanske inte är lätt för dtSearch på grund av vissa faktorer (allt är inte smidigt med gränssnittet, ryska användare är berövade, det finns inga ljusa funktioner för att arbeta med nätverket) . När det gäller att direkt söka efter dokument hade programmet inga problem med rysk text. Eftersom det inte fanns några med den deklarerade morfologin, eller med en suddig sökning. Systemet hittade på ett bra sätt de nödvändiga dokumenten både genom en enkel fråga på ett ord och genom att använda ett par stycken eller ett dokument som nyckelfras.
Officiell webbplats:
Distributionsstorlek: 23 Mb Bloodhound Prof Deluxe
Baserat på namnet kan du gissa att det finns stöd för det ryska språket i det här programmet. Det här är redan trevligt. När det gäller gränssnittet är det i allmänhet något ovanligt, men till utseendet är det väldigt attraktivt. En annan sak är bekvämlighet. Ett mycket kontroversiellt kriterium, men förmodligen är en lösning med flera fönster inte det mest framgångsrika alternativet (förfrågan skrivs in i ett fönster, resultatet visas i ett annat och liknande).
Snoop använder samma index för att utföra en snabb sökning, men indexeringen är mycket långsammare än andra program. Detta är mycket märkligt, särskilt med tanke på att dess förmåga att bearbeta sökfrågor är mycket svag, och därför är indexstrukturen inte komplex. Troligtvis beror detta på ooptimerade algoritmer. Detta program visade sig vara en tydlig outsider i indexering och sökhastigheter: tiden som läggs på att skapa ett index är sex gånger längre än för dtSearch och iSYS. Att indexera 20 gigabyte med texter för blodhunden resulterade i 38 timmar och 46 minuters arbete. Och det skapade "sökområdet" tog upp samma storlek på hårddisken som originaldata med ett litet minus - 19 gigabyte.
Bloodhound kan presenteras som ett alternativ till standardsökningen i Windows, det är osannolikt att det kan göra mer. Det faktum att Snoopers primära uppgift är den enklaste sökningen efter filer indikeras inte bara av det lilla antalet funktioner för att analysera texten i sökfrågor och en avancerad sökning efter filattribut, utan även av ett resultatfönster som ger direktlänkar till hittade filerna, samt till mapparna som innehåller dessa filer. Resultatfönstret är inte särskilt informativt i den meningen att du bara kan läsa hela den hittade filen genom att köra den, det vill säga att den inte har en inbyggd filvisare. Men ett utdrag ur filen där det sökta ordet hittades visas i allmänhet, detta visningsschema påminner mycket om sökmotorer på Internet.
På tal om specifika möjligheter för att bearbeta sökfrågor, är det värt att notera att det inte finns något sådant som "söktext" det maximala som kan sökas är en fras, om så bara för att det inte finns något textinmatningsfält med flera rader. Du kan dock analysera den inmatade frasen, och Snoop erbjuder oss en standardsökning här: logiska operationer, masksökning och citatsökning... inte mycket. Programmet innehåller några rudiment av morfologisk sökning, men det är förmodligen så grovt att det med största sannolikhet stör korrekt funktion (under tester har många buggar med felaktig användning av morfologi märkts).
Men programmet låter dig ange filattribut när du söker (dokumentdatum, filnamn, mappnamn), och i dessa frågor kan du också använda samma sökuppsättning. Du kan också söka efter bokstäver genom att ange parametrarna (Från, Ämne..., etc.).
Så vi kom på själva sökningen, vad mer är intressant med programmet, som det fick så många utmärkelser för, enligt information från den officiella webbplatsen? Det är svårt att säga vad som är så speciellt med det, troligen är Bloodhound-gränssnittet attraktivt (exakt till utseendet, för att inte tala om användbarhet).
Operationer med index är mycket standard en trevlig funktion är möjligheten att uppdatera index på ett schema. Dessutom kan index också användas online. Från och med nu behöver vi mer detaljer.
Trots sökfrågornas primitivitet kan programmet användas för att söka efter filer, så dess användning kan motiveras i nätverk. Fast med stor sträckning, eftersom i ett stort nätverk är den prioriterade uppgiften snabbsökning data med hjälp av komplexa sökfrågor på grund av den enorma mängden information - och det finns helt klart problem med sökningens och programmets hastighet. Jag måste säga att arbetet med nätverket på Izhishka är genomtänkt som det ska. En separat applikation är designad speciellt för detta - Bloodhound Server. Det fungerar på samma sätt som helt enkelt Snooper (de har samma sökmotor), bara för dokument som finns på en central server eller på delade resurser V företagsnätverk. Snooper Server skapar nya index på delade resurser eller använder tidigare skapade. Alla användare av företagets nätverk kan ansluta till sökservern och använda den för att komma åt vilket dokument som helst (som finns i det aktuella indexet) med en webbläsare. Håller med, detta schema är extremt bekvämt: det visar sig att filer på ditt eget nätverk kan sökas på samma sätt som information på Internet genom till exempel Google.
När man bedömer alla fördelar och nackdelar med detta program, tyder slutsatsen på att dess kapacitet sannolikt inte räcker för företagsnätverk (trots den goda organisationen av att arbeta med nätverket), utan för en hemdator eller till och med för hemnätverk I princip kan det vara lämpligt. Även om varken arbetshastigheten eller sökmöjligheterna inspirerar till optimism...
Officiell webbplats på ryska:
Distributionsstorlek: 6 MbGoogle Desktop Search + GDS Enterprise

Naturligtvis kunde vi inte ignorera en så berömd utvecklare. namn Google redan säger mycket. Människor som har använt den mest kraftfulla sökmotorn på Internet i flera år kommer säkerligen, utan ett enda tvivel, att besluta sig för att installera just denna sökmotor på sin dator. Tänk bara: Googla på din hemdator! Men utan att ge efter för provokationer med ett brett marknadsfört varumärke, låt oss försöka nyktert, och viktigast av allt objektivt, att överväga kapaciteten hos "desktop"-sökmotorn från Google.
Det första som fångar ditt öga är avsaknaden av ett eget skal för programmet. Google Desktop Search finns fortfarande i webbläsarfönstret, respektive, hela gränssnittet för skrivbordsversionen ärvdes från programvaran från sin äldre Internetbror. Om detta är bra eller dåligt är en omtvistad fråga: vissa människor gillar minimalismen i designen av denna sökmotor, medan andra vill se en fullfjädrad applikation fylld med alla typer av knappar och så vidare.
Vad fångar dig direkt efter designen? Och det faktum att samma Google Desktop Search börjar indexera allt på datorn, utan någon efterfrågan! Och det som är mest intressant är att det är omöjligt att välja indexeringsvägar med Google Desktop Search. Du måste ladda ner ett separat program (TweakGDS), som gör att du kan expandera något Google-inställningar Desktop, inklusive ange de platser som krävs för indexering. Även om den redan kommer att indexera en standardhårddisk när du räknar ut allt detta, så det är mer sannolikt att den här inställningen behövs när du arbetar med stora mängder data, vilket är mycket viktigt när det används i företagsnätverk (Enterprise-versioner) . Det är dock inte ett faktum att efter att ha laddat ner TweakGDS kommer dina problem att lösas. Trots allt behöver hon Microsoft för att fungera. NET Framework och Microsoft Scripting Runtime. Ja... installationen, liksom tillgången till inställningarna, kunde ha gjorts enklare, även om utvecklarna förmodligen kan förstå: varför skriva något nytt när det finns en färdig sökmotor, portade den till lokal dator och låt användaren "njuta", och låt det berömda namnet göra ännu ett mästerverk av "det här". Kom igen, låt oss avsluta denna lyriska utvikning och gå vidare till sökandet.
När det gäller att analysera sökfrågor och leverera resultat är allt här helt identiskt med Google på Internet: samma system för att visa resultat, samma standarduppsättning logiska operationer för sökfrågor. I allmänhet är Google Desktop Search, liksom det tidigare programmet, endast avsett för att söka efter filer - det har naturligtvis inte en intern visningsprogram för dessa filer. Antalet filformat som stöds av Google Desktop Search är ganska tillräckligt, och det är också trevligt att den söker på besökta internetsidor och tar data från cachen. Sök- och indexeringshastigheter är ganska acceptabla. Sant, för hemmabruk. Med imponerande 20 gigabyte Google texter Desktop Search slutförde uppgiften på 8 timmar och 17 minuter. Att spendera flera dagar på att bearbeta information från ett stort företags företagsnätverk är inget någon systemadministratör skulle vilja göra. På plussidan: storleken på det skapade indexet låg på samma nivå (4,5 GB) som en annan sökmotor som testades i denna recension - SearchInform.
Den stora fördelen (eller nackdelen – du bestämmer själv) med Google Desktop Search är att den stöder plugins, vilket kan förändra mycket till det bättre. En annan sak är att att ansluta plugins och ställa in dem komplicerar uppgiften att installera en sökmotor så mycket att du börjar undra om allt detta är nödvändigt när du kan installera ett normalt, fullfjädrat program där allt redan kommer att finnas. När allt kommer omkring, för att använda varje funktion måste du installera ett nytt plugin. Även för att programmet ska fungera fullt ut med arkiv behövs en separat pryl. Det är fascinerande och förföriskt att alla dessa extra moduler är gratis. Men om du inte tar hänsyn till skrivbordsversionen av sökmotorn, kan det hända att en kompetent konfiguration av GDS Enterprise inte ligger inom din makt - trots allt är det inte för inte som specialister från Google erbjuder sina tjänster för att sätta upp sina egna programvara för ditt nätverk för endast $10 000.
Om du går igenom installations- och installationsproceduren (eller betalar 10 000 USD till ett team för snabba svar från Google), kommer du att förstå att komplexiteten i installationen mer än kompenseras av de mycket flexibla inställningarna när de används i företagsnätverk. En viktig punkt Google arbete Desktop i ett företagsnätverk är användningen av grupppolicyer, vilket gör det möjligt att ställa in inställningar för varje användare.
För att sammanfatta, den mest rimliga användningen av detta program är en hem- eller arbetsdator. När allt kommer omkring, för en vanlig dator, räcker det bara att installera programmet - det kommer att göra resten själv (det kommer inte ens att fråga dig något).
Google Desktop Search Enterprise kommer dock att vara acceptabelt i fall där det finns ett akut behov av flexibel konfiguration av nätverkspolicy för att använda sökmotorn, medan förmågan att bearbeta sökfrågor kommer att vara på andra plats i betydelse, och tiden (eller pengarna) ) som spenderas på att sätta upp programmet kommer att hamna på första plats.
Officiell webbplats:
Distributionsstorlek inklusive TweakGDS: 1,2 MbCopernic Desktop Search

Klicka på bilden för att förstora
Programgränssnittet väcker extremt positiva känslor - allt görs i enlighet med allmänt accepterade standarder, inget överflödigt, med ett ord, en trevlig design. För en nybörjare är det mycket enkelt att förstå Copernic Desktop Search-gränssnittet. Även om det är något förvirrande att designers tydligt skapade programgränssnittet med hänsyn till det faktum att programmet kommer att fungera i standard Windows XP-tema. När man använder det klassiska temat ser programmet inte så snyggt ut. Men det här är mer en smaksak.
Vid den första lanseringen uppmanar programmet dig att skapa index för sökning. Det verkade något ovanligt att efter att ha valt mappar för indexering, erbjöd programmet inte att trycka på någon knapp, till exempel "Starta indexering", och indexeringen startade inte automatiskt, först då märktes det att Copernic försökte börja indexera medan datorn var ledig. Du måste gräva lite djupare i programmets alternativ för att konfigurera allt korrekt. Det bör noteras att det finns ganska breda möjligheter för att ställa in automatisk indexskapande: inbyggd schemaläggare, möjligheten att indexera medan datorn är inaktiv, bakgrund, med låg prioritet. Indexeringen gick inte för snabbt - 10 timmar 51 minuter - detta är långsammare än i andra sökmotorer (förutom Isle of Bloodhound, men Copernic är fortfarande en storleksordning snabbare än utvecklingen av iSleuthHound Technologies.
Nu om indexets struktur. I allmänhet är det inget speciellt med det. Det är möjligt att välja filtyper, både i allmän och detaljerad form. Det vill säga att du initialt kan välja vad du vill indexera - Dokument, Bilder, Videor, Musik. På den andra fliken i alternativfönstret kommer du att kunna välja specifika filtyper efter förlängning. Dessutom kan du konfigurera indexet så att till exempel bilder som är mindre än 16x16 i storlek inte indexeras eller ljudfiler som är kortare än 10 sekunder inte indexeras. Förutom att indexera filer från mappar kan Copernic arbeta med e-postmeddelanden och kontakter från adressboken Microsoft Outlook och Microsoft Outlook Express, indexering av favoriter och historik från Internet Explorer är möjlig.
När det gäller sökmöjligheterna är de väldigt svaga här. Under tester avslöjades det till och med att programmet inte söker efter dokument i txt- och html-format på ryska, vilket gör att du bara kan hitta dem efter titlar och inte efter innehåll. Det enda programmet tillhandahåller för att förbättra sökeffektiviteten är användningen av en standarduppsättning logiska operationer, och även då upptäcktes denna funktion experimentellt, eftersom den inte var dokumenterad. Förresten, programmets hjälp är inte heller okej - den är bara tillgänglig via Internet, vilket, du ser, är väldigt obekvämt, och det finns inte för mycket hjälpinformation på Internet. Tydligen bestämde utvecklarna att programmets enkla gränssnitt inte innebär närvaron av normal hjälp. För att fortsätta samtalet om sökfunktioner bör det noteras att programmet, trots den svaga analysen av frågor, erbjuder ett intressant söksystem - användaren kan välja typ av filer (bilder, videor, musik, etc.), ange en sökning fråga och välj attribut som är specifika för den valda filtypen. Till exempel, för ljudfiler, kan dessa vara värden från mp3-taggar (artist, album, datum, etc.), för bilder kan du till exempel välja storlek (efter upplösning), i allmänhet har varje typ sin egna inställningar. Efter att ha sökt efter en specifik filtyp kommer programmet att visa en mycket informativ lista i resultatfönstret, och om din förfrågan innehåller filer av andra typer kan du öppna dem genom att klicka på en specifik länk.
Separat är det värt att nämna resultatfönstret. Under listan över hittade filer visas innehållet i dessa filer (ett liknande schema används ofta i e-postklienter). Det är sant att textvisning endast kan göras i det ursprungliga formatet, och det finns inget visningsläge för vanlig text, vilket inte alltid är bekvämt, eftersom att öppna ett dokument i det här fallet tar mer tid. Men med tanke på att Copernic kan söka efter bilder och musik är det möjligt att se dessa multimediafiler.
De grundläggande principerna för driften av detta program beskrivs, nu ska vi se vad Copernic Desktop Search kan erbjuda oss för att arbeta med nätverket... I princip kan du titta väldigt länge, men du kommer knappast att kunna se något . Det här programmet var med andra ord inte tänkt att vara nätverksbaserat. Copernic Desktop Search är enbart en sökmotor för hemmet.
Uppenbarligen är den enda (mest logiska) tillämpningen av detta program hemdator. Här kommer den helt att klara alla enkla användarsökningsfrågor som består av ett eller två ord, hittar den nödvändiga informationen och uppdelningen av sökningen efter filtyp och stöd för multimediafiler tillsammans med bakgrundsindexering i lågprioritetsläge, tillsammans med en trevlig gränssnitt, ge bara programmet styrka att vinna förtroende bland oerfarna användare.
Officiell sida
Distributionsstorlek: 2,6 MbISYS Desktop

Klicka på bilden för att förstora
Ett mycket kraftfullt program. När det gäller dess utrustningsnivå med alla möjliga funktioner ligger den någonstans nära nästa SearchInform söksystem på listan. Dessutom är storleken på installationsfilen mer än 40Mb! Det är svårt att säga vad som skulle kunna pressas in i sådana dimensioner, eftersom samma SearchInform, med liknande funktionalitet, tar upp 15 Mb.
Installationsprocessen här är inte heller särskilt trevlig, eller snarare inte ens installationsprocessen. Redan innan du laddar ner programmet kommer du att bli ombedd att registrera dig, annars finns det ingen möjlighet. Nästa, gränssnittet. Det är mycket snyggt gjort, inget onödigt fångar ögat, men det här är intrycken av en person som redan är lite van vid det. Det kommer inte att vara lätt för en nybörjare att ta reda på var och vad som finns, var man ska klicka och var man slutligen ska söka. Det rekommenderas starkt att läsa hjälpen innan du börjar arbeta - du kommer att spara mycket nerver och tid. Till allt annat är den totala bristen på stöd för det ryska språket i programmet. Inte bra. Dessutom är fönstren här inte överbelastade med kontroller, utan vi fick betala för detta med multimoduler och användning av ytterligare fönster. Till exempel läggs sökfrågor in genom att starta ett program och indexhantering utförs med ett annat program. Sökfrågor läggs även in här i separata popup-fönster. Det är svårt att säga vilket som är bättre - ett överbelastat gränssnitt eller allestädes närvarande multi-fönster snarare, det är en smaksak.
När det gäller att skapa index, tillhandahåller programmet funktioner för att förenkla processen att ställa in alternativ för ett nytt index. Dessa funktioner inkluderar flera färdiga mallar att skapa index för mappen "Mina dokument", "Mail", "Mail och dokument", "Specific mapp", "Mapp med ett urval av filtyper" etc. Sådana mallar förenklar skapandet av index i det första steget. Verktyget för att arbeta med index har inte ett särskilt bra gränssnitt, vilket är skrämmande med viss komplexitet (detta är en väldigt subjektiv bedömning, för att vara ärlig), men om du tittar på det ger det många användbara alternativ och i allmänhet , dess användning orsakar inte mycket svårigheter. ISYS Desktop kan indexera data från olika datakällor och tillhandahåller även många flexibla inställningar för sådan indexering. Ytterligare indexeringsfunktioner inkluderar: stöd för SQL, FTP, TRIM Context, WORLDOX 2002, skript. När du skapar ett index, om du valt "Mapp med urval av filtyper" har du möjlighet att välja filtyper för indexering manuellt (i förlängning). Det måste sägas att det helt enkelt finns ett stort antal filtyper som stöds, men du kommer inte att kunna lägga till din egen typ (tillägg) till den befintliga listan. Du kan också notera närvaron av en indexeringsschemaläggare. Att skapa ett index och bearbeta 20 gigabyte med information tog ISYS Desktop 6 timmar och 13 minuter, vilket slutligen visade en bra tid och storleken på den skapade filen - 7,9 GB.
Sökmöjligheterna i detta program är ganska bra. Det som används i ISYS är mycket kraftfullare än konventionellt stöd för logiska operationer. Bland de avancerade sökmöjligheterna erbjuder programmet användning av synonymer och ett sorteringsfilter (efter sökväg, namn och datum för filskapandet). Uppsättningen av logiska operatorer är något bredare än standarduppsättningen. Förutom logiska operationer låter programmet dig arbeta med många andra operatorer, som i princip kan ersätta vissa typer av sökningar, till exempel kan sökning med parsning ersättas helt med hjälp av speciella operatorer. Jag blev mycket förvånad över att programmet inte har en sökning med hjälp av morfologi. Detta är en allvarlig försummelse, eftersom sökeffektiviteten förbättras avsevärt när man använder morfologisk analys. Dessutom finns det ingen lista över betydelsefulla ord, men det finns en omfattande lista över obetydliga ord. Sökfunktioner som "ungefärlig sökning" och "heuristisk analys" annonseras också.
ISYS erbjuder ett urval av flera typer av sökfrågor, nämligen visuella. Detta görs med olika typer av fönster för att ange sökfrågor, men i själva verket tillåter inte ett enda fönster användning av andra tekniker än de som anges ovan.
Sökresultaten är mycket informativa och visas som en lista över dokument sorterade efter relevans. En förhandsgranskning av det valda dokumentet visas nedan. Till skillnad från Copernic Desktop Search är förhandsgranskningen här endast tillgänglig i form av vanlig text. Det var inte möjligt att visa dokument i deras ursprungliga format, vare sig det är Word, Html eller PDF, även om detta i princip inte är alltför kritiskt. Programmet låter dig dela upp hittade dokument i grupper enligt vissa kriterier (som standard är de uppdelade efter relevans). Du kan också se redan hittade dokument genom att välja enskilda mappar (detta är praktiskt när resultatet ger ett mycket stort antal dokument).
Att använda programmet i ett företagsnätverk är också mycket motiverat, eftersom det ger goda möjligheter att organisera nätverkssökningar. Söksystemet bygger på skapandet av ett offentligt index som innehåller indexerad data från allmänt tillgängliga onlineresurser.
Faktum är att programmet från ISYS är värt att uppmärksammas, åtminstone att bekanta sig med det. Det här programmet är ett moget projekt med ett stort antal funktioner (inte alltid och inte alla behöver naturligtvis dem, men ändå). Chanserna att programmet kommer att se några förbättringar när det gäller bearbetning av sökfrågor är okända, men för närvarande kan det rekommenderas för nästan universell användning. Och med tanke på att det fortfarande är för tungt för hemsystem, är de viktigaste platserna för installationen företagsnätverk.
Officiell webbplats:
Distributionsstorlek: 40 MbSearchInform

Klicka på bilden för att förstora
Det är förmodligen inte värt att börja direkt med en beskrivning av SearchInform-gränssnittet. Vi bör först beskriva installationsprocessen, eller snarare en av dess detaljer: du kan inte installera programmet utan en Internetanslutning. Faktum är att innan den första lanseringen kräver programmet användarregistrering (gratis) och skickar all inmatad data till servern. Tydligen var utvecklarna tvungna att vidta sådana åtgärder i kampen mot piratkopiering, men detta hade inte en positiv effekt på installationens enkla.
Programgränssnittet är utformat i enlighet med alla allmänt accepterade regler, men vid första anblicken är det något besvärligt. När du använder programmet för första gången verkar det som att det är för komplicerat, ibland är det inte lätt att komma ihåg i vilken meny eller på vilken flik det önskade alternativet finns, men med längre användning verkar gränssnittet inte längre så fruktansvärt komplicerat . Det viktigaste är att läsa intyget först.
Efter att ha förstått gränssnittet lite kan du börja skapa ett index. Själva processen är väldigt enkel och indexeringshastigheten, även per öga, är betydligt högre än alla andra sökmotorer i recensionen. Tydliga testsiffror visar att SearchInform är dubbelt så snabb som dtSearch och iSYS vad gäller indexeringshastighet! Programmet indexerade den tillhandahållna datan i mängden 20 gigabyte på en rekordtid på 3 timmar och 17 minuter. Och storleken på det skapade indexet visade sig vara den minsta 4,4 GB - 100 megabyte mindre än Google Desktop Search.
Programmet stöder, förutom vanliga filer och mappar, även indexering av e-postmeddelanden, anslutning och indexering av databaser (!) och annat Externa källor(DMS, CRM), omedelbart under indexeringen kan du ange en ordbok för att utföra en morfologisk sökning, och alla filattribut kan indexeras. När du har skapat indexet, när du försöker göra den första testsökningen efter dokument, kan du bli något förvirrad: "det finns två typer av sökning här, men vilken behöver jag?" Som nämnts tidigare är det viktigaste att läsa hjälpen, då blir allt klart. Programmet kan faktiskt utföra två typer av sökningar - frassökning och sökning efter dokument som till innehåll liknar frågetexten.
En beskrivning av alla huvudfunktioner för att analysera en sökfråga gavs ovan, så nu kommer vi bara att lista sökmöjligheterna som tillhandahålls av detta program. Låt oss börja med frassökning: naturligtvis morfologisk sökning, citeringssökning, logiska operationer, sökning med ordanalys (sök i början av ordet, i slutet, i mitten eller en fullständig matchning), blandad citeringssökning ( när alla ord från frågan måste finnas i dokumentet, men inte nödvändigtvis i den angivna ordningen), sök med felkorrigering, användning av synonymer, "nästan citatsökning" (sök på den inmatade frasen som citat, men andra ord kan ev. vara närvarande mellan de inmatade orden) osv. Vissa av alternativen har sina egna specifika inställningar. Dessutom är det möjligt att använda en ordbok med oviktiga ord, och programmet har redan en färdig lista över dessa ord, du kan också använda en ordbok med prioriterade ord för att söka (naturligtvis måste du fylla i den själv).
Här har vi i princip kort gått igenom alla huvuddragen i frassökning.
Låt oss gå vidare för att överväga funktionerna i detta program - leta efter liknande dokument. Utvecklarna hävdar att detta inte på något sätt är en enkel textsökning, det är just en "sökning efter liknande" - det är precis så det beskrivs överallt, men jaja, du kan kalla det vad du vill - huvudpoängen är . En snabb sökning på Internet kan snabbt avslöja att så kallad "liknande sökning" är en nyutveckling inom textanalysområdet. Detta system låter dig hitta texter som liknar semantiskt innehåll. Det roligaste var att efter att ha genomfört testsökningar visade det sig att teorin stämmer ganska väl överens med praktiken! Programmet söker faktiskt efter dokument med liknande innehåll och visar dem i en lista och sorterar dem efter procentandel av likhet.
Låt oss sedan titta på vad SearchInform (i synnerhet dess företagsversion SearchInform Corporate) erbjuder för att arbeta i ett företagsnätverk. Det finns två typer av applikationer: serversidan och användarsidan. Serverdelen bearbetar de angivna indexen oberoende och användare kan använda dem för sökning, beroende på de åtkomsträttigheter som tilldelats dem. Användare kan konfigureras automatiskt med konton Windows (i professionella termer, SearchInform använder NTFS Windows-autentisering) och manuellt (användare måste läggas till separat). Varje användare kan tillåtas eller nekas åtkomst till vissa index, och användare kan också kombineras i grupper. I allmänhet ligger SearchInforms inställningar för att arbeta på nätverket före Google när det gäller flexibilitet och Ishcheika Server när det gäller bekvämlighet och enkelhet.
Officiell webbplats:
Distributionsstorlek: 14,7 Mb Jämförelse av indexeringshastigheter
Söksystem Indexeringstid Indexstorlek
Bloodhound Prof Deluxe 4.5 38 timmar 46 minuter 19 GB
Isys Desktop 7.0 6 timmar 13 minuter 7,9 GB
DtSearch 7.0 6 timmar 3 minuter 8,6 GB
Google Desktop Search Enterprise 8 timmar 17 minuter 4,5 GB
Copernic Desktop Search * 10 timmar 51 minuter 7 GB
SearchInform 1.5.02 3 timmar 17 minuter 4,4 GB
* De flesta av documents.html och .txt som innehöll rysk text, var omöjliga att hitta, även om de var indexerade, förutom genom deras namn
Alla program är värda uppmärksamhet.
Baserat på tester och en noggrann granskning av varje program som presenteras i granskningen kan vissa slutsatser dras. Så, Google Desktop Search Copernic Desktop Search är ganska lämplig för den oerfarna användaren som ett heminformationssökningssystem. De klarar enkla frågor bra, överbelasta inte användaren med inställningar och är dessutom helt gratis. Googles försök att komma in på företagens sökmotormarknad är ännu inte särskilt motiverat: för fullvärdigt arbete programmet behöver laddas med ytterligare moduler, och det är långt ifrån lätt att installera. Därför reserverar de självförklarande namnen Desktop Search, Copernic och Google nischen av "desktop" sökmotorer bakom sig.
Sant, mer kraftfulla lösningar - dtSearch, iSYS och SearchInform är inte heller idiotsäkra och erbjuder användarna deras "desktop"-versioner. Men till ett rimligt pris, till skillnad från gratisprogram från Google och Copernic. Självklart måste du betala för kraft, hastighet och funktionalitet. Men huvudfokus för utvecklarna av dtSearch, iSYS och SearchInform ligger naturligtvis på företagssektorn. Nätverk, funktionalitet, indexering och sökhastighet är det som skiljer dessa produkter från deras "konkurrenter". Baserat på testresultaten identifierades favoriten - SearchInform. Programmet ger möjlighet att söka efter liknande dokument, har den högsta hastigheten för indexering och sökning, har bra set funktioner.

Alexey Kutovenko

Professionell Internetsökning

Introduktion

Internetsökning är en viktig del av arbetet på Internet. Knappast någon vet med säkerhet det exakta antalet webbresurser på det moderna Internet. Hur som helst handlar det om miljarder. För att kunna använda den information som behövs vid ett givet ögonblick, oavsett för arbete eller underhållning, måste du först hitta den i denna ständigt påfyllda ocean av resurser. Detta är inte en lätt uppgift alls, eftersom informationen på det moderna Internet inte är strukturerad, vilket skapar problem med att hitta den. Det är ingen slump att sökmotorer på Internet har blivit unika "fönster" till detta informationsutrymme.

Det är osannolikt att det bland internetanvändare kommer att finnas personer som aldrig har använt stora universella sökmotorer. Namnen Google, Yandex och ett par andra stora maskiner är på allas läppar. De klarar anmärkningsvärt bra med vardagliga sökuppgifter på Internet, och ofta försöker användare inte ens leta efter en ersättare. Samtidigt uppgår antalet sökmotorer på internet i vår tid till tusentals. Anledningarna till en sådan variation av alternativa maskiner har olika rötter. Vissa projekt försöker konkurrera direkt med globala marknadsledare genom noggrant arbete med nationella internetresurser. Andra erbjuder frågefunktioner som inte är tillgängliga från välkända sökmotorer. Ett betydande antal alternativa motorer är specialiserade på att söka efter ett visst ämnesområde eller en viss typ av innehåll, och uppnå imponerande resultat för att lösa dessa problem. Hur som helst, inkluderandet av sådana sökmotorer i en användares egen arsenal av sökverktyg på Internet kan förbättra kvaliteten avsevärt. Det finns dock en nyans här: du måste känna till sådana maskiner och kunna använda deras kapacitet.

Vi antar att läsarna av den här boken redan är ganska bekanta med söktekniker som använder universella sökmotorer. Det var så bra att de kände de begränsningar som var förknippade med deras användning. Troligtvis har sådana människor redan försökt leta efter och använda vissa ytterligare verktyg. Det tryckta ordet ignorerar inte ämnet Internetsökning: artiklar dyker upp med jämna mellanrum och böcker publiceras. Men deras hjältar är som regel desamma - flera ledande universella sökmotorer. Det som gör den här boken annorlunda är att den försöker täcka hela skalan av moderna söklösningar. Här hittar du beskrivningar och rekommendationer för att använda de bästa moderna tjänster inriktad på att lösa de vanligaste sökproblemen. Den här boken är till för personer som arbetar mycket på Internet och använder nätverket för att hitta den information de behöver - oavsett om det är affärer, studier eller hobby.

För att en internetsökning ska bli framgångsrik måste två villkor vara uppfyllda: frågorna måste vara välformulerade och de måste ställas på lämpliga platser. Det krävs med andra ord att användaren dels ska kunna översätta sina sökintressen till sökfrågans språk, dels god kunskap om sökmotorer, tillgängliga sökverktyg, deras fördelar och nackdelar, vilket gör att han kan välja de mest lämpliga sökverktygen i varje specifikt fall .

För närvarande finns det ingen enskild resurs som uppfyller alla krav på internetsökning. Därför, om du tar din sökning på allvar, måste du oundvikligen använda olika verktyg och använda varje i det mest lämpliga fallet.

Det finns många sökverktyg tillgängliga. De kan kombineras i flera grupper, som var och en har vissa fördelar och nackdelar. Kapitlen i vår bok ägnas åt huvudgrupperna av moderna sökmotorer på Internet.

Kapitel 1, "Universella sökmotorer på internet," ägnas åt stora universella system för att hämta information på webben. Huvudfokus ligger på deras mest avancerade instrument, som vanligtvis faller under allmänhetens radar. En genomgång av kapaciteten hos kända maskiner ger oss en slags utgångspunkt och gör att vi tydligt kan föreställa oss tillämpningsområdet för alternativa söklösningar.

Kapitel 2, "Vertikal sökning", talar om system som är specialiserade på specifika ämnesområden eller specifika typer av innehåll.

Kapitel 3, "Metasearch", undersöker metasökmotorer som kan skicka en fråga samtidigt till flera sökmotorer på Internet och sedan samla in och bearbeta resultaten i ett enda gränssnitt.

Kapitel 4, "Semantiska och visuella sökmotorer på internet," är en översikt över experimentella system som erbjuder original användargränssnitt, såväl som intressanta metoder för bearbetning av frågor.

Kapitel 5, "Rekommendationsmaskiner," introducerar nyligen framväxande söktjänster, på engelska passande namnet "Discovery Engines", det vill säga "discovery machines". Med deras hjälp kan du bearbeta ett antal frågor som är för svåra för andra typer av sökmotorer på Internet.

Om ingen färdig produkt passar dig kan du skapa din egen sökmotor på Internet. Kapitel 6, "Personliga sökmotorer," ägnas åt att skapa sådana personliga maskiner.

Flera kapitel i vår bok ägnas åt sökning olika typer nätverksinnehåll. Kapitel 7, "Hämtning av bilder", introducerar aktuella trender för hämtning av bilder på Internet samt möjligheterna hos relaterade experimentella system. Kapitel 8, "Videosökning", ger en översikt över videosökverktygen för de ledande universella sökmotorerna på Internet, såväl som de bästa specialiserade systemen inom detta område.

Kapitel 9, "Hitta "dolt" innehåll," är en översikt över system som låter dig söka efter innehåll som "inte ses" av universella sökmotorer. Sådant "dolt" innehåll inkluderar till exempel torrents eller filer som finns på FTP-servrar och filvärdsajter.

Kapitel 10, "Search for Web 3.0", introducerar sökverktyg på Internet för data i Semantic Web-format.

Sökningen slutar inte med att bara få resultat från en eller annan sökmotor. Det sista kapitlet i vår bok, kapitel 11, "Hjälpprogram", ägnas åt verktyg för att bearbeta och spara resultat.

Innan du börjar en berättelse om specifika produkter är det vettigt att förstå klassificeringen moderna medel Internetsökning, samt definiera de termer som ständigt förekommer på sidorna i vår bok.

De viktigaste sökverktygen på Internet kan delas in i följande huvudgrupper:

Sökmotorer;

Webbkataloger;

Hjälpresurser;

Lokala program för att söka på Internet.

De populäraste sökverktygen är sökmotorer – de så kallade sökmotorerna på Internet (Search Engines). De tre bästa ledarna på global nivå är ganska stabila - Google, Yahoo! och Bing. I många länder läggs deras egna lokala sökmotorer, optimerade för att arbeta med lokalt innehåll, till denna lista. Med deras hjälp kan du teoretiskt hitta vilket specifikt ord som helst på sidorna på många miljoner webbplatser.

Trots många skillnader fungerar alla sökmotorer på Internet enligt liknande principer och består ur teknisk synvinkel av liknande delsystem.

Den första strukturella delen av en sökmotor är specialprogram som används för automatisk sökning och efterföljande indexering av webbsidor. Sådana program brukar kallas spindlar eller bots. De tittar på webbsidors kod, hittar länkar på dem och upptäcker därigenom nya webbsidor. Det finns ett alternativt sätt att inkludera en webbplats i indexet. Många sökmotorer erbjuder resursägare möjligheten att självständigt lägga till en webbplats i sin databas. Men webbsidorna laddas sedan ner, analyseras och indexeras. De lyfter fram strukturella element, hittar nyckelord och bestämmer deras kopplingar till andra webbplatser och webbsidor. Andra operationer utförs också, vars resultat är bildandet av en sökmotorindexdatabas. Denna databas är det andra huvudelementet i alla sökmotorer. För närvarande finns det ingen enda absolut komplett indexdatabas som skulle innehålla information om allt innehåll på Internet. Eftersom olika sökmotorer använder olika sökprogram för webbsidor och bygger sitt index med olika algoritmer, kan sökmotorindexdatabaser variera avsevärt. Vissa webbplatser indexeras av flera sökmotorer, men det finns alltid en viss procentandel av resurserna som ingår i databasen för endast en sökmotor. Närvaron av en sådan original och icke-överlappande del av indexet i varje sökmotor gör att vi kan dra en viktig praktisk slutsats: om du bara använder en sökmotor, även den största, kommer du definitivt att förlora en viss procentandel av användbara länkar .

Professionell internetsökning kräver specialiserad programvara, såväl som specialiserade sökmotorer och söktjänster.

PROGRAM

http://dr-watson.wix.com/home – programmet är utformat för att studera mängder av textinformation för att identifiera enheter och kopplingar mellan dem. Resultatet av arbetet är en rapport om föremålet som studeras.

http://www.fmsasg.com/ - ett av de bästa programmen i världen för att visualisera anslutningar och relationer Sentinel Vizualizer. Företaget har helt russat sina produkter och kopplat upp en hotline på ryska.

http://www.newprosoft.com/ – "Web Content Extractor" är den mest kraftfulla, lättanvända programvaran för att extrahera data från webbplatser. Den har också en effektiv Visual Web-spindel.

SiteSputnik – har inga analoger i världen mjukvarupaket, så att du kan söka och bearbeta dess resultat på det synliga och osynliga internet, med alla sökmotorer som behövs för användaren.

WebSite-Watcher – låter dig övervaka webbsidor, inklusive lösenordsskyddade, övervakningsforum, RSS-flöden, nyhetsgrupper, lokala filer. Innehar kraftfullt system filter. Övervakning sker automatiskt och levereras i en användarvänlig form. Ett program med avancerade funktioner kostar 50 euro. Ständigt uppdaterad.

http://www.scribd.com/ är den populäraste plattformen i världen och används allt mer i Ryssland för att lägga upp olika typer av dokument, böcker, etc. för fri tillgång med en mycket bekväm sökmotor för titlar, ämnen etc.

http://www.atlasti.com/ är det mest kraftfulla och effektiva verktyget för kvalitativ informationsanalys tillgängligt för enskilda användare, små och till och med medelstora företag. Programmet är multifunktionellt och därför användbart. Den kombinerar förmågan att skapa en enhetlig informationsmiljö för att arbeta med olika text-, tabell-, ljud- och videofiler som en helhet, samt verktyg för kvalitativ analys och visualisering.

Ashampoo ClipFinder HD – en ständigt ökande del av informationsflödet kommer från video. Följaktligen behöver konkurrerande underrättelsetjänstemän verktyg som gör att de kan arbeta med detta format. En sådan produkt är det kostnadsfria verktyget vi presenterar. Det låter dig söka efter videor baserat på angivna kriterier på videofillagringssajter som YouTube. Programmet är lätt att använda, visar alla sökresultat på en sida med detaljerad information, titlar, varaktighet, tid när videon laddades upp till lagringen, etc. Det finns ett ryskt gränssnitt.

http://www.advego.ru/plagiatus/ – programmet gjordes av SEO-optimerare, men är ganska lämpligt som ett internetintelligensverktyg. Plagiat visar graden av unikhet hos texten, textens källor och procentandelen av textmatchning. Programmet kontrollerar också unikheten hos den angivna URL:en. Programmet är gratis.

http://neiron.ru/toolbar/ – innehåller ett tillägg för att kombinera Google Sök och Yandex, och möjliggör också konkurrensanalys baserad på bedömning av effektiviteten hos webbplatser och kontextuell reklam. Implementerad som en plugin för FF och GC.

http://web-data-extractor.net/ är en universell lösning för att erhålla all data tillgänglig på Internet. Att ställa in dataklippning från valfri sida görs med några få musklick. Du behöver bara välja det dataområde som du vill spara och Datacol kommer automatiskt att välja en formel för att klippa ut detta block.

CaptureSaver är ett professionellt internetforskningsverktyg. Helt enkelt oersättlig fungerande program, som låter dig fånga, lagra och exportera all Internetinformation, inklusive inte bara webbsidor, bloggar, men även RSS-nyheter, e-post, bilder och mycket mer. Den har den bredaste funktionaliteten, ett intuitivt gränssnitt och ett löjligt pris.

http://www.orbiscope.net/en/software.html – webbövervakningssystem till mer än överkomliga priser.

http://www.kbcrawl.co.uk/ – programvara för arbete, bland annat på "Invisible Internet".

http://www.copernic.com/en/products/agent/index.html – programmet låter dig söka med mer än 90 sökmotorer med mer än 10 parametrar. Låter dig kombinera resultat, eliminera dubbletter, blockera trasiga länkar och visa de mest relevanta resultaten. Kommer i gratis, personliga och professionella versioner. Används av mer än 20 miljoner användare.

Maltego är en i grunden ny programvara som låter dig etablera relationen mellan ämnen, händelser och objekt i verkligheten och på Internet.

TJÄNSTER

ny – webbläsare med dussintals förinstallerade verktyg för OSINT.

– en effektiv sökmotorsamlare för att hitta personer på huvudryska i sociala nätverk.

https://hunter.io/ är en effektiv tjänst för att upptäcka och kontrollera e-post.

https://www.whatruns.com/ är en lättanvänd men ändå effektiv skanner för att upptäcka vad som fungerar och inte fungerar på en webbplats och vad dess säkerhetshål är. Även implementerad som en plugin för Chrom.

https://www.crayon.co/ är en amerikansk budgetplattform för marknads- och konkurrensinformation på Internet.

http://www.cs.cornell.edu/~bwong/octant/ – värdidentifierare.

https://iplogger.ru/ – en enkel och bekväm tjänst för att fastställa någon annans IP.

http://linkurio.us/ är en kraftfull ny produkt för ekonomisk säkerhetsarbetare och korruptionsutredare. Bearbetar och visualiserar enorma mängder ostrukturerad information från finansiella källor.

http://www.intelsuite.com/en – engelskspråkig onlineplattform för konkurrenskraftig intelligens och övervakning.

http://yewno.com/about/ är det första operativsystemet för att översätta information till kunskap och visualisera ostrukturerad information. Stöder för närvarande engelska, franska, tyska, spanska och portugisiska.

https://start.avalancheonline.ru/landing/?next=%2F – prognos- och analystjänster av Andrey Masalovich.

https://www.outwit.com/products/hub/ – en komplett uppsättning fristående program för professionellt arbete på webben 1.

https://github.com/search?q=user%3Acmlh+maltego – tillägg för Maltego.

http://www.whoishostingthis.com/ – sökmotor för hosting, IP-adresser, etc.

http://appfollow.ru/ – analys av applikationer baserat på recensioner, ASO-optimering, placeringar i toppar och sökresultat för App Store, Google Play och Windows Phone Store.

http://spiraldb.com/ är en tjänst implementerad som en plugin för Chrom, som låter dig få mycket värdefull information om vilken elektronisk resurs som helst.

https://millie.northernlight.com/dashboard.php?id=93 - gratis tjänst, samla in och strukturera nyckelinformation efter bransch och företag. Det är möjligt att använda informationspaneler baserade på textanalys.

http://byratino.info/ – insamling av faktauppgifter från allmänt tillgängliga källor på Internet.

http://www.datafox.co/ – CI-plattformen samlar in och analyserar information om företag av intresse för kunder. Det finns en demo.

https://unwiredlabs.com/home - en specialiserad applikation med ett API för sökning med geolokalisering av alla enheter som är anslutna till Internet.

http://visualping.io/ – en tjänst för att övervaka webbplatser och först och främst de fotografier och bilder som finns på dem. Även om fotot dök upp för en sekund så kommer det att vara det e-post abonnent Har ett plugin för Google Chrome.

http://spyonweb.com/ är ett forskningsverktyg som möjliggör en djupgående analys av alla Internetresurser.

http://bigvisor.ru/ – tjänsten låter dig spåra reklamkampanjer för vissa segment av varor och tjänster, eller specifika organisationer.

http://www.itsec.pro/2013/09/microsoft-word.html – bruksanvisningar av Artem Ageev Windows-program för konkurrenskraftiga underrättelsebehov.

http://granoproject.org/ är ett verktyg med öppen källkod källkod för forskare som spårar nätverk av kopplingar mellan individer och organisationer inom politik, ekonomi, kriminalitet m.m. Låter dig ansluta, analysera och visualisera information som erhållits från olika källor, samt visa betydande samband.

http://imgops.com/ – tjänst för att extrahera metadata från grafiska filer och arbeta med dem.

http://sergeybelove.ru/tools/one-button-scan/ – en liten onlineskanner för att kontrollera säkerhetshål på webbplatser och andra resurser.

http://isce-library.net/epi.aspx – tjänst för att söka primära källor med hjälp av ett fragment av text på engelska

https://www.rivaliq.com/ är ett effektivt verktyg för att bedriva konkurrensunderrättelseverksamhet på västerländska, främst europeiska och amerikanska marknader för varor och tjänster.

http://watchthatpage.com/ är en tjänst som låter dig automatiskt samla in ny information från övervakade internetresurser. Tjänsten är gratis.

http://falcon.io/ är ett slags Rapportive for the Web. Det är inte en ersättning för Rapportive, men ger ytterligare verktyg. Däremot tillhandahåller Rapportive en allmän profil av en person, som om den limmas ihop från data från sociala nätverk och omnämnanden på webben http://watchthatpage.com/ - en tjänst som låter dig automatiskt samla in ny information från övervakade resurser Internet. Tjänsten är gratis.

https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – tillägg för Firefox. Övervakar uppdateringar av webbsidor. Användbar för webbplatser som inte har nyhetsflöden (Atom eller RSS).

http://agregator.pro/ – aggregator av nyhets- och medieportaler. Används av marknadsförare, analytiker, etc. att analysera nyhetsflöden om vissa ämnen.

http://price.apishops.com/ – automatiserad webbtjänst för övervakning av priser för utvalda produktgrupper, specifika nätbutiker och andra parametrar.

http://www.la0.ru/ är en bekväm och relevant tjänst för att analysera länkar och bakåtlänkar till en internetresurs.

www.recordedfuture.com är ett kraftfullt verktyg för dataanalys och visualisering, implementerat som en onlinetjänst byggd på cloud computing.

http://advse.ru/ är en tjänst med sloganen "Ta reda på allt om dina konkurrenter." Låter dig få konkurrenters webbplatser i enlighet med sökfrågor och analysera konkurrenters reklamkampanjer i Google och Yandex.

http://spyonweb.com/ – tjänsten låter dig identifiera webbplatser med samma egenskaper, inklusive de som använder samma Google Analytics statistiktjänstidentifierare, IP-adresser, etc.

http://www.connotate.com/solutions – en produktlinje för konkurrenskraftig intelligens, hantering av informationsflöden och omvandling av information till informationstillgångar. Den innehåller både komplexa plattformar och enkla, billiga tjänster som möjliggör effektiv övervakning tillsammans med informationskomprimering och erhåller endast de nödvändiga resultaten.

http://www.clearci.com/ - konkurrenskraftig intelligensplattform för företag av olika storlekar från nystartade företag och småföretag till Fortune 500-företag. Löst som saas.

http://startingpage.com/ är ett Google-tillägg som låter dig söka på Google utan att registrera din IP-adress. Fullt stöd för alla sökmotorer Googles funktioner, inklusive på ryska.

http://newspapermap.com/ är en unik tjänst som är mycket användbar för en konkurrerande underrättelseofficer. Kopplar samman geolokalisering med en sökmotor online. De där. du väljer den region du är intresserad av, eller till och med staden eller språket, se platsen på kartan och en lista över onlineversioner av tidningar och tidskrifter, klicka på lämplig knapp och läs. Stöder ryska språket, mycket användarvänligt gränssnitt.

http://infostream.com.ua/ är ett mycket bekvämt nyhetsövervakningssystem "Infostream", kännetecknat av ett förstklassigt urval och ganska tillgängligt för alla plånböcker, från en av klassikerna inom internetsökning, D.V.

http://www.instapaper.com/ är ett mycket enkelt och effektivt verktyg för att spara nödvändiga webbsidor. Kan användas på datorer, iPhones, iPads, etc.

http://screen-scraper.com/ – låter dig automatiskt extrahera all information från webbsidor, ladda ner de allra flesta filformat och automatiskt ange data i olika former. Den sparar nedladdade filer och sidor i databaser och utför många andra extremt användbara funktioner. Fungerar på alla större plattformar, har fullt fungerande gratis och mycket kraftfulla professionella versioner.

http://www.mozenda.com/ - med flera tariffplaner och en webbtjänst för multifunktionell webbövervakning och leverans av information som behövs för användaren från utvalda webbplatser, tillgänglig även för småföretag.

http://www.recipdonor.com/ – tjänsten låter dig automatiskt övervaka allt som händer på konkurrenternas hemsidor.

http://www.spyfu.com/ – och detta är om dina konkurrenter är utländska.

www.webground.su är en tjänst skapad av proffs på Internet för att övervaka Runet, inklusive alla större leverantörer av information, nyheter etc., som kan individuella inställningarövervakning enligt användarens behov.

SÖKMOTORER

https://www.idmarch.org/ är den bästa sökmotorn för världsarkivet av pdf-dokument vad gäller kvalitet. För närvarande har mer än 18 miljoner pdf-dokument indexerats, allt från böcker till hemliga rapporter.

http://www.marketvisual.com/ är en unik sökmotor som låter dig söka efter ägare och högsta ledning med fullständigt namn, företagsnamn, position eller en kombination därav. Sökresultaten innehåller inte bara de objekt du letar efter, utan även deras kopplingar. Designad främst för engelsktalande länder.

http://worldc.am/ är en sökmotor för fritt tillgängliga fotografier kopplade till geolokalisering.

https://app.echosec.net/ är en allmänt tillgänglig sökmotor som beskriver sig själv som det mest avancerade analysverktyget för brottsbekämpande och säkerhets- och underrättelsepersonal. Låter dig söka efter foton som publicerats på olika webbplatser, sociala plattformar och sociala nätverk i relation till specifika geolokaliseringskoordinater. Det finns för närvarande sju datakällor anslutna. I slutet av året kommer deras antal att vara mer än 450. Tack till Dementy för tipset.

http://www.quandl.com/ är en sökmotor för sju miljoner finansiella, ekonomiska och sociala databaser.

http://bitzakaz.ru/ – sökmotor för anbud och statliga order med ytterligare betalda funktioner

Website-Finder – gör det möjligt att hitta sajter som Google inte indexerar bra. Den enda begränsningen är att den bara söker på 30 webbplatser för varje sökord. Programmet är lätt att använda.

http://www.dtsearch.com/ är en kraftfull sökmotor som låter dig bearbeta terabyte text. Fungerar på desktop, webb och intranät. Stöder både statisk och dynamisk data. Låter dig söka i alla MS Office-program. Sökningen görs med hjälp av fraser, ord, taggar, index och mycket mer. Den enda tillgängligt system federerad sökning. Den har både betal- och gratisversioner.

http://www.strategator.com/ – söker, filtrerar och samlar information om företaget från tiotusentals webbkällor. Sökningar i USA, Storbritannien, större EEC-länder. Det är mycket relevant, användarvänligt och har gratis och betalda alternativ ($14 per månad).

http://www.shodanhq.com/ – ovanlig sökmotor. Omedelbart efter sitt framträdande fick han smeknamnet "Google för hackare". Den söker inte efter sidor, men bestämmer IP-adresser, typer av routrar, datorer, servrar och arbetsstationer på en viss adress och spårar kedjor DNS-servrar och låter dig implementera många andra intressanta funktioner för konkurrenskraftig intelligens.

http://search.usa.gov/ är en sökmotor för webbplatser och öppna databaser för alla amerikanska statliga myndigheter. Databaserna innehåller mycket praktisk, användbar information, bland annat för användning i vårt land.

http://visual.ly/ – idag används visualisering allt mer för att presentera data. Detta är den första infografiska sökmotorn på webben. Tillsammans med sökmotorn har portalen kraftfulla datavisualiseringsverktyg som inte kräver programmeringskunskaper.

http://go.mail.ru/realtime – sök efter diskussioner om ämnen, händelser, objekt, ämnen i realtid eller anpassningsbar tid. Den tidigare hårt kritiserade sökningen i Mail.ru fungerar mycket effektivt och ger intressanta, relevanta resultat.

Zanran har precis lanserats, men fungerar redan utmärkt, den första och enda sökmotorn för data som extraherar den från PDF-filer, EXCEL-tabeller, data på HTML-sidor.

http://www.ciradar.com/Competitive-Analysis.aspx är ett av världens bästa system för informationsinhämtning för konkurrenskraftig intelligens på den djupa webben. Hämtar nästan alla typer av filer i alla format på ämnet av intresse. Implementerad som webbtjänst. Priserna är mer än rimliga.

http://public.ru/ – Effektiv sökning och professionell informationsanalys, mediearkiv sedan 1990. Onlinemediebiblioteket erbjuder ett brett utbud av informationstjänster: från tillgång till elektroniska arkiv med ryskspråkiga mediepublikationer och färdiga tematiska pressrecensioner till individuell övervakning och exklusiv analytisk forskning baserad på pressmaterial.

Cluuz är en ung sökmotor med stora möjligheter till konkurrenskraftig intelligens, särskilt på det engelskspråkiga internet. Låter dig inte bara hitta, utan också visualisera och upprätta kopplingar mellan personer, företag, domäner, e-post, adresser, etc.

www.wolframalpha.com – morgondagens sökmotor. Som svar på en sökförfrågan tillhandahåller den statistisk och faktainformation tillgänglig om förfrågningsobjektet, inklusive visualiserad information.

www.ist-budget.ru – universell sökning i databaser för offentlig upphandling, anbud, auktioner, etc.

Populärt i kategorin:

Hur skapar man ett karaokeklipp på en dator?

läsa

Origin-appen krävs för att spela, men den är inte installerad FIFA...

läsa

Registrera en personlig sida på det sociala nätverket Facebook

läsa

Hur man kör en enkel Nmap Nmap Scan

läsa

Hur man roterar en bild några grader...

läsa

Inaktiverar annonsering i Yandex webbläsare där...

läsa

Felsöker problem med Wi-Fi-anslutningen på...

läsa

Byt lösenord på Windows 10-profilen

läsa

Instruktioner för att ställa in trådlösa routrar...

läsa

Hur man väljer en hårddisk och vilken är bättre att köpa...

läsa

Meizu för dummies. Samtal och adressbok....

läsa

Ladda ner programmet PDFMaster

läsa

Söksystem	Indexeringstid	Indexstorlek
Bloodhound Prof Deluxe 4.5	38 timmar 46 minuter	19 GB
Isys Desktop 7.0	6 timmar 13 minuter	7,9 GB
DtSearch 7.0	6 timmar 3 minuter	8,6 GB
Google Desktop Search Enterprise	8 timmar 17 minuter	4,5 GB
Copernic Desktop Search *	10 timmar 51 minuter	7 GB
SearchInform 1.5.02	3 timmar 17 minuter	4,4 GB