Programmes de recherche de données Internet. Recherche professionnelle d'informations sur Internet. Déterminer le nom d'une personne par email

RECHERCHE D'INFORMATIONS PROFESSIONNELLES SUR INTERNET

La recherche sur Internet est un élément important du travail sur Internet. Il est peu probable que quiconque connaisse avec certitude le nombre exact de ressources Web sur l'Internet moderne. En tout cas, cela se compte en milliards. Pour pouvoir utiliser l'information nécessaire à un moment donné, que ce soit à des fins professionnelles ou de divertissement, il faut d'abord la trouver dans cet océan de ressources constamment renouvelé.

Pour qu’une recherche sur Internet soit réussie, deux conditions doivent être remplies : les requêtes doivent être bien formulées et elles doivent être posées aux endroits appropriés. En d'autres termes, l'utilisateur doit, d'une part, être capable de traduire ses intérêts de recherche dans la langue de la requête de recherche et, d'autre part, avoir de bonnes connaissances moteurs de recherche, les outils de recherche disponibles, leurs avantages et inconvénients, qui vous permettront de choisir les outils de recherche les plus adaptés à chaque cas spécifique.

Actuellement, il n’existe pas de ressource unique répondant à toutes les exigences de recherche sur Internet. Par conséquent, si vous prenez votre recherche au sérieux, vous devrez inévitablement utiliser différents outils, en utilisant chacun dans le cas le plus approprié.

Basique Outils de recherche sur Internetpeut être divisé en les groupes principaux suivants :

Moteurs de recherche;

Annuaires Web ;

Ressources d'aide ;

Programmes locaux pour rechercher sur Internet.

Les outils de recherche les plus populaires sontmoteurs de recherche– les moteurs de recherche dits Internet (Search Engines). Les trois premiers leaders à l'échelle mondiale sont assez stables : Google, Yahoo! et Bing. Dans de nombreux pays, leurs propres moteurs de recherche locaux, optimisés pour travailler avec du contenu local, sont ajoutés à cette liste. Avec leur aide, vous pouvez théoriquement trouver n'importe quel mot spécifique sur les pages de plusieurs millions de sites. Du point de vue de l'utilisateur, le principal inconvénient des moteurs de recherche est la présence inévitablebruit d'informationsdans les résultats. Il s'agit du nom habituel des résultats qui sont inclus dans la liste de recherche pour une raison ou une autre et ne correspondent pas à la demande.

Malgré de nombreuses différences, tous les moteurs de recherche Internet fonctionnent selon des principes similaires et, d'un point de vue technique, sont constitués de sous-systèmes similaires. La première partie structurelle du moteur de recherche est programmes spéciaux, utilisé pour la recherche automatique et l'indexation ultérieure des pages Web. De tels programmes sont généralement appelés araignées ou robots. Ils examinent le code des pages Web, trouvent les liens qui s'y trouvent et découvrent ainsi de nouvelles pages Web. Il y a aussi manière alternative inclusion du site dans l'index. De nombreux moteurs de recherche offrent aux propriétaires de ressources la possibilité d'ajouter indépendamment un site à leur base de données. Cependant, les pages Web sont ensuite téléchargées, analysées et indexées. Ils mettent en évidence des éléments structurels, trouvent des mots-clés et déterminent leurs connexions avec d'autres sites et pages Web. D'autres opérations sont également effectuées, dont le résultat est la constitution d'une base de données d'index de moteur de recherche. Cette base de données est le deuxième élément principal de tout moteur de recherche. Actuellement, il n'existe pas de base de données d'index absolument complète qui contiendrait des informations sur tout le contenu Internet. Étant donné que différents moteurs de recherche utilisent différents programmes de recherche de pages Web et construisent leur index à l'aide de différents algorithmes, les bases de données d'index des moteurs de recherche peuvent varier considérablement. Certains sites sont indexés par plusieurs moteurs de recherche, mais il y a toujours un certain pourcentage de ressources incluses dans la base de données d'un seul moteur de recherche. La présence d'une telle partie originale et non chevauchante de l'index dans chaque moteur de recherche permet de tirer une conclusion pratique importante : si vous n'utilisez qu'un seul moteur de recherche, même le plus gros, vous perdrez certainement un certain pourcentage de liens utiles. .

La partie suivante du moteur de recherche Internet concerne les programmes de recherche et de tri proprement dits. Ces programmes résolvent deux tâches principales : premièrement, ils trouvent les pages et les fichiers dans la base de données qui correspondent à la requête entrante, puis trient le tableau de données résultant selon divers critères. Le succès dans la réalisation des objectifs de recherche dépend en grande partie de l’efficacité de leur travail.

Le dernier élément d’un moteur de recherche Internet est l’interface utilisateur. En plus des exigences habituelles d'esthétique et de commodité pour tout site Web, les interfaces des moteurs de recherche ont une autre exigence importante : elles doivent offrir divers outils pour composer et clarifier les requêtes, ainsi que pour trier et filtrer les résultats. Les avantages des moteurs de recherche sont une excellente couverture des sources, une mise à jour relativement rapide du contenu des bases de données et un bon choix fonctions supplémentaires.

Le principal outil pour travailler avec les moteurs de recherche est une requête.

Pour les recherches sur Internet, des applications spéciales sont également utilisées, installées sur l'ordinateur local. Cela pourrait être comme programmes simples, et des complexes assez complexes de recherche et d'analyse de données. Les plus courants sont les plugins de recherche pour les navigateurs, les panneaux de navigateur conçus pour fonctionner avec un service de recherche spécifique et les packages de métarecherche dotés de capacités d'analyse des résultats.

Annuaires Web – ce sont des ressources dans lesquelles les sites sont répartis en catégories thématiques. Si l'utilisateur travaille avec les moteurs de recherche uniquement via des requêtes, alors dans le catalogue, il est possible de visualiser les sections thématiques dans leur intégralité. La deuxième différence fondamentale entre les annuaires et les moteurs de recherche automatiques est qu'en règle générale, les personnes sont directement impliquées dans leur remplissage, leur visualisation des ressources et leur classification dans une catégorie ou une autre. Les annuaires Web sont généralement divisés en universels et thématiques. Les universels tentent de couvrir autant de sujets que possible. Vous pouvez y trouver de tout : des sites Web sur la poésie aux ressources informatiques. En d’autres termes, leur étendue de recherche est maximale. Les annuaires thématiques se spécialisent dans un sujet spécifique, offrant une profondeur de recherche maximale en réduisant l'étendue de la couverture des ressources.

Les avantages des catalogues sont comparativement haute qualité ressources, puisque chaque site qu'il contient est consulté et sélectionné par une personne. Le regroupement thématique de sites vous permet d'organiser facilement des sites sur des sujets similaires. Ce mode de fonctionnement est idéal pour découvrir des sites nouveaux pour vous sur un sujet qui vous intéresse - il est plus précis que d'utiliser un moteur de recherche. Il est recommandé d'utiliser des catalogues Web pour la première connaissance d'un domaine, ainsi que pour rechercher des requêtes vagues - vous aurez la possibilité de « vous promener » dans les sections du catalogue et de déterminer plus précisément ce dont vous avez exactement besoin.

Les inconvénients des annuaires Web sont connus. Tout d'abord, il s'agit d'un lent réapprovisionnement de la base de données, puisque l'inscription d'un site dans le catalogue nécessite une participation humaine. En termes d’efficacité, un annuaire Web n’est pas un rival des moteurs de recherche. De plus, les annuaires Web sont nettement inférieurs aux moteurs de recherche en termes de taille de base de données.

Lorsqu'on parle de recherche sur Internet, nous ne pouvons ignorer un certain nombre de termes étroitement liés à ce domaine et qui sont souvent utilisés pour décrire et évaluer les moteurs de recherche. Par exemple: largeur et profondeur Recherche Internet. Une recherche large est une recherche qui capture autant de sources d'informations que possible. Dans ce cas, au moins une mention de l'un ou l'autre site adapté à la demande est considérée comme suffisante. La profondeur de recherche fait référence au détail de l’indexation et de la recherche ultérieure de chaque ressource spécifique. Par exemple, de nombreux moteurs de recherche abordent différemment l’indexation de différents sites. Les sites grands et populaires sont indexés au maximum, les robots essaient de ne pas manquer une seule page d'une telle ressource. Dans le même temps, sur d'autres sites, seules la page de titre et quelques pages de contenu peuvent être indexées. Ces circonstances affectent naturellement les recherches ultérieures. La recherche approfondie fonctionne sur le principe « il est préférable d'inclure des informations inutiles dans les résultats plutôt que de manquer des données pertinentes pour le sujet de recherche ».

Très souvent, vous pouvez rencontrer des concepts tels que mondial et local Recherche Internet. Les recherches locales sur Internet prennent en compte la situation géographique de l'utilisateur et donnent la préférence aux résultats qui sont liés d'une manière ou d'une autre à un pays ou une localité spécifique. Lors d'une recherche globale, ces informations ne sont pas prises en compte, et la recherche est effectuée dans toutes les ressources disponibles.

Lors de la rédaction d'une requête sur les moteurs de recherche Internet, différents modes de recherche fonctionnent. Les modes de recherche typiques trouvés sur la plupart des machines Internet incluent : simple et avancé recherche. Une recherche simple vous permet de spécifier une seule fonctionnalité de recherche dans une seule requête. La recherche avancée permet de créer une requête à partir de plusieurs conditions, en les reliant à des opérateurs logiques.

Pour affiner les requêtes de recherche, divers filtres . Les filtres sont ceux-ci ou d'autres moyens auxiliaires pour composer une requête qui ne concernent pas le contenu des conditions de requête, mais limitent les résultats de la recherche par une fonctionnalité formelle. Ainsi, par exemple, lors de l'utilisation d'un filtre de type de fichier lors d'une recherche, l'utilisateur ne fournit pas au système d'informations liées au sujet de sa demande, mais limite simplement les résultats obtenus à un certain type de fichier spécifié dans la condition de sa demande.

Pour la plupart des utilisateurs, les moteurs de recherche universels constituent le principal, et souvent le seul, moyen de recherche sur Internet. Ils offrent une bonne couverture des sources, ainsi qu'un ensemble d'outils suffisants pour résoudre les problèmes de recherche de base.

Le marché des moteurs de recherche universels est assez vaste. Nous avons essayé d'analyser les moteurs de recherche les plus connus et avons présenté les résultats dans le tableau 1.

Lors du choix d'un moteur de recherche universel, la qualité des ressources trouvées grâce à son aide joue un rôle important. Vous pouvez déterminer le moteur de recherche préféré pour des tâches spécifiques en utilisant la « méthode des marqueurs ». Son essence est que d'abord une certaine thématique requête de recherche, après quoi un groupe de personnes - experts dans ce domaine - est interrogé pour identifier les meilleures ressources Internet, à leur avis, sur le sujet choisi. Sur la base des données de l'enquête, une liste de sites marqueurs est générée, dont la pertinence par rapport à la demande est garantie et qui contient des informations de haute qualité. La requête est ensuite envoyée aux moteurs de recherche testés. La logique de l'évaluation est simple : plus les sites marqueurs sont situés haut dans les résultats de recherche, plus une ressource particulière est adaptée à la recherche d'informations sur un sujet de test.


Mi-2015, l’Internet mondial connectait déjà 3,2 milliards d’utilisateurs, soit près de 43,8 % de la population mondiale. A titre de comparaison : il y a 15 ans, seuls 6,5 % de la population étaient des internautes, c'est-à-dire que le nombre d'utilisateurs a été multiplié par plus de 6 ! Mais ce qui est plus impressionnant, ce ne sont pas les indicateurs quantitatifs, mais qualitatifs de l'expansion de la mise en œuvre des technologies Internet dans divers domaines de l'activité humaine : des communications mondiales des réseaux sociaux aux objets Internet domestiques. Internet mobile a offert aux utilisateurs la possibilité d'être en ligne en dehors du bureau et à la maison : sur la route, en dehors de la ville dans la nature.
Il existe actuellement des centaines de systèmes permettant de rechercher des informations sur Internet. Les plus populaires d'entre eux sont accessibles à la grande majorité des utilisateurs car gratuits et simples d'utilisation : Google, Yandex, Nigma, Yahoo!, Bing..... Pour les utilisateurs plus expérimentés, des interfaces de « recherche avancée » et spécialisées. Des recherches sur les réseaux sociaux sont disponibles, au gré des flux d'actualités et des annonces d'achat et de vente... Mais tous ces merveilleux moteurs de recherche ont un inconvénient important, que j'ai déjà noté plus haut comme un avantage : ils sont gratuits.
Si les investisseurs investissent des milliards de dollars dans le développement de moteurs de recherche, alors une question tout à fait pertinente se pose : où gagnent-ils de l'argent ?
Et ils gagnent de l'argent, notamment en fournissant en réponse aux demandes des utilisateurs non pas tant d'informations qui seraient utiles du point de vue de l'utilisateur, mais celles que les propriétaires des moteurs de recherche considèrent utiles pour l'utilisateur. Cela se fait en manipulant l'ordre dans lequel les listes de réponses aux requêtes de recherche des utilisateurs sont présentées. Voici la publicité ouverte de certains Ressources Internet, et manipulation cachée de la pertinence des réponses basée sur les intérêts commerciaux, politiques et idéologiques des propriétaires des moteurs de recherche.
Ainsi, parmi les professionnels spécialistes de la recherche d'informations sur Internet, le problème de la pertinence des résultats des moteurs de recherche est très pertinent.
La pertinence est la correspondance des documents trouvés par un système de recherche d'informations avec les besoins d'information de l'utilisateur, quelle que soit l'ampleur et la précision avec lesquelles ce besoin d'information est exprimé dans le texte de la demande d'information elle-même. Il s'agit du rapport entre la quantité d'informations utiles et la quantité totale d'informations reçues. En gros, c'est l'efficacité de la recherche.
Les spécialistes effectuant des recherches qualifiées d'informations sur Internet doivent faire certains efforts pour filtrer les résultats de la recherche, en éliminant le « bruit » d'informations inutile. Et pour cela, des outils de recherche de niveau professionnel sont utilisés.
L'un de ces systèmes professionnels est le programme russe FileForFiles et SiteSputnik (SiteSputnik).
Développeur Alexeï Mylnikov de Volgograd.

"Le programme FileForFiles & SiteSputnik (SiteSputnik) est conçu pour organiser et automatiser la recherche professionnelle, la collecte et le suivi des informations publiées sur Internet. Une attention particulière est accordée à l'obtention de nouvelles informations entrantes sur des sujets d'intérêt. Plusieurs fonctions d'analyse de l'information ont été mises en œuvre."


Suivi et catégorisation des flux d'informations


D'abord quelques mots sur surveiller les flux d’informations, dont un cas particulier est veille des médias et des réseaux sociaux :

  • l'utilisateur indique les Sources pouvant contenir les informations nécessaires et les Règles de sélection de ces informations ;

  • le programme télécharge de nouveaux liens à partir des sources, libère leur contenu des déchets et des répétitions et les organise en sections conformément aux règles.

  • Pour voir en direct un processus de suivi simple mais réel, qui fait intervenir 6 sources et 4 rubriques :
  • ouvrez la version démo du programme ;


  • puis, dans la fenêtre qui apparaît, cliquez sur le bouton Ensemble;

  • et quand Site WebSputnik réaliserez ce Projet en temps réel, vous :
    — dans la liste « Clean Stream », vous verrez toutes les nouvelles informations des Sources,
    — dans la rubrique « Post-demande » - uniquement les actualités économiques et financières qui satisfont à la règle,
    - dans les rubriques « À propos du Président », « À propos de la Première » et « Banque centrale », - des informations relatives aux objets concernés.

  • Dans les projets réels, vous pouvez utiliser presque n'importe quel nombre de sources et de rubriques.
    Vous pouvez créer vos premiers projets fonctionnels en quelques heures et les améliorer en cours d'exploitation.
    Le traitement des informations décrit est disponible dans le package SiteSputnik Pro+News et supérieur.

2. Recherche simple et par lots, collecte d'informations

Pour se familiariser avec les possibilités SiteSputnik Pro(version de base du programme) :

  • ouvrez la version démo du programme ;

  • saisissez votre première demande, par exemple votre nom complet, comme je l'ai fait :

    et cliquez sur le bouton Recherche.


  • Le programme (voir le panneau construit par SiteSputnik) interrogera dans quelques secondes 7 sources, s'ouvrira en elles 24 pages de recherche, je trouverai 227 liens pertinents, supprimera les liens en double et du reste 156 unique liste de liens "Une association".

    Nom
    Source

    Commandé
    pages

    Téléchargé
    pages

    Trouvé
    liens

    Temps
    recherche

    Efficacité
    recherche

    Liens
    Nouveau

    Efficacité
    Nouveau
    Yandex 5 5 50 0:00:05 32% 0 0
    Google 5 5 44 0:00:03 28% 0 0
    Yahoo 5 5 50 0:00:05 32% 0 0
    Randonneur 5 4 56 0:00:07 36% 0 0
    MSN (Bing) 5 3 23 0:00:04 15% 0 0
    Yandex.Blogs 5 1 1 0:00:01 1% 0 0
    Google.Blogs 5 1 3 0:00:01 2% 0 0
    Total: 35 24 227 0:00:26 0 0
    Total : nombre de liens uniques - 156 , liens en double - 46 %.

  • (! ) Répétez votre demande après quelques heures ou jours, et vous ne verrez que nouveaux liens qui figurait dans les Sources pour cette période. Dans les deux dernières colonnes du tableau, vous pouvez voir combien de nouveaux liens ont apporté chaque Source et son efficacité en termes de « nouveauté ». Lorsqu'une requête est exécutée plusieurs fois, une liste contenant uniquement nouveaux liens , est créé par rapport à toutes les exécutions précédentes de cette requête. Cela semblerait élémentaire et fonction requise, mais l'auteur n'a connaissance d'aucun programme dans lequel il est implémenté.

  • (!! ) Les capacités décrites sont prises en charge non seulement pour les requêtes individuelles, mais également pour l'ensemble demander des paquets :

    Le package que vous voyez se compose de sept requêtes différentes qui collectent des informations sur Vasily Shukshin à partir de plusieurs sources, notamment les moteurs de recherche, Wikipédia, la recherche exacte dans les actualités Yandex, la métarecherche et la recherche de mentions sur les stations de télévision et de radio. Vers le scénario Télévision et Radio comprend : "Channel One", "TV Russia", NTV, RBC TV, "Echo of Moscow", la société de radio "Mayak", ... et d'autres sources d'information. Chaque source a sa propre profondeur de recherche ou de navigation dans les pages. Il est répertorié dans la troisième colonne.

    La recherche par lots vous permet d'effectuer des recherches complètes en un seul clic collecte d'informations sur un sujet donné.
    Liste séparée nouveaux liens, lors d'exécutions répétées du package, ne contiendra que des liens qui n'ont pas été trouvés auparavant.
    Rappelez-vous quoi et quand vous avez demandé à Internet et ce qu'il vous a répondu Pas besoin- tout est automatiquement enregistré dans les bibliothèques et dans les bases de données du programme.
    Je répète que les capacités décrites dans ce paragraphe sont entièrement incluses dans le package SiteSpunik Pro.


  • Plus de détails dans les instructions : SiteSputnik Pro pour les débutants.

3. Surveillance des objets et des recherches

Très souvent, l'utilisateur est confronté à la tâche suivante. Vous devez savoir ce qu'il y a sur Internet à propos d'un objet précis : une personne ou une entreprise. Par exemple, lors de l'embauche d'un nouvel employé ou lorsqu'une nouvelle contrepartie apparaît, vous connaissez toujours le nom complet, le nom de l'entreprise, les numéros de téléphone, INN, OGRN ou OGRNIP, vous pouvez également prendre ICQ, Skype et quelques autres données. Ensuite, en faisant appel à fonction spéciale programmes Site WebSputnik "Collecte d'informations sur l'objet" (équipement SiteSputnik Pro+Objets):

Vous saisissez les données que vous connaissez, et d'un simple clic de souris vous effectuez précis Et complet rechercher des liens contenant des informations spécifiées. La recherche s'effectue sur plusieurs moteurs de recherche à la fois, en utilisant tous les détails à la fois, en utilisant plusieurs combinaisons possibles de détails d'enregistrement à la fois : rappelez-vous comment vous pouvez écrire un numéro de téléphone de différentes manières. Après un certain temps, sans effectuer de travail de routine ennuyeux, vous recevrez une liste de liens, débarrassée des répétitions et, surtout, classée par pertinence par rapport à l'objet que vous recherchez. La pertinence (importance) est obtenue grâce au fait que les premiers résultats de recherche de SiteSputnik seront les liens sur lesquels grande quantité les détails que vous avez spécifiés, et non ceux qui ont remonté les résultats du moteur de recherche du Webmaster.

Important .
Le programme SiteSputnik est meilleur que les autres programmes pour extraire réel, mais non officiel informations sur l'objet. Par exemple, dans la base de données officielle opérateur mobile il peut être enregistré que le téléphone appartient à Vasily Terekhin, mais en réalité ce téléphone contient des informations selon lesquelles Alexander a vendu une voiture Ford Focus en 2013, ce qui est Informations Complémentaires pour la réflexion.

Surveillance de la recherche .
La surveillance de la recherche signifie ce qui suit. Si vous devez suivre l'événement nouveaux liens, par un objet donné ou arbitraire paquet de requêtes, il vous suffit alors de répéter périodiquement la recherche correspondante. Comme pour une simple demande, programme SiteSputnik créera une liste "Nouveau", qui inclura uniquement les liens qui n'ont été trouvés dans aucune des recherches précédentes.

Surveillance de la recherche intéressant non seulement en soi. Il peut être impliqué dans veille sur les médias, les réseaux sociaux et d'autres sources d'information, mentionnées ci-dessus au paragraphe 1. Contrairement à d'autres programmes, dans lesquels il est possible d'obtenir de nouvelles informations uniquement à partir de flux RSS, dans le programme Site WebSputnik peut être utilisé pour cela recherches intégrées aux sites Web Et moteurs de recherche . Aussi possible émulation(auto-création) plusieurs flux RSSà partir de pages arbitraires, en outre, émulation d'un flux RSS sur demande et même d'un lot de requêtes.


  • Pour tirer le meilleur parti du programme, utilisez ses principales fonctions, à savoir :

    • demander des packages, des packages avec paramètres, utiliser l'Assembleur (assembleur), l'opération « Fusion analytique » des résultats de plusieurs tâches, si nécessaire, appliquer les fonctions de recherche de base sur l'Internet invisible ;

    • connectez vos sources aux sources d'informations intégrées au programme : autres moteurs de recherche et recherches intégrées aux sites, flux RSS existants créés par vous propres flux RSS Avec arbitraire pages, utilisez la fonction de recherche pour de nouvelles sources ;

    • utiliser les types de fonctionnalités suivants surveillance: Médias, réseaux sociaux et autres sources, veille commentaires aux actualités et aux messages, suivre l'apparition de nouvelles informations sur les pages existantes ;

    • s'engager Catégories , Fonctions externes, planificateur de tâches, liste de diffusion, plusieurs ordinateurs, instructeur de projet, installation alarme Pour vous avertir de la survenance d'événements significatifs, utilisez les autres fonctions listées ci-dessous.



4. Programme SiteSputnik (SiteSputnik) : options et fonctionnalités

- Programme SiteSputnik est en constante amélioration dans les domaines suivants : "J'ai besoin de tout trouver et avec une garantie".
"Logiciel d'interrogatoire pour Internet", - une autre définition de l'Utilisateur pour l'attribution du programme.

UN. Fonctions de recherche et de collecte d'informations.

. Demander un forfait - exécution de plusieurs requêtes à la fois, combinant les résultats de recherche ou séparément. Lors de la génération du résultat combiné, les liens trouvés à plusieurs reprises sont supprimés. Plus de détails sur les packages peuvent être trouvés dans l'introduction de SiteSputnik, et visuellement dans la vidéo : un joint Et séparé exécution des demandes. Il n’existe pas d’analogues dans les développements nationaux et étrangers.

. Packages avec paramètres. Toutes les requêtes et packages de requêtes conçus pour résoudre des tâches de recherche standard, par exemple, recherche par numéro de téléphone, nom complet ou e-mail, - peut être paramétré, enregistré et exécuté à partir d'une bibliothèque de requêtes prêtes à l'emploi avec substitution des valeurs de paramètres réelles (nécessaires). Chaque paquet avec des paramètres a sa propre particularité formulaire de recherche avancée . Il peut utiliser non pas un, mais plusieurs moteurs de recherche. Vous pouvez créer des formulaires dont l'objectif fonctionnel est très complexe. Il est extrêmement important que formes peut être créé par les utilisateurs eux-mêmes, sans la participation de l'auteur du programme ou du programmeur. Ceci est écrit très simplement dans les instructions, plus de détails dans une publication séparée sur le paramétrage de la recherche et sur le forum, clairement dans la vidéo : recherchez toutes les options d'enregistrement d'un numéro à la fois téléphone mobile et selon plusieurs options d'enregistrement de l'adresse E-mail. Il n'y a pas d'analogues.

. Assembleur NOUVEAU- assembler une tâche de recherche à partir de plusieurs tâches prêtes à l'emploi : requêtes, packages de requêtes et packages de paramètres. Les packages peuvent contenir d'autres packages dans leur texte. La profondeur d'imbrication des packages est illimitée. Vous pouvez créer plusieurs tâches de recherche, par exemple sur plusieurs entités juridiques et personnes physiques, et effectuer ces tâches simultanément. Plus de détails sur le forum et dans une publication séparée sur Assembler, clairement sur vidéo. Il n'y a pas d'analogues.

. Métarecherche - exécution d'une requête spécifique simultanément à une « profondeur » de recherche donnée pour chacun d'eux. La métarecherche est possible à l'aide des moteurs de recherche intégrés, notamment des blogs Yandex, Rambler, Google, Yahoo, MSN (Bing), Mail, Yandex et Google, ainsi que des outils de recherche connectés. Travailler avec plusieurs moteurs de recherche donne l'impression que vous travaillez avec un moteur de recherche . Les liens retrouvés sont supprimés. Métarecherche visuelle sur trois réseaux sociaux connectés : VKontakte, Twitter et Youtube - affiché sur vidéo.

. Métarecherche sur le site - combinant la recherche de sites dans Google, Yahoo, Yandex, MSN (Bing). Clairement sur vidéo.

. Métarecherche dans les documents bureautiques - combiner la recherche dans les fichiers Format PDF, XLS, DOC, RTF, PPT, FLASH dans Google, Yahoo, Yandex, MSN (Bing). Vous pouvez choisir n'importe quelle combinaison de formats de fichiers.

. Métarecherche de copies de cache liens dans Yandex, Google, Yahoo, MSN (Bing). Une liste est établie dont chaque élément contient tous les extraits trouvés pour chaque lien par chaque moteur de recherche. Il n'y a pas d'analogues.

. Recherche poussée pour Yandex, Google et Rambler vous permettent de combiner en une seule liste tous les liens de la recherche régulière et tous les liens, respectivement, des listes « Plus du site », « Résultats supplémentaires du site » et « Recherche sur le site (Total ...) ». En savoir plus sur la recherche approfondie sur le forum. Il n'y a pas d'analogues.

. Recherche précise et complète . Cela signifie ce qui suit. D'une part, chaque requête peut être exécutée sur celui-ci et uniquement sur la source dans le langage de requête dans laquelle elle est écrite. Ce recherche exacte. D’un autre côté, le nombre de ces demandes et sources peut être arbitraire. Cela fournit recherche complète. Apprenez-en davantage dans un article séparé sur la recherche procédurale. Il n'y a pas d'analogues.

. Rechercher sur Internet invisible .

    Il comprend les fonctionnalités de base suivantes :

    Un ensemble spécial de demandes pouvant être améliorées par l'Utilisateur,
    - rechercher des liens invisibles à l'aide d'une araignée,
    - rechercher des liens invisibles à proximité d'un lien ou d'un dossier visible par « image et ressemblance »,
    - recherches spéciales de dossiers ouverts,
    - rechercher des liens invisibles et des dossiers avec des noms standards à l'aide de dictionnaires spéciaux,
    - utilisation de vos propres recherches intégrées aux sites.

    Plus de détails dans une publication distincte sur SiteSputnik Invisible. Les fonctions de base sont « bien connues dans les cercles restreints », mais la manière dont elles sont utilisées n’a pas d’analogue. L'essence de cette méthode est de construire un plan de site visible depuis Internet (c'est-à-dire de matérialiser l'Internet visible), et uniquement sur la base de liens visibles et de rechercher des liens invisibles par rapport à ceux-ci. La recherche de liens déjà visibles par des méthodes « invisibles » n'est pas effectuée.

B. Fonctions de surveillance des informations.

. Surveillance pour une apparition sur Internet nouveau des liens sur un sujet donné. Apparence du moniteur nouveau les liens peuvent être utilisés en utilisant des entiers demander des paquets , qui impliquent l’une des méthodes de recherche mentionnées ci-dessus, plutôt que les pages d’accueil des moteurs de recherche individuels. Union et intersection mises en œuvre nouveau liens provenant de plusieurs recherches distinctes. Plus de détails dans la publication sur le monitoring (voir § 1) et sur le forum. Il n'y a pas d'analogues.

. Traitement collectif des informations . Création réseau d'entreprise ou professionnel pour la collecte collective, le suivi et l’analyse des informations. Les participants et créateurs d'un tel réseau sont des salariés de l'entreprise, des membres d'une communauté professionnelle ou des groupes d'intérêt. La situation géographique des participants n'a pas d'importance. Plus de détails dans une publication séparée sur l'organisation d'un réseau de collecte, de suivi et d'analyse collectives d'informations.

. Surveillance liens (pages Web) pour détecter les changements dans leur contenu (contenu). Version bêta. Les modifications trouvées sont mises en évidence par des couleurs et des symboles spéciaux. Plus de détails dans une publication séparée sur le suivi (voir § 2 et 3).

DANS. Fonctions d'analyse de l'information.

. Catégories de matériaux déjà décrit ci-dessus. Plus de détails peuvent être trouvés dans une publication distincte sur les rubriques. Les règles de saisie des rubriques vous permettent de spécifier des mots-clés et la distance entre eux, de définir des « ET », « OU » et « NON » logiques, d'appliquer une structure de parenthèses à plusieurs niveaux et des dictionnaires (insérer des fichiers) auxquels des opérations logiques peuvent être appliquées.

. Technologie VF - expansion presque arbitraire de la possibilité de catégoriser les matériaux grâce à la mise en œuvre de fonctions externes organiquement intégrées aux règles de saisie des rubriques et pouvant être mises en œuvre par le programmeur de manière indépendante sans la participation de l'auteur du programme.

. Analyse numérique occupation de Rubriks, installation alarme et notification de la survenance d'événements significatifs par mise en évidence des Rubriques en couleur et/ou envoi d'un rapport d'alarme par e-mail.

. Pertinence factuelle. Il existe une option pour organiser les liens dans l'ordre proche de l'importance ces liens en relation avec le problème en cours de résolution, en contournant les astuces des webmasters qui utilisent différentes manières augmenter le classement des sites Web dans les moteurs de recherche. Ceci est réalisé en analysant les résultats de l’exécution de plusieurs requêtes « diverses » sur un sujet donné. Au sens littéral du terme, les liens contenant informations maximales requises . Pour en savoir plus, consultez la description de la manière de trouver le fournisseur optimal et sur le forum. Il n'y a pas d'analogues.

. Calcul des relations entre objets - rechercher des liens, des ressources (sites), des dossiers et des domaines sur lesquels des objets sont simultanément mentionnés. Les objets les plus courants sont les personnes et les entreprises. Pour rechercher des connexions, tous les outils du programme mentionnés sur cette page peuvent être utilisés SiteSputnik, ce qui augmente considérablement l'efficacité du travail que vous effectuez. L'opération est effectuée sur un nombre quelconque d'objets. Plus de détails dans l'introduction du programme, ainsi que dans la description nouvelle fonctionnalité"les objets et leurs connexions". Il n'y a pas d'analogues.

. Formation, intégration et intersection des flux d'informations sur une variété de sujets, comparaison des discussions. Plus de détails dans un article séparé sur les discussions.

. Création de cartes Web sites, ressources, dossiers et objets recherchés en fonction de ceux trouvés sur Internet lorsque Aide Google, Yahoo, Yandex, MSN (Bing) et Altavista appartenant au site. Les experts peuvent découvrir : est-ce visible "supplémentaire" des informations provenant d’Internet sur leurs sites Web, ainsi que des recherches sur les sites Web de concurrents à ce sujet. Le plan du site Web est matérialisation de l’internet visible . Plus de détails dans une publication distincte sur la création de cartes Web, visuellement sur vidéo. Il n'y a pas d'analogues.

. Trouver de nouvelles sources d'information sur un sujet donné, qui peuvent ensuite être utilisées pour suivre l'émergence de nouvelles informations pertinentes. Plus de détails sur.

G. Fonctions de services.

. Planificateur de tâches fournit du travail Programmé: exécute des fonctions de programme spécifiées à un moment donné. Plus de détails dans une publication séparée sur le Planner.

. Instructeur de projet NOUVEAU- c'est un assistant création et maintenance Projets de recherche, de collecte, de suivi et d'analyse d'informations (catégorisation et signalisation). Plus de détails sur le forum.

. Archivage automatique. DANS bases de données Tous les résultats de votre travail sont automatiquement mémorisés, à savoir : les requêtes, les packages de requêtes, les protocoles de recherche et de surveillance, toute autre des fonctions ci-dessus et les résultats de leur exécution. Peut structure travailler sur des sujets et sous-thèmes.

. Base de données comprend le tri, la recherche simple et la recherche personnalisée par requête SQL. Pour ces derniers, il existe un assistant de composition de requêtes SQL. Grâce à ces outils, vous pouvez rechercher et réviser le travail que vous avez effectué hier, le mois dernier, il y a un an, définir un sujet comme critère de recherche ou définir un autre critère de recherche basé sur le contenu de la base de données.

. Limites techniques moteurs de recherche. Certaines limitations, telles que la longueur de la chaîne de requête, peuvent être surmontées. Il assure l'exécution non pas d'une, mais de plusieurs requêtes, combinant les résultats de recherche ou séparément. Vous pouvez découvrir un moyen de surmonter la violation de la loi d'additivité pour les principaux moteurs de recherche. Pour un mot ou une phrase mis entre guillemets, une recherche sensible à la casse dans les moteurs de recherche est mise en œuvre, notamment une recherche par abréviation.

Intégré navigateur . Navigateur par page. Multicolore marqueur pour mettre en évidence des mots clés et arbitraires. Bilistage et N-listing à partir des documents générés.

. Déchargement les actualités s'affichent dans une vue tabulaire axée sur importer dans Excel, MySQL, Access, Kronos et autres applications.


5. Installation et lancement du Programme, configuration informatique requise.

Pour installer et exécuter le programme :

  • Téléchargez le fichier, copiez le dossier FileForFiles sur votre Disque dur, par exemple, sur D:\;

  • Version démo du programme sera installé et il s'ouvrira.

  • Le programme fonctionnera sur n'importe quel ordinateur sur lequel il est installé Windows n'importe lequel versions.

    Parlez de quoi à notre époque technologies de l'information et la croissance sans fin du volume de données disponibles à la fois pour un individu et pour la société, il existe de nombreux problèmes liés au traitement de l'information et à sa recherche - c'est déjà un blasphème. Qui n'aborde pas ce sujet ? Et afin de ne pas vous encombrer de jugements subjectifs et, en partie, objectifs tirés de diverses sources d'information concernant le problème, je passerai directement à sa solution. Aujourd'hui, nous allons parler de recherche. C'est-à-dire des programmes et des systèmes d'information sérieux qui recherchent les documents et les données dont nous avons besoin.

    Mettre à niveau la "recherche directe"

    Il n'y a pas si longtemps, lorsque les arbres étaient grands et que l'information, même réseau local il n'y avait pas tellement d'entreprises, toute recherche était effectuée par une recherche banale d'une poignée de fichiers disponibles et une vérification séquentielle de leurs noms et contenus. Une telle recherche est dite directe, et les programmes (utilitaires) utilisant la technologie de recherche directe sont traditionnellement présents dans tous systèmes d'exploitation et des packages d'outils. Mais même le pouvoir ordinateurs modernes pas suffisant pour une recherche rapide et adéquate dans des volumes gigantesques de données lors d'une recherche directe. Rechercher parmi quelques centaines de documents sur un disque et parcourir une immense bibliothèque et plusieurs dizaines de boîtes aux lettres sont deux choses différentes. Par conséquent, les programmes de recherche directe d'aujourd'hui passent clairement au second plan - si nous parlons de sur les moyens universels.

    Bien entendu, ce type de recherche n'est plus demandé depuis longtemps dans le secteur des entreprises. Les volumes ne sont pas les mêmes. Et par conséquent, depuis de nombreuses années maintenant, et récemment clairement, les technologies capables de rechercher rapidement et avec précision des documents de différents formats et provenant de diverses sources sont plus que pertinentes. Il n'y a pas si longtemps, le « père » de Microsoft, Bill Gates, apparemment envieux du succès phénoménal du moteur de recherche Internet Google, a annoncé lors d'une conférence de presse le désir de l'industrie du logiciel (et pas seulement) de contribuer de toutes les manières possibles, développer et approfondir la création de moteurs et de technologies de recherche. Mais il est trop tôt pour créer un programme Microsoft au fonctionnement phénoménal ou un serveur compétitif sur Internet (MSN n’atteint toujours pas Google). Passons donc aux développements existants. Index, requête, pertinence

    Au coeur technologies modernes il y a deux processus fondamentaux. Premièrement, il s'agit d'indexer les informations disponibles et de traiter la demande avec la sortie ultérieure des résultats. Quant au premier, n'importe quel programme (qu'il s'agisse d'un moteur de recherche de bureau, d'entreprise) Système d'Information ou moteur de recherche Internet) crée sa propre zone de recherche. Autrement dit, il traite les documents et génère un index de ces documents (une structure organisée qui contient des informations sur les données traitées). À l'avenir, c'est l'index créé qui est utilisé pour le travail - obtenant rapidement une liste des documents nécessaires selon la demande. Ce qui suit, bien que loin d’être simple en termes de technologie, est tout à fait compréhensible pour l’utilisateur moyen. Le programme traite la demande (à l'aide d'une expression clé) et affiche une liste de documents contenant cette expression clé. Les informations étant contenues dans un index structuré, le traitement des requêtes est nettement (des dizaines et des centaines de fois !) plus rapide que dans le cas d'une recherche directe (la sélection des documents s'effectue non pas par recherche dans des fichiers, mais par analyse informations textuelles dans l'index).

    Le programme affiche les documents trouvés dans la liste résultante selon leur pertinence - la conformité du document avec le texte de la requête. Dans différentes technologies, bien entendu, il existe différentes méthodes pour rechercher et déterminer la pertinence d'un document (le nombre d'« occurrences » d'un mot et sa fréquence de mention dans le document, le rapport de ces paramètres au nombre total de mots dans le document, la distance entre les mots de la phrase de requête dans les fichiers recherchés, etc.). Sur la base de ces paramètres, le « poids » du document est déterminé et, en fonction de celui-ci, un fichier particulier apparaît dans la liste des résultats à une certaine position. Dans le cas de la recherche sur Internet, la situation est encore plus compliquée. En effet, dans ce cas, bien d’autres facteurs doivent être pris en compte (le Page Rank de Google en est un exemple). Mais il s’agit d’un sujet pour un article séparé, nous n’aborderons donc pas Internet.

    Ce document examine les capacités de plusieurs programmes de recherche populaires offrant à la fois des vitesses décentes et de bonnes fonctionnalités. Mais s’afficher dans des brochures est une chose, mais se tenir sous le regard d’un expert en est une autre. Et il n'y avait plus d'experts, ni moins un bureau rempli de gens qui aimaient bricoler le logiciel pour le rendre plus convivial. Sur un ordinateur expérimental (Athlon 2,2 MHz, d'une capacité mémoire vive Disque dur IDE Seagate 1 Go, 160 Go à 7 200 tr/min et Système Windows XP), un ensemble de programmes a été installé : dtSearch Desktop, Ischeyka Prof Deluxe, Google Desktop Search, SearchInform, Copernic Desktop Search, ISYS Desktop. Pour les tests, une base de données texte de documents a été compilée en doc, txt et HTML général la taille n'est ni plus ni moins, mais 20 gigaoctets. Un groupe de camarades sous la houlette de votre humble serviteur a testé, comparé et partagé leurs impressions subjectives sur chaque logiciel. Lisez un résumé des résultats ci-dessous. Bureau dtSearch

    Un programme qui, selon les développeurs, prétend être le moteur de recherche le plus rapide, le plus pratique et le meilleur. Comme, en général, tout le monde de cette revue. L'interface de dtSearch est assez simple, mais certaines fenêtres ou onglets sont quelque peu surchargés d'éléments, ce qui la rend difficile à utiliser. Mais en réalité il n’y a pas de difficultés particulières. Le seul point vraiment désagréable est le manque de support de la langue russe par le logiciel (malgré le fait que le programme puisse rechercher des documents en plusieurs langues, son interface est exclusivement en anglais).

    Mais dtSearch est l'un des rares programmes capables d'indexer des pages Web à une « profondeur » spécifiée par l'utilisateur (tout en tenant compte de « l'achat supplémentaire » du kit complémentaire dtSearch Spider). Ceci s'ajoute à la prise en charge des fichiers disque de divers formats de texte et des e-mails de boites aux lettres Perspectives. Dans le même temps, le programme ne peut pas fonctionner avec des bases de données, qui constituent un morceau si savoureux pour les moteurs de recherche en raison des grands volumes d'informations qu'elles contiennent et de leur large diffusion dans les entreprises, et donc dans les réseaux d'entreprise. La vitesse d'indexation des documents dtSearch s'est avérée être au bon niveau. Pour l'avenir, je dirai que ce programme a réussi à indexer une quantité donnée d'informations au niveau d'un autre concurrent - iSYS - et a partagé avec lui la deuxième place dans la liste des plus performants. systèmes rapides. dtSearch a indexé un test de 20 Go d'informations en 6 heures et 13 minutes, créant ainsi un index de 7,9 Go pour les besoins de recherche ultérieurs.

    Quant aux capacités de recherche, elles sont ici au bon niveau. Tout d'abord, dtSearch dispose d'une recherche morphologique (recherche d'un mot sous toutes ses formes morphologiques). En utilisant cette opportunité, vous vous libérez, par exemple, de pensées telles que « dans quel cas un certain mot a-t-il été utilisé dans le document dont j'avais besoin ? Le recours à la recherche morphologique est presque toujours justifié, elle devrait donc être présente dans tout moteur de recherche professionnel.

    La recherche par le son est une fonctionnalité non standard, même pour les moteurs de recherche professionnels. Son essence est que le programme recherchera des mots qui sonnent de la même manière que le mot que vous avez saisi. Et le meilleur, c'est que cette fonction fonctionne également pour la langue russe ! Par exemple, lorsque vous tapez le mot « oreille » dans une requête de recherche, vous verrez non seulement les mots « oreille », mais également « oreille ».

    La recherche avec correction d'erreurs est une fonction très importante. Il est utilisé pour rechercher des mots contenant des erreurs syntaxiques - il peut s'agir soit de fautes de frappe, soit d'erreurs dans des documents obtenus à l'aide de systèmes de reconnaissance de caractères, par exemple. Un exemple simple : vous recherchez le mot clavier. Certains documents contiennent le mot « clavier », il est évident qu'il s'agit en fait du mot « clavier », la personne vient de faire une faute de frappe en tapant. Ainsi, une recherche de correction d'erreur détectera et inclura un document avec le mot « clavier » dans le résultat. Il existe également un paramètre dans dtSearch qui vous permet de déterminer le degré de caractères erronés possibles.

    Effectuez une recherche à l'aide de synonymes. Cette fonctionnalité utilise une liste de synonymes pour différents mots. Ainsi, par exemple, en saisissant le mot « rapide », le programme trouvera également les mots « haute vitesse » et d'autres synonymes du mot « rapide », si, bien sûr, ils sont présents dans la liste des synonymes. . Une liste de synonymes prête à l'emploi n'est pas fournie avec le programme dtSearch, cependant, il est possible d'utiliser des listes sur Internet (une connexion est donc requise, ce qui n'est pas toujours pratique), ou vous pouvez créer votre propre liste de synonymes .

    En plus des fonctionnalités répertoriées, dtSearch peut effectuer une recherche à l'aide d'expressions composées de mots reliés par des opérations logiques. Chaque mot d’une requête peut se voir attribuer son propre « poids », c’est-à-dire sa signification. Une option utile consiste à utiliser un dictionnaire composé de mots sans importance afin de ne pas en tenir compte lors de la recherche, mais ce dictionnaire est également vide et vous devrez le remplir vous-même.

    Examinons ensuite les capacités du programme lorsque vous travaillez sur le réseau. En fait, dtSearch n'offre aucune fonctionnalité spécifique pour travailler avec le réseau. Il est cependant tout à fait possible de l’utiliser en ligne. Alternativement, vous pouvez créer une sorte d'index et le placer dans un dossier public (partagé). Le programme lui-même peut être installé sur l'ordinateur de chaque utilisateur, ou il peut également être placé dans un dossier ouvert à accès publique, et créez des raccourcis spéciaux pour chaque utilisateur séparément à l'aide des paramètres ligne de commande, dont le but est décrit dans le fichier d'aide fourni avec le programme. Il existe également une possibilité installation automatique programmes au réseau en utilisant Fichier MSI. Cela prendra en compte les paramètres de chaque utilisateur connecté.

    En général, c'est un bon programme de la catégorie des moteurs de recherche professionnels. Il peut prétendre à une bonne note, mais gagner la confiance et le respect des utilisateurs peut ne pas être facile pour dtSearch en raison de certains facteurs (tout n'est pas fluide avec l'interface, les utilisateurs russes sont privés, il n'y a pas de fonctionnalités brillantes pour travailler avec le réseau) . Quant à la recherche directe de documents, le programme n'a eu aucun problème avec le texte russe. Comme il n'y en avait pas avec la morphologie déclarée, ni avec une recherche floue. Le système a trouvé de manière tout à fait adéquate les documents nécessaires à la fois par une simple requête d'un mot et en utilisant quelques paragraphes ou un document comme phrase clé.

    Site officiel:
    Taille de distribution : 23 Mo Bloodhound Prof Deluxe

    D'après le nom, vous pouvez deviner que ce programme prend en charge la langue russe. C'est déjà sympa. Quant à l'interface, en général, elle est quelque peu inhabituelle, mais en apparence elle est très attractive. Une autre chose est la commodité. Un critère très controversé, mais néanmoins, probablement, une solution multi-fenêtres n'est pas l'option la plus réussie (la demande est saisie dans une fenêtre, le résultat est affiché dans une autre, etc.).

    Snoop utilise les mêmes index pour effectuer une recherche rapide, mais l'indexation est beaucoup plus lente que celle des autres programmes. C'est très étrange, d'autant plus que ses capacités de traitement des requêtes de recherche sont très faibles et que la structure de l'index n'est donc pas complexe. Très probablement, cela est dû à des algorithmes non optimisés. Ce programme s'est avéré être un outsider évident en termes de vitesses d'indexation et de recherche : le temps passé à créer un index est six fois plus long que celui de dtSearch et iSYS. L'indexation de 20 gigaoctets de textes pour le limier a nécessité 38 heures et 46 minutes de travail. Et la "zone de recherche" créée occupait sur le disque dur la même taille que les données d'origine avec un petit moins - 19 gigaoctets.

    Bloodhound peut être présenté comme une alternative à la recherche standard sous Windows ; il est peu probable qu'il soit capable de faire plus. Le fait que la tâche principale du Snooper soit la recherche la plus simple de fichiers est indiqué non seulement par le petit nombre de fonctions d'analyse du texte des requêtes de recherche et une recherche avancée par attributs de fichier, mais même par une fenêtre de résultats qui fournit des liens directs vers le fichiers trouvés, ainsi qu'aux dossiers contenant ces fichiers. La fenêtre des résultats n'est pas très informative dans le sens où vous pouvez lire l'intégralité du fichier trouvé uniquement en l'exécutant, c'est-à-dire qu'elle n'a pas de visionneuse de fichiers intégrée. Mais un extrait du fichier où a été trouvé le mot recherché est affiché ; en général, ce schéma d'affichage rappelle beaucoup les moteurs de recherche Internet.

    En parlant de capacités spécifiques de traitement des requêtes de recherche, il convient de noter qu'il n'existe pas de « texte de recherche » ; le maximum pouvant être recherché est une phrase, ne serait-ce que parce qu'il n'y a pas de champ de saisie de texte multiligne. Cependant, vous pouvez analyser la phrase saisie, et Snoop nous propose ici un ensemble de recherche standard : opérations logiques, recherche de masque et recherche de citations... pas grand-chose. Le programme contient quelques rudiments de recherche morphologique, mais il est probablement si rudimentaire qu'il interfère très probablement avec le bon fonctionnement (lors des tests, de nombreux bugs avec une utilisation incorrecte de la morphologie ont été remarqués).

    Mais le programme vous permet de spécifier les attributs du fichier lors de la recherche (date du document, nom du fichier, nom du dossier), et dans ces requêtes, vous pouvez également utiliser le même ensemble de recherche. Vous pouvez également rechercher des lettres en précisant les paramètres (De, Objet..., etc.).

    Ainsi, nous avons compris la recherche elle-même, qu'y a-t-il d'autre d'intéressant dans le programme, pour lequel il a reçu tant de récompenses, selon les informations du site officiel ? Il est difficile de dire ce qu'il a de si spécial ; très probablement, l'interface de Bloodhound est attrayante (exactement en apparence, sans parler de la convivialité).

    Les opérations avec les index sont très standards ; une fonctionnalité intéressante est la possibilité de mettre à jour les index selon un calendrier. De plus, les index peuvent également être utilisés en ligne. A partir de maintenant, nous avons besoin de plus de détails.

    Malgré le caractère primitif des requêtes de recherche, le programme peut être utilisé pour rechercher des fichiers, son utilisation peut donc être justifiée dans les réseaux. Bien que cela soit très étendu, puisque dans un grand réseau, la tâche prioritaire est recherche rapide données utilisant des requêtes de recherche complexes en raison de l'énorme quantité d'informations - et il y a clairement des problèmes avec la vitesse de recherche et le programme. Je dois dire que le travail avec le réseau à Izhishika est pensé comme il se doit. Une application distincte est spécialement conçue pour cela - Bloodhound Server. Il fonctionne de la même manière que simplement Snooper (ils ont le même moteur de recherche), uniquement pour les documents hébergés sur un serveur central ou sur ressources partagées V réseau d'entreprise. Snooper Server crée de nouveaux index sur des ressources partagées ou utilise ceux créés précédemment. Tout utilisateur du réseau d'entreprise peut se connecter au serveur de recherche et l'utiliser pour accéder à n'importe quel document (situé dans l'index actuel) à l'aide d'un navigateur Internet. D'accord, ce schéma est extrêmement pratique : il s'avère que les fichiers sur votre propre réseau peuvent être recherchés de la même manière que les informations sur Internet via, par exemple, Google.

    En évaluant tous les avantages et inconvénients de ce programme, la conclusion s'impose que ses capacités ne sont probablement pas suffisantes pour les réseaux d'entreprise (malgré la bonne organisation du travail avec le réseau), mais pour un ordinateur domestique ou même pour réseau domestique En principe, cela pourrait convenir. Même si ni la rapidité de travail ni les capacités de recherche n'inspirent l'optimisme...

    Site officiel en russe :
    Taille de distribution : 6 MoGoogle Desktop Search + GDS Enterprise

    Bien sûr, nous ne pouvions pas ignorer un développeur aussi célèbre. Nom Google déjà en dit long. Les personnes qui utilisent le moteur de recherche Internet le plus puissant depuis des années décideront certainement, sans aucun doute, d'installer ce moteur de recherche particulier sur leur ordinateur. Pensez-y : Google sur votre ordinateur personnel ! Cependant, sans céder aux provocations d'une marque largement promue, essayons de considérer sobrement, et surtout objectivement, les capacités du moteur de recherche « de bureau » de Google.

    La première chose qui attire l'attention est l'absence de son propre shell pour le programme. Google Desktop Search est toujours situé dans la fenêtre du navigateur, respectivement, toute l'interface de la version de bureau a été héritée du logiciel de son frère Internet aîné. Que cela soit bon ou mauvais est un point discutable : certaines personnes aiment le minimalisme dans la conception de ce moteur de recherche, tandis que d'autres souhaitent voir une application à part entière remplie de toutes sortes de boutons, etc.

    Qu’est-ce qui attire votre attention juste après la conception ? Et le fait que ce même Google Desktop Search commence à tout indexer sur l'ordinateur, sans aucune demande ! Et ce qui est le plus intéressant, c’est qu’il est impossible de sélectionner des chemins d’indexation à l’aide de Google Desktop Search. Vous devrez télécharger un programme séparé (TweakGDS), qui vous permettra d'étendre légèrement Paramètres Google Bureau, y compris en spécifiant les emplacements requis pour l'indexation. Bien que, au moment où vous comprendrez tout cela, il indexera déjà un disque dur standard, ce paramètre sera donc plus susceptible d'être nécessaire lorsque vous travaillez avec de grandes quantités de données, ce qui est très important lorsqu'il est utilisé dans des réseaux d'entreprise (versions Enterprise). . Cependant, ce n’est pas un fait qu’après avoir téléchargé TweakGDS, vos problèmes seront résolus. Après tout, elle a besoin de Microsoft pour travailler. NET-Framework et Microsoft Scripting Runtime. Ouais... l'installation, ainsi que l'accès aux paramètres, auraient pu être simplifiés, même si les développeurs peuvent probablement comprendre : pourquoi écrire quelque chose de nouveau alors qu'il existe un moteur de recherche prêt à l'emploi, l'a porté sur ordinateur local et laissez l'utilisateur « profiter », et laissez le célèbre nom faire de « ceci » un autre chef-d'œuvre. Allez, terminons cette digression lyrique et passons à la recherche.

    Quant à l'analyse des requêtes de recherche et à la fourniture de résultats, tout ici est absolument identique à Google sur Internet : le même système d'affichage des résultats, le même ensemble standard d'opérations logiques pour les requêtes de recherche. En général, Google Desktop Search, comme le programme précédent, est destiné exclusivement à la recherche de fichiers - il ne dispose bien sûr pas de visionneuse interne pour ces fichiers. Le nombre de formats de fichiers pris en charge par Google Desktop Search est tout à fait suffisant, et il est également agréable qu'il recherche les pages Internet visitées en récupérant les données du cache. Les vitesses de recherche et d’indexation sont tout à fait acceptables. C'est vrai, pour un usage domestique. Avec un impressionnant 20 gigaoctets SMS Google Desktop Search a terminé la tâche en 8 heures et 17 minutes. Passer plusieurs jours à traiter des informations provenant du réseau d'entreprise d'une grande entreprise n'est pas quelque chose qu'un administrateur système aimerait faire. Du côté positif : la taille de l'index créé était du même niveau (4,5 Go) qu'un autre moteur de recherche testé dans cette revue - SearchInform.

    Le gros avantage (ou inconvénient - à vous de décider) de Google Desktop Search est qu'il prend en charge les plugins, ce qui peut changer beaucoup pour le mieux. Une autre chose est que connecter des plugins et les configurer complique tellement la tâche d'installation d'un moteur de recherche que vous commencez à vous demander si tout cela est nécessaire lorsque vous pouvez installer un programme normal et à part entière dans lequel tout sera déjà présent. Après tout, pour utiliser chaque fonctionnalité, vous devrez installer un nouveau plugin. Même pour que le programme fonctionne pleinement avec les archives, un gadget distinct est nécessaire. C’est fascinant et séduisant que tous ces modules supplémentaires soient gratuits. Cependant, si vous ne tenez pas compte de la version de bureau du moteur de recherche, une configuration compétente de GDS Enterprise n'est peut-être pas en votre pouvoir - après tout, ce n'est pas pour rien que les spécialistes de Google proposent leurs services pour configurer le leur. logiciel pour votre réseau pour seulement 10 000 $.

    Si vous suivez la procédure de configuration et d'installation (ou payez 10 000 $ à une équipe de réponse rapide de Google), vous comprendrez que la complexité de l'installation est plus que compensée par les paramètres très flexibles lors de l'utilisation dans les réseaux d'entreprise. Un point important Google travaille Le bureau dans un réseau d'entreprise consiste à utiliser des stratégies de groupe, qui permettent de définir des paramètres pour chaque utilisateur.

    Pour résumer, l'utilisation la plus raisonnable de ce programme est un ordinateur personnel ou professionnel. Après tout, pour un ordinateur ordinaire, il suffit d'installer le programme - il fera le reste lui-même (il ne vous demandera même rien).

    Cependant, Google Desktop Search Enterprise sera acceptable dans les cas où il existe un besoin urgent d'une configuration flexible de la politique de réseau pour utiliser le moteur de recherche, tandis que la capacité de traiter les requêtes de recherche viendra en deuxième position en termes d'importance, et le temps (ou l'argent) ) consacrés à la mise en place du programme occuperont la première place.

    Site officiel:
    Taille de la distribution incluant TweakGDS : 1,2 MbCopernic Desktop Search

    Cliquez sur l'image pour agrandir

    L'interface du programme évoque des émotions extrêmement positives - tout est fait conformément aux normes généralement acceptées, rien de superflu, en un mot, un design agréable. Pour un débutant, comprendre l’interface de Copernic Desktop Search sera très simple. Cependant, il est quelque peu déroutant que les concepteurs aient clairement créé l'interface du programme en tenant compte du fait que le programme fonctionnera dans le thème standard de Windows XP. Lorsque vous utilisez le thème classique, le programme n’a pas l’air si joli. Mais c'est plutôt une question de goût.

    Au premier lancement, le programme vous propose de créer des index de recherche. Il semblait quelque peu inhabituel qu'après avoir sélectionné les dossiers à indexer, le programme ne propose d'appuyer sur aucun bouton, tel que "Démarrer l'indexation", et l'indexation ne démarre pas automatiquement, ce n'est qu'à ce moment-là qu'il a été remarqué que Copernic essayait de démarrer l'indexation pendant que l'ordinateur était inactif. Vous devrez creuser un peu plus dans les options du programme pour tout configurer correctement. A noter qu'il existe des possibilités assez larges pour mettre en place la création automatique d'index : planificateur intégré, possibilité d'indexer lorsque l'ordinateur est inactif, arrière-plan, avec une faible priorité. L'indexation n'a pas été trop rapide - 10 heures 51 minutes - c'est plus lent que dans d'autres moteurs de recherche (à l'exception d'Isle of Bloodhound, mais Copernic est toujours un ordre de grandeur plus rapide que le développement d'iSleuthHound Technologies.

    Parlons maintenant de la structure de l'index. En général, cela n’a rien de spécial. Il est possible de sélectionner les types de fichiers, à la fois sous forme générale et détaillée. Autrement dit, vous pouvez initialement choisir ce que vous souhaitez indexer : documents, images, vidéos, musique. Sur l'autre onglet de la fenêtre d'options, vous pourrez sélectionner des types de fichiers spécifiques par extension. De plus, vous pouvez configurer l'index de sorte que, par exemple, les images d'une taille inférieure à 16 x 16 ne soient pas indexées ou que les fichiers son d'une durée inférieure à 10 secondes ne soient pas indexés. En plus d'indexer les fichiers des dossiers, Copernic peut travailler avec les e-mails et les contacts du carnet d'adresses. Microsoft Outlook et Microsoft Outlook Express, l'indexation des favoris et de l'historique depuis Internet Explorer est possible.

    Quant aux capacités de recherche, elles sont ici très faibles. Lors des tests, il a même été révélé que le programme ne recherche pas les documents aux formats txt et html en russe, ce qui permet de les retrouver uniquement par titres, et non par contenu. La seule chose que le programme propose pour améliorer l'efficacité de la recherche est l'utilisation d'un ensemble standard d'opérations logiques, et même dans ce cas, cette fonctionnalité a été découverte expérimentalement, car elle n'était pas documentée. À propos, l'aide du programme n'est pas non plus correcte - elle n'est disponible que via Internet, ce qui, voyez-vous, est très gênant, et il n'y a pas beaucoup d'informations d'aide sur Internet. Apparemment, les développeurs ont décidé que l'interface simple du programme n'impliquait pas la présence d'une aide normale. Poursuivant la conversation sur les capacités de recherche, il convient de noter que, malgré la faible analyse des requêtes, le programme propose un système de recherche intéressant - l'utilisateur peut sélectionner le type de fichiers (images, vidéos, musique, etc.), saisir une recherche interroger et sélectionner les attributs spécifiques au type de fichier sélectionné. Par exemple, pour les fichiers sons, il peut s'agir de valeurs issues de balises mp3 (artiste, album, date, etc.), pour les images par exemple, vous pouvez sélectionner leur taille (par résolution), en général, chaque type a son propres paramètres. Après avoir recherché un type de fichier spécifique, le programme affichera une liste très informative dans la fenêtre des résultats, et si votre demande inclut des fichiers d'autres types, vous pourrez les ouvrir en cliquant sur un lien spécifique.

    Séparément, il convient de mentionner la fenêtre d'affichage des résultats. Sous la liste des fichiers trouvés, le contenu de ces fichiers est affiché (un schéma similaire est souvent utilisé dans les clients de messagerie). Certes, la visualisation de texte ne peut être effectuée qu'au format natif et il n'existe pas de mode d'affichage de texte brut, ce qui n'est pas toujours pratique, car l'ouverture d'un document dans ce cas prend plus de temps. Mais étant donné que Copernic peut rechercher des images et de la musique, il est possible de visualiser ces fichiers multimédias.

    Les principes de base de fonctionnement de ce programme sont décrits, voyons maintenant ce que Copernic Desktop Search peut nous offrir pour travailler avec le réseau... En principe, vous pouvez regarder très longtemps, mais vous ne pourrez pratiquement rien voir . En d’autres termes, ce programme n’était pas destiné à être basé sur un réseau. Copernic Desktop Search est exclusivement un moteur de recherche domestique.

    Évidemment, la seule application (la plus logique) de ce programme est ordinateur de famille. Ici, il répondra pleinement à toutes les requêtes de recherche simples des utilisateurs composées d'un ou deux mots, trouvera les informations nécessaires, ainsi que la division de la recherche par type de fichier et la prise en charge des fichiers multimédias ainsi que l'indexation en arrière-plan en mode basse priorité, couplée à un agréable interface, donnez seulement au programme la force de gagner la confiance des utilisateurs inexpérimentés.

    Site officiel
    Taille de distribution : 2,6 MbISYS Desktop

    Cliquez sur l'image pour agrandir

    Un programme très puissant. En termes de niveau d'équipement avec toutes sortes de fonctions, il se situe quelque part proche du prochain système de recherche SearchInform de la liste. De plus, la taille du fichier d'installation est supérieure à 40 Mo ! Il est difficile de dire ce qui pourrait être compressé dans de telles dimensions, car le même SearchInform, avec des fonctionnalités similaires, occupe 15 Mo.

    Le processus d'installation ici n'est pas non plus très agréable, ou plutôt même pas le processus d'installation. Avant même de télécharger le programme, il vous sera demandé de vous inscrire, sinon il n'y a aucun moyen. Ensuite, l'interface. C'est très bien fait, rien d'inutile n'attire l'attention, cependant, ce sont les impressions d'une personne qui y est déjà un peu habituée. Il ne sera pas facile pour un débutant de savoir où et ce qui se trouve, où cliquer et où enfin chercher. Il est fortement recommandé de lire l'aide avant de commencer à travailler - vous économiserez beaucoup de nerfs et de temps. À tout le reste s'ajoute l'absence totale de prise en charge de la langue russe dans le programme. Pas bon. De plus, les fenêtres ici ne sont pas surchargées de contrôles, mais nous avons dû payer pour cela avec des multi-modules et l'utilisation de fenêtres supplémentaires. Par exemple, les requêtes de recherche sont saisies en lançant un programme et la gestion des index est effectuée à l'aide d'un autre programme. Les requêtes de recherche sont également saisies ici dans des fenêtres contextuelles distinctes. Il est difficile de dire ce qui est le mieux : une interface surchargée ou des fenêtres multiples omniprésentes ; c'est plutôt une question de goût.

    Lorsqu'il s'agit de créer des index, le programme fournit des fonctionnalités pour simplifier le processus de définition des options pour un nouvel index. Ces fonctionnalités comprennent plusieurs modèles prêts à l'emploi pour créer des index pour le dossier « Mes documents », « Courrier », « Courrier et documents », « Dossier spécifique », « Dossier avec une sélection de types de fichiers », etc. De tels modèles simplifient la création d'index dans un premier temps. L'utilitaire pour travailler avec des index n'a pas une très bonne interface, ce qui est intimidant avec une certaine complexité (c'est une évaluation très subjective, pour être honnête), cependant, si vous le regardez, il offre de nombreuses options utiles et, en général , son utilisation ne pose pas beaucoup de difficultés. ISYS Desktop peut indexer des données provenant de diverses sources de données et fournit également de nombreux paramètres flexibles pour une telle indexation. Les fonctionnalités d'indexation supplémentaires incluent : la prise en charge de SQL, FTP, TRIM Context, WORLDOX 2002 et des scripts. Lors de la création d'un index, si vous avez sélectionné l'élément "Dossier avec sélection des types de fichiers", vous avez la possibilité de sélectionner manuellement les types de fichiers à indexer (par extension). Il faut dire qu'il existe simplement un grand nombre de types de fichiers pris en charge, mais vous ne pourrez pas ajouter votre propre type (extension) à la liste existante. On peut également noter la présence d'un planificateur d'indexation. La création d'un index et le traitement de 20 Go d'informations ont pris 6 heures et 13 minutes à ISYS Desktop, affichant finalement un bon temps et la taille du fichier créé - 7,9 Go.

    Les capacités de recherche de ce programme sont assez bonnes. Ce qui est utilisé dans ISYS est bien plus puissant que la prise en charge conventionnelle des opérations logiques. Parmi les capacités de recherche avancées, le programme propose l'utilisation de synonymes et d'un filtre de tri (par chemin, nom et date de création du fichier). L'ensemble des opérateurs logiques est un peu plus large que l'ensemble standard. En plus des opérations logiques, le programme vous permet de travailler avec de nombreux autres opérateurs qui, en principe, peuvent remplacer certains types de recherche ; par exemple, la recherche avec analyse peut être complètement remplacée en utilisant des opérateurs spéciaux. J'ai été très surpris que le programme ne propose pas de recherche utilisant la morphologie. Il s’agit d’une omission grave, puisque l’efficacité de la recherche est grandement améliorée lors de l’utilisation de l’analyse morphologique. De plus, il n’y a pas de liste de mots significatifs, mais il existe une longue liste de mots insignifiants. Des fonctions de recherche telles que « recherche approximative » et « analyse heuristique » sont également annoncées.

    ISYS propose un choix de plusieurs types de requêtes de recherche, notamment visuelles. Cela se fait à l'aide de différents types de fenêtres pour saisir les requêtes de recherche. Cependant, en réalité, aucune fenêtre ne permet l'utilisation d'autres technologies que celles énumérées ci-dessus.

    Les résultats de la recherche sont très informatifs et sont affichés sous forme de liste de documents triés par pertinence. Un aperçu du document sélectionné s'affiche ci-dessous. Contrairement à Copernic Desktop Search, l'aperçu ici n'est disponible que sous forme de texte brut ; il n'a pas été possible d'afficher les documents dans leur format natif, que ce soit Word, HTML ou PDF, bien que cela, en principe, ne soit pas trop critique. Le programme vous permet de diviser les documents trouvés en groupes selon certains critères (par défaut ils sont divisés par pertinence). Vous pouvez également visualiser les documents déjà trouvés en sélectionnant des dossiers individuels (ce qui est pratique lorsque le résultat produit un très grand nombre de documents).

    L'utilisation du programme sur un réseau d'entreprise est également très justifiée, car il offre de bonnes opportunités pour organiser la recherche de réseau. Le système de recherche est basé sur la création d'un index public contenant des données indexées provenant de ressources en ligne accessibles au public.

    En fait, le programme d'ISYS mérite l'attention, au moins pour en prendre connaissance. Ce programme est un projet mature avec un grand nombre de fonctions (pas toujours et tout le monde, bien sûr, n'en a pas besoin, mais quand même). Les chances que le programme connaisse des améliorations en termes de traitement des requêtes de recherche sont inconnues, mais pour le moment, il peut être recommandé pour une utilisation presque universelle. Et étant donné qu'il est encore trop lourd pour les systèmes domestiques, les principaux lieux d'installation sont les réseaux d'entreprise.

    Site officiel:
    Taille de distribution : 40 MbSearchInform

    Cliquez sur l'image pour agrandir

    Cela ne vaut probablement pas la peine de commencer tout de suite par une description de l’interface SearchInform. Nous devons d'abord décrire le processus d'installation, ou plutôt un de ses détails : vous ne pouvez pas installer le programme sans connexion Internet. Le fait est qu'avant le premier lancement, le programme nécessite l'enregistrement de l'utilisateur (gratuit) et envoie toutes les données saisies au serveur. Apparemment, les développeurs ont dû prendre de telles mesures pour lutter contre le piratage, mais cela n'a pas eu d'effet positif sur la facilité d'installation.

    L'interface du programme est conçue dans le respect de toutes les règles généralement acceptées, mais à première vue, elle est quelque peu lourde. En utilisant le programme pour la première fois, il semble que ce soit trop compliqué, parfois il n'est pas facile de se rappeler dans quel menu ou sur quel onglet se trouve l'option souhaitée, cependant, avec une utilisation plus longue, l'interface ne semble plus si terriblement complexe . L'essentiel est de lire d'abord le certificat.

    Après avoir un peu compris l'interface, vous pouvez commencer à créer un index. Le processus lui-même est très simple et la vitesse d'indexation, même à l'œil nu, est nettement supérieure à celle de tous les autres moteurs de recherche de la revue. Des chiffres de test clairs montrent que SearchInform est deux fois plus rapide que dtSearch et iSYS en termes de vitesse d'indexation ! Le programme a indexé les données fournies à hauteur de 20 gigaoctets en un temps record de 3 heures 17 minutes. Et la taille de l'index créé s'est avérée être la plus petite de 4,4 Go, soit 100 mégaoctets de moins que Google Desktop Search.

    Le programme prend en charge, en plus des fichiers et dossiers classiques, également l'indexation des e-mails, la connexion et l'indexation des bases de données (!) et autres sources externes(DMS, CRM), immédiatement lors de l'indexation, vous pouvez spécifier un dictionnaire pour effectuer une recherche morphologique, et tous les attributs du fichier peuvent être indexés. Après avoir créé l'index, lorsque vous essayez d'effectuer la première recherche test de documents, vous risquez d'être quelque peu confus : « il existe deux types de recherche ici, mais de laquelle ai-je besoin ? Comme mentionné précédemment, l'essentiel est de lire l'aide, alors tout deviendra clair. Le programme peut en fait effectuer deux types de recherches : la recherche d'expressions et la recherche de documents dont le contenu est similaire au texte de la requête.

    Une description de toutes les principales fonctions d'analyse d'une requête de recherche a été donnée ci-dessus, nous allons donc maintenant répertorier uniquement les capacités de recherche fournies par ce programme. Commençons par la recherche d'expressions : bien sûr, recherche morphologique, recherche de citations, opérations logiques, recherche avec analyse de mots (recherche au début du mot, à la fin, au milieu ou par correspondance complète), recherche de citations mixtes ( lorsque tous les mots de la requête doivent être présents dans le document, mais pas nécessairement dans l'ordre saisi), recherche avec correction d'erreurs, utilisation de synonymes, « recherche presque par citation » (recherche de la phrase saisie comme citation, mais d'autres mots peuvent être présent entre les mots saisis), etc. Certaines des options répertoriées ont leurs propres paramètres spécifiques. De plus, il est possible d'utiliser un dictionnaire de mots sans importance, et le programme dispose déjà d'une liste toute faite de ces mots ; vous pouvez également utiliser un dictionnaire de mots prioritaires pour la recherche (bien sûr, vous devrez le remplir toi-même).

    Ici, en principe, nous avons brièvement passé en revue toutes les principales caractéristiques de la recherche par expression.

    Passons maintenant à l'examen des fonctionnalités de ce programme : la recherche de documents similaires. Les développeurs affirment qu'il ne s'agit en aucun cas d'une simple recherche de texte, il s'agit précisément d'une "recherche de similaires" - c'est exactement ainsi que cela est décrit partout, mais bon, vous pouvez l'appeler comme vous voulez - l'essentiel est . Une recherche rapide sur Internet peut rapidement révéler que la « recherche similaire » est un nouveau développement dans le domaine de l'analyse de texte. Ce système vous permet de trouver des textes dont le contenu sémantique est similaire. Le plus agréable, c'est qu'après avoir effectué des recherches de tests, il s'est avéré que la théorie coïncide assez bien avec la pratique ! Le programme recherche en fait des documents ayant un contenu similaire et les affiche dans une liste, en les triant par pourcentage de similarité.

    Voyons ensuite ce que propose SearchInform (en particulier sa version d'entreprise SearchInform Corporate) pour travailler sur un réseau d'entreprise. Il existe deux types d'applications : côté serveur et côté utilisateur. La partie serveur traite indépendamment les index spécifiés et les utilisateurs peuvent les utiliser pour la recherche, en fonction des droits d'accès qui leur sont attribués. Les utilisateurs peuvent être configurés automatiquement à l'aide de Comptes Windows (en termes professionnels, SearchInform utilise l'authentification Windows NTFS) et manuellement (les utilisateurs devront être ajoutés séparément). Chaque utilisateur peut se voir autoriser ou refuser l'accès à certains index, et les utilisateurs peuvent également être regroupés en groupes. En général, les paramètres de SearchInform pour travailler sur le réseau sont en avance sur Google en termes de flexibilité et sur Ishhound Server en termes de commodité et de simplicité.

    Site officiel:
    Taille de distribution : 14,7 Mo Comparaison des vitesses d'indexation

    Système de rechercheTemps d'indexationTaille de l'index
    Bloodhound Prof Deluxe 4.538 heures 46 minutes19 Go
    Bureau Isys 7.06 heures 13 minutes7,9 Go
    DtSearch 7.06 heures 3 minutes8,6 Go
    Google Desktop Recherche Entreprise8 heures 17 minutes4,5 Go
    Recherche de bureau Copernic *10 heures 51 minutes7 Go
    RechercherInformer 1.5.023 heures 17 minutes4,4 Go

    * La plupart des documents.html et .txt contenant du texte russe, bien qu'indexés, étaient introuvables autrement que par leurs noms.

    Tous les programmes méritent l’attention.

    Sur la base de tests et d'un examen attentif de chaque programme présenté dans la revue, certaines conclusions peuvent être tirées. Ainsi, Google Desktop Search Copernic Desktop Search convient parfaitement à l'utilisateur inexpérimenté en tant que système de recherche d'informations sur la maison. Ils gèrent bien les requêtes simples, ne surchargent pas l'utilisateur de paramètres et, de plus, sont totalement gratuits. La tentative de Google de pénétrer le marché des moteurs de recherche d'entreprise n'est pas encore très justifiée : par exemple travail à part entière le programme doit être chargé de modules supplémentaires et il est loin d'être facile à mettre en place. Les noms explicites de Desktop Search, Copernic et Google réservent donc derrière eux le créneau des moteurs de recherche « de bureau ».

    De véritables solutions plus puissantes - dtSearch, iSYS et SearchInform ne sont pas non plus infaillibles et proposent aux utilisateurs leurs versions « de bureau ». Mais à un prix raisonnable, contrairement aux logiciels gratuits de Google et Copernic. Bien entendu, vous devez payer pour la puissance, la vitesse et la fonctionnalité. Mais les développeurs de dtSearch, iSYS et SearchInform se concentrent bien entendu principalement sur le secteur des entreprises. La mise en réseau, la fonctionnalité, l'indexation et la vitesse de recherche sont ce qui distingue ces produits de leurs « concurrents ». Sur la base des résultats des tests, le favori a été identifié - SearchInform. Le programme offre la possibilité de rechercher des documents similaires, a la vitesse d'indexation et de recherche la plus élevée, a bon ensemble les fonctions.

    Alexeï Koutovenko

    Recherche Internet professionnelle

    Introduction

    La recherche sur Internet est un élément important du travail sur Internet. Il est peu probable que quiconque connaisse avec certitude le nombre exact de ressources Web sur l'Internet moderne. En tout cas, cela se compte en milliards. Pour pouvoir utiliser l'information nécessaire à un moment donné, que ce soit à des fins professionnelles ou de divertissement, il faut d'abord la trouver dans cet océan de ressources constamment renouvelé. Ce n'est pas du tout une tâche facile, car les informations sur l'Internet moderne ne sont pas structurées, ce qui crée des problèmes pour les trouver. Ce n’est pas un hasard si les moteurs de recherche Internet sont devenus des « fenêtres » uniques sur cet espace d’information.

    Il est peu probable que parmi les internautes, il y ait des personnes qui n'ont jamais utilisé les grands moteurs de recherche universels. Les noms de Google, Yandex et quelques autres grosses machines sont sur toutes les lèvres. Ils s’acquittent remarquablement bien des tâches quotidiennes de recherche sur Internet et, souvent, les utilisateurs n’essaient même pas de chercher un remplaçant. Dans le même temps, le nombre de moteurs de recherche Internet s’élève à notre époque à des milliers. Les raisons d’une telle diversité de machines alternatives ont des racines différentes. Certains projets tentent de rivaliser directement avec les leaders du marché mondial grâce à un travail minutieux avec les ressources Internet nationales. D'autres offrent des fonctionnalités de requête non disponibles sur les moteurs de recherche bien connus. Un nombre important de moteurs alternatifs se spécialisent dans la recherche d'un certain domaine ou d'un certain type de contenu, obtenant des résultats impressionnants dans la résolution de ces problèmes. Quoi qu'il en soit, l'inclusion de tels moteurs de recherche dans l'arsenal d'outils de recherche Internet d'un utilisateur peut améliorer considérablement sa qualité. Cependant, il y a ici une nuance : vous devez connaître ces machines et être capable d'utiliser leurs capacités.

    Nous supposons que les lecteurs de ce livre sont déjà assez familiers avec les techniques de recherche utilisant les moteurs de recherche universels. C'était tellement bon qu'ils ressentaient les limites liées à leur utilisation. Très probablement, ces personnes ont déjà essayé de rechercher et d'utiliser certains outils supplémentaires. L'imprimé n'ignore pas le thème de la recherche sur Internet : des articles paraissent périodiquement et des livres sont publiés. Mais leurs héros, en règle générale, sont les mêmes : plusieurs moteurs de recherche universels de premier plan. Ce qui rend ce livre différent, c'est qu'il tente de couvrir la gamme complète des solutions de recherche modernes. Vous trouverez ici des descriptions et des recommandations pour utiliser au mieux services modernes orienté vers la résolution des problèmes de recherche les plus courants. Ce livre s'adresse aux personnes qui travaillent beaucoup sur Internet et utilisent le réseau pour trouver les informations dont elles ont besoin - qu'il s'agisse d'affaires, d'études ou de loisirs.

    Pour qu’une recherche sur Internet soit réussie, deux conditions doivent être remplies : les requêtes doivent être bien formulées et elles doivent être posées aux endroits appropriés. En d'autres termes, l'utilisateur doit, d'une part, être capable de traduire ses intérêts de recherche dans la langue de la requête de recherche, et d'autre part, avoir une bonne connaissance des moteurs de recherche, des outils de recherche disponibles, de leurs avantages et inconvénients, qui lui permettront de choisir les outils de recherche les plus adaptés à chaque cas spécifique .

    Actuellement, il n’existe pas de ressource unique répondant à toutes les exigences de recherche sur Internet. Par conséquent, si vous prenez votre recherche au sérieux, vous devrez inévitablement utiliser différents outils, en utilisant chacun dans le cas le plus approprié.

    Il existe de nombreux outils de recherche disponibles. Ils peuvent être combinés en plusieurs groupes, chacun présentant certains avantages et inconvénients. Les chapitres de notre livre sont consacrés aux principaux groupes de moteurs de recherche Internet modernes.

    Le chapitre 1, « Moteurs de recherche Internet universels », est consacré aux grands systèmes universels de récupération d'informations sur le Web. L’accent est mis principalement sur leurs instruments les plus avancés, qui passent généralement sous le radar du grand public. Un examen des capacités des machines connues nous donne une sorte de point de départ et permet d'imaginer clairement le champ d'application des solutions de recherche alternatives.

    Le chapitre 2, « Recherche verticale », parle des systèmes spécialisés dans des domaines spécifiques ou des types de contenu spécifiques.

    Le chapitre 3, « Métarecherche », examine les métamoteurs de recherche capables d'envoyer une requête simultanément à plusieurs moteurs de recherche Internet, puis de collecter et de traiter les résultats dans une seule interface.

    Le chapitre 4, « Moteurs de recherche Internet sémantiques et visuels », est un aperçu des systèmes expérimentaux qui offrent des Les interfaces des utilisateurs, ainsi que des approches intéressantes du traitement des requêtes.

    Le chapitre 5, « Machines de recommandation », présente les outils récemment apparus. services de recherche, en anglais bien nommé « Discovery Engines », c’est-à-dire « Discovery Machines ». Avec leur aide, vous pouvez traiter un certain nombre de requêtes trop complexes pour d'autres types de moteurs de recherche Internet.

    Si aucun produit prêt à l'emploi ne vous convient, vous pouvez créer votre propre moteur de recherche Internet. Le chapitre 6, « Moteurs de recherche personnels », est consacré à la création de telles machines personnelles.

    Plusieurs chapitres de notre livre sont consacrés à la recherche divers types contenu du réseau. Le chapitre 7, « Récupération d'images », présente les tendances actuelles en matière de récupération d'images sur Internet ainsi que les capacités des systèmes expérimentaux associés. Le chapitre 8, « Recherche vidéo », offre un aperçu des outils de recherche vidéo des principaux moteurs de recherche Internet universels, ainsi que des meilleurs systèmes spécialisés dans ce domaine.

    Le chapitre 9, « Recherche de contenu « caché » » est un aperçu des systèmes qui vous permettent de rechercher du contenu « non vu » par les moteurs de recherche universels. Ce contenu « caché » inclut, par exemple, les torrents ou les fichiers hébergés sur des serveurs FTP et des sites d'hébergement de fichiers.

    Le chapitre 10, « Recherche sur le Web 3.0 », présente les outils de recherche Internet pour les données aux formats du Web sémantique.

    La recherche ne se limite pas à la simple réception des résultats de l'un ou l'autre moteur de recherche. Le dernier chapitre de notre livre, le chapitre 11, « Programmes d'aide », est consacré aux outils de traitement et de sauvegarde des résultats.

    Avant de commencer une histoire sur des produits spécifiques, il est logique de comprendre la classification moyens modernes Recherche sur Internet, ainsi que définition des termes qui apparaissent constamment sur les pages de notre livre.

    Les principaux outils de recherche sur Internet peuvent être divisés dans les groupes principaux suivants :

    Moteurs de recherche;

    Annuaires Web ;

    Ressources d'aide ;

    Programmes locaux pour rechercher sur Internet.

    Les outils de recherche les plus populaires sont les moteurs de recherche, appelés moteurs de recherche Internet (Search Engines). Les trois premiers leaders à l'échelle mondiale sont assez stables : Google, Yahoo! et Bing. Dans de nombreux pays, leurs propres moteurs de recherche locaux, optimisés pour travailler avec du contenu local, sont ajoutés à cette liste. Avec leur aide, vous pouvez théoriquement trouver n'importe quel mot spécifique sur les pages de plusieurs millions de sites.

    Malgré de nombreuses différences, tous les moteurs de recherche Internet fonctionnent selon des principes similaires et, d'un point de vue technique, sont constitués de sous-systèmes similaires.

    La première partie structurelle d'un moteur de recherche est constituée de programmes spéciaux utilisés pour la recherche automatique et l'indexation ultérieure des pages Web. De tels programmes sont généralement appelés araignées ou robots. Ils examinent le code des pages Web, trouvent les liens qui s'y trouvent et découvrent ainsi de nouvelles pages Web. Il existe une autre manière d'inclure un site dans l'index. De nombreux moteurs de recherche offrent aux propriétaires de ressources la possibilité d'ajouter indépendamment un site à leur base de données. Cependant, les pages Web sont ensuite téléchargées, analysées et indexées. Ils mettent en évidence des éléments structurels, trouvent des mots-clés et déterminent leurs connexions avec d'autres sites et pages Web. D'autres opérations sont également effectuées, dont le résultat est la constitution d'une base de données d'index de moteur de recherche. Cette base de données est le deuxième élément principal de tout moteur de recherche. Actuellement, il n'existe pas de base de données d'index absolument complète qui contiendrait des informations sur tout le contenu Internet. Étant donné que différents moteurs de recherche utilisent différents programmes de recherche de pages Web et construisent leur index à l'aide de différents algorithmes, les bases de données d'index des moteurs de recherche peuvent varier considérablement. Certains sites sont indexés par plusieurs moteurs de recherche, mais il y a toujours un certain pourcentage de ressources incluses dans la base de données d'un seul moteur de recherche. La présence d'une telle partie originale et non chevauchante de l'index dans chaque moteur de recherche permet de tirer une conclusion pratique importante : si vous n'utilisez qu'un seul moteur de recherche, même le plus gros, vous perdrez certainement un certain pourcentage de liens utiles. .

    La recherche professionnelle sur Internet nécessite des logiciels spécialisés, ainsi que des moteurs et des services de recherche spécialisés.

    PROGRAMMES

    http://dr-watson.wix.com/home – le programme est conçu pour étudier des tableaux d'informations textuelles afin d'identifier les entités et les connexions entre elles. Le résultat des travaux est un rapport sur l'objet étudié.

    http://www.fmsasg.com/ - l'un des meilleurs programmes au monde pour visualiser les connexions et les relations Sentinel Vizualizer. L'entreprise a complètement russifié ses produits et connecté une hotline en russe.

    http://www.newprosoft.com/ – « Web Content Extractor » est le logiciel le plus puissant et le plus facile à utiliser pour extraire des données de sites Web. Il dispose également d’une araignée Visual Web efficace.

    SiteSputnik n'a pas d'analogues dans le monde progiciel, permettant de rechercher et de traiter ses résultats sur l'Internet Visible et Invisible, en utilisant tous les moteurs de recherche nécessaires à l'utilisateur.

    WebSite-Watcher – vous permet de surveiller les pages Web, y compris celles protégées par mot de passe, de surveiller les forums, les flux RSS, les groupes de discussion et les fichiers locaux. Possède système puissant filtres. La surveillance est effectuée automatiquement et est fournie sous une forme conviviale. Un programme avec des fonctions avancées coûte 50 euros. Constamment mis à jour.

    http://www.scribd.com/ est la plateforme la plus populaire au monde et de plus en plus utilisée en Russie pour publier divers types de documents, livres, etc. en accès libre avec un moteur de recherche très pratique de titres, sujets, etc.

    http://www.atlasti.com/ est l'outil le plus puissant et le plus efficace d'analyse d'informations qualitatives disponible pour les utilisateurs individuels, les petites et même les moyennes entreprises. Le programme est multifonctionnel et donc utile. Il combine la capacité de créer un environnement d'information unifié pour travailler avec divers fichiers texte, tabulaires, audio et vidéo dans un tout, ainsi que des outils d'analyse qualitative et de visualisation.

    Ashampoo ClipFinder HD – une part toujours croissante du flux d'informations provient de la vidéo. Les agents de veille concurrentielle ont donc besoin d’outils leur permettant de travailler avec ce format. L'un de ces produits est l'utilitaire gratuit que nous présentons. Il vous permet de rechercher des vidéos en fonction de critères spécifiés sur des sites de stockage de fichiers vidéo tels que YouTube. Le programme est facile à utiliser, affiche tous les résultats de recherche sur une seule page avec des informations détaillées, les titres, la durée, l'heure à laquelle la vidéo a été téléchargée sur le stockage, etc. Il existe une interface russe.

    http://www.advego.ru/plagiatus/ – le programme a été créé par des optimiseurs de référencement, mais il convient tout à fait comme outil d'intelligence Internet. Le plagiat montre le degré d'unicité du texte, les sources du texte et le pourcentage de correspondance du texte. Le programme vérifie également le caractère unique de l'URL spécifiée. Le programme est gratuit.

    http://neiron.ru/toolbar/ – inclut un module complémentaire pour combiner recherche Google et Yandex, et permet également une analyse concurrentielle basée sur l'évaluation de l'efficacité des sites et publicité contextuelle. Implémenté en tant que plugin pour FF et GC.

    http://web-data-extractor.net/ est une solution universelle pour obtenir toutes les données disponibles sur Internet. La configuration du découpage des données à partir de n’importe quelle page se fait en quelques clics de souris. Il vous suffit de sélectionner la zone de données que vous souhaitez enregistrer et Datacol sélectionnera automatiquement une formule pour découper ce bloc.

    CaptureSaver est un outil de recherche Internet professionnel. Tout simplement irremplaçable programme de travail, vous permettant de capturer, stocker et exporter toute information Internet, y compris non seulement les pages Web, blogs, mais aussi actualités RSS, emails, images et bien plus encore. Il possède les fonctionnalités les plus larges, une interface intuitive et un prix ridicule.

    http://www.orbiscope.net/en/software.html – système de surveillance Web à des prix plus qu'abordables.

    http://www.kbcrawl.co.uk/ – logiciel pour le travail, y compris sur « l’Internet invisible ».

    http://www.copernic.com/en/products/agent/index.html – le programme vous permet d'effectuer des recherches en utilisant plus de 90 moteurs de recherche, en utilisant plus de 10 paramètres. Vous permet de combiner les résultats, d'éliminer les doublons, de bloquer les liens rompus et d'afficher les résultats les plus pertinents. Existe en versions gratuites, personnelles et professionnelles. Utilisé par plus de 20 millions d'utilisateurs.

    Maltego est un logiciel fondamentalement nouveau qui vous permet d'établir des relations entre des sujets, des événements et des objets dans la vie réelle et sur Internet.

    PRESTATIONS DE SERVICE

    nouveau - navigateur Internet avec des dizaines d'outils préinstallés pour OSINT.

    – un moteur de recherche-agrégateur efficace pour trouver des personnes dans le russe principal dans les réseaux sociaux.

    https://hunter.io/ est un service efficace pour détecter et vérifier les e-mails.

    https://www.whatruns.com/ est un scanner facile à utiliser mais efficace pour découvrir ce qui fonctionne et ne fonctionne pas sur un site Web et quelles sont ses failles de sécurité. Également implémenté en tant que plugin pour Chrom.

    https://www.crayon.co/ est une plateforme budgétaire américaine de veille commerciale et concurrentielle sur Internet.

    http://www.cs.cornell.edu/~bwong/octant/ – identifiant de l'hôte.

    https://iplogger.ru/ – un service simple et pratique pour déterminer l’adresse IP de quelqu’un d’autre.

    http://linkurio.us/ est un nouveau produit puissant destiné aux agents de sécurité économique et aux enquêteurs en matière de corruption. Traite et visualise d’énormes quantités d’informations non structurées provenant de sources financières.

    http://www.intelsuite.com/en – Plateforme en ligne anglophone de veille et de veille concurrentielle.

    http://yewno.com/about/ est le premier système d'exploitation permettant de traduire des informations en connaissances et de visualiser des informations non structurées. Prend actuellement en charge l'anglais, le français, l'allemand, l'espagnol et le portugais.

    https://start.avalancheonline.ru/landing/?next=%2F – services de prévision et d'analyse par Andrey Masalovich.

    https://www.outwit.com/products/hub/ – un ensemble complet de programmes autonomes pour le travail professionnel sur le Web 1.

    https://github.com/search?q=user%3Acmlh+maltego – extensions pour Maltego.

    http://www.whoishostingthis.com/ – moteur de recherche d'hébergement, d'adresses IP, etc.

    http://appfollow.ru/ – analyse des applications basée sur les avis, l'optimisation ASO, les positions dans les tops et les résultats de recherche pour l'App Store, Google Play et Windows Phone Store.

    http://spiraldb.com/ est un service implémenté sous forme de plugin pour Chrom, qui vous permet d'obtenir de nombreuses informations précieuses sur n'importe quelle ressource électronique.

    https://millie.northernlight.com/dashboard.php?id=93 - service gratuit, collectant et structurant les informations clés par secteur et entreprise. Il est possible d'utiliser des panneaux d'information basés sur l'analyse de texte.

    http://byratino.info/ – collecte de données factuelles à partir de sources accessibles au public sur Internet.

    http://www.datafox.co/ – La plateforme CI collecte et analyse des informations sur les entreprises qui intéressent les clients. Il y a une démo.

    https://unwiredlabs.com/home - une application spécialisée avec une API pour la recherche par géolocalisation de tout appareil connecté à Internet.

    http://visualping.io/ – un service de surveillance des sites et, en premier lieu, des photographies et images disponibles sur ceux-ci. Même si la photo apparaît pendant une seconde, elle sera e-mail abonné Possède un plugin pour Google Chrome.

    http://spyonweb.com/ est un outil de recherche qui permet une analyse approfondie de n'importe quelle ressource Internet.

    http://bigvisor.ru/ – le service vous permet de suivre les campagnes publicitaires pour certains segments de biens et services, ou pour des organisations spécifiques.

    http://www.itsec.pro/2013/09/microsoft-word.html – mode d'emploi par Artem Ageev Programmes Windows pour les besoins de veille concurrentielle.

    http://granoproject.org/ est un outil open source code source pour les chercheurs qui suivent les réseaux de connexions entre individus et organisations dans les domaines politique, économique, criminel, etc. Vous permet de connecter, d'analyser et de visualiser des informations obtenues à partir de diverses sources, ainsi que d'afficher des connexions significatives.

    http://imgops.com/ – service d'extraction de métadonnées de fichiers graphiques et travailler avec eux.

    http://sergeybelove.ru/tools/one-button-scan/ – un petit scanner en ligne pour vérifier les failles de sécurité des sites Web et autres ressources.

    http://isce-library.net/epi.aspx – service de recherche de sources primaires à partir d'un fragment de texte en anglais

    https://www.rivaliq.com/ est un outil efficace pour réaliser une veille concurrentielle sur les marchés occidentaux, principalement européens et américains, des biens et services.

    http://watchthatpage.com/ est un service qui vous permet de collecter automatiquement de nouvelles informations à partir de ressources Internet surveillées. Le service est gratuit.

    http://falcon.io/ est une sorte de Rapportive pour le Web. Il ne remplace pas Rapportive, mais fournit des outils supplémentaires. En revanche, Rapportive fournit un profil général d'une personne, comme s'il était collé à partir de données provenant de réseaux sociaux et de mentions sur le Web. http://watchthatpage.com/ - un service qui vous permet de collecter automatiquement de nouvelles informations à partir de ressources surveillées sur l'Internet. Le service est gratuit.

    https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – module complémentaire pour Firefox. Surveille les mises à jour des pages Web. Utile pour les sites Web qui ne disposent pas de flux d'actualités (Atom ou RSS).

    http://agregator.pro/ – agrégateur de portails d'actualités et de médias. Utilisé par les spécialistes du marketing, les analystes, etc. pour analyser les flux d'actualité sur certains sujets.

    http://price.apishops.com/ – service Web automatisé permettant de surveiller les prix de groupes de produits sélectionnés, de boutiques en ligne spécifiques et d'autres paramètres.

    http://www.la0.ru/ est un service pratique et pertinent pour analyser les liens et les backlinks vers une ressource Internet.

    www.recordedfuture.com est un outil puissant d'analyse et de visualisation de données, mis en œuvre sous la forme d'un service en ligne basé sur le cloud computing.

    http://advse.ru/ est un service dont le slogan est « Découvrez tout sur vos concurrents ». Vous permet d'obtenir les sites Web des concurrents en fonction des requêtes de recherche et d'analyser les campagnes publicitaires des concurrents dans Google et Yandex.

    http://spyonweb.com/ – le service vous permet d'identifier les sites présentant les mêmes caractéristiques, y compris ceux utilisant les mêmes identifiants du service de statistiques Google Analytics, adresses IP, etc.

    http://www.connotate.com/solutions – une gamme de produits pour la veille concurrentielle, la gestion des flux d'informations et la conversion des informations en actifs informationnels. Il comprend à la fois des plates-formes complexes et des services simples et bon marché qui permettent une surveillance efficace ainsi qu'une compression des informations et l'obtention uniquement des résultats nécessaires.

    http://www.clearci.com/ - plateforme de veille concurrentielle pour les entreprises de différentes tailles, des start-ups et petites entreprises aux entreprises Fortune 500. Résolu en mode Saas.

    http://startingpage.com/ est un module complémentaire Google qui vous permet d'effectuer une recherche sur Google sans enregistrer votre adresse IP. Prend entièrement en charge tous les moteurs de recherche Fonctionnalités Google, y compris en russe.

    http://newspapermap.com/ est un service unique très utile pour un responsable de la veille concurrentielle. Connecte la géolocalisation à un moteur de recherche de médias en ligne. Ceux. vous sélectionnez la région qui vous intéresse, voire une ville, ou une langue, voyez le lieu sur la carte et une liste des versions en ligne de journaux et magazines, cliquez sur le bouton approprié et lisez. Prend en charge la langue russe, interface très conviviale.

    http://infostream.com.ua/ est un système de surveillance de l'actualité très pratique « Infostream », qui se distingue par une sélection de première classe et tout à fait accessible à n'importe quel portefeuille, à partir de l'un des classiques de la recherche sur Internet, D.V. Lande.

    http://www.instapaper.com/ est un outil très simple et efficace pour sauvegarder les pages Web nécessaires. Peut être utilisé sur les ordinateurs, iPhones, iPads, etc.

    http://screen-scraper.com/ – vous permet d'extraire automatiquement toutes les informations des pages Web, de télécharger la grande majorité des formats de fichiers et de saisir automatiquement les données dans divers formulaires. Il enregistre les fichiers et les pages téléchargés dans des bases de données et exécute de nombreuses autres fonctions extrêmement utiles. Fonctionne sur toutes les principales plates-formes, dispose de versions professionnelles gratuites et très puissantes entièrement fonctionnelles.

    http://www.mozenda.com/ - en avoir plusieurs plans tarifaires et un service Web de surveillance Web multifonctionnel et de fourniture des informations nécessaires à l'utilisateur à partir de sites sélectionnés, disponible même pour les petites entreprises.

    http://www.recipdonor.com/ - le service vous permet de surveiller automatiquement tout ce qui se passe sur les sites Web des concurrents.

    http://www.spyfu.com/ – et ce, si vos concurrents sont étrangers.

    www.webground.su est un service créé par des professionnels de la recherche sur Internet pour surveiller le Runet, y compris tous les principaux fournisseurs d'informations, d'actualités, etc., capables de paramètres individuels suivi selon les besoins de l'utilisateur.

    MOTEURS DE RECHERCHE

    https://www.idmarch.org/ est le meilleur moteur de recherche d'archives mondiales de documents pdf en termes de qualité. Actuellement, plus de 18 millions de documents PDF ont été indexés, allant des livres aux rapports secrets.

    http://www.marketvisual.com/ est un moteur de recherche unique qui vous permet de rechercher des propriétaires et des cadres supérieurs par nom complet, nom de société, poste ou une combinaison de ceux-ci. Les résultats de la recherche contiennent non seulement les objets que vous recherchez, mais également leurs connexions. Conçu principalement pour les pays anglophones.

    http://worldc.am/ est un moteur de recherche de photographies en accès libre lié à la géolocalisation.

    https://app.echosec.net/ est un moteur de recherche public qui se décrit comme l'outil d'analyse le plus avancé pour les professionnels de l'application de la loi, de la sécurité et du renseignement. Permet de rechercher des photos publiées sur divers sites, plateformes sociales et réseaux sociaux en relation avec des coordonnées de géolocalisation précises. Il existe actuellement sept sources de données connectées. D'ici la fin de l'année, leur nombre dépassera les 450. Merci à Dementy pour le conseil.

    http://www.quandl.com/ est un moteur de recherche de sept millions de bases de données financières, économiques et sociales.

    http://bitzakaz.ru/ – moteur de recherche d'appels d'offres et de commandes gouvernementales avec des fonctions payantes supplémentaires

    Website-Finder - permet de trouver des sites que Google n'indexe pas bien. La seule limitation est qu’il ne recherche que 30 sites Web pour chaque mot-clé. Le programme est simple à utiliser.

    http://www.dtsearch.com/ est un moteur de recherche puissant qui vous permet de traiter des téraoctets de texte. Fonctionne sur ordinateur, Web et intranet. Prend en charge les données statiques et dynamiques. Vous permet de rechercher dans tous les programmes MS Office. La recherche s'effectue à l'aide d'expressions, de mots, de balises, d'index et bien plus encore. Le seul système accessible recherche fédérée. Il existe des versions payantes et gratuites.

    http://www.strategator.com/ – recherche, filtre et regroupe des informations sur l'entreprise à partir de dizaines de milliers de sources Web. Recherches aux USA, en Grande-Bretagne, dans les principaux pays de la CEE. Il est très pertinent, convivial et propose des options gratuites et payantes (14 $ par mois).

    http://www.shodanhq.com/ – moteur de recherche inhabituel. Immédiatement après son apparition, il a reçu le surnom de « Google pour les hackers ». Il ne recherche pas de pages, mais détermine les adresses IP, les types de routeurs, d'ordinateurs, de serveurs et de postes de travail situés à une adresse particulière, et trace les chaînes. Serveurs DNS et permet de mettre en œuvre de nombreuses autres fonctions intéressantes pour la veille concurrentielle.

    http://search.usa.gov/ est un moteur de recherche de sites Web et de bases de données ouvertes de toutes les agences gouvernementales américaines. Les bases de données contiennent de nombreuses informations pratiques et utiles, notamment utiles dans notre pays.

    http://visual.ly/ – aujourd'hui, la visualisation est de plus en plus utilisée pour présenter des données. Il s'agit du premier moteur de recherche infographique sur le Web. Outre le moteur de recherche, le portail dispose de puissants outils de visualisation de données qui ne nécessitent pas de compétences en programmation.

    http://go.mail.ru/realtime – recherchez des discussions sur des sujets, des événements, des objets, des sujets en temps réel ou personnalisable. La recherche précédemment très critiquée dans Mail.ru fonctionne très efficacement et fournit des résultats intéressants et pertinents.

    Zanran vient d'être lancé, mais fonctionne déjà très bien, le premier et le seul moteur de recherche de données qui les extrait Fichiers PDF, tableaux EXCEL, données sur pages HTML.

    http://www.ciradar.com/Competitive-Analysis.aspx est l'un des meilleurs systèmes de recherche d'informations au monde pour la veille concurrentielle sur le Web profond. Récupère presque tous les types de fichiers dans tous les formats sur le sujet qui vous intéresse. Implémenté en tant que service Web. Les prix sont plus que raisonnables.

    http://public.ru/ – Recherche efficace et analyse d'informations professionnelles, archives médiatiques depuis 1990. La médiathèque en ligne offre une large gamme de services d'information : de l'accès aux archives électroniques des publications médiatiques en langue russe et aux revues de presse thématiques prêtes à l'emploi jusqu'au suivi individuel et à la recherche analytique exclusive basée sur des documents de presse.

    Cluuz est un jeune moteur de recherche offrant de nombreuses possibilités de veille concurrentielle, notamment sur l'Internet anglophone. Permet non seulement de rechercher, mais aussi de visualiser et d'établir des connexions entre des personnes, des entreprises, des domaines, des e-mails, des adresses, etc.

    www.wolframalpha.com – le moteur de recherche de demain. En réponse à une requête de recherche, il fournit des informations statistiques et factuelles disponibles sur l'objet de la requête, y compris des informations visualisées.

    www.ist-budget.ru – recherche universelle dans les bases de données des marchés publics, des appels d'offres, des enchères, etc.




Haut