برنامه های جستجوی داده های اینترنتی جستجوی حرفه ای اطلاعات در اینترنت. تعیین نام شخص از طریق ایمیل

جستجوی اطلاعات حرفه ای در اینترنت

جستجوی اینترنتی یکی از عناصر مهم کار در اینترنت است. تعداد دقیق منابع وب در اینترنت مدرن بعید است که کسی به طور قطعی بداند. در هر صورت شمارش میلیاردی است. برای اینکه بتوانید از اطلاعات مورد نیاز در یک لحظه، صرف نظر از اهداف کاری یا سرگرمی استفاده کنید، ابتدا باید آن را در این اقیانوس دائماً پر از منابع پیدا کنید.

برای موفقیت آمیز بودن جستجوی اینترنتی، دو شرط باید رعایت شود: پرس و جوها باید به خوبی فرموله شوند و در مکان های مناسب پرسیده شوند. به عبارت دیگر، کاربر باید از یک سو بتواند علایق جستجوی خود را به زبان جستجوی جستجو ترجمه کند و از سوی دیگر دانش خوبی داشته باشد. موتورهای جستجو، ابزارهای جستجوی موجود، مزایا و معایب آنها، که به شما امکان می دهد در هر مورد خاص مناسب ترین ابزار جستجو را انتخاب کنید.

در حال حاضر، هیچ منبع واحدی وجود ندارد که تمام الزامات جستجوی اینترنتی را برآورده کند. بنابراین، اگر جستجوی خود را جدی بگیرید، ناگزیر باید از ابزارهای مختلفی استفاده کنید و از هر کدام در مناسب ترین حالت استفاده کنید.

پایه ای ابزارهای جستجوی اینترنتیرا می توان به گروه های اصلی زیر تقسیم کرد:

موتورهای جستجو؛

دایرکتوری های وب؛

منابع راهنما؛

برنامه های محلی برای جستجو در اینترنت.

محبوب ترین ابزارهای جستجو هستندموتورهای جستجو- به اصطلاح موتورهای جستجوی اینترنتی (موتورهای جستجو). سه رهبر برتر در مقیاس جهانی کاملاً پایدار هستند - گوگل، یاهو! و بینگ در بسیاری از کشورها، موتورهای جستجوی محلی خودشان که برای کار با محتوای محلی بهینه شده اند، به این لیست اضافه می شوند. با کمک آنها، از نظر تئوری می توانید هر کلمه خاصی را در صفحات میلیون ها سایت پیدا کنید. از دید کاربر، عیب اصلی موتورهای جستجو حضور اجتناب ناپذیر استنویز اطلاعاتدر نتایج این نام معمولی برای نتایجی است که به دلایلی در لیست جستجو قرار می گیرند و با درخواست مطابقت ندارند.

با وجود تفاوت های زیاد، همه موتورهای جستجوی اینترنتی بر اساس اصول مشابهی کار می کنند و از نقطه نظر فنی از زیرسیستم های مشابهی تشکیل شده اند. اولین بخش ساختاری موتور جستجو است برنامه های ویژه، برای جستجوی خودکار و نمایه سازی بعدی صفحات وب استفاده می شود. چنین برنامه هایی معمولاً عنکبوت یا ربات نامیده می شوند. آنها به کد صفحات وب نگاه می کنند، پیوندهای موجود در آنها را پیدا می کنند و در نتیجه صفحات وب جدیدی را کشف می کنند. نیز وجود دارد راه جایگزیندرج سایت در فهرست بسیاری از موتورهای جستجو به صاحبان منابع این فرصت را می دهند که به طور مستقل یک سایت را به پایگاه داده خود اضافه کنند. با این حال، صفحات وب سپس دانلود، تجزیه و تحلیل و نمایه می شوند. آنها عناصر ساختاری را برجسته می کنند، کلمات کلیدی را پیدا می کنند و ارتباط آنها را با سایر سایت ها و صفحات وب تعیین می کنند. عملیات دیگری نیز انجام می شود که نتیجه آن تشکیل پایگاه داده فهرست موتور جستجو است. این پایگاه داده دومین عنصر اصلی هر موتور جستجو است. در حال حاضر، هیچ پایگاه داده فهرستی کاملاً کاملی وجود ندارد که حاوی اطلاعاتی در مورد تمام محتوای اینترنتی باشد. از آنجایی که موتورهای جستجوی مختلف از برنامه های مختلف جستجوی صفحات وب استفاده می کنند و فهرست خود را با استفاده از الگوریتم های مختلف ایجاد می کنند، پایگاه داده های فهرست موتورهای جستجو می توانند به طور قابل توجهی متفاوت باشند. برخی از سایت ها توسط چندین موتور جستجو ایندکس می شوند، اما همیشه درصد مشخصی از منابع در پایگاه داده تنها یک موتور جستجو وجود دارد. وجود چنین بخش اصلی و غیرهمپوشانی از ایندکس در هر موتور جستجو به ما امکان می دهد یک نتیجه عملی مهم را بگیریم: اگر فقط از یک موتور جستجو استفاده کنید، حتی از بزرگترین موتور جستجو، قطعا درصد مشخصی از لینک های مفید را از دست خواهید داد. .

بخش بعدی موتور جستجوی اینترنت، برنامه های جستجو و مرتب سازی واقعی است. این برنامه‌ها دو مشکل اصلی را حل می‌کنند: ابتدا صفحات و فایل‌هایی را در پایگاه داده که با درخواست ورودی مطابقت دارند پیدا می‌کنند و سپس آرایه داده‌های حاصل را بر اساس معیارهای مختلف مرتب می‌کنند. موفقیت در دستیابی به اهداف جستجو تا حد زیادی به اثربخشی کار آنها بستگی دارد.

آخرین عنصر یک موتور جستجوی اینترنتی، رابط کاربری است. علاوه بر الزامات معمول برای زیبایی شناسی و راحتی برای هر وب سایت، رابط های موتورهای جستجو یک نیاز مهم دیگر نیز دارند: آنها باید ابزارهای مختلفی را برای نوشتن و شفاف سازی پرس و جوها و همچنین مرتب سازی و فیلتر کردن نتایج ارائه دهند. از مزایای موتورهای جستجو می توان به پوشش عالی منابع، به روز رسانی نسبتا سریع محتوای پایگاه داده و یک انتخاب خوبتوابع اضافی

ابزار اصلی کار با موتورهای جستجو یک پرس و جو است.

برای جستجوهای اینترنتی، از برنامه های ویژه ای نیز استفاده می شود که بر روی رایانه محلی نصب می شوند. می تواند شبیه باشد برنامه های ساده، و مجتمع های کاملاً پیچیده جستجو و تجزیه و تحلیل داده ها. رایج ترین آنها افزونه های جستجو برای مرورگرها، پانل های مرورگر طراحی شده برای کار با یک سرویس جستجوی خاص و بسته های متاجستجو با قابلیت تجزیه و تحلیل نتایج هستند.

دایرکتوری های وب - اینها منابعی هستند که در آنها سایت ها به دسته های موضوعی تقسیم می شوند. اگر کاربر فقط از طریق پرس و جو با موتورهای جستجو کار می کند، در کاتالوگ می توان بخش های موضوعی را به طور کامل مشاهده کرد. دومین تفاوت اساسی بین دایرکتوری ها و موتورهای جستجوی خودکار این است که، به عنوان یک قاعده، مردم به طور مستقیم در پر کردن، مشاهده منابع و طبقه بندی سایت در یک دسته یا دسته دیگر دخالت دارند. دایرکتوری های وب معمولا به دو دسته جهانی و موضوعی تقسیم می شوند. یونیورسال سعی می کند تا حد امکان موضوعات را پوشش دهد. شما می توانید هر چیزی را در آنها بیابید: از وب سایت های مربوط به شعر تا منابع کامپیوتری. به عبارت دیگر، وسعت جستجوی آنها حداکثر است. دایرکتوری های موضوعی در یک موضوع خاص تخصص دارند و با کاهش وسعت پوشش منابع، حداکثر عمق جستجو را فراهم می کنند.

مزایای کاتالوگ ها به صورت نسبی است کیفیت بالامنابع، زیرا هر سایت در آن توسط یک شخص مشاهده و انتخاب می شود. گروه بندی موضوعی سایت ها به شما امکان می دهد به راحتی سایت هایی با موضوعات مشابه ترتیب دهید. این حالت عملکرد برای کشف سایت هایی که برای شما جدید هستند در مورد موضوع مورد علاقه خوب است - دقیق تر از استفاده از موتور جستجو است. توصیه می شود برای اولین آشنایی با هر زمینه موضوعی و همچنین جستجوی سؤالات مبهم از کاتالوگ های وب استفاده کنید - این فرصت را خواهید داشت که در بخش های کاتالوگ "سرگردان" شوید و با دقت بیشتری تعیین کنید که دقیقاً به چه چیزی نیاز دارید.

معایب دایرکتوری های وب شناخته شده است. اول از همه، این یک پر کردن آهسته پایگاه داده است، زیرا گنجاندن یک سایت در کاتالوگ نیاز به مشارکت انسانی دارد. از نظر کارایی، یک فهرست وب رقیب موتورهای جستجو نیست. علاوه بر این، دایرکتوری های وب از نظر اندازه پایگاه داده به طور قابل توجهی از موتورهای جستجو پایین تر هستند.

هنگامی که در مورد جستجوی اینترنتی صحبت می کنیم، نمی توانیم تعدادی از اصطلاحاتی را که ارتباط نزدیکی با این حوزه دارند و اغلب برای توصیف و ارزیابی موتورهای جستجو به کار می روند، نادیده بگیریم. مثلا:وسعت و عمق جستجوی اینترنتی، جستجو در اینترنت. جستجوی گسترده، جستجویی است که تا حد امکان منابع اطلاعاتی را جمع آوری کند. در این صورت حداقل ذکر یک سایت مناسب برای درخواست کافی تلقی می شود. عمق جستجو به جزئیات نمایه سازی و جستجوی بعدی هر منبع خاص اشاره دارد. به عنوان مثال، بسیاری از موتورهای جستجو به طور متفاوتی به فهرست بندی سایت های مختلف می پردازند. سایت های بزرگ و محبوب به حداکثر میزان ایندکس می شوند؛ ربات ها سعی می کنند حتی یک صفحه از چنین منبعی را از دست ندهند. در عین حال، در سایت های دیگر، تنها صفحه عنوان و چند صفحه محتوا ممکن است ایندکس شوند. این شرایط به طور طبیعی بر جستجوهای بعدی تأثیر می گذارد. جستجوی عمیق بر اساس این اصل کار می کند: «بهتر است اطلاعات غیر ضروری را در نتایج گنجانده شود تا اینکه داده های مرتبط با موضوع جستجو را از دست بدهیم».

اغلب اوقات می توانید با مفاهیمی مانندجهانی و محلی جستجوی اینترنتی، جستجو در اینترنت. جستجوهای اینترنتی محلی موقعیت جغرافیایی کاربر را در نظر می گیرند و به نتایجی که به نوعی به یک کشور یا محل خاص مربوط می شوند ترجیح می دهند. در طول یک جستجوی جهانی، این اطلاعات در نظر گرفته نمی شود و جستجو در تمام منابع موجود انجام می شود.

هنگام نوشتن یک پرس و جو در موتورهای جستجوی اینترنتی، حالت های جستجوی مختلفی عمل می کنند. حالت‌های جستجوی معمولی که در اکثر ماشین‌های اینترنتی یافت می‌شوند عبارتند از:ساده و پیشرفته جستجو کردن. یک جستجوی ساده به شما امکان می دهد تنها یک ویژگی جستجو را در یک درخواست مشخص کنید. جستجوی پیشرفته امکان ایجاد یک پرس و جو از چندین شرط را فراهم می کند و آنها را با عملگرهای منطقی پیوند می دهد.

برای اصلاح عبارت های جستجو، مختلففیلترها . فیلترها آن دسته از ابزارها یا دیگر ابزارهای کمکی برای نوشتن یک پرس و جو هستند که به سمت محتوای شرایط پرس و جو مربوط نمی شوند، اما نتایج جستجو را با برخی ویژگی های رسمی محدود می کنند. بنابراین، به عنوان مثال، هنگام استفاده از فیلتر نوع فایل هنگام جستجو، کاربر اطلاعات مربوط به موضوع درخواست خود را در اختیار سیستم قرار نمی دهد، بلکه به سادگی نتایج به دست آمده را به نوع فایل خاصی که در شرایط درخواست او مشخص شده است محدود می کند.

برای اکثر کاربران، موتورهای جستجوی جهانی اصلی ترین و اغلب تنها ابزار جستجوی اینترنتی هستند. آنها پوشش خوبی از منابع و همچنین مجموعه ای از ابزارهای کافی برای حل مشکلات اساسی جستجو را ارائه می دهند.

بازار موتورهای جستجوی جهانی بسیار بزرگ است. ما سعی کردیم معروف ترین موتورهای جستجو را تجزیه و تحلیل کنیم و نتایج را در جدول 1 ارائه کردیم.

هنگام انتخاب یک موتور جستجوی جهانی، کیفیت منابع یافت شده با کمک آن نقش مهمی ایفا می کند. شما می توانید موتور جستجوی ترجیحی را برای کارهای خاص با استفاده از "روش نشانگر" تعیین کنید. ماهیت آن این است که ابتدا یک موضوع خاص پرس و جو جستجو، پس از آن گروهی از افراد -متخصص در این زمینه- مورد نظرسنجی قرار می گیرند تا بهترین منابع اینترنتی از نظر آنها را در مورد موضوع انتخابی شناسایی کنند. بر اساس داده‌های نظرسنجی، فهرستی از سایت‌های نشانگر ایجاد می‌شود که تضمین می‌شوند مرتبط با درخواست هستند و حاوی اطلاعات با کیفیت بالا هستند. سپس درخواست به موتورهای جستجوی آزمایش شده ارسال می شود. منطق ارزیابی ساده است: هر چه سایت های نشانگر بالاتر در نتایج جستجو قرار گیرند، منبع خاصی برای جستجوی اطلاعات در مورد یک موضوع آزمایشی مناسب تر است.


تا اواسط سال 2015، اینترنت جهانی قبلاً 3.2 میلیارد کاربر را به هم متصل کرده بود، یعنی تقریباً 43.8٪ از جمعیت کره زمین. برای مقایسه: 15 سال پیش فقط 6.5 درصد از مردم اینترنت کاربران بودند، یعنی تعداد کاربران بیش از 6 برابر شده است! اما آنچه که چشمگیرتر است، کمی نیست، بلکه شاخص های کیفی گسترش اجرای فناوری های اینترنت در زمینه های مختلف فعالیت های انسانی است: از ارتباطات جهانی شبکه های اجتماعی تا چیزهای اینترنتی خانگی. اینترنت تلفن همراهاین امکان را برای کاربران فراهم کرد که خارج از دفتر و در خانه آنلاین باشند: در جاده ها، خارج از شهر در طبیعت.
در حال حاضر صدها سیستم برای جستجوی اطلاعات در اینترنت وجود دارد. محبوب ترین آنها به دلیل رایگان بودن و استفاده آسان در دسترس اکثریت قریب به اتفاق کاربران هستند: Google، Yandex، Nigma، Yahoo!، Bing..... برای کاربران با تجربه تر، رابط های "جستجوی پیشرفته" و تخصصی " با توجه به جریان اخبار و آگهی‌های خرید و فروش، جستجوهای شبکه‌های اجتماعی در دسترس هستند... اما همه این موتورهای جستجوی شگفت‌انگیز یک اشکال مهم دارند که قبلاً به عنوان یک مزیت به آن اشاره کردم: رایگان هستند.
اگر سرمایه گذاران میلیاردها دلار در توسعه موتورهای جستجو سرمایه گذاری کنند، یک سوال کاملاً مناسب مطرح می شود: از کجا پول در می آورند؟
و آنها به ویژه با ارائه در پاسخ به درخواست های کاربر، نه اطلاعات زیادی که از نظر کاربر مفید باشد، بلکه اطلاعاتی که صاحبان موتورهای جستجو برای کاربر مفید می دانند، کسب درآمد می کنند. این کار با دستکاری ترتیبی که در آن لیستی از پاسخ ها به پرسش های جستجوی کاربر ارائه می شود، انجام می شود. در اینجا تبلیغات باز است منابع اینترنتیو دستکاری پنهان مرتبط بودن پاسخ ها بر اساس منافع تجاری، سیاسی و ایدئولوژیک صاحبان موتورهای جستجو.
بنابراین، در میان متخصصان حرفه ای در جستجوی اطلاعات در اینترنت، مشکل مربوط بودن نتایج موتورهای جستجو بسیار مهم است.
تناسب، مطابقت اسنادی است که توسط یک سیستم بازیابی اطلاعات پیدا می شود، با نیازهای اطلاعاتی کاربر، صرف نظر از اینکه این نیاز اطلاعاتی تا چه حد به طور کامل و با چه دقتی در متن درخواست اطلاعات بیان شده است. این نسبت مقدار اطلاعات مفید به کل اطلاعات دریافتی است. به طور کلی، این کارایی جستجو است.
متخصصانی که جستجوهای واجد شرایط را برای اطلاعات در اینترنت انجام می دهند، باید تلاش های خاصی را برای فیلتر کردن نتایج جستجو انجام دهند و "نویز" اطلاعات غیر ضروری را حذف کنند. و برای این کار از ابزارهای جستجو در سطح حرفه ای استفاده می شود.
یکی از این سیستم های حرفه ای برنامه روسی است FileForFiles & SiteSputnik (SiteSputnik).
توسعه دهنده الکسی میلنیکوفاز ولگوگراد

"برنامه FileForFiles & SiteSputnik (SiteSputnik) برای سازماندهی و خودکارسازی جستجوی حرفه ای، جمع آوری و نظارت بر اطلاعات ارسال شده در اینترنت طراحی شده است. توجه ویژه ای به دستیابی به اطلاعات ورودی جدید در مورد موضوعات مورد علاقه است. چندین عملکرد تجزیه و تحلیل اطلاعات پیاده سازی شده است."


نظارت و طبقه بندی جریان اطلاعات


ابتدا چند کلمه در مورد نظارت بر جریان اطلاعات، که یک مورد خاص آن است نظارت بر رسانه ها و شبکه های اجتماعی:

  • کاربر منابعی را که ممکن است حاوی اطلاعات لازم باشد و قوانین انتخاب این اطلاعات را نشان می دهد.

  • این برنامه لینک‌های تازه را از منابع دانلود می‌کند، محتوای آن‌ها را از زباله‌ها و تکرارها آزاد می‌کند و آنها را طبق قوانین در بخش‌هایی مرتب می‌کند.

  • برای مشاهده زنده یک فرآیند نظارت ساده اما واقعی که شامل 6 منبع و 4 عنوان است:
  • باز کردن نسخه آزمایشی برنامه؛


  • سپس در پنجره ظاهر شده بر روی دکمه کلیک کنید با یکدیگر;

  • و وقتی که وب سایت اسپوتنیکاین پروژه را در زمان واقعی انجام خواهید داد، شما:
    - در لیست «جریان پاک»، تمام اطلاعات جدید منابع را خواهید دید،
    - در بخش "پس از درخواست" - فقط اخبار اقتصادی و مالی مطابق با قانون،
    - در عناوین "درباره رئیس جمهور"، "درباره اولین نمایش" و "بانک مرکزی"، - اطلاعات مربوط به اشیاء مربوطه.

  • در پروژه های واقعی، می توانید تقریباً از هر تعداد منبع و روبریک استفاده کنید.
    شما می توانید اولین پروژه های کاری خود را در چند ساعت ایجاد کنید و آنها را در حین کار بهبود دهید.
    پردازش اطلاعات توصیف شده در بسته SiteSputnik Pro+News و بالاتر موجود است.

2. جستجوی ساده و دسته ای، جمع آوری اطلاعات

برای آشنایی با امکانات SiteSputnik Pro(نسخه اصلی برنامه) :

  • باز کردن نسخه آزمایشی برنامه؛

  • اولین درخواست خود را وارد کنید، به عنوان مثال، نام کامل خود را، همانطور که من انجام دادم:

    و روی دکمه کلیک کنید جستجو کردن.


  • این برنامه (به علامتی که SiteSputnik ساخته است مراجعه کنید) در چند ثانیه نظرسنجی خواهد شد 7 منابع، در آنها باز خواهد شد 24 صفحات جستجو، پیدا خواهد کرد 227 لینک های مرتبط لینک های تکراری را حذف می کندو از بقیه 156 منحصر بفردلیست پیوندها "یک انجمن".

    نام
    منبع

    سفارش داده شده
    صفحات

    دانلود شد
    صفحات

    پیدا شد
    پیوندها

    زمان
    جستجو کردن

    بهره وری
    جستجو کردن

    پیوندها
    جدید

    بهره وری
    جدید
    یاندکس 5 5 50 0:00:05 32% 0 0
    گوگل 5 5 44 0:00:03 28% 0 0
    یاهو 5 5 50 0:00:05 32% 0 0
    رامبلر 5 4 56 0:00:07 36% 0 0
    MSN (بینگ) 5 3 23 0:00:04 15% 0 0
    Yandex.Blogs 5 1 1 0:00:01 1% 0 0
    Google.Blogs 5 1 3 0:00:01 2% 0 0
    جمع: 35 24 227 0:00:26 0 0
    مجموع: تعداد پیوندهای منحصر به فرد - 156 ، پیوندهای تکراری - 46 %.

  • (! ) بعد از چند ساعت یا چند روز درخواست خود را تکرار کنید و فقط خواهید دید لینک های جدید که در این دوره زمانی در منابع ظاهر شد. در دو ستون آخر جدول می توانید مشاهده کنید که هر منبع چند لینک جدید آورده و کارایی آن از نظر «تازه بودن» چقدر است. هنگامی که یک پرس و جو چندین بار اجرا می شود، یک لیست فقط شامل لینک های جدید ، نسبت به تمام اجراهای قبلی این درخواست ایجاد می شود. ابتدایی به نظر می رسد و عملکرد مورد نیاز، اما نویسنده از هیچ برنامه ای که در آن اجرا شده است آگاه نیست.

  • (!! ) قابلیت های توصیف شده نه تنها برای درخواست های فردی، بلکه برای کل پشتیبانی می شوند درخواست بسته ها :

    بسته ای که مشاهده می کنید شامل هفت پرس و جو مختلف است که اطلاعات مربوط به واسیلی شوکشین را از چندین منبع جمع آوری می کند، از جمله موتورهای جستجو، ویکی پدیا، جستجوی دقیق در اخبار Yandex، متاجستجو و جستجوی ذکر در ایستگاه های تلویزیونی و رادیویی. به فیلمنامه تلویزیون و رادیوشامل: «کانال یک»، «تی وی روسیه»، «ان تی وی»، «آر بی سی تی وی»، «اکوی مسکو»، شرکت رادیویی «مایاک» و ... و سایر منابع اطلاعاتی. هر منبع عمق جستجو یا مرور خود را در صفحات دارد. در ستون سوم ذکر شده است.

    جستجوی دسته ای به شما امکان می دهد با یک کلیک جستجوهای جامع انجام دهید مجموعه اطلاعاتدر یک موضوع معین
    لیست جداگانه لینک های جدید، در صورت اجرای مکرر بسته، فقط حاوی پیوندهایی خواهد بود که قبلاً پیدا نشده بودند.
    به یاد داشته باشید که چه چیزی و چه زمانی از اینترنت پرسیدید و چه پاسخی به شما داد نیازی نیست- همه چیز به طور خودکار در کتابخانه ها و در پایگاه های داده برنامه ذخیره می شود.
    تکرار می کنم که قابلیت های توضیح داده شده در این بند به طور کامل در بسته گنجانده شده است SiteSpunik Pro.


  • جزئیات بیشتر در دستورالعمل: SiteSputnik Pro برای مبتدیان.

3. نظارت بر اشیاء و جستجو

اغلب کاربر با کار زیر مواجه می شود. شما باید دریابید که در مورد یک شی خاص در اینترنت چیست: یک شخص یا یک شرکت. به عنوان مثال، هنگام استخدام یک کارمند جدید یا زمانی که طرف مقابل جدید ظاهر می شود، همیشه نام کامل، نام شرکت، شماره تلفن، INN، OGRN یا OGRNIP را می دانید، همچنین می توانید ICQ، Skype و برخی داده های دیگر را بگیرید. بعد، با استفاده از درخواست تجدید نظر به عملکرد ویژهبرنامه ها وب سایت اسپوتنیک "جمع آوری اطلاعات در مورد شی" (تجهیزات SiteSputnik Pro+ Objects):

داده هایی را که می دانید وارد می کنید و با یک کلیک ماوس انجام می دهید دقیقو پر شدهپیوندهای حاوی اطلاعات مشخص شده را جستجو کنید. جستجو در چندین موتور جستجو به طور همزمان انجام می شود، با استفاده از همه جزئیات به طور همزمان، با استفاده از چندین ترکیب ممکن از ضبط جزئیات به طور همزمان: به یاد داشته باشید که چگونه می توانید یک شماره تلفن را به روش های مختلف یادداشت کنید. پس از مدت زمان معینی، بدون انجام کارهای معمول خسته کننده، لیستی از پیوندها را دریافت خواهید کرد که از تکرار پاک شده و مهمتر از همه، بر اساس ارتباط با شی مورد نظر مرتب شده اند. ارتباط (اهمیت) به این دلیل به دست می آید که اولین مورد در نتایج جستجوی SiteSputnik پیوندهایی خواهد بود که در آنها مقدار زیادجزئیاتی که شما مشخص کرده‌اید، و نه آن‌هایی که نتایج موتور جستجوی وب‌مستر را بالا برده‌اند.

مهم .
برنامه SiteSputnik در استخراج بهتر از سایر برنامه ها است واقعی، اما نه رسمیاطلاعات در مورد شی به عنوان مثال، در پایگاه داده رسمی اپراتور تلفن همراهممکن است ثبت شود که این تلفن متعلق به واسیلی ترخین است، اما در واقع این تلفن حاوی اطلاعاتی است که الکساندر در سال 2013 یک خودروی فورد فوکوس فروخته است. اطلاعات اضافیبرای فکر.

نظارت بر جستجو .
نظارت جستجو به معنای زیر است. اگر نیاز به پیگیری وقوع دارید لینک های جدید، توسط یک شی داده شده یا دلخواهبسته پرس و جو، سپس فقط باید به صورت دوره ای جستجوی مربوطه را تکرار کنید. همانند یک درخواست ساده، برنامه SiteSputnikیک لیست "جدید" ایجاد می کند که فقط پیوندهایی را شامل می شود که در هیچ یک از جستجوهای قبلی یافت نشدند.

نظارت بر جستجوجالب نه تنها به خودی خود ممکن است درگیر باشد نظارت بر رسانه ها، شبکه های اجتماعیو سایر منابع خبری که در بالا در پاراگراف 1 ذکر شد. وب سایت اسپوتنیکمی توان برای این کار استفاده کرد جستجوهای ساخته شده در وب سایت ها و موتورهای جستجو . همچنین ممکن است تقلید(خودسازی) چند فیدهای RSSاز صفحات دلخواه، علاوه بر این، شبیه سازی یک فید RSS در صورت درخواست و حتی دسته ای از درخواست ها.


  • برای استفاده حداکثری از برنامه، از توابع اصلی آن استفاده کنید، یعنی:

    • درخواست بسته ها، بسته های با پارامترها، استفاده از اسمبلر (مونتاژ)، عملیات "ادغام تحلیلی" نتایج چندین کار، در صورت لزوم، توابع جستجوی اساسی را در اینترنت نامرئی اعمال کنید.

    • منابع خود را به منابع اطلاعاتی تعبیه شده در برنامه متصل کنید : سایر موتورهای جستجو و جستجوهای ساخته شده در سایت ها، فیدهای RSS موجود ایجاد شده توسط شما فیدهای RSS خود با دلخواهصفحات، از تابع جستجو برای منابع جدید استفاده کنید.

    • از انواع ویژگی های زیر استفاده کنید نظارت بر: رسانه ها، شبکه های اجتماعی و سایر منابع، نظارت نظراتبرای اخبار و پیام ها، ردیابی ظاهر اطلاعات جدید در صفحات موجود؛

    • مشغول کردن دسته بندی ها , توابع خارجی, Task Scheduler, لیست پستی, چندین کامپیوتر, Project Instructor, نصب زنگ خطر. هشدار برای اطلاع شما از وقوع رویدادهای مهم، از سایر عملکردهای فهرست شده در زیر استفاده کنید.



4. برنامه SiteSputnik (SiteSputnik): گزینه ها و ویژگی ها

- برنامه سایت اسپوتنیکبه طور مداوم در زمینه های زیر بهبود می یابد: "من باید همه چیز و با ضمانت پیدا کنم".
"نرم افزار بازجویی برای اینترنت"، - تعریف دیگری از کاربر برای اختصاص برنامه.

آ. توابع برای جستجو و جمع آوری اطلاعات.

. درخواست بسته - اجرای چندین پرس و جو به طور همزمان، ترکیب نتایج جستجو یا به طور جداگانه. هنگام ایجاد نتیجه ترکیبی، پیوندهای مکرر یافت شده حذف می شوند. جزئیات بیشتر در مورد بسته ها را می توانید در مقدمه SiteSputnik و به صورت بصری در ویدیو پیدا کنید: یک مفصلو جداگانه، مجزااجرای درخواست ها در تحولات داخلی و خارجی مشابهی وجود ندارد.

. بسته های دارای پارامتر. هرگونه پرسش و بسته پرس و جو که برای حل وظایف جستجوی استاندارد طراحی شده است، به عنوان مثال، جستجو بر اساس شماره تلفن، نام کامل یا پست الکترونیک، - می توان از یک کتابخانه پرس و جوهای آماده با جایگزینی مقادیر واقعی (نیاز) پارامتر پارامتری، ذخیره و اجرا کرد. هر بسته با پارامترهای خاص خود را دارد فرم جستجوی پیشرفته . می تواند نه از یک، بلکه از چندین موتور جستجو استفاده کند. شما می توانید فرم هایی ایجاد کنید که از نظر هدف کاربردی بسیار پیچیده هستند. بسیار مهم است که تشکیل می دهدمی تواند توسط خود کاربران، بدون مشارکت نویسنده یا برنامه نویس برنامه ایجاد شود. این بسیار ساده در دستورالعمل ها نوشته شده است، جزئیات بیشتر در یک نشریه جداگانه در مورد پارامترهای جستجو و در انجمن، به وضوح در ویدئو: جستجوی همه گزینه ها برای ضبط یک عدد به طور همزمان تلفن همراهو با توجه به چندین گزینه برای ثبت آدرس پست الکترونیک. هیچ آنالوگ وجود ندارد.

. مونتاژ کنندهجدید- مونتاژ یک کار جستجو از چندین مورد آماده : درخواست ها، بسته های درخواستی و بسته های پارامتری. بسته ها ممکن است حاوی بسته های دیگری در متن خود باشند. عمق لانه سازی بسته ها نامحدود است. شما می توانید چندین کار جستجو، به عنوان مثال، در مورد چندین شخص حقوقی و شخصی ایجاد کنید و این کارها را به طور همزمان انجام دهید. جزئیات بیشتر در انجمن و در یک نشریه جداگانه در مورد اسمبلر، به وضوح در ویدئو. هیچ آنالوگ وجود ندارد.

. متاجستجو - اجرای یک درخواست خاص به طور همزمان در یک "عمق" جستجو برای هر یک از آنها. Metasearch با استفاده از موتورهای جستجوی داخلی، که شامل Yandex، Rambler، Google، Yahoo، MSN (Bing)، Mail، Yandex و وبلاگ‌های Google و ابزارهای جستجوی متصل می‌شود، امکان‌پذیر است. کار با چندین موتور جستجو به نظر می رسد که با آن کار می کنید یک موتور جستجو . پیوندهای دوباره یافت شده حذف می شوند. متاجستجوی بصری در سه شبکه اجتماعی متصل: VKontakte، Twitter و Youtube - نشان داده شده است ویدئو.

. متاسرچ در سایت - ترکیب جستجوی سایت در گوگل، یاهو، یاندکس، MSN (بینگ). به وضوح روشن است ویدئو.

. متاجستجو در اسناد اداری - ترکیب جستجو در فایل ها فرمت PDF، XLS، DOC، RTF، PPT، FLASH در Google، Yahoo، Yandex، MSN (Bing). شما می توانید هر ترکیبی از فرمت های فایل را انتخاب کنید.

. متاجستجو برای کپی های کش پیوندها در Yandex، Google، Yahoo، MSN (Bing). فهرستی گردآوری می‌شود که هر مورد آن حاوی تمام قطعاتی است که برای هر پیوند توسط هر موتور جستجو پیدا شده است. هیچ آنالوگ وجود ندارد.

. جستجوی عمیق برای Yandex، Google و Rambler به شما امکان می دهد تمام پیوندهای جستجوی معمولی و همه پیوندها را به ترتیب از لیست های "بیشتر از سایت"، "نتایج اضافی از سایت" و "جستجو در سایت" در یک لیست ترکیب کنید (مجموع ...)». در مورد جستجوی عمیق در انجمن بیشتر بخوانید. هیچ آنالوگ وجود ندارد.

. جستجوی دقیق و کامل . این به معنای زیر است. از یک سو، هر پرس و جو را می توان بر روی آن و تنها در منبعی که به زبان پرس و جو نوشته شده است، اجرا کرد. این جستجوی دقیق. از سوی دیگر، تعداد دلخواه از این گونه درخواست ها و منابع ممکن است وجود داشته باشد. این فراهم می کند جستجوی کامل. در یک پست جداگانه درباره جستجوی رویه ای بیشتر بخوانید. هیچ آنالوگ وجود ندارد.

. جستجو در اینترنت نامرئی .

    این شامل ویژگی های اساسی زیر است:

    بسته ویژه ای از درخواست ها که می تواند توسط کاربر بهبود یابد،
    - جستجوی پیوندهای نامرئی با استفاده از یک عنکبوت،
    - پیوندهای نامرئی را در مجاورت یک پیوند یا پوشه قابل مشاهده با "تصویر و شباهت" جستجو کنید.
    - جستجوهای ویژه برای پوشه های باز،
    - جستجو برای پیوندها و پوشه های نامرئی با نام های استاندارد با استفاده از فرهنگ لغت های خاص،
    - استفاده از جستجوهای ساخته شده در سایت ها.

    جزئیات بیشتر در یک نشریه جداگانه در SiteSputnik Invisible. توابع اصلی "در دایره های باریک به خوبی شناخته شده اند"، اما نحوه استفاده از آنها مشابهی ندارد. ماهیت این روش ساختن یک نقشه سایت قابل مشاهده از اینترنت (به عبارت دیگر، مادی کردن اینترنت قابل مشاهده) و تنها بر اساس لینک های قابل مشاهده و جستجوی لینک های نامرئی در رابطه با آنها است. جستجو برای پیوندهایی که قبلاً قابل مشاهده است با استفاده از روش های "نامرئی" انجام نمی شود.

ب. توابع نظارت بر اطلاعات

. نظارت بر برای حضور در اینترنت جدید پیوندهای مربوط به یک موضوع معین ظاهر مانیتور جدید پیوندها را می توان با استفاده از اعداد صحیح استفاده کرد درخواست بسته ها ، که شامل هر یک از روش های جستجوی ذکر شده در بالا است، به جای صفحات اول موتورهای جستجو. اتحادیه و تقاطع اجرا شد جدید پیوندهایی از چندین جستجوی جداگانه جزئیات بیشتر در نشریه نظارت (نگاه کنید به بند 1) و در انجمن. هیچ آنالوگ وجود ندارد.

. پردازش اطلاعات جمعی . ایجاد شبکه شرکتی یا حرفه ایبرای جمع آوری، نظارت و تجزیه و تحلیل جمعی اطلاعات. شرکت کنندگان و سازندگان چنین شبکه ای کارکنان شرکت، اعضای یک جامعه حرفه ای یا گروه های ذینفع هستند. موقعیت جغرافیایی شرکت کنندگان مهم نیست. جزئیات بیشتر در یک نشریه جداگانه در مورد سازماندهی یک شبکه برای جمع آوری جمعی، نظارت و تجزیه و تحلیل اطلاعات.

. نظارت بر پیوندها (صفحات وب) برای تشخیص تغییرات در محتوای آنها (محتوا). نسخه بتا. تغییرات یافت شده با رنگ و نمادهای خاص برجسته می شوند. جزئیات بیشتر در یک نشریه جداگانه در مورد نظارت (به بند 2 و 3 مراجعه کنید).

که در. توابع تجزیه و تحلیل اطلاعات

. دسته بندی مواد قبلاً در بالا توضیح داده شد. جزئیات بیشتر را می توان در یک نشریه جداگانه در مورد Rubrics یافت. قوانین برای وارد کردن Rubrics به شما امکان می دهد کلمات کلیدی و فاصله بین آنها را مشخص کنید، "AND"، "OR" و "NOT" منطقی را تنظیم کنید، یک ساختار براکت چند سطحی و فرهنگ لغت (درج فایل ها) را اعمال کنید که می توان عملیات منطقی را روی آنها اعمال کرد.

. تکنولوژی VF - گسترش تقریباً خودسرانه امکان طبقه بندی مواد از طریق اجرای توابع خارجی که به طور ارگانیک در قوانین ورود به Rubrics ادغام شده اند و می توانند توسط برنامه نویس به طور مستقل و بدون مشارکت نویسنده برنامه اجرا شوند.

. تحلیل عددی اشغال روبریک، نصب زنگ خطر. هشدار و اطلاع از وقوع رویدادهای مهم با برجسته کردن روبریک ها به صورت رنگی و/یا ارسال گزارش هشدار از طریق ایمیل.

. ارتباط واقعی گزینه ای برای مرتب کردن پیوندها به ترتیب وجود دارد نزدیک به اهمیت این لینک ها در رابطه با مشکل حل شده، دور زدن ترفندهای وب مسترهایی که استفاده می کنند راه های مختلفافزایش رتبه وب سایت در موتورهای جستجو این با تجزیه و تحلیل نتایج اجرای چندین پرس‌وجو «متنوع» در یک موضوع مشخص به دست می‌آید. در معنای تحت اللفظی کلمه، پیوندهایی حاوی حداکثر اطلاعات مورد نیاز . در توضیح نحوه یافتن تامین کننده بهینه و در انجمن بیشتر بخوانید. هیچ آنالوگ وجود ندارد.

. محاسبه روابط شی - جستجو برای پیوندها، منابع (سایت ها)، پوشه ها و دامنه هایی که اشیاء به طور همزمان در آنها ذکر شده است. رایج ترین اشیاء افراد و شرکت ها هستند. برای جستجوی اتصالات می توان از تمامی ابزارهای برنامه ذکر شده در این صفحه استفاده کرد سایت اسپوتنیک، که کارایی کاری را که انجام می دهید به میزان قابل توجهی افزایش می دهد. این عملیات بر روی هر تعداد شی انجام می شود. جزئیات بیشتر در مقدمه برنامه و همچنین در توضیحات خصوصیت جدید"اشیاء و ارتباطات آنها." هیچ آنالوگ وجود ندارد.

. شکل گیری، ادغام و تلاقی جریان های اطلاعاتی در موضوعات مختلف، مقایسه موضوعات. جزئیات بیشتر در یک پست جداگانه در موضوعات.

. ساختن نقشه های وب سایت‌ها، منابع، پوشه‌ها و اشیاء جستجو شده بر اساس مواردی که در اینترنت یافت می‌شوند کمک گوگل، یاهو، یاندکس، MSN (بینگ) و پیوندهای Altavista متعلق به سایت. کارشناسان می توانند دریابند: آیا قابل مشاهده است "اضافی" اطلاعات از اینترنت در وب سایت های آنها و همچنین وب سایت های رقبا در این زمینه تحقیق کنید. نقشه وب سایت است تحقق اینترنت قابل مشاهده . جزئیات بیشتر در یک نشریه جداگانه در مورد ساختن نقشه های وب، به صورت بصری در ویدئو. هیچ آنالوگ وجود ندارد.

. یافتن منابع جدید اطلاعات در یک موضوع معین، که سپس می تواند برای ردیابی ظهور اطلاعات مرتبط جدید استفاده شود. جزئیات بیشتر در.

جی. توابع خدمات.

. وظیفه زمانبندی کار فراهم می کند برنامه ریزی شده: عملکردهای برنامه مشخص شده را در یک زمان معین انجام می دهد. جزئیات بیشتر در یک نشریه جداگانه در مورد برنامه ریز.

. مدرس پروژهجدید- این یک دستیار است ایجاد و نگهداری پروژه های جستجو، جمع آوری، نظارت و تجزیه و تحلیل اطلاعات (دسته بندی و سیگنال دهی). توضیحات بیشتر در انجمن

. بایگانی خودکار که در پایگاه های دادهتمام نتایج کار شما به طور خودکار به خاطر سپرده می شود، یعنی: درخواست ها، بسته های درخواست، پروتکل های جستجو و نظارت، هر یک از عملکردهای فوق و نتایج اجرای آنها. می توان ساختار روی موضوعات و موضوعات فرعی کار کنید.

. پایگاه داده شامل مرتب سازی، جستجوی ساده و جستجوی سفارشی بر اساس پرس و جوی SQL. برای دومی، یک جادوگر برای نوشتن کوئری های SQL وجود دارد. با استفاده از این ابزارها می توانید کارهایی را که دیروز، ماه گذشته، یک سال پیش انجام داده اید، پیدا کرده و مرور کنید، موضوعی را به عنوان معیار جستجو تعریف کنید و یا معیار جستجوی دیگری را بر اساس محتویات پایگاه داده تعیین کنید.

. محدودیت های فنی موتورهای جستجو. برخی از محدودیت ها مانند طول رشته پرس و جو را می توان برطرف کرد. اجرای نه یک، بلکه چندین پرس و جو را با ترکیب نتایج جستجو یا جداگانه تضمین می کند. شما می توانید در مورد روشی برای غلبه بر نقض قانون افزایشی برای موتورهای جستجوی اصلی بخوانید. برای یک کلمه یا یک عبارت محصور شده در نقل قول، یک جستجوی حساس به حروف بزرگ در موتورهای جستجو اجرا می شود، به ویژه، جستجو با اختصار.

ساخته شده در مرورگر . ناوبر توسط صفحه چند رنگ نشانگر برای برجسته کردن کلمات کلیدی و دلخواه بیلیستی و N-listing از اسناد تولید شده.

. تخلیه کردن اخبار به یک نمای جدول متمرکز می شود وارد كردن در Excel، MySQL، Access، Kronos و سایر برنامه ها.


5. نصب و راه اندازی برنامه، نیازهای کامپیوتر.

برای نصب و اجرای برنامه:

  • فایل را دانلود کنید، پوشه FileForFiles را از آن در خود کپی کنید HDDبه عنوان مثال، در D:\;

  • نسخه آزمایشی برنامه نصب خواهد شدو باز خواهد شد

  • این برنامه روی هر کامپیوتری که روی آن نصب شده باشد کار خواهد کرد ویندوز هرنسخه ها

    در مورد آنچه در زمان ما صحبت کنید فناوری اطلاعاتو رشد بی پایان در حجم داده های موجود برای هر فرد و جامعه ، مشکلات زیادی در پردازش اطلاعات و جستجوی آن وجود دارد - این قبلاً کفرگویی است. چه کسی این موضوع را مطرح نمی کند؟ و برای اینکه شما را با قضاوت های ذهنی و تا حدی عینی که از منابع اطلاعاتی مختلف در مورد مشکل گرفته شده است، بار نکنم، مستقیماً به سراغ راه حل آن خواهم رفت. امروز در مورد جستجو صحبت خواهیم کرد. یعنی در مورد برنامه ها و سیستم های اطلاعاتی جدی که اسناد و داده های مورد نیاز ما را جستجو می کنند.

    ارتقاء "جستجوی مستقیم"

    در گذشته نه چندان دور، زمانی که درختان بزرگ بودند و اطلاعات حتی در آن وجود داشت شبکه محلیشرکت های زیادی وجود نداشت، هر جستجویی با جستجوی پیش پا افتاده تعداد انگشت شماری از پرونده های موجود و بررسی متوالی نام و محتوای آنها انجام شد. چنین جستجویی مستقیم نامیده می شود و برنامه ها (ابزارها) با استفاده از فناوری جستجوی مستقیم به طور سنتی در همه وجود دارند سیستم های عاملو بسته های ابزار اما حتی قدرت کامپیوترهای مدرنبرای جستجوی سریع و کافی در حجم عظیم داده در طول جستجوی مستقیم کافی نیست. جستجوی چند صد سند روی یک دیسک و جستجو در یک کتابخانه عظیم و چندین ده صندوق پستی دو چیز متفاوت هستند. بنابراین، برنامه های جستجوی مستقیم امروزه به وضوح در پس زمینه محو می شوند - اگر ما در مورددر مورد وسایل جهانی

    البته این نوع جستجو برای مدت طولانی در بخش شرکتی مورد تقاضا نبوده است. حجم ها یکسان نیست. و بنابراین، برای سالهای متمادی، و اخیراً به وضوح، فناوری هایی که قادر به جستجوی سریع و دقیق اسناد با فرمت های مختلف و از منابع مختلف هستند، بیش از حد مرتبط هستند. چندی پیش، "پدر" مایکروسافت، بیل گیتس، که ظاهراً به موفقیت خارق العاده موتور جستجوی اینترنتی Google غبطه می خورد، در یکی از کنفرانس های مطبوعاتی تمایل صنعت نرم افزار (و نه تنها) را برای کمک به هر طریق ممکن اعلام کرد. توسعه و تعمیق ایجاد موتورهای جستجو و فناوری. اما هنوز خیلی زود است که برنامه‌ای با عملکرد فوق‌العاده از مایکروسافت یا یک سرور رقابتی در اینترنت ایجاد کنید (MSN هنوز به گوگل نمی‌رسد). بنابراین، بیایید به تحولات موجود بپردازیم. فهرست، پرس و جو، ارتباط

    در هسته فن آوری های مدرندو فرآیند اساسی وجود دارد. در مرحله اول، اطلاعات موجود را نمایه می کند و درخواست را با خروجی بعدی نتایج پردازش می کند. در مورد اول، هر برنامه ای (خواه یک موتور جستجوی دسکتاپ باشد، شرکتی سیستم اطلاعاتیا موتور جستجوی اینترنتی) منطقه جستجوی خود را ایجاد می کند. به این معنا که اسناد را پردازش می کند و نمایه ای از این اسناد تولید می کند (یک ساختار سازمان یافته که حاوی اطلاعاتی در مورد داده های پردازش شده است). در آینده، این شاخص ایجاد شده است که برای کار استفاده می شود - به سرعت لیستی از اسناد لازم را طبق درخواست به دست می آورید. آنچه در ادامه می آید، اگرچه از نظر فناوری به هیچ وجه ساده نیست، اما برای کاربر عادی کاملاً قابل درک است. این برنامه درخواست را پردازش می کند (با استفاده از یک عبارت کلیدی) و لیستی از اسناد حاوی این عبارت کلیدی را نمایش می دهد. از آنجایی که اطلاعات در یک نمایه ساختاریافته قرار دارند، پردازش پرس و جو به طور قابل توجهی (ده ها و صدها بار!) سریعتر از جستجوی مستقیم است (انتخاب اسناد نه با جستجو در فایل ها، بلکه با تجزیه و تحلیل انجام می شود. اطلاعات متنیدر شاخص).

    این برنامه اسناد یافت شده را در لیست حاصل با توجه به ارتباط - مطابقت سند با متن درخواست نمایش می دهد. البته در فناوری های مختلف، روش های مختلفی برای جستجو و تعیین ارتباط یک سند وجود دارد (تعداد "تکرار" یک کلمه و تعداد دفعات ذکر آن در سند، نسبت این پارامترها به تعداد کل کلمات در سند، فاصله بین کلمات عبارت جستجو در فایل های جستجو شده و غیره). بر اساس این پارامترها، "وزن" سند تعیین می شود و بسته به آن، یک فایل خاص در لیست نتایج در یک موقعیت خاص ظاهر می شود. در مورد جستجوی اینترنتی، وضعیت حتی پیچیده تر است. در واقع، در این مورد، بسیاری از عوامل دیگر باید در نظر گرفته شوند (رتبه صفحه گوگل نمونه ای از این مورد است). اما این یک موضوع برای یک مقاله جداگانه است، بنابراین ما به اینترنت دست نخواهیم داد. بررسی موتورهای جستجو

    این مطالب قابلیت های چندین برنامه جستجوی محبوب را بررسی می کند که هم سرعت مناسب و هم عملکرد خوب دارند. اما خودنمایی در بروشورها یک چیز است، اما ایستادن زیر نگاه یک متخصص چیز دیگری است. و نه متخصص بیشتری وجود داشت، نه کمتر از یک دفتر پر از افرادی که دوست داشتند نرم افزار را برای قابلیت استفاده آن سرهم کنند. روی یک کامپیوتر آزمایشی (Athlon 2.2 مگاهرتز، با ظرفیت حافظه دسترسی تصادفی 1 گیگابایت، 160 گیگابایت سیگیت 7200 دور در دقیقه هارد IDE و سیستم ویندوز XP) مجموعه ای از برنامه ها نصب شد: dtSearch Desktop، Ischeyka Prof Deluxe، Google Desktop Search، SearchInform، Copernic Desktop Search، ISYS Desktop. برای تست ها، پایگاه داده متنی اسناد به صورت doc، txt و html عمومیاندازه نه بیشتر و نه کمتر، بلکه 20 گیگابایت است. گروهی از رفقا به رهبری بنده حقیر، برداشت های ذهنی خود را از هر نرم افزار تست، مقایسه و به اشتراک گذاشتند. خلاصه ای از یافته ها را در زیر بخوانید. dtSearch Desktop

    برنامه ای که به گفته توسعه دهندگان، ادعا می کند سریع ترین، راحت ترین و بهترین موتور جستجو است. مانند، به طور کلی، هر کس دیگری از این بررسی. رابط dtSearch بسیار ساده است، اما برخی از پنجره‌ها یا برگه‌ها تا حدودی مملو از عناصر هستند که استفاده از آن را دشوار می‌کند. اما در واقعیت هیچ مشکل خاصی وجود ندارد. تنها نکته واقعا ناخوشایند عدم پشتیبانی نرم افزار از زبان روسی است (با وجود این واقعیت که برنامه می تواند اسناد را به چندین زبان جستجو کند، رابط آن منحصراً انگلیسی است).

    اما dtSearch یکی از معدود برنامه‌هایی است که می‌تواند صفحات وب را با «عمق» مشخص شده توسط کاربر فهرست‌بندی کند (البته، با در نظر گرفتن «خرید اضافی» کیت الحاقی dtSearch Spider). این علاوه بر پشتیبانی از فایل‌های دیسک با فرمت‌های متنی مختلف و ایمیل‌های ارسالی است صندوق پستیچشم انداز. در عین حال، این برنامه نمی تواند با پایگاه های داده کار کند که به دلیل حجم زیاد اطلاعات موجود در آنها و توزیع گسترده آنها در شرکت ها و در نتیجه در شبکه های شرکتی، لقمه خوشمزه ای برای موتورهای جستجوگر هستند. سرعت نمایه سازی اسناد dtSearch در سطح مناسبی بود. با نگاهی به آینده، می گویم که این برنامه با نمایه سازی مقدار معینی از اطلاعات در یک سطح با یک رقیب دیگر - iSYS - کنار آمد و رتبه دوم را در لیست بیشترین ها با آن به اشتراک گذاشت. سیستم های سریع. dtSearch یک آزمایش 20 گیگابایتی اطلاعات را در 6 ساعت و 13 دقیقه ایندکس کرد و برای نیازهای جستجوی بعدی، فهرستی معادل 7.9 گیگابایت ایجاد کرد.

    در مورد قابلیت های جستجو، در اینجا آنها در سطح مناسب هستند. اولا، dtSearch یک جستجوی صرفی دارد (جستجوی یک کلمه در تمام اشکال صرفی آن). استفاده كردن این فرصت، مثلاً خود را از افکاری مانند "در چه موردی از یک کلمه خاص در سند مورد نیاز من استفاده شده است" رها می کنید؟ استفاده از جستجوی مورفولوژیکی تقریباً همیشه موجه است، بنابراین باید در هر موتور جستجوی حرفه ای وجود داشته باشد.

    جستجو بر اساس صدا یک ویژگی غیر استاندارد حتی برای موتورهای جستجوی حرفه ای است. ماهیت آن این است که برنامه کلماتی را جستجو می کند که همان کلمه ای را که وارد کرده اید صدا می کنند. و بهترین بخش این است که این تابع برای زبان روسی نیز کار می کند! به عنوان مثال، وقتی کلمه "گوش" را در یک عبارت جستجو تایپ می کنید، نه تنها کلمات "گوش" بلکه "گوش" را نیز در نتیجه خواهید دید.

    جستجو با تصحیح خطا یک عملکرد بسیار مهم است. برای جستجوی کلمات حاوی خطاهای نحوی استفاده می شود - مثلاً اینها می توانند اشتباهات تایپی یا خطاهایی در اسناد به دست آمده با استفاده از سیستم های تشخیص کاراکتر باشند. یک مثال ساده - شما به دنبال کلمه صفحه کلید هستید. برخی از اسناد حاوی کلمه "صفحه کلید" هستند، واضح است که در واقع این کلمه "صفحه کلید" است، شخص فقط هنگام تایپ اشتباه تایپی کرده است. بنابراین، یک جستجوی تصحیح خطا سندی را با کلمه "صفحه کلید" در نتیجه شناسایی کرده و شامل می شود. همچنین تنظیماتی در dtSearch وجود دارد که به شما امکان می دهد درجه کاراکترهای اشتباه احتمالی را تعیین کنید.

    جستجو با استفاده از مترادف. این ویژگی از فهرستی از مترادف های کلمات مختلف استفاده می کند. به عنوان مثال، برنامه با وارد کردن کلمه "سریع" کلمات "سرعت بالا" و موارد دیگر را که مترادف کلمه "سریع" هستند نیز پیدا می کند، البته اگر در لیست مترادف ها وجود داشته باشند. . لیست آماده ای از مترادف ها با برنامه dtSearch ارائه نمی شود، با این حال، می توان از لیست ها در اینترنت استفاده کرد (بر این اساس، اتصال لازم است، که همیشه راحت نیست)، یا می توانید لیست مترادف های خود را ایجاد کنید. .

    علاوه بر قابلیت‌های ذکر شده، dtSearch می‌تواند با استفاده از عبارات متشکل از کلمات مرتبط با عملیات منطقی جستجو کند. هر کلمه در یک پرس و جو را می توان "وزن" خود، یعنی اهمیت، اختصاص داد. یک گزینه مفید این است که از دیکشنری متشکل از کلمات بی اهمیت استفاده کنید تا در هنگام جستجو به آنها توجه نکنید، اما این دیکشنری نیز خالی است و باید خودتان آن را پر کنید.

    در ادامه به قابلیت های برنامه در هنگام کار بر روی شبکه می پردازیم. در واقع dtSearch هیچ قابلیت خاصی برای کار با شبکه ارائه نمی دهد. با این حال، استفاده از آن به صورت آنلاین کاملاً امکان پذیر است. همچنین، می‌توانید نوعی فهرست ایجاد کنید و آن را در یک پوشه عمومی (اشتراک‌گذاری شده) قرار دهید. خود برنامه را می توان بر روی رایانه هر کاربر نصب کرد، یا می توان آن را در یک پوشه باز قرار داد دسترسی عمومیو برای هر کاربر به طور جداگانه با استفاده از پارامترها میانبرهای ویژه ایجاد کنید خط فرمان، که هدف آن در فایل راهنمای ارائه شده به همراه برنامه توضیح داده شده است. همچنین امکان وجود دارد نصب اتوماتیکبرنامه ها به شبکه با استفاده از فایل MSI. این تنظیمات برای هر کاربر متصل را در نظر می گیرد.

    در کل برنامه خوبی از دسته موتورهای جستجوگر حرفه ای است. ممکن است واجد شرایط یک رتبه خوب باشد، اما به دلیل برخی عوامل، جلب اعتماد و احترام کاربران برای dtSearch آسان نیست (همه چیز با رابط کاربری صاف نیست، کاربران روسی محروم هستند، هیچ ویژگی روشنی برای کار با شبکه وجود ندارد) . در مورد جستجوی مستقیم اسناد، برنامه هیچ مشکلی با متن روسی نداشت. همانطور که هیچ کدام با مورفولوژی اعلام شده، یا با جستجوی فازی وجود نداشت. سیستم به اندازه کافی اسناد لازم را هم با یک پرس و جو ساده یک کلمه ای و هم با استفاده از چند پاراگراف یا یک سند به عنوان یک عبارت کلیدی پیدا کرد.

    سایت رسمی:
    اندازه توزیع: 23 مگابایت Bloodhound Prof Deluxe

    بر اساس نام، می توانید حدس بزنید که پشتیبانی از زبان روسی در این برنامه وجود دارد. این قبلاً خوب است. در مورد رابط، به طور کلی، تا حدودی غیر معمول است، اما از نظر ظاهری بسیار جذاب است. چیز دیگر راحتی است. یک معیار بسیار بحث برانگیز، اما هنوز، احتمالا، راه حل چند پنجره ای موفق ترین گزینه نیست (درخواست در یک پنجره وارد می شود، نتیجه در پنجره دیگر نمایش داده می شود و موارد مشابه).

    Snoop از همان شاخص ها برای انجام جستجوی سریع استفاده می کند، اما نمایه سازی بسیار کندتر از برنامه های دیگر است. این بسیار عجیب است، به ویژه با توجه به اینکه قابلیت های آن برای پردازش پرس و جوهای جستجو بسیار ضعیف است و بنابراین ساختار فهرست پیچیده نیست. به احتمال زیاد، این به دلیل الگوریتم های بهینه نشده است. معلوم شد که این برنامه در نمایه سازی و سرعت جستجو یک بیگانه واضح است: زمان صرف شده برای ایجاد نمایه شش برابر بیشتر از dtSearch و iSYS است. نمایه سازی 20 گیگابایت متون برای سگ خونی منجر به 38 ساعت و 46 دقیقه کار شد. و "منطقه جستجو" ایجاد شده در هارد دیسک همان اندازه داده های اصلی را با منهای کوچک - 19 گیگابایت گرفت.

    Bloodhound را می توان به عنوان جایگزینی برای جستجوی استاندارد در ویندوز ارائه کرد؛ بعید است که توانایی بیشتری داشته باشد. این واقعیت که وظیفه اصلی Snooper ساده‌ترین جستجوی فایل‌ها است، نه تنها با تعداد کمی توابع برای تجزیه و تحلیل متن عبارت‌های جستجو و جستجوی پیشرفته بر اساس ویژگی‌های فایل نشان داده می‌شود، بلکه حتی با یک پنجره نتایج که پیوندهای مستقیم به فایل های یافت شده و همچنین به پوشه های حاوی این فایل ها. پنجره نتایج خیلی آموزنده نیست به این معنا که شما می توانید کل فایل پیدا شده را فقط با اجرای آن بخوانید، یعنی نمایشگر فایل داخلی ندارد. اما گزیده ای از فایلی که کلمه جستجو شده در آن پیدا شده نمایش داده می شود؛ به طور کلی این طرح نمایش بسیار یادآور موتورهای جستجوی اینترنتی است.

    در مورد قابلیت های خاص برای پردازش پرس و جوهای جستجو، شایان ذکر است که چیزی به نام "متن جستجو" وجود ندارد؛ حداکثر چیزی که می توان جستجو کرد یک عبارت است، اگر فقط به این دلیل که فیلد ورودی متن چند خطی وجود ندارد. با این حال، شما می توانید عبارت وارد شده را تجزیه و تحلیل کنید، و Snoop یک مجموعه جستجوی استاندارد را در اینجا به ما ارائه می دهد: عملیات منطقی، جستجوی ماسک و جستجوی نقل قول... خیلی زیاد نیست. این برنامه حاوی برخی مقدمات جستجوی مورفولوژیکی است، اما احتمالاً آنقدر خام است که به احتمال زیاد در عملکرد صحیح اختلال ایجاد می کند (در طول آزمایشات، بسیاری از اشکالات با استفاده نادرست از مورفولوژی مشاهده شد).

    اما این برنامه به شما این امکان را می دهد که هنگام جستجو ویژگی های فایل (تاریخ سند، نام فایل، نام پوشه) را مشخص کنید و در این کوئری ها نیز می توانید از همان مجموعه جستجو استفاده کنید. همچنین می توانید با تعیین پارامترها (از، موضوع... و غیره) حروف را جستجو کنید.

    بنابراین، ما خود جستجو را فهمیدیم، چه چیز دیگری در مورد برنامه جالب است، که طبق اطلاعات وب سایت رسمی جوایز زیادی برای آن دریافت کرد؟ به سختی می توان گفت که چه چیزی در مورد آن بسیار خاص است؛ به احتمال زیاد، رابط Bloodhound جذاب است (دقیقاً از نظر ظاهری، بدون ذکر قابلیت استفاده).

    عملیات با ایندکس ها بسیار استاندارد هستند؛ یک ویژگی خوب، امکان به روز رسانی فهرست ها بر اساس یک برنامه زمان بندی است. علاوه بر این، فهرست ها را می توان به صورت آنلاین نیز استفاده کرد. از این به بعد به جزئیات بیشتری نیاز داریم.

    با وجود بدوی بودن پرس و جوهای جستجو، می توان از این برنامه برای جستجوی فایل ها استفاده کرد، بنابراین استفاده از آن در شبکه ها قابل توجیه است. اگرچه با کشش زیاد، از آنجایی که در یک شبکه بزرگ وظیفه اولویت است جستجوی سریعداده ها با استفاده از عبارت های جستجوی پیچیده به دلیل حجم عظیم اطلاعات - و به وضوح مشکلاتی در سرعت جستجو و برنامه وجود دارد. باید بگویم که کار با شبکه در Izhishika همانطور که باید فکر شده است. یک برنامه جداگانه به طور خاص برای این طراحی شده است - سرور Bloodhound. این به همان روش ساده Snooper کار می کند (آنها موتور جستجوی یکسانی دارند)، فقط برای اسناد میزبانی شده روی سرور مرکزی یا در منابع مشترک V شبکه شرکتی. Snooper Server نمایه های جدیدی را در منابع مشترک ایجاد می کند یا از مواردی که قبلا ایجاد شده است استفاده می کند. هر کاربر شبکه شرکتی می تواند با استفاده از مرورگر اینترنت به سرور جستجو متصل شود و از آن برای دسترسی به هر سند (واقع در فهرست فعلی) استفاده کند. موافقم، این طرح بسیار راحت است: معلوم می شود که فایل های موجود در شبکه خود را می توان به همان روشی که اطلاعات موجود در اینترنت را از طریق، به عنوان مثال، Google جستجو کرد.

    با ارزیابی تمام مزایا و معایب این برنامه، نتیجه گیری به خودی خود نشان می دهد که قابلیت های آن به احتمال زیاد برای شبکه های شرکتی کافی نیست (با وجود سازماندهی خوب کار با شبکه)، بلکه برای یک رایانه خانگی یا حتی برای شبکه خانگیدر اصل، ممکن است مناسب باشد. اگرچه نه سرعت کار و نه قابلیت جستجو باعث خوش بینی نمی شود...

    وب سایت رسمی به زبان روسی:
    اندازه توزیع: 6 مگابایت Google Desktop Search + GDS Enterprise

    البته، ما نمی‌توانستیم چنین توسعه‌دهنده معروفی را نادیده بگیریم. نام گوگل در حال حاضرخیلی می گوید افرادی که سال ها از قدرتمندترین موتور جستجوی اینترنتی استفاده می کنند، بدون شک تصمیم خواهند گرفت که این موتور جستجوی خاص را روی رایانه خود نصب کنند. فقط فکر کنید: گوگل در رایانه خانگی شما! با این حال، بدون تسلیم شدن به اقدامات تحریک آمیز با یک نام تجاری گسترده، بیایید با هوشیاری، و مهمتر از همه عینی، سعی کنیم قابلیت های موتور جستجوی "رومیزی" گوگل را در نظر بگیریم.

    اولین چیزی که توجه شما را جلب می کند عدم وجود پوسته مخصوص برنامه است. جستجوی دسکتاپ گوگل هنوز در پنجره مرورگر قرار دارد، به ترتیب، کل رابط نسخه دسکتاپ از این نرم افزار از برادر بزرگتر اینترنت خود به ارث رسیده است. خوب یا بد بودن این یک نکته قابل بحث است: برخی از افراد مینیمالیسم در طراحی این موتور جستجو را دوست دارند، در حالی که برخی دیگر می خواهند یک برنامه کامل پر از انواع دکمه ها و غیره را ببینند.

    چه چیزی بلافاصله بعد از طراحی نظر شما را جلب می کند؟ و این واقعیت که همین جستجوی دسکتاپ گوگل شروع به فهرست کردن همه چیز در رایانه می کند، بدون هیچ تقاضایی! و جالب‌ترین چیز این است که انتخاب مسیرهای نمایه‌سازی با استفاده از جستجوی دسکتاپ گوگل غیرممکن است. شما باید یک برنامه جداگانه (TweakGDS) دانلود کنید که به شما امکان می دهد کمی گسترش دهید تنظیمات گوگلدسکتاپ، از جمله تعیین مکان های مورد نیاز برای نمایه سازی. اگرچه، تا زمانی که همه اینها را بفهمید، از قبل یک هارد دیسک استاندارد را ایندکس می کند، بنابراین به احتمال زیاد این تنظیم هنگام کار با حجم زیادی از داده مورد نیاز است، که هنگام استفاده در شبکه های شرکتی (نسخه های Enterprise) بسیار مهم است. . با این حال، این یک واقعیت نیست که پس از دانلود TweakGDS، مشکلات شما حل شود. از این گذشته، او برای کار کردن به مایکروسافت نیاز دارد. چارچوب خالصو Microsoft Scripting Runtime. بله... نصب و همچنین دسترسی به تنظیمات می‌توانست ساده‌تر شود، اگرچه توسعه‌دهندگان احتمالاً می‌توانند درک کنند: چرا وقتی یک موتور جستجوی آماده وجود دارد چیزی جدید بنویسید، آن را به آن منتقل کنید. کامپیوتر محلیو اجازه دهید کاربر "لذت برد" و اجازه دهید نام معروف شاهکاری دیگر از "این" بسازد. بیا، این انحراف غزلی را تمام کنیم و به جستجو برویم.

    در مورد تجزیه و تحلیل عبارت‌های جستجو و ارائه نتایج، همه چیز در اینجا کاملاً مشابه Google در اینترنت است: همان سیستم برای نمایش نتایج، همان مجموعه استاندارد عملیات منطقی برای عبارت‌های جستجو. به طور کلی، جستجوی دسکتاپ گوگل، مانند برنامه قبلی، منحصراً برای جستجوی فایل ها در نظر گرفته شده است - البته، نمایشگر داخلی برای این فایل ها ندارد. تعداد فرمت های فایل پشتیبانی شده توسط Google Desktop Search کاملاً کافی است و همچنین خوب است که صفحات اینترنتی بازدید شده را جستجو می کند و داده ها را از حافظه پنهان می گیرد. سرعت جستجو و نمایه سازی کاملا قابل قبول است. درست است، برای استفاده خانگی. با حجم قابل توجه 20 گیگابایت متن های گوگل Desktop Search کار را در 8 ساعت و 17 دقیقه تکمیل کرد. صرف چندین روز برای پردازش اطلاعات از شبکه شرکتی یک شرکت بزرگ، کاری نیست که هیچ مدیر سیستمی بخواهد انجام دهد. از جنبه مثبت: اندازه شاخص ایجاد شده در همان سطح (4.5 گیگابایت) با موتور جستجوی دیگری که در این بررسی آزمایش شده بود - SearchInform بود.

    مزیت بزرگ (یا نقطه ضعف - شما تصمیم می گیرید) جستجوی دسکتاپ گوگل این است که از افزونه ها پشتیبانی می کند که می تواند تغییرات زیادی را برای بهتر شدن ایجاد کند. نکته دیگر این است که اتصال پلاگین ها و تنظیم آنها کار نصب یک موتور جستجو را بسیار پیچیده می کند، به طوری که شما شروع به تعجب می کنید که آیا همه اینها زمانی که می توانید یک برنامه معمولی و کامل را نصب کنید که همه چیز در آن وجود دارد، ضروری است یا خیر. پس از همه، برای استفاده از هر ویژگی باید یک افزونه جدید نصب کنید. حتی برای اینکه برنامه به طور کامل با آرشیو کار کند، یک ابزار جداگانه مورد نیاز است. این جذاب و فریبنده است که همه این ماژول های اضافی رایگان هستند. با این حال، اگر نسخه دسکتاپ موتور جستجو را در نظر نگیرید، ممکن است پیکربندی صالح GDS Enterprise در اختیار شما نباشد - از این گذشته، بیهوده نیست که متخصصان Google خدمات خود را برای راه اندازی خدمات خود ارائه می دهند. نرم افزار برای شبکه شما تنها با 10000 دلار.

    اگر مراحل راه‌اندازی و نصب را انجام دهید (یا 10000 دلار به تیم پاسخ سریع گوگل بپردازید)، متوجه خواهید شد که پیچیدگی نصب بیشتر از تنظیمات بسیار انعطاف‌پذیر هنگام استفاده در شبکه‌های شرکتی جبران می‌شود. یک نکته مهم کار گوگلدسکتاپ در یک شبکه شرکتی استفاده از سیاست های گروهی است که امکان تنظیم تنظیمات برای هر کاربر را ممکن می سازد.

    به طور خلاصه، معقول ترین استفاده برای این برنامه یک کامپیوتر خانگی یا محل کار است. از این گذشته ، برای یک رایانه معمولی ، فقط نصب برنامه کافی است - بقیه کارها را خودش انجام می دهد (حتی از شما چیزی نمی خواهد).

    با این حال، Google Desktop Search Enterprise در مواردی که نیاز فوری به پیکربندی انعطاف پذیر خط مشی شبکه برای استفاده از موتور جستجو وجود دارد، قابل قبول خواهد بود، در حالی که توانایی پردازش پرس و جوهای جستجو از نظر اهمیت و زمان (یا پول) در رتبه دوم قرار خواهد گرفت. ) صرف راه اندازی برنامه در وهله اول خواهد بود.

    سایت رسمی:
    اندازه توزیع شامل TweakGDS: 1.2 MbCopernic Desktop Search

    برای بزرگنمایی روی عکس کلیک کنید

    رابط برنامه احساسات بسیار مثبت را برمی انگیزد - همه چیز مطابق با استانداردهای پذیرفته شده عمومی انجام می شود، هیچ چیز اضافی، در یک کلام، طراحی دلپذیر است. برای یک مبتدی، درک رابط جستجوی دسکتاپ کوپرنیک بسیار آسان خواهد بود. اگرچه، تا حدودی گیج کننده است که طراحان به وضوح رابط برنامه را با در نظر گرفتن این واقعیت که برنامه در قالب استاندارد ویندوز XP کار می کند ایجاد کرده اند. هنگام استفاده از تم کلاسیک، برنامه چندان زیبا به نظر نمی رسد. اما این بیشتر سلیقه ای است.

    در اولین راه اندازی، برنامه از شما می خواهد که فهرست هایی برای جستجو ایجاد کنید. تا حدودی غیرمعمول به نظر می رسید که پس از انتخاب پوشه ها برای نمایه سازی، برنامه پیشنهادی برای فشار دادن هیچ دکمه ای مانند "شروع نمایه سازی" نداد و نمایه سازی به طور خودکار شروع نشد، تنها پس از آن متوجه شد که کوپرنیک در حال تلاش برای شروع نمایه سازی در حالی است که کامپیوتر بیکار بود باید کمی بیشتر در گزینه های برنامه جستجو کنید تا همه چیز را به درستی پیکربندی کنید. لازم به ذکر است که امکانات بسیار گسترده ای برای راه اندازی ایجاد نمایه خودکار وجود دارد: زمانبندی داخلی، امکان نمایه سازی در حالی که رایانه بیکار است، زمینه، با اولویت پایین نمایه سازی خیلی سریع نبود - 10 ساعت و 51 دقیقه - این سرعت نسبت به سایر موتورهای جستجو کندتر است (به جز Bloodhound، اما Copernic هنوز یک مرتبه سریعتر از توسعه iSleuthHound Technologies است.

    حال در مورد ساختار شاخص. به طور کلی، چیز خاصی در مورد آن وجود ندارد. امکان انتخاب انواع فایل به صورت کلی و جزئی وجود دارد. یعنی در ابتدا می توانید آنچه را که می خواهید فهرست کنید - اسناد، تصاویر، فیلم ها، موسیقی را انتخاب کنید. در برگه دیگر پنجره گزینه ها، می توانید انواع فایل های خاصی را با پسوند انتخاب کنید. علاوه بر این، می‌توانید ایندکس را طوری پیکربندی کنید که برای مثال، تصاویر کوچک‌تر از ۱۶×۱۶ ایندکس نشوند یا فایل‌های صوتی با طول کمتر از ۱۰ ثانیه ایندکس نشوند. علاوه بر نمایه سازی فایل ها از پوشه ها، کوپرنیک می تواند با ایمیل ها و مخاطبین از دفترچه آدرس کار کند Microsoft Outlookو Microsoft Outlook Express، فهرست بندی موارد دلخواه و تاریخچه از اینترنت اکسپلورر امکان پذیر است.

    در مورد قابلیت های جستجو، آنها در اینجا بسیار ضعیف هستند. در طول آزمایشات، حتی مشخص شد که این برنامه اسناد را با فرمت های txt و html به زبان روسی جستجو نمی کند و به شما امکان می دهد آنها را فقط با عنوان و نه بر اساس محتوا پیدا کنید. تنها چیزی که این برنامه برای بهبود کارایی جستجو ارائه می دهد، استفاده از مجموعه استانداردی از عملیات منطقی است و حتی پس از آن، این ویژگی به صورت آزمایشی کشف شد، زیرا مستند نشده بود. به هر حال، کمک برنامه نیز درست نیست - فقط از طریق اینترنت در دسترس است، که، می بینید، بسیار ناخوشایند است و اطلاعات کمک زیادی در اینترنت وجود ندارد. ظاهراً توسعه دهندگان تصمیم گرفتند که رابط کاربری ساده این برنامه به معنای وجود کمک معمولی نیست. در ادامه گفتگو در مورد قابلیت های جستجو، لازم به ذکر است که علیرغم تحلیل ضعیف پرس و جوها، این برنامه یک سیستم جستجوی جالب ارائه می دهد - کاربر می تواند نوع فایل ها (تصاویر، فیلم ها، موسیقی و غیره) را انتخاب کند، جستجو را وارد کند. پرس و جو کنید و ویژگی های خاص نوع فایل انتخابی را انتخاب کنید. به عنوان مثال، برای فایل های صوتی، این ها می توانند مقادیری از برچسب های mp3 (هنرمند، آلبوم، تاریخ و غیره) باشند، برای مثال، برای تصاویر، می توانید اندازه آنها را (بر اساس وضوح) انتخاب کنید، به طور کلی، هر نوع خود را دارد. تنظیمات خود پس از جستجوی یک نوع فایل خاص، برنامه یک لیست بسیار آموزنده را در پنجره نتایج نمایش می دهد و اگر درخواست شما شامل فایل هایی از انواع دیگر باشد، می توانید با کلیک بر روی یک لینک خاص، آنها را باز کنید.

    به طور جداگانه، لازم است به پنجره نمایش نتایج اشاره شود. در زیر لیست فایل های یافت شده، محتویات این فایل ها نمایش داده می شود (از یک طرح مشابه اغلب در کلاینت های ایمیل استفاده می شود). درست است، مشاهده متن فقط در قالب بومی انجام می شود، و هیچ حالت نمایش متن ساده ای وجود ندارد، که همیشه راحت نیست، زیرا باز کردن یک سند در این مورد زمان بیشتری می برد. اما با توجه به اینکه کوپرنیک می تواند تصاویر و موسیقی را جستجو کند، امکان مشاهده این فایل های چند رسانه ای وجود دارد.

    اصول اولیه عملکرد این برنامه توضیح داده شده است، حالا ببینیم Copernic Desktop Search برای کار با شبکه چه چیزی می تواند به ما ارائه دهد... در اصل، شما می توانید برای مدت طولانی تماشا کنید، اما به سختی قادر خواهید بود چیزی را ببینید. . به عبارت دیگر، قرار نبود این برنامه مبتنی بر شبکه باشد. Copernic Desktop Search منحصراً یک موتور جستجوی خانگی است.

    بدیهی است که تنها (منطقی ترین) کاربرد این برنامه است کامپیوتر خانگی. در اینجا به طور کامل با تمام پرس و جوهای ساده جستجوی کاربر متشکل از یک یا دو کلمه مقابله می کند، اطلاعات لازم را پیدا می کند و تقسیم جستجو بر اساس نوع فایل و پشتیبانی از فایل های چند رسانه ای همراه با نمایه سازی پس زمینه در حالت اولویت پایین، همراه با دلپذیر رابط، فقط به برنامه قدرت می دهد تا اعتماد کاربران بی تجربه را جلب کند.

    سایت رسمی
    اندازه توزیع: 2.6 MbISYS Desktop

    برای بزرگنمایی روی عکس کلیک کنید

    یک برنامه بسیار قدرتمند از نظر سطح تجهیزات با انواع عملکردها، تقریباً نزدیک به سیستم جستجوی SearchInform بعدی در لیست است. علاوه بر این، حجم فایل نصبی بیش از 40 مگابایت است! سخت است بگوییم چه چیزی می تواند در چنین ابعادی فشرده شود، زیرا همان SearchInform با عملکرد مشابه، 15 مگابایت را اشغال می کند.

    فرآیند نصب در اینجا نیز چندان خوشایند نیست، یا بهتر است بگوییم حتی فرآیند نصب نیست. حتی قبل از دانلود برنامه از شما خواسته می شود که ثبت نام کنید وگرنه راهی وجود ندارد. بعد، رابط. این بسیار زیبا ساخته شده است، هیچ چیز غیر ضروری چشم را جلب نمی کند، با این حال، این برداشت های شخصی است که قبلاً تا حدودی به آن عادت کرده است. برای یک مبتدی آسان نخواهد بود که بفهمد کجا و چه چیزی قرار دارد، کجا کلیک کند و در نهایت کجا جستجو کند. به شدت توصیه می شود قبل از شروع کار راهنما را بخوانید - در اعصاب و زمان زیادی صرفه جویی خواهید کرد. به هر چیز دیگری عدم پشتیبانی کامل از زبان روسی در برنامه اضافه شده است. خوب نیست. علاوه بر این، ویندوزهای اینجا با کنترل بیش از حد بارگذاری نمی شوند، اما مجبور شدیم برای این کار با مولتی ماژول ها و استفاده از پنجره های اضافی هزینه کنیم. به عنوان مثال، درخواست های جستجو با راه اندازی یک برنامه وارد می شوند و مدیریت فهرست با استفاده از برنامه دیگری انجام می شود. پرس و جوهای جستجو نیز در اینجا در پنجره های پاپ آپ جداگانه وارد می شوند. سخت است که بگوییم کدام بهتر است - یک رابط پربار یا چند پنجره همه جا حاضر؛ بلکه یک موضوع سلیقه ای است.

    هنگامی که نوبت به ایجاد نمایه ها می رسد، برنامه ویژگی هایی را برای ساده سازی فرآیند تنظیم گزینه ها برای یک نمایه جدید ارائه می دهد. این ویژگی ها شامل چندین مورد است قالب های آمادهبرای ایجاد نمایه برای پوشه "اسناد من"، "ایمیل"، "ایمیل و اسناد"، "پوشه خاص"، "پوشه با انتخاب انواع فایل" و غیره. چنین الگوهایی ایجاد نمایه ها را در مرحله اول ساده می کند. ابزار کار با ایندکس ها رابط کاربری خیلی خوبی ندارد، که با کمی پیچیدگی ترسناک است (این یک ارزیابی بسیار ذهنی است، صادقانه بگویم)، با این حال، اگر به آن نگاه کنید، گزینه های مفید زیادی را ارائه می دهد و به طور کلی ، استفاده از آن مشکل زیادی ایجاد نمی کند. ISYS Desktop می‌تواند داده‌ها را از منابع داده‌های مختلف فهرست‌بندی کند، و همچنین تنظیمات انعطاف‌پذیر بسیاری را برای این فهرست‌سازی فراهم می‌کند. ویژگی های اضافی نمایه سازی عبارتند از: پشتیبانی از SQL، FTP، TRIM Context، WORLDOX 2002، اسکریپت ها. هنگام ایجاد نمایه، اگر مورد "پوشه با انتخاب انواع فایل" را انتخاب کرده باشید، این فرصت را دارید که انواع فایل را برای نمایه سازی به صورت دستی (با پسوند) انتخاب کنید. باید گفت که تعداد زیادی از انواع فایل های پشتیبانی شده وجود دارد، اما شما نمی توانید نوع (پسوند) خود را به لیست موجود اضافه کنید. همچنین می توانید به وجود یک زمانبندی نمایه سازی توجه کنید. ایجاد نمایه و پردازش 20 گیگابایت اطلاعات ISYS Desktop 6 ساعت و 13 دقیقه طول کشید که در نهایت زمان مناسب و حجم فایل ایجاد شده - 7.9 گیگابایت را نشان داد.

    قابلیت جستجوی این برنامه بسیار خوب است. آنچه در ISYS استفاده می شود بسیار قدرتمندتر از پشتیبانی معمولی برای عملیات منطقی است. در میان قابلیت های جستجوی پیشرفته، این برنامه استفاده از مترادف ها و فیلتر مرتب سازی (بر اساس مسیر، نام و تاریخ ایجاد فایل) را ارائه می دهد. مجموعه عملگرهای منطقی تا حدودی گسترده تر از مجموعه استاندارد است. علاوه بر عملیات منطقی، این برنامه به شما امکان می دهد با بسیاری از اپراتورهای دیگر کار کنید، که در اصل می توانند جایگزین برخی از انواع جستجو شوند؛ به عنوان مثال، جستجو با تجزیه را می توان با استفاده از عملگرهای خاص به طور کامل جایگزین کرد. من بسیار تعجب کردم که این برنامه جستجوی با استفاده از مورفولوژی ندارد. این یک حذف جدی است، زیرا کارایی جستجو هنگام استفاده از تجزیه و تحلیل مورفولوژیکی بسیار بهبود می یابد. علاوه بر این، لیستی از کلمات مهم وجود ندارد، اما فهرست گسترده ای از کلمات بی اهمیت وجود دارد. توابع جستجو مانند "جستجوی تقریبی" و "تحلیل اکتشافی" نیز اعلام شده است.

    ISYS انتخابی از انواع مختلفی از پرس و جوهای جستجو، یعنی انواع بصری را فراهم می کند. این کار با استفاده از انواع مختلف پنجره برای وارد کردن عبارت‌های جستجو انجام می‌شود، با این حال، در واقع هیچ پنجره‌ای اجازه استفاده از فناوری‌هایی غیر از موارد ذکر شده در بالا را نمی‌دهد.

    نتایج جستجو بسیار آموزنده هستند و به عنوان لیستی از اسناد مرتب شده بر اساس ارتباط نمایش داده می شوند. پیش نمایش سند انتخاب شده در زیر نمایش داده می شود. برخلاف جستجوی دسک‌تاپ کوپرنیک، پیش‌نمایش در اینجا فقط به صورت متن ساده در دسترس است؛ امکان نمایش اسناد در قالب اصلی آنها، ورد، Html یا PDF وجود ندارد، اگرچه این در اصل خیلی مهم نیست. این برنامه به شما امکان می دهد اسناد پیدا شده را با توجه به معیارهای خاصی به گروه ها تقسیم کنید (به طور پیش فرض آنها بر اساس ارتباط تقسیم می شوند). همچنین می‌توانید اسنادی را که قبلاً پیدا شده‌اند، با انتخاب پوشه‌های جداگانه مشاهده کنید (این کار زمانی راحت است که نتیجه تعداد بسیار زیادی اسناد تولید کند).

    استفاده از برنامه در یک شبکه شرکتی نیز بسیار موجه است، زیرا فرصت های خوبی برای سازماندهی جستجوی شبکه فراهم می کند. سیستم جستجو بر اساس ایجاد یک نمایه عمومی است که حاوی داده های نمایه شده از منابع آنلاین در دسترس عموم است.

    در واقع برنامه ISYS لااقل آشنایی با آن شایسته توجه است. این برنامه یک پروژه بالغ با تعداد زیادی کارکرد است (البته نه همیشه و نه همه به آنها نیاز دارند، اما هنوز هم). این احتمال وجود دارد که این برنامه از نظر پردازش پرس و جوهای جستجو پیشرفت هایی را ببیند، اما در حال حاضر می توان آن را برای استفاده تقریباً جهانی توصیه کرد. و با توجه به اینکه هنوز برای سیستم های خانگی بسیار سنگین است، مکان های اصلی نصب آن شبکه های شرکتی است.

    سایت رسمی:
    اندازه توزیع: 40 MbSearchInform

    برای بزرگنمایی روی عکس کلیک کنید

    احتمالاً ارزش ندارد که فوراً با توضیح رابط SearchInform شروع کنید. ابتدا باید فرآیند نصب یا بهتر است بگوییم یکی از جزئیات آن را شرح دهیم: شما نمی توانید برنامه را بدون اتصال به اینترنت نصب کنید. واقعیت این است که قبل از اولین راه اندازی، برنامه نیاز به ثبت نام کاربر (رایگان) دارد و تمام داده های وارد شده را به سرور ارسال می کند. ظاهراً توسعه دهندگان باید چنین اقداماتی را در مبارزه با دزدی دریایی انجام می دادند، اما این امر تأثیر مثبتی بر سهولت نصب نداشت.

    رابط برنامه مطابق با تمام قوانین پذیرفته شده طراحی شده است، با این حال، در نگاه اول، تا حدودی دست و پا گیر است. با استفاده از برنامه برای اولین بار، به نظر می رسد که خیلی پیچیده است، گاهی اوقات به راحتی نمی توان به یاد آورد که گزینه مورد نظر در کدام منو یا در کدام برگه قرار دارد، اما با استفاده طولانی تر، رابط دیگر آنقدر پیچیده به نظر نمی رسد. . نکته اصلی این است که ابتدا گواهینامه را بخوانید.

    با درک کمی رابط، می توانید شروع به ایجاد یک شاخص کنید. این فرآیند به خودی خود بسیار ساده است و سرعت نمایه سازی، حتی با چشم، به طور قابل توجهی بالاتر از سایر موتورهای جستجو در بررسی است. پاک کردن اعداد تست نشان می دهد که SearchInform از نظر سرعت ایندکس دو برابر سریعتر از dtSearch و iSYS است! این برنامه داده های ارائه شده را در حجم 20 گیگابایت در زمان رکورد 3 ساعت و 17 دقیقه ایندکس کرد. و اندازه شاخص ایجاد شده کوچکترین 4.4 گیگابایت - 100 مگابایت کمتر از جستجوی دسکتاپ گوگل است.

    این برنامه علاوه بر فایل ها و پوشه های معمولی، از نمایه سازی ایمیل ها، اتصال و نمایه سازی پایگاه های داده (!) و موارد دیگر پشتیبانی می کند. منابع خارجی(DMS، CRM)، بلافاصله در حین نمایه سازی می توانید یک فرهنگ لغت را برای انجام جستجوی مورفولوژیکی مشخص کنید و همه ویژگی های فایل را می توان نمایه کرد. پس از ایجاد نمایه، هنگام تلاش برای انجام اولین جستجوی آزمایشی برای اسناد، ممکن است تا حدودی گیج شوید: "در اینجا دو نوع جستجو وجود دارد، اما به کدام یک نیاز دارم؟" همانطور که قبلا ذکر شد، نکته اصلی خواندن گواهی است، سپس همه چیز روشن می شود. این برنامه در واقع می تواند دو نوع جستجو را انجام دهد - جستجوی عبارت و جستجوی اسنادی که از نظر محتوایی مشابه متن پرس و جو هستند.

    شرحی از تمام توابع اصلی برای تجزیه و تحلیل یک عبارت جستجو در بالا ارائه شد، بنابراین اکنون ما فقط قابلیت های جستجوی ارائه شده توسط این برنامه را لیست می کنیم. بیایید با جستجوی عبارت شروع کنیم: البته، جستجوی مورفولوژیکی، جستجوی استنادی، عملیات منطقی، جستجو با تجزیه کلمه (جستجو در ابتدای کلمه، در انتها، در قسمت میانی یا مطابقت کامل)، جستجوی استنادی مختلط ( هنگامی که همه کلمات از پرس و جو باید در سند وجود داشته باشند، اما نه لزوماً به ترتیب وارد شده، جستجو با تصحیح خطا، استفاده از مترادف ها، "جستجوی تقریباً نقل قول" (جستجوی عبارت وارد شده به عنوان استناد، اما کلمات دیگر ممکن است بین کلمات وارد شده وجود داشته باشد) و غیره برخی از گزینه های ذکر شده تنظیمات خاص خود را دارند. علاوه بر این، امکان استفاده از فرهنگ لغات بی اهمیت نیز وجود دارد و برنامه از قبل فهرست آماده ای از این کلمات را دارد؛ همچنین می توانید از فرهنگ لغات اولویت دار برای جستجو استفاده کنید (البته باید آن را پر کنید. خودت).

    در اینجا، در اصل، به طور خلاصه تمام ویژگی های اصلی جستجوی عبارت را بررسی کردیم.

    بیایید به بررسی ویژگی های این برنامه - جستجوی اسناد مشابه ادامه دهیم. توسعه دهندگان ادعا می کنند که این به هیچ وجه یک جستجوی متنی ساده نیست، بلکه دقیقاً "جستجوی موارد مشابه" است - این دقیقاً همان چیزی است که در همه جا توضیح داده شده است ، اما اوه خوب ، می توانید آن را هر طور که می خواهید صدا کنید - نکته اصلی این است که . یک جستجوی سریع در اینترنت می تواند به سرعت نشان دهد که به اصطلاح "جستجوی مشابه" یک پیشرفت جدید در زمینه تجزیه و تحلیل متن است. این سیستم به شما امکان می دهد متن هایی را پیدا کنید که از نظر محتوای معنایی مشابه هستند. خوشایندترین چیز این بود که پس از انجام پرس و جوهای جستجوی آزمایشی، معلوم شد که این تئوری کاملاً با تمرین مطابقت دارد! این برنامه در واقع اسنادی با محتوای مشابه را جستجو می کند و آنها را در یک لیست نمایش می دهد و آنها را بر اساس درصد شباهت مرتب می کند.

    در مرحله بعد، بیایید به آنچه SearchInform (به ویژه نسخه شرکتی آن SearchInform Corporate) برای کار در یک شبکه شرکتی ارائه می دهد نگاه کنیم. دو نوع برنامه وجود دارد: سمت سرور و سمت کاربر. بخش سرور به طور مستقل ایندکس های مشخص شده را پردازش می کند و کاربران بسته به حقوق دسترسی اختصاص داده شده به آنها می توانند از آنها برای جستجو استفاده کنند. کاربران را می توان به طور خودکار با استفاده از پیکربندی کرد حساب هاویندوز (به زبان حرفه ای، SearchInform از احراز هویت NTFS ویندوز استفاده می کند)، و به صورت دستی (کاربران باید جداگانه اضافه شوند). هر کاربر می تواند اجازه داشته باشد یا از دسترسی به نمایه های خاصی محروم شود و کاربران نیز می توانند در گروه ها ترکیب شوند. به طور کلی تنظیمات SearchInform برای کار در شبکه از نظر انعطاف پذیری از گوگل و از نظر راحتی و سادگی از سرور Ishhound جلوتر است.

    سایت رسمی:
    اندازه توزیع: 14.7 مگابایت مقایسه سرعت نمایه سازی

    سیستم جستجوزمان نمایه سازیاندازه شاخص
    Bloodhound Prof Deluxe 4.538 ساعت 46 دقیقه19 گیگابایت
    Isys Desktop 7.06 ساعت 13 دقیقه7.9 گیگابایت
    DtSearch 7.06 ساعت 3 دقیقه8.6 گیگابایت
    Google Desktop Search Enterprise8 ساعت 17 دقیقه4.5 گیگابایت
    جستجوی دسکتاپ کوپرنیک *10 ساعت 51 دقیقه7 گیگابایت
    SearchInform 1.5.023 ساعت 17 دقیقه4.4 گیگابایت

    * بیشتر اسناد.html و txt حاوی متن روسی، اگرچه نمایه شده بودند، یافت نشد جز با نام آنها.

    همه برنامه ها قابل توجه هستند.

    بر اساس آزمایش‌ها و بررسی دقیق هر برنامه ارائه شده در بررسی، می‌توان نتایج مشخصی گرفت. بنابراین، Google Desktop Search Copernic Desktop Search برای کاربران بی تجربه به عنوان یک سیستم جستجوی اطلاعات خانه کاملاً مناسب است. آنها به خوبی با پرس و جوهای ساده کنار می آیند، کاربر را با تنظیمات بارگذاری نمی کنند و علاوه بر این، کاملا رایگان هستند. تلاش گوگل برای ورود به بازار موتورهای جستجوی شرکتی هنوز چندان موجه نیست: برای اینکه به درستی کار کند، برنامه باید به ماژول های اضافی مجهز شود و راه اندازی آن بسیار آسان نیست. بنابراین، نام‌های قابل توضیح Desktop Search، Copernic و Google جایگاه موتورهای جستجوی «رومیزی» را پشت سر خود نگه می‌دارند.

    راه‌حل‌های واقعی و قدرتمندتر - dtSearch، iSYS و SearchInform نیز بی‌خطا نیستند و نسخه‌های «دسک‌تاپ» خود را به کاربران ارائه می‌دهند. اما با قیمت مناسب، بر خلاف نرم افزار رایگان گوگل و کوپرنیک. البته برای قدرت، سرعت و عملکرد باید هزینه پرداخت کنید. اما تمرکز اصلی توسعه دهندگان dtSearch، iSYS و SearchInform، البته، بر روی بخش شرکتی است. شبکه، عملکرد، نمایه سازی و سرعت جستجو چیزی است که این محصولات را از "رقبا" خود متمایز می کند. بر اساس نتایج آزمایش، مورد علاقه مشخص شد - SearchInform. این برنامه با ارائه قابلیت جستجوی اسناد مشابه، دارای بالاترین سرعت نمایه سازی و جستجو است مجموعه خوبکارکرد.

    الکسی کوتوونکو

    جستجوی حرفه ای در اینترنت

    معرفی

    جستجوی اینترنتی یکی از عناصر مهم کار در اینترنت است. تعداد دقیق منابع وب در اینترنت مدرن بعید است که کسی به طور قطعی بداند. در هر صورت شمارش میلیاردی است. برای اینکه بتوانید از اطلاعات مورد نیاز در یک لحظه، صرف نظر از اهداف کاری یا سرگرمی استفاده کنید، ابتدا باید آن را در این اقیانوس دائماً پر از منابع پیدا کنید. این به هیچ وجه کار آسانی نیست، زیرا اطلاعات در اینترنت مدرن ساختاری ندارد، که در یافتن آن مشکل ایجاد می کند. تصادفی نیست که موتورهای جستجوی اینترنتی به «پنجره‌هایی» منحصربه‌فرد در این فضای اطلاعاتی تبدیل شده‌اند.

    بعید است که در بین کاربران اینترنت افرادی وجود داشته باشند که هرگز از موتورهای جستجوی جهانی بزرگ استفاده نکرده باشند. نام گوگل، یاندکس و چند ماشین بزرگ دیگر بر لبان همه است. آنها به خوبی با کارهای روزمره جستجوی اینترنتی کنار می آیند و اغلب کاربران حتی سعی نمی کنند به دنبال جایگزینی بگردند. در عین حال، تعداد موتورهای جستجوی اینترنتی در زمان ما به هزاران می رسد. دلایل چنین تنوعی از ماشین های جایگزین ریشه های مختلفی دارد. برخی از پروژه ها در تلاش هستند تا از طریق کار دقیق با منابع اینترنتی ملی به طور مستقیم با رهبران بازار جهانی رقابت کنند. برخی دیگر قابلیت های پرس و جو را ارائه می دهند که در موتورهای جستجوی معروف موجود نیست. تعداد قابل توجهی از موتورهای جایگزین در جستجوی یک موضوع خاص یا نوع خاصی از محتوا تخصص دارند و به نتایج چشمگیر در حل این مشکلات دست می یابند. به هر حال، گنجاندن چنین موتورهای جستجو در زرادخانه ابزارهای جستجوی اینترنتی خود کاربر می تواند کیفیت آن را به میزان قابل توجهی بهبود بخشد. با این حال، یک نکته ظریف در اینجا وجود دارد: شما باید در مورد چنین ماشین هایی بدانید و بتوانید از قابلیت های آنها استفاده کنید.

    ما فرض می کنیم که خوانندگان این کتاب قبلاً با تکنیک های جستجو با استفاده از موتورهای جستجوی جهانی کاملاً آشنا هستند. آنقدر خوب بود که محدودیت های مربوط به استفاده از آنها را احساس کردند. به احتمال زیاد، چنین افرادی قبلاً سعی کرده اند ابزارهای اضافی خاصی را جستجو کرده و از آنها استفاده کنند. کلمه چاپی موضوع جستجوی اینترنتی را نادیده نمی گیرد: مقالات به صورت دوره ای ظاهر می شوند و کتاب ها منتشر می شوند. اما قهرمانان آنها، به عنوان یک قاعده، یکسان هستند - چندین موتور جستجوی جهانی پیشرو. چیزی که این کتاب را متمایز می کند این است که سعی دارد طیف کاملی از راه حل های جستجوی مدرن را پوشش دهد. در اینجا توضیحات و توصیه هایی برای استفاده از بهترین ها خواهید یافت خدمات مدرنجهت حل رایج ترین مشکلات جستجو. این کتاب برای افرادی است که زیاد روی اینترنت کار می کنند و از شبکه برای یافتن اطلاعات مورد نیاز خود استفاده می کنند - خواه تجارت، مطالعه یا سرگرمی.

    برای موفقیت آمیز بودن جستجوی اینترنتی، دو شرط باید رعایت شود: پرس و جوها باید به خوبی فرموله شوند و در مکان های مناسب پرسیده شوند. به عبارت دیگر، کاربر باید از یک سو بتواند علایق جستجوی خود را به زبان جستجوی جستجو ترجمه کند و از سوی دیگر، دانش کافی از موتورهای جستجو، ابزارهای جستجوی موجود، مزایا و مزیت های آن ها را داشته باشد. معایب، که به او اجازه می دهد تا مناسب ترین ابزار جستجو را در هر مورد خاص انتخاب کند.

    در حال حاضر، هیچ منبع واحدی وجود ندارد که تمام الزامات جستجوی اینترنتی را برآورده کند. بنابراین، اگر جستجوی خود را جدی بگیرید، ناگزیر باید از ابزارهای مختلفی استفاده کنید و از هر کدام در مناسب ترین حالت استفاده کنید.

    ابزارهای جستجوی زیادی وجود دارد. آنها را می توان در چندین گروه ترکیب کرد که هر کدام دارای مزایا و معایب خاصی هستند. فصل های کتاب ما به گروه های اصلی موتورهای جستجوی اینترنتی مدرن اختصاص دارد.

    فصل 1، «موتورهای جستجوی اینترنتی جهانی»، به سیستم‌های جهانی بزرگ برای بازیابی اطلاعات در وب اختصاص دارد. تمرکز اصلی بر روی پیشرفته ترین ابزار آنها است که معمولاً در رادار عموم مردم قرار می گیرند. بررسی قابلیت‌های ماشین‌های شناخته شده نوعی نقطه شروع به ما می‌دهد و به ما اجازه می‌دهد تا محدوده کاربرد راه‌حل‌های جستجوی جایگزین را به وضوح تصور کنیم.

    فصل 2، "جستجوی عمودی"، در مورد سیستم هایی صحبت می کند که در زمینه های موضوعی خاص یا انواع خاصی از محتوا تخصص دارند.

    فصل 3، «متاجستجو»، موتورهای فراجستجو را بررسی می کند که می توانند یک پرس و جو را به طور همزمان به چندین موتور جستجوی اینترنتی ارسال کنند و سپس نتایج را در یک رابط واحد جمع آوری و پردازش کنند.

    فصل 4، «موتورهای جستجوی اینترنتی معنایی و بصری»، مروری بر سیستم‌های آزمایشی است که نسخه اصلی را ارائه می‌کنند. رابط های کاربریو همچنین رویکردهای جالب برای پردازش پرس و جو.

    فصل 5، «ماشین‌های توصیه‌کننده»، به معرفی تازه‌های ظهور می‌پردازد خدمات جستجو، در انگلیسی به درستی «موتورهای کشف» نامیده می شود، یعنی «ماشین های کشف». با کمک آنها، می توانید تعدادی از پرس و جوها را پردازش کنید که برای انواع دیگر موتورهای جستجوی اینترنتی بسیار سخت هستند.

    اگر هیچ محصول آماده ای مناسب شما نیست، می توانید موتور جستجوی اینترنتی خود را ایجاد کنید. فصل 6، "موتورهای جستجوی شخصی" به ایجاد چنین ماشین های شخصی اختصاص داده شده است.

    چندین فصل از کتاب ما به جستجو اختصاص داده شده است انواع مختلفمحتوای شبکه فصل 7، "بازیابی تصویر"، روندهای فعلی در بازیابی تصاویر اینترنتی و همچنین قابلیت های سیستم های آزمایشی مرتبط را معرفی می کند. فصل 8، «جستجوی ویدیویی»، مروری بر ابزارهای جستجوی ویدیویی موتورهای جستجوی جهانی پیشرو در اینترنت، و همچنین بهترین سیستم‌های تخصصی در این زمینه را ارائه می‌دهد.

    فصل 9، «یافتن محتوای «پنهان»، مروری بر سیستم‌هایی است که به شما امکان می‌دهد محتوایی را جستجو کنید که توسط موتورهای جستجوی جهانی «دیده نمی‌شود». چنین محتوای "پنهان" شامل، برای مثال، تورنت ها یا فایل های میزبانی شده در سرورهای FTP و سایت های میزبان فایل است.

    فصل 10، «جستجوی وب 3.0»، ابزارهای جستجوی اینترنتی برای داده‌ها در قالب‌های وب معنایی را معرفی می‌کند.

    جستجو فقط با دریافت نتایج از یک موتور جستجو ختم نمی شود. آخرین فصل کتاب ما، فصل 11، "برنامه های کمکی" به ابزارهایی برای پردازش و ذخیره نتایج اختصاص دارد.

    قبل از شروع یک داستان در مورد محصولات خاص، درک طبقه بندی منطقی است وسایل مدرنجستجوی اینترنتی و همچنین تعریف عباراتی که دائماً در صفحات کتاب ما ظاهر می شود.

    ابزارهای اصلی جستجوی اینترنتی را می توان به گروه های اصلی زیر تقسیم کرد:

    موتورهای جستجو؛

    دایرکتوری های وب؛

    منابع راهنما؛

    برنامه های محلی برای جستجو در اینترنت.

    محبوب ترین ابزارهای جستجو موتورهای جستجو هستند - به اصطلاح موتورهای جستجوی اینترنتی (موتورهای جستجو). سه رهبر برتر در مقیاس جهانی کاملاً پایدار هستند - گوگل، یاهو! و بینگ در بسیاری از کشورها، موتورهای جستجوی محلی خودشان که برای کار با محتوای محلی بهینه شده اند، به این لیست اضافه می شوند. با کمک آنها، از نظر تئوری می توانید هر کلمه خاصی را در صفحات میلیون ها سایت پیدا کنید.

    با وجود تفاوت های زیاد، همه موتورهای جستجوی اینترنتی بر اساس اصول مشابهی کار می کنند و از نقطه نظر فنی از زیرسیستم های مشابهی تشکیل شده اند.

    اولین بخش ساختاری یک موتور جستجو، برنامه های ویژه ای است که برای جستجوی خودکار و نمایه سازی بعدی صفحات وب استفاده می شود. چنین برنامه هایی معمولاً عنکبوت یا ربات نامیده می شوند. آنها به کد صفحات وب نگاه می کنند، پیوندهای موجود در آنها را پیدا می کنند و در نتیجه صفحات وب جدیدی را کشف می کنند. یک راه جایگزین برای درج یک سایت در فهرست وجود دارد. بسیاری از موتورهای جستجو به صاحبان منابع این فرصت را می دهند که به طور مستقل یک سایت را به پایگاه داده خود اضافه کنند. با این حال، صفحات وب سپس دانلود، تجزیه و تحلیل و نمایه می شوند. آنها عناصر ساختاری را برجسته می کنند، کلمات کلیدی را پیدا می کنند و ارتباط آنها را با سایر سایت ها و صفحات وب تعیین می کنند. عملیات دیگری نیز انجام می شود که نتیجه آن تشکیل پایگاه داده فهرست موتور جستجو است. این پایگاه داده دومین عنصر اصلی هر موتور جستجو است. در حال حاضر، هیچ پایگاه داده فهرستی کاملاً کاملی وجود ندارد که حاوی اطلاعاتی در مورد تمام محتوای اینترنتی باشد. از آنجایی که موتورهای جستجوی مختلف از برنامه های مختلف جستجوی صفحات وب استفاده می کنند و فهرست خود را با استفاده از الگوریتم های مختلف ایجاد می کنند، پایگاه داده های فهرست موتورهای جستجو می توانند به طور قابل توجهی متفاوت باشند. برخی از سایت ها توسط چندین موتور جستجو ایندکس می شوند، اما همیشه درصد مشخصی از منابع در پایگاه داده تنها یک موتور جستجو وجود دارد. وجود چنین بخش اصلی و غیرهمپوشانی از ایندکس در هر موتور جستجو به ما امکان می دهد یک نتیجه عملی مهم را بگیریم: اگر فقط از یک موتور جستجو استفاده کنید، حتی از بزرگترین موتور جستجو، قطعا درصد مشخصی از لینک های مفید را از دست خواهید داد. .

    جستجوی حرفه ای در اینترنت به نرم افزارهای تخصصی و همچنین موتورهای جستجو و خدمات جستجوی تخصصی نیاز دارد.

    برنامه ها

    http://dr-watson.wix.com/home – این برنامه برای مطالعه آرایه های اطلاعات متنی به منظور شناسایی موجودیت ها و ارتباطات بین آنها طراحی شده است. نتیجه کار گزارشی از شی مورد مطالعه است.

    http://www.fmsasg.com/ - یکی از بهترین برنامه ها در جهان برای تجسم ارتباطات و روابط Sentinel Vizualizer. این شرکت محصولات خود را کاملاً روسی کرده و یک خط تلفن به زبان روسی وصل کرده است.

    http://www.newprosoft.com/ – “Web Content Extractor” قدرتمندترین نرم افزار با کاربری آسان برای استخراج داده ها از وب سایت ها است. همچنین دارای یک عنکبوت وب ویژوال موثر است.

    سایت اسپوتنیک مشابهی در دنیا ندارد بسته نرم افزاری، به شما امکان می دهد با استفاده از تمام موتورهای جستجوی لازم برای کاربر، نتایج آن را در اینترنت مرئی و نامرئی جستجو و پردازش کنید.

    WebSite-Watcher - به شما اجازه می دهد تا صفحات وب، از جمله صفحات محافظت شده با رمز عبور، انجمن های نظارت، فیدهای RSS، گروه های خبری، فایل های محلی را نظارت کنید. دارد سیستم قدرتمندفیلترها نظارت به صورت خودکار انجام می شود و به صورت کاربر پسند ارائه می شود. یک برنامه با عملکردهای پیشرفته 50 یورو هزینه دارد. به طور مداوم به روز می شود.

    http://www.scribd.com/ محبوب ترین پلت فرم در جهان است و به طور فزاینده ای در روسیه برای ارسال انواع اسناد، کتاب ها و غیره استفاده می شود. برای دسترسی رایگان با یک موتور جستجوی بسیار راحت برای عناوین، موضوعات و غیره.

    http://www.atlasti.com/ قدرتمندترین و موثرترین ابزار برای تجزیه و تحلیل اطلاعات کیفی است که در دسترس کاربران فردی، کسب و کارهای کوچک و حتی متوسط ​​است. این برنامه چند منظوره است و بنابراین مفید است. این ترکیبی از توانایی ایجاد یک محیط اطلاعاتی یکپارچه برای کار با فایل های متنی، جدولی، صوتی و تصویری مختلف به عنوان یک کل واحد و همچنین ابزارهایی برای تجزیه و تحلیل کیفی و تجسم است.

    Ashampoo ClipFinder HD – سهم فزاینده ای از جریان اطلاعات از طریق ویدیو حاصل می شود. بر این اساس، افسران اطلاعات رقابتی به ابزارهایی نیاز دارند که به آنها امکان کار با این قالب را بدهد. یکی از این محصولات، ابزار رایگانی است که ارائه می کنیم. این امکان را به شما می دهد تا بر اساس معیارهای مشخص شده در سایت های ذخیره سازی فایل های ویدئویی مانند YouTube، ویدیوها را جستجو کنید. استفاده از این برنامه آسان است، تمام نتایج جستجو را با اطلاعات دقیق، عناوین، مدت زمان، زمان آپلود ویدیو در فضای ذخیره سازی و غیره در یک صفحه نمایش می دهد. یک رابط روسی وجود دارد.

    http://www.advego.ru/plagiatus/ – این برنامه توسط بهینه سازان SEO ساخته شده است، اما به عنوان یک ابزار هوشمند اینترنتی کاملاً مناسب است. سرقت ادبی میزان منحصر به فرد بودن متن، منابع متن و درصد تطابق متن را نشان می دهد. این برنامه همچنین منحصر به فرد بودن URL مشخص شده را بررسی می کند. برنامه رایگان است.

    http://neiron.ru/toolbar/ – شامل افزونه ای برای ترکیب می باشد جستجوی گوگلو Yandex، و همچنین امکان تجزیه و تحلیل رقابتی را بر اساس ارزیابی اثربخشی سایت ها و تبلیغات متنی. به عنوان یک پلاگین برای FF و GC پیاده سازی شده است.

    http://web-data-extractor.net/ یک راه حل جهانی برای به دست آوردن هر گونه داده موجود در اینترنت است. تنظیم برش داده ها از هر صفحه با چند کلیک ماوس انجام می شود. فقط باید ناحیه داده ای را که می خواهید ذخیره کنید انتخاب کنید و Datacol به طور خودکار فرمولی را برای برش این بلوک انتخاب می کند.

    CaptureSaver یک ابزار تحقیقاتی اینترنتی حرفه ای است. به سادگی غیر قابل تعویض برنامه کاری، به شما امکان می دهد هر گونه اطلاعات اینترنتی، از جمله نه تنها، ضبط، ذخیره و صادر کنید صفحات وب، وبلاگ ها، و همچنین اخبار RSS، ایمیل، تصاویر و موارد دیگر. دارای گسترده ترین عملکرد، رابط بصری و قیمت مضحک است.

    http://www.orbiscope.net/en/software.html – سیستم مانیتورینگ وب با قیمت های بیش از مقرون به صرفه.

    http://www.kbcrawl.co.uk/ – نرم افزاربرای کار، از جمله در "اینترنت نامرئی".

    http://www.copernic.com/en/products/agent/index.html - این برنامه به شما امکان می دهد با استفاده از بیش از 90 موتور جستجو، با استفاده از بیش از 10 پارامتر، جستجو کنید. به شما امکان می دهد نتایج را ترکیب کنید، موارد تکراری را حذف کنید، لینک های شکسته را مسدود کنید و مرتبط ترین نتایج را نشان دهید. در نسخه های رایگان، شخصی و حرفه ای عرضه می شود. توسط بیش از 20 میلیون کاربر استفاده شده است.

    Maltego یک نرم افزار اساساً جدید است که به شما امکان می دهد ارتباط بین موضوعات، رویدادها و اشیاء را در زندگی واقعی و اینترنت برقرار کنید.

    خدمات

    جدید - مرورگر اینترنتبا ده ها ابزار از پیش نصب شده برای OSINT.

    - یک موتور جستجوگر موثر برای یافتن افراد به زبان روسی اصلی در شبکه های اجتماعی.

    https://hunter.io/ یک سرویس موثر برای شناسایی و بررسی ایمیل است.

    https://www.whatruns.com/ یک اسکنر آسان برای استفاده و در عین حال موثر برای کشف اینکه چه چیزی در یک وب سایت کار می کند و چه چیزی کار نمی کند و حفره های امنیتی آن چیست. همچنین به عنوان یک افزونه برای Chrom پیاده سازی شده است.

    https://www.crayon.co/ یک پلت فرم بودجه آمریکایی برای هوش بازار و رقابتی در اینترنت است.

    http://www.cs.cornell.edu/~bwong/octant/ – شناسه میزبان.

    https://iplogger.ru/ – یک سرویس ساده و راحت برای تعیین IP شخص دیگری.

    http://linkurio.us/ یک محصول جدید قدرتمند برای کارکنان امنیت اقتصادی و بازرسان فساد است. حجم عظیمی از اطلاعات بدون ساختار را از منابع مالی پردازش و تجسم می کند.

    http://www.intelsuite.com/en – پلت فرم آنلاین انگلیسی زبان برای هوش رقابتی و نظارت.

    http://yewno.com/about/ اولین سیستم عامل برای تبدیل اطلاعات به دانش و تجسم اطلاعات بدون ساختار است. در حال حاضر از زبان های انگلیسی، فرانسوی، آلمانی، اسپانیایی و پرتغالی پشتیبانی می کند.

    https://start.avalancheonline.ru/landing/?next=%2F – خدمات پیش بینی و تحلیلی توسط آندری ماسالوویچ.

    https://www.outwit.com/products/hub/ – مجموعه کاملی از برنامه های مستقل برای کار حرفه ای در وب 1.

    https://github.com/search?q=user%3Acmlh+maltego – برنامه های افزودنی برای Maltego.

    http://www.whoishostingthis.com/ – موتور جستجو برای میزبانی، آدرس های IP و غیره.

    http://appfollow.ru/ – تجزیه و تحلیل برنامه ها بر اساس بررسی ها، بهینه سازی ASO، موقعیت های برتر و نتایج جستجو برای فروشگاه App، Google Play و Windows Phone Store.

    http://spiraldb.com/ سرویسی است که به عنوان یک افزونه برای Chrom پیاده سازی شده است که به شما امکان می دهد اطلاعات ارزشمند زیادی در مورد هر منبع الکترونیکی به دست آورید.

    https://millie.northernlight.com/dashboard.php?id=93 - خدمات رایگان، جمع آوری و ساختاردهی اطلاعات کلیدی توسط صنعت و شرکت. امکان استفاده از پنل های اطلاعاتی بر اساس تحلیل متن وجود دارد.

    http://byratino.info/ – جمع آوری داده های واقعی از منابع عمومی در دسترس در اینترنت.

    http://www.datafox.co/ – پلت فرم CI اطلاعات مربوط به شرکت های مورد علاقه مشتریان را جمع آوری و تجزیه و تحلیل می کند. نسخه ی نمایشی وجود دارد.

    https://unwiredlabs.com/home - یک برنامه تخصصی با یک API برای جستجو بر اساس موقعیت جغرافیایی هر دستگاه متصل به اینترنت.

    http://visualping.io/ – سرویسی برای نظارت بر سایت ها و اول از همه عکس ها و تصاویر موجود در آنها. حتی اگر عکس برای یک ثانیه ظاهر شود، خواهد بود پست الکترونیکمشترک دارای افزونه برای گوگل کروم

    http://spyonweb.com/ یک ابزار تحقیقاتی است که امکان تجزیه و تحلیل عمیق هر منبع اینترنتی را فراهم می کند.

    http://bigvisor.ru/ – این سرویس به شما امکان می دهد کمپین های تبلیغاتی را برای بخش های خاصی از کالاها و خدمات یا سازمان های خاص پیگیری کنید.

    http://www.itsec.pro/2013/09/microsoft-word.html – دستورالعمل استفاده توسط Artem Ageev برنامه های ویندوزبرای نیازهای هوش رقابتی

    http://granoproject.org/ یک ابزار متن باز است کد منبعبرای محققانی که شبکه‌های ارتباط بین افراد و سازمان‌ها را در سیاست، اقتصاد، جرم و جنایت و غیره دنبال می‌کنند. به شما امکان می دهد اطلاعات به دست آمده از منابع مختلف را متصل، تجزیه و تحلیل و تجسم کنید و همچنین ارتباطات قابل توجهی را نشان دهید.

    http://imgops.com/ – سرویسی برای استخراج ابرداده از فایل های گرافیکیو کار با آنها

    http://sergeybelove.ru/tools/one-button-scan/ – یک اسکنر آنلاین کوچک برای بررسی حفره های امنیتی در وب سایت ها و سایر منابع.

    http://isce-library.net/epi.aspx – سرویسی برای جستجوی منابع اولیه با استفاده از بخشی از متن به زبان انگلیسی

    https://www.rivaliq.com/ ابزاری مؤثر برای انجام هوش رقابتی در بازارهای غربی، عمدتاً اروپا و آمریکا برای کالاها و خدمات است.

    http://watchthatpage.com/ سرویسی است که به شما امکان می دهد به طور خودکار اطلاعات جدید را از منابع اینترنتی تحت نظارت جمع آوری کنید. سرویس رایگان است.

    http://falcon.io/ نوعی گزارش برای وب است. این جایگزینی برای Rapportive نیست، اما ابزارهای اضافی را فراهم می کند. در مقابل، Rapportive یک نمایه کلی از یک شخص ارائه می‌کند، گویی که از داده‌های شبکه‌های اجتماعی و ذکرهای موجود در وب به هم چسبیده است. اینترنت. سرویس رایگان است.

    https://addons.mozilla.org/ru/firefox/addon/update-scanner/ – افزونه برای فایرفاکس. به روز رسانی صفحات وب را رصد می کند. مفید برای وب سایت هایی که فید خبری (Atom یا RSS) ندارند.

    http://agregator.pro/ – گردآورنده پرتال های خبری و رسانه ای. مورد استفاده بازاریابان، تحلیلگران و غیره. برای تجزیه و تحلیل جریان اخبار در مورد موضوعات خاص.

    http://price.apishops.com/ – وب سرویس خودکار برای نظارت بر قیمت ها برای گروه های محصول انتخاب شده، فروشگاه های آنلاین خاص و سایر پارامترها.

    http://www.la0.ru/ یک سرویس مناسب و مرتبط برای تجزیه و تحلیل پیوندها و بک لینک ها به یک منبع اینترنتی است.

    www.recordedfuture.com یک ابزار قدرتمند برای تجزیه و تحلیل و تجسم داده ها است که به عنوان یک سرویس آنلاین ساخته شده بر روی رایانش ابری پیاده سازی شده است.

    http://advse.ru/ سرویسی با شعار "همه چیز را در مورد رقبای خود بیابید." به شما امکان می‌دهد تا وب‌سایت‌های رقبا را مطابق با سؤالات جستجو به دست آورید و کمپین‌های تبلیغاتی رقبا را در Google و Yandex تجزیه و تحلیل کنید.

    http://spyonweb.com/ – این سرویس به شما امکان می‌دهد سایت‌هایی را با ویژگی‌های یکسان شناسایی کنید، از جمله سایت‌هایی که از همان شناسه‌های سرویس آمار Google Analytics، آدرس‌های IP و غیره استفاده می‌کنند.

    http://www.connotate.com/solutions - خطی از محصولات برای هوش رقابتی، مدیریت جریان اطلاعات و تبدیل اطلاعات به دارایی های اطلاعاتی. این شامل پلتفرم های پیچیده و خدمات ساده و ارزان است که امکان نظارت موثر همراه با فشرده سازی اطلاعات و کسب تنها نتایج لازم را فراهم می کند.

    http://www.clearci.com/ - پلتفرم هوش رقابتی برای مشاغل با اندازه های مختلف از شرکت های نوپا و کوچک گرفته تا شرکت های Fortune 500. حل شده به عنوان saas.

    http://startingpage.com/ یک افزونه گوگل است که به شما امکان می دهد بدون ثبت آدرس IP خود در گوگل جستجو کنید. به طور کامل از تمام قابلیت های جستجوی گوگل، از جمله به زبان روسی پشتیبانی می کند.

    http://newspapermap.com/ یک سرویس منحصر به فرد است که برای یک افسر اطلاعاتی رقابتی بسیار مفید است. موقعیت جغرافیایی را با یک موتور جستجوی رسانه آنلاین متصل می کند. آن ها منطقه مورد نظر خود یا حتی شهر یا زبان را انتخاب می کنید، مکان را روی نقشه و لیستی از نسخه های آنلاین روزنامه ها و مجلات را مشاهده می کنید، روی دکمه مناسب کلیک کرده و مطالعه می کنید. پشتیبانی از زبان روسی، رابط کاربری بسیار کاربر پسند.

    http://infostream.com.ua/ یک سیستم نظارت بر اخبار بسیار راحت "Infostream" است که با انتخاب درجه یک و کاملاً قابل دسترسی برای هر کیف پول، از یکی از کلاسیک های جستجوی اینترنتی، D.V. Lande، متمایز است.

    http://www.instapaper.com/ ابزاری بسیار ساده و موثر برای ذخیره صفحات وب ضروری است. قابل استفاده بر روی کامپیوتر، آیفون، آیپد و ...

    http://screen-scraper.com/ – به شما این امکان را می دهد که به طور خودکار تمام اطلاعات را از صفحات وب استخراج کنید، اکثریت قریب به اتفاق فرمت های فایل را دانلود کنید و به طور خودکار داده ها را به اشکال مختلف وارد کنید. این فایل ها و صفحات دانلود شده را در پایگاه داده ذخیره می کند و بسیاری از عملکردهای بسیار مفید دیگر را انجام می دهد. روی تمام پلتفرم های اصلی کار می کند، دارای نسخه های کاملاً کاربردی رایگان و حرفه ای بسیار قدرتمند است.

    http://www.mozenda.com/ - داشتن چندین طرح های تعرفه ایو یک وب سرویس نظارت بر وب چند منظوره و ارائه اطلاعات لازم برای کاربر از سایت های منتخب، حتی برای مشاغل کوچک.

    http://www.recipdonor.com/ - این سرویس به شما امکان می دهد تا به طور خودکار همه چیزهایی را که در وب سایت های رقبا اتفاق می افتد نظارت کنید.

    http://www.spyfu.com/ – و این در صورتی است که رقبای شما خارجی باشند.

    www.webground.su سرویسی است که توسط متخصصان جستجوی اینترنتی برای نظارت بر Runet ایجاد شده است، از جمله کلیه ارائه دهندگان اصلی اطلاعات، اخبار و غیره که قادر به نظارت بر Runet هستند. تنظیمات فردینظارت بر اساس نیاز کاربر

    موتورهای جستجو

    https://www.idmarch.org/ بهترین موتور جستجوی آرشیو جهانی اسناد pdf از نظر کیفیت است. در حال حاضر، بیش از 18 میلیون سند pdf نمایه شده است، از کتاب تا گزارش های سری.

    http://www.marketvisual.com/ یک موتور جستجوی منحصر به فرد است که به شما امکان می دهد مالکان و مدیران ارشد را با نام کامل، نام شرکت، موقعیت یا ترکیبی از آنها جستجو کنید. نتایج جستجو نه تنها شامل اشیایی است که به دنبال آن هستید، بلکه شامل اتصالات آنها نیز می شود. در درجه اول برای کشورهای انگلیسی زبان طراحی شده است.

    http://worldc.am/ یک موتور جستجو برای عکس‌های آزادانه مرتبط با موقعیت جغرافیایی است.

    https://app.echosec.net/ یک موتور جستجوی عمومی است که خود را پیشرفته ترین ابزار تحلیلی برای مجریان قانون و متخصصان امنیتی و اطلاعاتی معرفی می کند. به شما امکان می دهد عکس های ارسال شده در سایت ها، پلتفرم های اجتماعی و شبکه های اجتماعی مختلف را در رابطه با مختصات موقعیت جغرافیایی خاص جستجو کنید. در حال حاضر هفت منبع داده متصل هستند. تا پایان سال تعداد آنها به بیش از 450 نفر خواهد رسید. با تشکر از Dementy برای راهنمایی.

    http://www.quandl.com/ یک موتور جستجو برای هفت میلیون پایگاه داده مالی، اقتصادی و اجتماعی است.

    http://bitzakaz.ru/ – موتور جستجوی مناقصات و سفارشات دولتی با عملکردهای پولی اضافی

    Website-Finder - یافتن سایت هایی را که گوگل به خوبی ایندکس نمی کند امکان پذیر می کند. تنها محدودیت این است که برای هر کلمه کلیدی فقط 30 وب سایت را جستجو می کند. استفاده از برنامه آسان است.

    http://www.dtsearch.com/ یک موتور جستجوی قدرتمند است که به شما امکان پردازش ترابایت متن را می دهد. روی دسکتاپ، وب و اینترانت کار می کند. از داده های استاتیک و پویا پشتیبانی می کند. به شما امکان می دهد در تمام برنامه های MS Office جستجو کنید. جستجو با استفاده از عبارات، کلمات، برچسب ها، نمایه ها و موارد دیگر انجام می شود. تنها سیستم قابل دسترسیجستجوی فدرال هم نسخه پولی و هم رایگان دارد.

    http://www.strategator.com/ – اطلاعات مربوط به شرکت را از ده ها هزار منبع وب جستجو، فیلتر و جمع آوری می کند. جستجو در ایالات متحده آمریکا، بریتانیا، کشورهای عمده EEC. این بسیار مرتبط، کاربر پسند است و دارای گزینه های رایگان و پولی است (14 دلار در ماه).

    http://www.shodanhq.com/ – موتور جستجوی غیر معمول. بلافاصله پس از ظهور، او لقب «گوگل برای هکرها» را دریافت کرد. صفحات را جستجو نمی کند، اما آدرس های IP، انواع روترها، کامپیوترها، سرورها و ایستگاه های کاری واقع در یک آدرس خاص را تعیین می کند و زنجیره ها را ردیابی می کند. سرورهای DNSو به شما اجازه می دهد تا بسیاری از عملکردهای جالب دیگر را برای هوش رقابتی پیاده سازی کنید.

    http://search.usa.gov/ یک موتور جستجو برای وب سایت ها و پایگاه های داده باز همه سازمان های دولتی ایالات متحده است. پایگاه‌های اطلاعاتی حاوی اطلاعات کاربردی و مفید زیادی هستند، از جمله برای استفاده در کشور ما.

    http://visual.ly/ – امروزه تجسم به طور فزاینده ای برای ارائه داده ها استفاده می شود. این اولین موتور جستجوی اینفوگرافیک در وب است. در کنار موتور جستجو، این پورتال دارای ابزارهای قدرتمند تجسم داده است که نیازی به مهارت برنامه نویسی ندارد.

    http://go.mail.ru/realtime - جستجوی بحث درباره موضوعات، رویدادها، اشیا، موضوعات در زمان واقعی یا قابل تنظیم. جستجوی مورد انتقاد قبلی در Mail.ru بسیار مؤثر عمل می کند و نتایج جالب و مرتبطی را ارائه می دهد.

    Zanran به تازگی راه اندازی شده است، اما در حال حاضر عالی کار می کند، اولین و تنها موتور جستجو برای داده هایی که آن را از آن استخراج می کند فایل های PDF، جداول EXCEL، داده ها در صفحات HTML.

    http://www.ciradar.com/Competitive-Analysis.aspx یکی از بهترین سیستم های بازیابی اطلاعات در جهان برای هوش رقابتی در وب عمیق است. تقریباً همه انواع فایل ها را در همه فرمت ها در مورد موضوع مورد علاقه بازیابی می کند. به عنوان یک وب سرویس پیاده سازی شده است. قیمت ها بیش از حد معقول است.

    http://public.ru/ – جستجوی موثرو تحلیل اطلاعات حرفه ای، آرشیو رسانه از سال 1990. کتابخانه رسانه آنلاین طیف گسترده ای از خدمات اطلاعاتی را ارائه می دهد: از دسترسی به آرشیو الکترونیکی نشریات رسانه ای روسی زبان و بررسی های موضوعی مطبوعاتی آماده تا نظارت فردی و تحقیقات تحلیلی انحصاری بر اساس مواد مطبوعاتی.

    Cluuz یک موتور جستجوی جوان با فرصت های فراوان برای هوش رقابتی، به ویژه در اینترنت انگلیسی زبان است. به شما این امکان را می دهد که نه تنها پیدا کنید، بلکه بین افراد، شرکت ها، دامنه ها، ایمیل ها، آدرس ها و غیره ارتباط برقرار کنید.

    www.wolframalpha.com – موتور جستجوی فردا. در پاسخ به درخواست جستجو، اطلاعات آماری و واقعی موجود بر روی شی درخواست، از جمله اطلاعات تجسمی شده را ارائه می دهد.

    www.ist-budget.ru - جستجوی جهانی در پایگاه داده های تدارکات دولتی، مناقصات، مزایده ها و غیره.




بالا