اطلاعاتی در مورد تعداد کاربران رایج ترین موتورهای جستجو. آدرس های مفید وب جهانی تست وظایف برای خودکنترلی

چگونه آنچه را که نیاز دارید به درستی و با حداقل زمان در اینترنت پیدا کنید

نحوه جستجوی صحیح در اینترنت

چگونه آنچه را که در اینترنت نیاز دارید به درستی و با حداقل زمان پیدا کنید.

مشکل یافتن اطلاعات دیر یا زود در انتظار هر کاربر اینترنتی است. اگر ندانید که چگونه به درستی جستجو کنید و آنچه را که در آن نیاز دارید پیدا کنید، یافتن اطلاعات لازم، مقالات ترم، مقاله یا هر مستند فنی می تواند زمان زیادی را از شما بگیرد. شبکه جهانی وب. در این صورت، کاتالوگ ها و پایگاه های دانش مختلف و همچنین به اصطلاح «موتورهای جستجو» می توانند در این مورد به کمک ما بیایند. در مرحله بعد، ما آنها را به نوبه خود در نظر خواهیم گرفت.

بیایید با کاتالوگ ها شروع کنیم. همه چیز در اینجا بسیار ساده است، زیرا کاتالوگ یک کابینت فایل الکترونیکی از پیوندها به سایت هایی در یک موضوع خاص است. مانند یک نمایه کارت واقعی، تمام سایت ها و منابع در اینجا در قفسه هایی قرار گرفته اند که مجهز به آن هستند توضیح مختصرتا پیدا کردن اطلاعات مورد نیاز را آسان تر کند. عیب بزرگ این سیستم این است که همه منابع در آنجا قرار ندارند، زیرا برای افزودن سایت شما به دایرکتوری، مالک باید ثبت نام کند و این کار کمی طول می کشد و بنابراین باید سایت ها را به صورت دستی تایپ کنید که بسیار ناخوشایند است.

حال بیایید به پایگاه های دانش نگاه کنیم. منابعی وجود دارند که حاوی حجم عظیمی از اطلاعات هستند و در عین حال امکان ویرایش و تکمیل آن را در اختیار کاربران قرار می دهند. این منابع به سرعت در حال رشد هستند و به پایگاه داده های عظیمی تبدیل می شوند، مانند ویکی پدیا (http://ru.wikipedia.org/) که به حق یکی از بهترین ها در نظر گرفته می شود. به لطف موتور جستجوی داخلی، میلیون ها نفر می توانند به راحتی اطلاعات مورد نیاز خود را در مدت زمان کوتاهی پیدا کنند.

و در نهایت، موتورهای جستجو، یا همانطور که عموماً به آنها "موتورهای جستجو" می گویند. اگر روش های بالا را در جستجوی خود امتحان کرده اید، اما نتیجه ای حاصل نشد، ناامید نشوید. موتورهای جستجو، که امروزه تعداد زیادی از آنها وجود دارد، می توانند به شما کمک کنند. "پیشگامان" اصلی در CIS Rambler، Yandex و البته Google هستند. مزیت اصلی موتورهای جستجو، اصل عملکرد آنهاست. موتورهای جستجو، بر خلاف دایرکتوری ها، از یک ربات ویژه استفاده می کنند که تمام منابع اینترنتی موجود را اسکن می کند و به طور خودکار آنها را به پایگاه داده خود اضافه می کند. اما یک پایگاه داده عظیم برای جستجوی موفق برای ما کافی نخواهد بود. پس چگونه می توانیم دقیقاً آنچه را که نیاز داریم در میان دریای وسیع اطلاعات پیدا کنیم؟

اولاً سعی نکنید مثلاً کل موضوع یک پایان نامه یا مقاله را در درخواست وارد کنید؛ دقیق، اما مختصر باشید. ابتدا در مورد درخواست خود فکر کنید و سعی کنید تا حد امکان در مورد موضوع مورد علاقه خود، از صحت، اطلاعات کسب کنید پرس و جو جستجوکلید رسیدن به نتیجه مطلوب است. به عنوان مثال، اگر می خواهید در مورد المپیک 2014 روسیه بدانید، در پرس و جو باید المپیک 2014 روسیه و نه فقط المپیک روسیه را تایپ کنید. به یاد داشته باشید، دستگاه عبارات و کلمات را جستجو می کند و اطلاعات را بر اساس میزان تصادف مرتب می کند، اما نمی تواند منظور شما را بداند. سایتی که بیشترین تعداد منطبق را داشته باشد در رتبه اول قرار خواهد گرفت و ... همچنین باید بدانید که موتور جستجو با علائم نگارشی، حروف اضافه و کلماتی مانند "چه"، "کجا"، "وقتی" جستجو نمی کند.

اگر موتور جستجو کلمات و حروف اضافه رایج را در نظر نگیرد، چگونه می توانید یک نقل قول پیدا کنید؟ برای این کار کافیست درخواست را در گیومه هایلایت کنید و سپس به صورت یک کل با تمام کلمات و حروف اضافه به ترتیبی که آن را نوشته اید در نظر گرفته می شود. شما همچنین می توانید یک "+" را در مقابل یک کلمه یا نماد قرار دهید، و سپس به یک پرس و جو، به عنوان مثال، "بیگانگان +4"، پاسخ لینک هایی به این بخش خاص از فیلم خواهد بود. همچنین ممکن است مثلاً مقاله ای را در یک سایت خاص پیدا کنیم، اگر فراموش کرده ایم پیوندی به آن ذخیره کنیم. برای انجام این کار، کافی است پرس و جو را در نوار جستجو تایپ کنید، سپس site: نام سایت در گوگل و پرس و جو<

موتورهای جستجو نه تنها می توانند جستجو کنند، بلکه برخی از کلمات را نیز از جستجو حذف می کنند. به عنوان مثال، اگر در مورد رم سؤال می کنید، نمی خواهید اسنادی در مورد تاریخچه آن در Google دریافت کنید، وارد کنید: Rome - history، و در Yandex به جای "-" از "~ ~" استفاده می کنند.

همچنین باید بدانید که موتورهای جستجو کاراکترهای بزرگ را در نظر نمی گیرند و این برای جستجوی شهرک ها ناخوشایند است. بنابراین برای اینکه به نتیجه دلخواه برسیم قبل از کلمه ای که موتور جستجو باید ببیند یک حرف بزرگ قرار می دهیم! به عنوان مثال "روستا! ماهی." برای جستجوی دقیق تر، از عملکرد "جستجوی پیشرفته" استفاده کنید. در جستجوی خود موفق باشید!

http://www.searchboth.ru/search-systems/search-in-www.html

وب میزبان میلیون ها سایت است و در کنار اطلاعات به روز بسیاری از منابع قدیمی، زباله و تبلیغات نادرست وجود دارد.

اینترنت دموکراتیک ترین منبع اطلاعات است. هر کس می تواند منبع خود را در اینترنت قرار دهد و نظر خود را بیان کند. این هم نقطه قوت و هم ضعف شبکه جهانی وب است.

اگر ابزارهای جستجوی قدرتمند ایجاد نمی شد، یافتن اطلاعات در اینترنت احتمالاً بسیار دشوار خواهد بود: موتورهای جستجو(موتورهای جستجو)، کاتالوگ ها - رتبه بندی(دسته بندی ها)، لیست های موضوعی پیوندها, دایره المعارف ها و لغت نامه های آنلاین.

برای جستجوی انواع مختلف اطلاعات، ابزارهای مختلف موثرترین هستند.

فهرست های منابع

کاتالوگ دارد ساختار سلسله مراتبی. بخش‌های موضوعی سطح اول گسترده‌ترین موضوعات ممکن را تعریف می‌کنند، مانند «ورزش»، «تفریح»، «علم»، «خرید» و غیره. هر یک از این بخش ها ممکن است دارای زیربخش هایی باشد. کاربر می تواند منطقه مورد علاقه خود را با سفر در درخت دایرکتوری و محدود کردن تدریجی منطقه جستجو اصلاح کند. به عنوان مثال، هنگام جستجوی اطلاعات در مورد لپ‌تاپ‌ها، زنجیره جستجو ممکن است به شکل زیر باشد: فناوری اطلاعات-> کامپیوتر -> لپ تاپ. پس از رسیدن به زیر شاخه مورد نظر، کاربر مجموعه ای از پیوندها را در آن پیدا می کند.

به طور معمول، همه پیوندهای موجود در یک کاتالوگ پیوندهای پروفایل هستند، زیرا کاتالوگ ها نه توسط برنامه ها، بلکه توسط افراد جمع آوری می شوند. بدیهی است که اگر جستجو در حال انجام است اطلاعات کلیدر مورد برخی از موضوعات گسترده، توصیه می شود به کاتالوگ مراجعه کنید. اگر نیاز به یافتن یک سند خاص دارید، کاتالوگ یک ابزار جستجوی ناکارآمد خواهد بود.

اغلب کاتالوگ های منابع نیز رتبه بندی هستند، یعنی. دایرکتوری از سایت های ثبت شده در آن دعوت می کند تا در صفحات خود نصب کنند شمارشگر ضربه، و لیستی از پیوندهای سایت ها را با توجه به محبوبیت (ترافیک) آنها نمایش می دهد. محبوبیت یک منبع با توجه به تعدادی از پارامترها، از جمله به اصطلاح، ارزیابی می شود میزبان ها(تعداد بازدیدکنندگان منحصر به فرد در روز) و بازدید(تعداد بازدید از سایت در روز).

یکی از محبوب‌ترین کاتالوگ‌های رتبه‌بندی، Rambler's Top 100 است. با مروری بر منابع و مناطق وب کراسنویارسک، می توانیم کاتالوگ های رتبه بندی منابع Krasland (http://www.krasland.ru/) و Stalker (http://www.stalker.internet.ru/) را توصیه کنیم.

موتورهای جستجو

سند مربوطه- سندی که محتوای معنایی آن مطابقت دارد درخواست اطلاعات. موتورهای جستجوی مدرن بر اساس زمینه جستجو می کنند، یعنی. کلمات موجود در پرس و جو، با در نظر گرفتن تغییرات در اشکال کلمه و گسترش پرس و جو با مترادف. اما کامپیوترها معنی را درک نمی کنند، بنابراین در لیست پاسخ به یک درخواست، به همراه اسناد مربوط به درخواست شما، ممکن است مواردی را نیز دریافت کنید که به هیچ وجه برای شما مناسب نیستند.

بدیهی است که درصد اسناد مربوطه دریافتی بستگی به توانایی صدور صحیح درخواست دارد. نسبت اسناد مرتبط در فهرست تمام مواردی که توسط یک موتور جستجو پیدا شده است، دقت جستجو نامیده می شود. به اسناد نامربوط نویز می گویند. اگر همه اسناد یافت شده مرتبط باشند (هیچ نویز وجود ندارد)، دقت جستجو 100٪ است. اگر تمام اسناد مربوطه پیدا شود، کامل بودن جستجو 100٪ است.

بنابراین، کیفیت جستجو توسط دو پارامتر وابسته به یکدیگر تعیین می شود: دقت جستجو و کامل بودن. افزایش کامل بودن جستجو باعث کاهش دقت می شود و بالعکس.

موتورهای جستجو را می توان با یک میز کمک مقایسه کرد که در آن نمایندگان به گردآوری اطلاعات در یک پایگاه داده به کسب و کار می پردازند. هنگامی که با سرویس تماس می گیرید، اطلاعات از این پایگاه داده بازیابی می شود. داده های پایگاه داده قدیمی می شوند، بنابراین عوامل به طور دوره ای آن را به روز می کنند. به عبارت دیگر، میز کمکدارای دو کارکرد: 1) ایجاد و به روز رسانی مداوم داده ها در پایگاه داده و 2) جستجوی اطلاعات در پایگاه داده به درخواست مشتری.

به طور مشابه، یک موتور جستجو از دو بخش تشکیل شده است: به اصطلاح ربات جستجوگر (یا عنکبوت) که سرورهای اینترنت را می خزد و پایگاه داده می سازد و موتور جستجوپیوندهای مربوط به درخواست کاربر در پایگاه داده.

لازم به ذکر است که هنگام پردازش یک درخواست کاربر خاص، موتور جستجو دقیقاً بر روی پایگاه داده داخلی کار می کند (و در اینترنت سفر نمی کند). با وجود این واقعیت که پایگاه داده موتور جستجو به طور مداوم به روز می شود، موتور جستجو نمی تواند تمام اسناد وب را فهرست کند: تعداد آنها بسیار زیاد است. مشکل کامل نبودن جستجو نه تنها در منابع داخلی محدود موتور جستجو نهفته است، بلکه در این واقعیت است که سرعت ربات محدود است و تعداد اسناد جدید وب دائما در حال افزایش است.

امروزه محبوب ترین موتورهای جستجوگوگل (www.google.com، www.google.ru) و یاندکس (www.yandex.ru) هستند.

دایره المعارف های آنلاین و کتاب های مرجع

در برخی موارد، ممکن است لازم باشد نه فقط یک سند حاوی یک کلمه کلیدی، بلکه تفسیر یک کلمه خاص را پیدا کنید. هنگامی که با استفاده از یک موتور جستجو برای یک عبارت ناآشنا جستجو می کنید، در معرض خطر به دست آوردن یک سری مقالات کامل قرار می گیرید که در آنها از این اصطلاح استفاده شده است، و در عین حال نمی دانید واقعاً به چه معناست. انجام چنین جستجویی در یک دایره المعارف آنلاین ترجیح داده می شود.

یکی از بزرگترین دایره المعارف های آنلاین، منبع دایره المعارف Yandex است (http://encycl.yandex.ru/) - این پروژه شامل 14 دایره المعارف، از جمله مقالاتی از دایره المعارف بزرگ شوروی و دایره المعارف بروکهاوس و افرون است. بزرگترین آنها عبارتند از "دایره المعارف سیریل و متدیوس" (http://www.km.ru).

علاوه بر انتقال فرهنگ لغت های سنتی به محیط فرامتن، پروژه های ویکی دایره المعارفی به سرعت در حال توسعه هستند. ویکی وب سایتی برای جمع آوری و ساختاردهی اطلاعات مکتوب است. مشخصه آن این است که همه بازدیدکنندگان می توانند اطلاعات ارسال شده روی آن را پر کرده و ویرایش کنند. http://ru.wikipedia.org/ - ویکی پدیا به زبان روسی بخشی از یک پروژه چند زبانه است که هدف آن ایجاد یک دایره المعارف کامل به تمام زبان های زمین است.

تاریخچه شبکه جهانی وب

مخترعین وب جهانیهستند سر تیموتی جان برنرز لی(متولد 8 ژوئن 1955) و تا حدی، رابرت کایو. تیم برنرز لی یک خالق فناوری است HTTP، URI/URL و HTML. در سال 1980، او برای شورای اروپا برای تحقیقات هسته ای (Conseil Européen pour la Recherche Nucléaire، CERN) به عنوان مشاور نرم افزار کار کرد. در آنجا، در ژنو (سوئیس) بود که برای نیازهای خود برنامه Enquirer را نوشت که پایه مفهومی شبکه جهانی وب را ایجاد کرد.

که در 1989تیم برنرز لی در حالی که در CERN بر روی شبکه داخلی سازمان کار می کرد، پروژه فرامتن جهانی را پیشنهاد داد که اکنون به عنوان وب جهانی شناخته می شود.

به عنوان بخشی از این پروژه، برنرز لی اولین وب سرور جهان و اولین مرورگر وب فرامتنی جهان به نام "WorldWideWeb" را نوشت.

برنرز لی اولین وب سایت جهان را به آدرس http://info.cern.ch/ ایجاد کرد، این سایت اکنون بایگانی شده است. این سایت در اینترنت ظاهر شد 6 آگوست 1991. این سایت توضیح داد که وب جهانی چیست، چگونه یک وب سرور نصب کنیم، و چگونه از مرورگر استفاده کنیم. این سایت همچنین اولین فهرست اینترنتی جهان بود زیرا تیم برنرز لی بعداً لیستی از پیوندهای سایر سایت‌ها را در آنجا پست کرد و نگهداری کرد.

اما هنوز مبنای نظریوب خیلی زودتر تأسیس شد. در سال 1945، وانیور بوش مفهوم "Memex" را توسعه داد - کمکی برای "توسعه حافظه انسان". Memex دستگاهی است که شخص تمام کتاب ها و سوابق خود را در آن ذخیره می کند (و در حالت ایده آل، تمام دانش خود را که می توان به طور رسمی توصیف کرد) و اطلاعات لازم را با سرعت و انعطاف کافی ارائه می دهد. بوش همچنین نمایه سازی جامع منابع متنی و چند رسانه ای را با این توانایی پیش بینی کرد جستجوی سریعاطلاعات لازم. گام مهم بعدی به سوی شبکه جهانی وب، ایجاد فرامتن بود (اصطلاحی که تد نلسون در سال 1965 ابداع کرد).

برنج. 75. آرم کنسرسیوم وب جهانی

از سال 1994، کار اصلی بر روی توسعه شبکه جهانی وب به عهده گرفته شده است کنسرسیوم وب جهانی، توسط تیم برنرز لی تاسیس شد و هنوز هم رهبری می شود. W3C سازمانی است که استانداردهای فناوری برای اینترنت و شبکه جهانی وب را توسعه و پیاده سازی می کند.

چشم انداز توسعه

مفهوم فعلی برای توسعه وب جهانی امروز ایجاد یک وب معنایی (معنادار) است. نویسنده مفهوم وب معنایی نیز تیم برنرز لی است. وب معنایییک افزونه به شبکه جهانی وب موجود است که برای دسترسی بیشتر به اطلاعات ارسال شده در شبکه طراحی شده است کامپیوتر دوستانه.

در حال حاضر، رایانه ها نقش محدودی در تولید و پردازش اطلاعات در اینترنت دارند. عملکرد رایانه ها عمدتاً به ذخیره، نمایش و بازیابی اطلاعات محدود می شود. در همان زمان، ایجاد اطلاعات، ارزیابی، طبقه بندی و به روز رسانی آن - همه اینها هنوز توسط انسان انجام می شود. چگونه کامپیوتر را در این فرآیندها قرار دهیم؟ اگر هنوز نمی توان به رایانه ای آموزش داد که زبان انسان را بفهمد، پس باید از زبانی استفاده کرد که برای رایانه قابل فهم باشد. یعنی در ایده آلتمام اطلاعات در اینترنت باید به دو زبان ارسال شود: به زبان انسان برای انسان و به زبان رایانه برای درک رایانه. وب معنایی مفهومی از شبکه ای است که در آن هر منبعی به زبان انسانی با توصیفی ارائه می شود که یک کامپیوتر بتواند آن را درک کند.

برنامه ها قادر خواهند بود منابع لازم را پیدا کنند، اطلاعات را پردازش کنند، داده ها را طبقه بندی کنند، ارتباطات منطقی را شناسایی کنند، نتیجه گیری کنند و بر اساس این نتیجه گیری ها تصمیم بگیرند. اگر وب معنایی به طور گسترده مورد پذیرش و پیاده سازی عاقلانه قرار گیرد، پتانسیل ایجاد یک انقلاب در اینترنت را دارد.

اثر اصلی در وب معنایی کتاب برنرز لی در سال 2005 است، چرخش وب معنایی: باز کردن پتانسیل کامل وب جهانی.

وظایف

1. اولین شبکه کامپیوتری جهانی به نام:

  • BITNet;
  • ARPANet;
  • NSFNet.

2. ارائه دهنده اینترنت:

  • سازمان ارائه دهنده خدمات اینترنت؛
  • سازمانی که وب سایت ایجاد می کند.
  • دستگاه ثانوی، برای برقراری ارتباط با رایانه دیگری استفاده می شود.

3. FTP عبارت است از:

  • سرویس گیرنده پست الکترونیکی؛
  • برنامه تلفن IP;
  • پروتکل انتقال فایل.

4. URL صفحه وب تنظیم شده است: http://www.sgzt.com/sgzt/archive/content/2005/03/043. نام پروتکل دسترسی برای این چیست منبع اطلاعاتی?

  • sgzt/archive/content/2005/03/043;
  • http;
  • www.sgzt.com.

5. کدام یک از موارد زیر مناطق دامنهسطح اول می تواند یک نام دامنه خریداری کند وجود، موجودیت، در فدراسیون روسیه ثبت شده است؟

  • .com
  • در هر دو

6. در میان ورودی های زیر، آدرس IP صحیح رایانه را مشخص کنید:

  • 198.15.19.216;
  • 298.15.19.216;
  • 200,6,201,13;
  • http://www.ipc.ru؛
  • www.ip-address.com.

7. کدام یک از آدرس های ایمیل داده شده صحیح است؟

8. HTML چیست؟

  • یکی از پروتکل های خانواده TCP/IP؛
  • زبان نشانه گذاری فرامتن سند؛
  • زبان برنامه نویسی.

اطلاعات مربوطه.


وب میزبان میلیون ها سایت است و در کنار اطلاعات به روز بسیاری از منابع قدیمی، زباله و تبلیغات نادرست وجود دارد.

اینترنت دموکراتیک ترین منبع اطلاعات است. هر کس می تواند منبع خود را در اینترنت قرار دهد و نظر خود را بیان کند. این هم نقطه قوت و هم ضعف شبکه جهانی وب است.

اگر ابزارهای جستجوی قدرتمند ایجاد نمی شد، یافتن اطلاعات در اینترنت احتمالاً بسیار دشوار خواهد بود: موتورهای جستجو(موتورهای جستجو)، کاتالوگ ها - رتبه بندی(دسته بندی ها)، لیست های موضوعی پیوندها, دایره المعارف های آنلاینو لغت نامه ها.

برای جستجوی انواع مختلف اطلاعات، ابزارهای مختلف موثرترین هستند.

فهرست های منابع

دایرکتوری دارای ساختار سلسله مراتبی است. بخش‌های موضوعی سطح اول گسترده‌ترین موضوعات ممکن را تعریف می‌کنند، مانند «ورزش»، «تفریح»، «علم»، «خرید» و غیره. هر یک از این بخش ها ممکن است دارای زیربخش هایی باشد. کاربر می تواند منطقه مورد علاقه خود را با سفر در درخت دایرکتوری و محدود کردن تدریجی منطقه جستجو اصلاح کند. به عنوان مثال، هنگام جستجوی اطلاعات در مورد لپ تاپ، زنجیره جستجو ممکن است به این صورت باشد: فناوری اطلاعات -> رایانه ها -> لپ تاپ ها. پس از رسیدن به زیر شاخه مورد نظر، کاربر مجموعه ای از پیوندها را در آن پیدا می کند.

به طور معمول، همه پیوندهای موجود در یک کاتالوگ پیوندهای پروفایل هستند، زیرا کاتالوگ ها نه توسط برنامه ها، بلکه توسط افراد جمع آوری می شوند. بدیهی است که اگر به دنبال اطلاعات کلی در مورد یک موضوع گسترده هستید، بهتر است با کاتالوگ مشورت کنید. اگر نیاز به یافتن یک سند خاص دارید، کاتالوگ یک ابزار جستجوی ناکارآمد خواهد بود.

اغلب کاتالوگ های منابع نیز رتبه بندی هستند، یعنی. دایرکتوری از سایت های ثبت شده در آن دعوت می کند تا در صفحات خود نصب کنند شمارشگر ضربه، و لیستی از پیوندهای سایت ها را با توجه به محبوبیت (ترافیک) آنها نمایش می دهد. محبوبیت یک منبع با توجه به تعدادی از پارامترها، از جمله به اصطلاح، ارزیابی می شود میزبان ها(تعداد بازدیدکنندگان منحصر به فرد در روز) و بازدید(تعداد بازدید از سایت در روز).

یکی از محبوب‌ترین کاتالوگ‌های رتبه‌بندی، Rambler's Top 100 است. با مروری بر منابع و مناطق وب کراسنویارسک، می توانیم کاتالوگ های رتبه بندی منابع Krasland (http://www.krasland.ru/) و Stalker (http://www.stalker.internet.ru/) را توصیه کنیم.

موتورهای جستجو

سند مربوطه- سندی که محتوای معنایی آن مطابقت دارد درخواست اطلاعات. موتورهای جستجوی مدرن بر اساس زمینه جستجو می کنند، یعنی. کلمات موجود در پرس و جو، با در نظر گرفتن تغییرات در اشکال کلمه و گسترش پرس و جو با مترادف. اما کامپیوترها معنی را درک نمی کنند، بنابراین در لیست پاسخ به یک درخواست، به همراه اسناد مربوط به درخواست شما، ممکن است مواردی را نیز دریافت کنید که به هیچ وجه برای شما مناسب نیستند.

بدیهی است که درصد اسناد مربوطه دریافتی بستگی به توانایی صدور صحیح درخواست دارد. نسبت اسناد مرتبط در فهرست تمام مواردی که توسط یک موتور جستجو پیدا شده است، دقت جستجو نامیده می شود. به اسناد نامربوط نویز می گویند. اگر همه اسناد یافت شده مرتبط باشند (هیچ نویز وجود ندارد)، دقت جستجو 100٪ است. اگر تمام اسناد مربوطه پیدا شود، کامل بودن جستجو 100٪ است.

بنابراین، کیفیت جستجو توسط دو پارامتر وابسته به یکدیگر تعیین می شود: دقت جستجو و کامل بودن. افزایش کامل بودن جستجو باعث کاهش دقت می شود و بالعکس.

موتورهای جستجو را می توان با یک میز کمک مقایسه کرد که در آن نمایندگان به گردآوری اطلاعات در یک پایگاه داده به کسب و کار می پردازند. هنگامی که با سرویس تماس می گیرید، اطلاعات از این پایگاه داده بازیابی می شود. داده های پایگاه داده قدیمی می شوند، بنابراین عوامل به طور دوره ای آن را به روز می کنند. به عبارت دیگر، Help Desk دارای دو عملکرد است: 1) ایجاد و به روز رسانی مداوم داده ها در پایگاه داده و 2) جستجوی اطلاعات در پایگاه داده به درخواست مشتری.

به طور مشابه، یک موتور جستجو از دو بخش تشکیل شده است: به اصطلاح ربات جستجوگر(یا عنکبوت) که سرورهای اینترنت را می خزد و پایگاه داده می سازد و موتور جستجوپیوندهای مربوط به درخواست کاربر در پایگاه داده.

لازم به ذکر است که هنگام پردازش یک درخواست کاربر خاص، موتور جستجو دقیقاً بر روی پایگاه داده داخلی کار می کند (و در اینترنت سفر نمی کند). با وجود این واقعیت که پایگاه داده موتور جستجو به طور مداوم به روز می شود، موتور جستجو نمی تواند تمام اسناد وب را فهرست کند: تعداد آنها بسیار زیاد است. مشکل کامل نبودن جستجو نه تنها در منابع داخلی محدود موتور جستجو نهفته است، بلکه در این واقعیت است که سرعت ربات محدود است و تعداد اسناد جدید وب دائما در حال افزایش است.

محبوب ترین موتورهای جستجوی امروزی گوگل (www.google.com، www.google.ru) و یاندکس (www.yandex.ru) هستند.

دایره المعارف های آنلاین و کتاب های مرجع

در برخی موارد، ممکن است لازم باشد نه فقط یک سند حاوی یک کلمه کلیدی، بلکه تفسیر یک کلمه خاص را پیدا کنید. هنگامی که با استفاده از یک موتور جستجو برای یک عبارت ناآشنا جستجو می کنید، در معرض خطر به دست آوردن یک سری مقالات کامل قرار می گیرید که در آنها از این اصطلاح استفاده شده است، و در عین حال نمی دانید واقعاً به چه معناست. انجام چنین جستجویی در یک دایره المعارف آنلاین ترجیح داده می شود.

یکی از بزرگترین دایره المعارف های آنلاین، منبع دایره المعارف Yandex است (http://encycl.yandex.ru/) - این پروژه شامل 14 دایره المعارف، از جمله مقالاتی از دایره المعارف بزرگ شوروی و دایره المعارف بروکهاوس و افرون است. بزرگترین آنها عبارتند از "دایره المعارف سیریل و متدیوس" (http://www.km.ru).

علاوه بر انتقال فرهنگ لغت های سنتی به محیط فرامتن، پروژه های ویکی دایره المعارفی به سرعت در حال توسعه هستند. ویکی- وب سایتی برای جمع آوری و ساختاردهی اطلاعات مکتوب. مشخصه آن این است که همه بازدیدکنندگان می توانند اطلاعات ارسال شده روی آن را پر کرده و ویرایش کنند. http://ru.wikipedia.org/ - ویکی پدیا به زبان روسی بخشی از یک پروژه چند زبانه است که هدف آن ایجاد یک دایره المعارف کامل به تمام زبان های زمین است.




بالا