موتورهای جستجو در چه سالی ظاهر شدند؟ موتورهای جستجو. بازار موتورهای جستجو

در روزهای اولیه اینترنت، کاربران یک اقلیت ممتاز بودند و میزان اطلاعات موجود نسبتاً کم بود. در آن زمان، دسترسی به آن عمدتاً در اختیار کارکنان مؤسسات آموزشی و آزمایشگاه های بزرگ مختلف بود و داده های به دست آمده برای اهداف علمی مورد استفاده قرار می گرفت. در آن زمان، استفاده از اینترنت به اندازه کنونی مرتبط نبود.

در سال 1990دانشمند بریتانیایی تیم برنرز لی (که همچنین مخترع URI، URL، HTTP، وب جهانی است) این سایت را ایجاد کرد. info.cern.ch، که اولین دایرکتوری قابل دسترس سایت های اینترنتی در جهان است. از آن لحظه به بعد، اینترنت نه تنها در میان محافل علمی، بلکه در میان صاحبان معمولی رایانه های شخصی نیز محبوبیت پیدا کرد.

بنابراین، اولین راه برای تسهیل دسترسی به منابع اطلاعاتشکل گیری دایرکتوری های وب سایت در اینترنت آغاز شده است. پیوندهای منابع موجود در آنها بر اساس موضوع گروه بندی شدند.

اولین پروژه از این دست پروژه یاهو باز است در آوریل 1994. با توجه به رشد سریع تعداد سایت های موجود در آن، به زودی امکان جستجوی اطلاعات لازم در صورت درخواست فراهم شد. البته هنوز یک موتور جستجوی تمام عیار نبود. جستجو فقط به داده هایی که در کاتالوگ بود محدود شد.

در مراحل اولیه توسعه اینترنت، دایرکتوری های پیوند به طور فعال مورد استفاده قرار می گرفتند، اما به تدریج محبوبیت خود را از دست دادند. دلیل ساده است: حتی اگر منابع زیادی در کاتالوگ های مدرن وجود داشته باشد، آنها هنوز تنها بخش کوچکی از اطلاعات موجود در اینترنت را نشان می دهند. به عنوان مثال، بزرگترین دایرکتوری در شبکه است - DMOZ(پروژه دایرکتوری باز). این شامل اطلاعاتی در مورد بیش از پنج میلیون منبع است که توسط پایگاه داده جستجوی گوگل با بیش از هشت میلیارد سند، ناچیز است.

بزرگترین کاتالوگ روسی زبان کاتالوگ Yandex است. این شامل اطلاعاتی در مورد بیش از صد و چهار هزار منبع است.

جدول زمانی توسعه موتور جستجو

1945- مهندس آمریکایی وانوار بوش سابقه ای از این ایده را منتشر کرد که بعدها منجر به اختراع فرامتن شد و بحث در مورد نیاز به توسعه سیستمی برای بازیابی سریع داده ها از اطلاعات ذخیره شده به این روش (معادل موتورهای جستجوی امروزی) بود. مفهوم دستگاه گسترش دهنده حافظه که او معرفی کرد حاوی ایده های اصلی بود که در نهایت در اینترنت به ثمر نشست.

دهه 1960— جرارد سالتون و تیمش در دانشگاه کرنل سیستم بازیابی اطلاعات SMART را توسعه دادند. SMART مخفف Salton’s Magic Automatic Retriever of Text است، یعنی «Salton’s Magic Automatic Text Retriever». جرارد سالتون را پدر فناوری جستجوی مدرن می دانند.

1987-1989 - توسعه یافته آرچی- یک موتور جستجو برای نمایه سازی آرشیوهای FTP. Archie اسکریپتی بود که پیاده سازی لیست ها را در سرورهای ftp خودکار می کرد، که سپس به فایل های محلی منتقل می شد و تنها پس از آن در فایل های محلی انجام می شد. جستجوی سریعاطلاعات لازم. جستجو بر اساس دستور استاندارد یونیکس grep بود و دسترسی کاربر به داده ها بر اساس telnet بود.

در نسخه بعدی، داده ها به پایگاه های داده جداگانه تقسیم شدند که یکی از آنها فقط شامل نام فایل های متنی بود. و دیگری - رکوردهایی با پیوندهایی به دایرکتوری های سلسله مراتبی هزاران میزبان. و یکی دیگر که دو مورد اول را به هم متصل می کند. این نسخه از Archie کارآمدتر از نسخه قبلی بود، زیرا جستجو فقط با نام فایل ها انجام می شد و بسیاری از موارد تکراری از قبل موجود را حذف می کرد.

موتور جستجو بیشتر و بیشتر محبوب شد و توسعه دهندگان شروع به فکر کردن در مورد چگونگی سرعت بخشیدن به کار کردند. پایگاه داده ذکر شده در بالا با پایگاه دیگری بر اساس نظریه درخت فشرده جایگزین شده است. یک نسخه جدید، اساسا یک پایگاه داده تمام متنی را به جای لیستی از نام فایل ها ایجاد کرد و به طور قابل توجهی سریعتر از قبل بود. علاوه بر این، تغییرات جزئی به سیستم Archie اجازه داد تا صفحات وب را فهرست کند. متاسفانه، به دلایل مختلف، کار بر روی Archie به زودی متوقف شد.

در سال 1993اولین موتور جستجوی جهان ایجاد شد شبکه جهانی وب واندکس. این بر اساس ربات World Wide Web Wanderer ساخته شده توسط متیو گری از موسسه فناوری ماساچوست است.

1993– مارتین کوستر خلق می کند علی وب- یکی از اولین موتورهای جستجو در وب جهانی. صاحبان سایت باید خودشان آنها را به نمایه Aliweb اضافه می کردند تا در جستجوها ظاهر شوند. از آنجایی که تعداد کمی از مدیران وب این کار را انجام دادند، Aliweb محبوب نشد

30 فروردین 94– برایان پینکرتون از دانشگاه واشنگتن منتشر شد وب خزنده- اولین رباتی که صفحات را به طور کامل ایندکس کرد. تفاوت اصلی موتور جستجو با موتورهای قبلی آن این است که به کاربران اجازه می دهد هر کلمه کلیدی را در هر صفحه وب جستجو کنند. امروزه این فناوری استاندارد جستجوی هر موتور جستجویی است. موتور جستجوی WebCrawler اولین سیستمی بود که برای طیف وسیعی از کاربران شناخته شده بود. افسوس توان عملیاتیکم بود و سیستم اغلب در طول روز در دسترس نبود.

29 تیر 94- باز شد لایکوسیک پیشرفت بزرگ در فناوری جستجو است که در دانشگاه کارنگی ملون ایجاد شده است. مایکل مالدین مسئول این موتور جستجو بود و هنوز هم به عنوان یک متخصص برجسته در Lycos Inc. Lycos با کاتالوگ 54000 سند افتتاح شد. و علاوه بر این نتایجی که ارائه کرد رتبه بندی شد و پیشوندها و مطابقت های تقریبی را نیز در نظر گرفت. اما تفاوت اصلی بین Lycos کاتالوگ دائماً در حال گسترش آن بود: تا نوامبر 1996، 60 میلیون سند نمایه شد - بیش از هر موتور جستجوی دیگری در آن زمان.

ژانویه 1994- تاسیس شد Infoseek. این واقعاً نوآورانه نبود، اما تعدادی افزودنی مفید داشت. یکی از این افزونه های محبوب، امکان اضافه کردن صفحه شما در زمان واقعی بود.

1995- آغاز شده AltaVista. پس از ظهور، سیستم جستجوی AltaVista به سرعت توسط کاربران شناخته شد و در بین همتایان خود به یک رهبر تبدیل شد. این سیستم در آن زمان تقریباً پهنای باند نامحدودی داشت، این اولین موتور جستجویی بود که در آن امکان فرمول بندی پرس و جوها به زبان طبیعی و همچنین فرمول بندی وجود داشت. پرس و جوهای پیچیده. کاربران مجاز به افزودن یا حذف URL های خود در عرض 24 ساعت بودند. AltaVista همچنین نکات و ترفندهای جستجوی زیادی را ارائه کرده است. شایستگی اصلی سیستم AltaVista پشتیبانی از بسیاری از زبان ها از جمله چینی، ژاپنی و کره ای در نظر گرفته می شود. در واقع، در سال 1997، حتی یک موتور جستجو در اینترنت با چندین زبان، به ویژه زبان های نادر، کار نمی کرد.

1996— موتور جستجوی AltaVista یک فرمت مورفولوژیکی برای زبان روسی راه اندازی کرده است. در همان سال، اولین موتورهای جستجوی داخلی راه اندازی شد - Rambler.ru و Aport.ru. ظهور اولین موتورهای جستجوی داخلی مرحله جدیدی را در توسعه Runet نشان داد و به کاربران روسی زبان اجازه داد تا به زبان مادری خود پرس و جو کنند و همچنین به سرعت به تغییرات رخ داده در شبکه پاسخ دهند.

20 اردیبهشت 96- شرکت Inktomi همراه با موتور جستجوی خود ظاهر شد هات بات. سازندگان آن دو تیم از دانشگاه کالیفرنیا بودند. وقتی این سایت ظاهر شد، به سرعت محبوب شد. در اکتبر 2001، دنی سالیوان مقاله‌ای با عنوان «پایگاه اطلاعاتی سایت‌های هرزنامه اینکتومی برای عموم باز است» نوشت، که توضیح می‌دهد چگونه اینکتومی به‌طور تصادفی پایگاه داده‌های سایت‌های هرزنامه خود را که تا آن زمان حاوی حدود 1 میلیون URL بود، در دسترس عموم قرار داد. .

1997- در کشورهای غربی نقطه عطفی در توسعه موتورهای جستجو رخ می دهد، زمانی که S. Brin و L. Page از دانشگاه استنفورد تأسیس کردند. گوگل(نام اصلی پروژه BackRub). آنها موتور جستجوی خود را توسعه دادند که به کاربران این فرصت را می داد تا جستجوهای با کیفیت بالا را با در نظر گرفتن مورفولوژی، اشتباهات املایی کلمات و همچنین افزایش ارتباط در نتایج پرس و جو انجام دهند.

23 سپتامبر 1997- اعلام کرد Yandex، که به سرعت به محبوب ترین موتور جستجو در بین کاربران روسی زبان اینترنت تبدیل شد. با راه اندازی موتور جستجوی Yandex، موتورهای جستجوی داخلی شروع به رقابت با یکدیگر کردند، سیستم جستجو و نمایه سازی سایت ها، ارائه نتایج و همچنین ارائه خدمات جدید را بهبود بخشیدند.

بنابراین، توسعه موتورهای جستجو و شکل گیری آنها را می توان با مراحل ذکر شده در بالا مشخص کرد.

امروز، سه رهبر در بازار جهانی مستقر شده اند - گوگل، یاهو و بینگ. آنها پایگاه های داده و الگوریتم های جستجوی خود را دارند. بسیاری از موتورهای جستجوی دیگر از نتایج این سه موتور جستجوی اصلی استفاده می کنند. به عنوان مثال، AOL از یک پایگاه داده استفاده می کند داده های گوگلدر حالی که AltaVista، Lycos و AllTheWeb از پایگاه داده یاهو استفاده می کنند، تمام موتورهای جستجوی دیگر در ترکیبات مختلف از نتایج (مسائل) سیستم های فهرست شده استفاده می کنند.

اگر تحلیل مشابهی از موتورهای جستجوی محبوب در کشورهای مستقل مشترک المنافع انجام دهیم، مشاهده خواهیم کرد که mail.ru پخش می شود جستجوی گوگل، در حالی که پیشرفت های جدید خود را اعمال می کند، Rambler به نوبه خود Yandex را پخش می کند. بنابراین، کل بازار RuNet را می توان بین این دو غول تقسیم کرد.

به همین دلیل است که در کشورهای مستقل مشترک المنافع، تبلیغ وب سایت، به عنوان یک قاعده، فقط در این دو PS انجام می شود.

1. معرفی

بهینه‌سازی وب‌سایت‌ها برای موتورهای جستجو معمولاً شامل تغییر ساختار وب‌سایت، پر کردن آن با محتوای متنی بسته به درخواست‌هایی است که تبلیغ می‌شود، و همچنین راه های مختلفافزایش استناد به منبع علاوه بر فرآیندهای بهینه سازی استاندارد، روش های متعددی وجود دارد که قبلاً برای یک موتور جستجوی خاص اعمال می شود. البته موتورهای جستجو متن بازهنوز نادر است، و بهینه‌سازها چیزهای زیادی برای معما دارند، اما برخی از الگوهای رفتاری اولیه را می‌توان در سیستم‌های از قبل ایجاد شده ردیابی کرد.

در این استاد کلاس ما با یک لمس هستیم تحلیل مقایسه ایبیایید به محبوب ترین موتورهای جستجوی خارجی و موتورهای جستجوی روسی نگاه کنیم.

2. موتورهای جستجوی روسی

گوگل، یاندکس و رامبلر در حال حاضر محبوب ترین موتورهای جستجو در روسیه محسوب می شوند. سیستم Yandex بیشتر بازدید می شود و نتایج مربوطه را به میزان لازم دارد، بنابراین، اغلب، بهینه سازان متعهد می شوند که منبع را در این سیستم ارتقا دهند.

بیایید نگاهی دقیق تر به هر یک از این موتورهای جستجو بیندازیم.

گوگل

گوگل آنالوگ روسی خود را دارد که از محبوبیت کمتری نسبت به نمونه اصلی آمریکایی برخوردار است، اما از نظر کیفیت جستجو به هیچ وجه پایین تر از آن نیست. گوگل در روسیه طرفداران زیادی دارد که معتقدند این موتور جستجو بهترین نتایج را ایجاد می کند.

رتبه صفحه مورد استفاده توسط گوگل در درجه اول بر اساس محبوبیت لینک است. آن ها هنگام محاسبه ارتباط صفحه، بیشترین سهم از تعداد و کیفیت پیوندها به صفحات سایر صفحات است.

بر این لحظهپایگاه داده گوگل شامل بیش از یک میلیارد صفحه نمایه شده است.

گوگل یکی از معدود موتورهای جستجویی است که سایت شما را عمیقا فهرست می کند. گوگل از محبوبیت لینک به عنوان مهم ترین عامل در تعیین ارتباط یک صفحه استفاده می کند. بنابراین، رتبه بندی سایت های بزرگ و محبوب در نتایج جستجو آسان تر است. این همچنین از گوگل در برابر هرزنامه محافظت می کند.

گوگل معتقد است که عوامل زیر بیشترین تاثیر را در رتبه بندی صفحات خواهند داشت:

  • محبوبیت پیوند (شاخص استناد)؛
  • نزدیکی و چگالی کلمات کلیدی (چگالی و فراوانی کلمات کلیدی)؛
  • کلمات کلیدی در متن پیوند (کلمات کلیدی در پیوندها)؛
  • متن تاکید شده (متن تاکیدی).
Yandex

ویژگی متمایز Yandex - جستجوی بصری در تمام اشکال کلمه. توسعه منحصر به فرد برای ویژگی های زبان روسی.

کاتالوگ Yandex از چنین مفهومی استفاده می کند نمایه استنادی موضوعی (TCI) . این با تعداد و کیفیت لینک های خارجی به سایت شما تعیین می شود. کیفیت پیوند تحت تأثیر TCI منبعی است که به شما پیوند می دهد. نزدیکی موضوعی سایت شما به منابعی که به شما لینک می دهند نقش مهمی ایفا می کند.

هنگام محاسبه شاخص استناد، پیوندهای انجمن ها، تابلوهای وب، کنفرانس ها و سایت های واقع در میزبانی رایگان(اگر آنها در کاتالوگ Yandex توضیح داده نشده باشند). به طور طبیعی، پیوندهای سایت هایی که Yandex ایندکس نمی کند (به عنوان مثال، سایت های خارجی) در نظر گرفته نمی شود.

تعداد هاست ها به بازدیدکنندگان بستگی دارد (هرچه بیشتر باشد، میزبان ها بیشتر می شود) و شاخص استناد Yandex به نویسندگان سایت بستگی دارد (هر چه نویسندگان بیشتری به منبع شما پیوند دهند، ارزش CY بالاتر است).

مقدار شاخص استناد، ارتباط منبع را در کاتالوگ Yandex و بر این اساس، موقعیت سایت شما در بخش انتخاب شده را تعیین می کند.

فهرست مجدد سند تقریباً هر دو هفته یک بار انجام می شود، اما ربات برای هر سایت به طور جداگانه تنظیم می شود. همه چیز به فرکانس به روز رسانی بستگی دارد. با توجه به Yandex، برچسب< meta name="Revizit-after" content="n-days">هیچ نقشی در عملکرد ربات ندارد.

Yandex شبکه روسی را نمایه می کند، بنابراین سرورها در دامنه های su، ru، am، az، by، ge، kg، kz، md، ua، uz وارد موتور جستجو می شوند. سرورهای باقی مانده تنها در صورتی گنجانده می شوند که متنی به زبان روسی در آنها یافت شود.

اطلاعات سرصفحه (برچسب< title >) Yandex در نتایج جستجو نمایش داده می شود. کلمات در برچسب< title >، وزن بیشتری نسبت به بقیه دارند. کلمات کلیدی در تگ< meta>همچنین وزن یک کلمه را در یک سند افزایش دهید، اما به شرطی که خود کلمه در صفحه باشد.

علاوه بر روش های فوق، ارتباط یک کلمه تحت تأثیر فراوانی استفاده از آن در سرفصل ها است (< h1>, < h2>...)، در ویژگی alt، در راهنمای ابزار (برچسب< acronym>) و درصد وقوع این کلمه در سند، یعنی. چند بار از آن استفاده می کنید اما در عین حال، حفظ معنای سند ضروری است، در غیر این صورت Yandex ممکن است این کلمه را هرزنامه در نظر بگیرد.

رامبلر

امروز بهترین روبریکاتور است. راحت است زیرا تمام منابع به بخش ها، زیربخش ها و غیره تقسیم می شوند. بسیاری از آنها در رتبه بندی Top100 شرکت می کنند که به ما امکان می دهد محبوبیت یک منبع خاص را تعیین کنیم.

اعتقاد بر این است که عامل اساسی برای ارتقای وب سایت در رامبلر، محتوا و ترافیک خوب است که با استفاده از شمارنده نصب شده در سایت اندازه گیری می شود. بنابراین، موقعیت های بالایی در رتبه بندی می تواند توسط یک سایت خوب تبلیغ شده، با کیفیت و با سابقه طولانی در اینترنت و با ترافیک بالا اشغال شود.

پورت

کمترین محبوبیت در بین موتورهای جستجوی فهرست شده. معیارهای اصلی که این سیستمهنگام مرتب سازی سایت ها موارد زیر را در نظر می گیرد:

  • تعداد کلمات جستجو شده در متن سند (در درصد)، فاصله بین کلمات جستجو در متن سند؛
  • مکانی در متن که در آن کلمات جستجو شده (عنوان، توضیحات، متا تگ و غیره) رخ می دهد.
  • ظاهرفونتی که کلمات جستجو شده در متن تایپ می شوند (اندازه، پررنگی، رنگ)؛
  • تعداد لینک از اینترنت به این سند;
  • استفاده از کلمه جستجو در متن پیوندهای اینترنت به این سند.

3. موتورهای جستجوی خارجی

موتورهای جستجوی خارجی ارائه شده در زیر به طور گسترده در سراسر جهان شناخته شده و مورد استفاده قرار می گیرند. برای وب مسترها، این موتورهای جستجو مهمترین مکان برای ثبت نام هستند، زیرا پتانسیل این را دارند که تعداد زیادی از بازدیدکنندگان را به سایت هدایت کنند. برخی از سیستم های فهرست شده موتورهای جستجوی کامل نیستند، بلکه فقط از منابع دیگر موتورهای جستجوی معروف استفاده می کنند.

این یکی از بزرگترین موتورهای جستجو بر اساس تعداد صفحات فهرست شده در نظر گرفته می شود. این سیستم به دلیل توانایی جستجو با استفاده از معیارهای انتخاب پیچیده محبوبیت زیادی به دست آورد. AltaVista خدمات اضافی را در قالب جستجوی دایرکتوری ها از Open Directory، LookSmart، Ask Jeeves ارائه می دهد.

گوگل موتور جستجویی است که از تعداد لینک های یک وب سایت به عنوان معیار اصلی محبوبیت یک سایت استفاده می کند. این به ویژه هنگام جستجوی سایت های خوب با استفاده از ساده مفید است پرس و جوهای جستجو. گوگل به خاطر لینک های بسیار مرتبط معروف است. گوگل پایگاه داده بسیار بزرگی از سایت های ایندکس شده دارد و برخی از نتایج خود را در اختیار یاهو و جستجوی نت اسکیپ قرار می دهد.

یاهو محبوب ترین و قدیمی ترین موتور جستجو است. یاهو حدود 150 ویراستار دارد که محتوای دایرکتوری های خود را تنظیم و ویرایش می کنند. یاهو بیش از 1 میلیون سایت ایندکس شده در پایگاه داده خود دارد. همچنین در صورت عدم وجود دیتابیس اختصاصی یاهو از دیتابیس گوگل استفاده می کند و قبلا باید گفت از دیتابیس Inktomi استفاده می کرد.

Direct Hit تعداد کلیک ها را اندازه گیری می کند. سایت هایی که کلیک های بیشتری دریافت می کنند، دریافت می کنند بهترین امتیاز. معروف به "موتور جستجوی محبوبیت".

نتایج Direct Hit نیز در HotBot ظاهر می شوند و همچنین می توانند به صورت اختیاری در جستجوی MSN نشان داده شوند.

نتایج سیستم از LookSmart، Inktomi، RealNames و Direct Hit گرفته شده است. کاربران جستجو توانایی منحصر به فردی برای ذخیره نتایج جستجوی قبلی دارند.

تفاوت قابل توجه سیستم این است که موقعیت ها در نتایج جستجو فروخته می شود. GoTo این را مرتبط تر می داند. همچنین امکان خرید صندلی های بالاتر نیز وجود دارد رتبه بندی های مختلف. نتایج بدون پرداخت توسط Inktomi ارائه شده است.

این سیستم قابلیت وارد کردن مستقیم کلمه جستجو را تنها از طریق رابط سایر موتورهای جستجو اجرا نمی کند. و تعداد زیادی از آنها وجود دارد.

یک ویژگی مشخصه را می توان نتایج عالی برای هر یک از شرکای آنها در این پایگاه نامید. تغییر نتایج باعث می شود که نتایج یک موتور جستجوی خاص با سایر موتورهای جستجو متفاوت باشد.

این سیستم با کمک داوطلبان پر شد. پس از شکل گیری کافی، استفاده آزادانه از نتایج آن امکان پذیر شد. در حال حاضر، Open Directory توسط Lycos، AOL Search، AltaVista و HotBot استفاده می شود.

ویژگی بارز این سیستم این است که وقتی یک کلمه کلیدی را تایپ می کنید (مثلاً برند یک شرکت) می توانید به وب سایت رسمی آن شرکت دسترسی پیدا کنید.

4. ویژگی های ارتقاء

سیستم جستجو، روسی یا خارجی، هر الگوریتم فیلترینگی که داشته باشد، معیار اصلی برای ارزیابی ارتباط یک منبع برای یک درخواست خاص، وجود محتوای متنی با کیفیت بالا است که خبر خوبی است. برای بهینه سازهای وظیفه شناس، وظیفه اصلی هنگام تبلیغ یک منبع، اول از همه، بهینه سازی محتوای سایت، ناوبری لینک داخلی و راحتی آن برای کاربر مستقیم است، و نه بهینه سازی مستقیم برای یک موتور جستجوی خاص.

دومین مرحله مهم در هنگام تبلیغ در بسیاری از موتورهای جستجو، داشتن حداکثر تعداد لینک به یک منبع است. اگرچه در بین بسیاری از کاربران مستقیم این نظر وجود دارد که این معیار نمی تواند به طور کامل نتیجه را ارائه دهد، اما امروزه ضروری است.

می توان گفت که سایر ویژگی های تبلیغات برای موتورهای جستجوی مختلف، که، صادقانه بگوییم، کاملاً "تمیز" نیستند، مستقیماً توسط هزینه های الگوریتم های فیلتر خود موتورهای جستجو شکل می گیرند. بنابراین، خود موتورهای جستجو، بهینه سازان را به استفاده از ترفندها تحریک می کنند. این به ویژه در مورد موتورهای جستجوی اصلی روسیه که با تمایل به انحصار مشخص می شوند صادق است.

5. نتیجه گیری

کلاس کارشناسی ارشد به شما امکان می دهد تفاوت های اساسی بین غول های جستجو را ارزیابی کنید و ایده ای در مورد اینکه چگونه می توانید اطلاعات کم و بیش مرتبط را در اینترنت بدست آورید، به دست آورید. وجود موتورهای جستجوی متعدد رقابت قابل توجهی ایجاد می کند و همانطور که می دانیم رقابت مستلزم فرآیندهایی با هدف پیشرفت و توسعه در جهت درست است. در این مورد، اولویت اصلی هنوز یک نتیجه با کیفیت است. هورا!

در سالهای اولیه توسعه جامعه اینترنتی، کاربران فعال اینترنت در اقلیت بودند و میزان اطلاعات منابع اینترنتی نسبتاً کم بود. دسترسی به جهان شبکه اطلاعاتدر بیشتر موارد، فقط کارمندان آزمایشگاه های علمی و مؤسسات آموزشی بزرگ داشتند. به طور کلی، استفاده از یک منبع شبکه به اندازه امروز مرتبط نبود.

تاریخچه توسعه موتورهای جستجو

یک قدم بزرگ در جهت گسترش اینترنت به توده ها، ظهور وب سایت info.centr.ch در سال 1990 بود. این سایت اولین دایرکتوری در دسترس عموم از سایت های اینترنتی بود. خالق آن دانشمند بریتانیایی تیم برنرز لی است که او را خالق URI، HTTP، وب جهانی و URL نیز می دانند. از آن لحظه، سایت های اینترنتی نه تنها در حلقه های تخصصی کاربران، بلکه در میان صاحبان معمولی رایانه های خانگی نیز مطرح شده اند. در این کاتالوگ برای سهولت، منابع اطلاعاتی بر اساس گروه هایی با موضوعات مشابه ترتیب داده شد که جستجوی اطلاعات را بسیار تسهیل می کرد.

اما پیشرفت به همین جا ختم نشد و در سال 1994، یک فناوری جستجو که توسط دانشگاه کارنگی ساخته شد، معروف به لوکوس، متولد شد. این دایرکتوری که توسط مایکل مالدین ایجاد شده است، با منبعی از بیش از 50000 سند شروع به کار کرد. در Lucos، پرس و جوها مطابقت های تقریبی پرس و جو را در نظر می گرفتند و نتیجه جستجو بسته به تطابق بین اطلاعات ورودی و خروجی رتبه بندی می شد. و همچنین، منبع به طور مداوم با صفحات جدید اینترنتی به روز می شد. در ماه نوامبر، لوکوس بیش از 55 میلیون صفحه و سند داشت که بسیار بیشتر از هر فهرست اسنادی در آن زمان بود.

در پایان سال 1994، منبع Infosek ظاهر شد. نسبت به سایر منابع دارای مزایای متعددی بود. به عنوان مثال، افزودن سایت ها توسط کاربر به پایگاه داده دایرکتوری در زمان واقعی.

هیولای جدید در صنعت موتورهای جستجو در سال 1995 AltaVista بود. او به سرعت در بین کاربران اینترنت محبوبیت پیدا کرد و در حوزه کاری خود جایگاه پیشرو را به دست آورد. ویژگی اصلی آن امکان فرمول بندی پرس و جوها به زبان طبیعی و محاوره ای بود و کاربران همچنین اجازه داشتند آدرس URL خود را اضافه کنند. اما با این حال، شایستگی اصلی AltaVista پشتیبانی آن از بسته های زبانی متعدد مانند کره ای، ژاپنی، چینی و همچنین روسی بود.

یک قدم بزرگ در فناوری جستجو، ظهور یک موتور جستجوی جدید در اینترنت بود که نام آن اکنون برای هر کاربر، یعنی گوگل، به خوبی شناخته شده است. در سال 1997، ال. پیج و اس. برین از دانشگاه استنفورد، ویژگی های جدیدی را در الگوریتم های جستجوی فرزند ذهن خود معرفی کردند. جستجو از سیستم‌های مرتبط با نتایج جستجوی تولید شده توسط سیستم استفاده کرد و هنگام درخواست، مورفولوژی و اشتباهات املایی احتمالی در نظر گرفته شد.

امروزه، سه رهبر اصلی در بازار موتورهای جستجو وجود دارد - بینگ، گوگل و یاهو. آنها الگوریتم های جستجو و پایگاه های داده تولید خود را در اختیار دارند. بسیاری از موتورهای جستجو که تعداد زیادی از آنها وجود دارد، از پیشرفت های این سه تایتان در بین موتورهای جستجو استفاده می کنند.

به لطف موتورهای جستجو، کشف وسعت گسترده حوزه اطلاعات برای افراد عادی آسانتر شده است. بدون توسعه آنها، بهبود روش های تبادل اطلاعات بین افراد غیرممکن است.

در زمانی که توسعه اینترنت تازه شروع شده بود، حجم اطلاعات موجود نسبتاً کم بود و کاربران اینترنت کم بودند. در مراحل اولیه توسعه شبکه، توسط کارکنان دانشگاه ها و آزمایشگاه های تحقیقاتی برای تبادل اطلاعات بین موسسات استفاده می شد. در آن زمان جستجوی اطلاعات در اینترنت بر خلاف امروز موضوعیتی نداشت.

اولین راه برای سازماندهی و سیستماتیک کردن دسترسی به منابع اطلاعاتی ایجاد فهرست راهنماهای وب سایت بود. آنها شروع به گروه بندی پیوندها بر اساس موضوعات خاص کردند.

پیشگام در این منطقه یاهو بود که در آوریل 1994 ظاهر شد. با گذشت زمان، تعداد سایت ها افزایش یافت و یاهو گزینه جستجوی دایرکتوری را اضافه کرد. این یک موتور جستجو به معنای واقعی نبود، زیرا دامنه جستجو به منابع فهرست محدود بود.

متعاقباً ، کاتالوگ ها گسترش یافت و در همه جا مورد استفاده قرار گرفت ، اما اینترنت ثابت نماند ، اما به توسعه خود ادامه داد. روش های جستجو نیز همراه با آن توسعه یافته است. در حال حاضر، دایرکتوری ها تقریباً محبوبیت خود را از دست داده اند، این با این واقعیت توضیح داده می شود که یک دایرکتوری مدرن، حتی اگر حاوی مقدار زیادی منابع باشد، تنها می تواند به بخش کوچکی از اطلاعات موجود در شبکه دسترسی داشته باشد.

این روزها، بزرگترین دایرکتوری در وب، پروژه Open Directory یا DMOZ است که حاوی اطلاعاتی در مورد 5 میلیون منبع است، اما در مقایسه با موتور جستجوی گوگل که شامل حدود 8 میلیارد سند است، نسبتاً کوچک است.

یک سیستم جستجوی تمام عیار فقط در سال 1994 منتشر شد و به سیستم جستجوی WebCrawler تبدیل شد.

یک سال بعد، در سال 1995، پروژه های موتور جستجوی AltaVista و Lycos ظاهر شدند. یکی از آنها، به ویژه AltaVista، سال ها در زمینه جستجو موقعیت پیشرو داشت.

دو سال بعد، در سال 1997، سرگئی برین و لری پیج، دانشجویان دانشگاه استنفورد، موتور جستجوی گوگل را توسعه دادند که امروزه پیشرو در جستجو است.

امسال همچنین سالی بود که ایجاد موتور جستجوی روسی Yandex به طور رسمی اعلام شد که همچنان در بخش روسی زبان شبکه پیشرو است.

در حال حاضر تنها 3 موتور جستجو به سطح بین المللی رسیده اند: MSN Search، Yahoo و Google. این سیستم ها پایگاه های داده و الگوریتم های جستجوی خود را دارند. اکثر موتورهای جستجوی دیگر از نتایج خود استفاده می کنند. بنابراین Mail.ru از پایگاه داده Yandex، search.aol.com از Google، و Lycos، AltaVista و AllTheWeb از Yahoo استفاده می کند.

رهبر جستجو در اینترنت روسیه در حال حاضر Yandex است، پس از آن Rambler، پس از آن گوگل، Mail.ru، پورت A و KM.ru قرار دارند.

موتورهای جستجو دارای الگوریتم های عملیاتی متفاوتی هستند و برای اینکه در نتایج جستجو جایگاه خوبی داشته باشید و بازدیدکنندگان هدفمند را جذب کنید، باید ویژگی های بهینه سازی سئو را برای موتورهای جستجوی مختلف بدانید. مثلا

به طور کلی پذیرفته شده است که تاریخچه اولین موتورهای جستجو در بخش روسی اینترنت از سال 1995 آغاز می شود. در این سال بود که یک پسوند مورفولوژیکی برای موتور جستجوی Altavista در دسترس کاربران Runet قرار گرفت. تقریباً بلافاصله پس از گسترش، موتورهای جستجوی اصلی Aport و Rambler ظاهر شدند که اولین موتورهای جستجوی روسی محسوب می شوند.

AltaVista در دسامبر 1995 منتشر شد و توسط قدرتمندترین سرور محاسباتی موجود در آن زمان، DEC Alpha پشتیبانی می‌شد. این سریع‌ترین موتور جستجویی بود که می‌توانست میلیون‌ها درخواست جستجو را در روز مدیریت کند.

پورت

سیستم جستجوی Aport چندین ماه قبل از Rambler در فوریه 1996 به عموم مردم نشان داده شد. در زمان راه اندازی، این دستگاه فقط در سایت russia.agama.com جستجو کرد. متعاقباً، توسعه‌دهندگان Aport در توسعه پروژه خود کندی شدید نشان دادند و جستجوی طولانی مدت را ابتدا روی 4 سرور و سپس در 6 راه‌اندازی کردند. Aport فقط در نوامبر 1997 یاد گرفت که کل Runet را فهرست کند. رسما راه اندازی شد در این زمان، موتور جستجوی دیگری به نام Rambler قبلاً با موفقیت در بخش روسی زبان فعالیت می کرد.

با وجود تمام این شرایط، آپورتو تا اوایل دهه 2000. توانست با موفقیت با بازیگران اصلی بازار Rambler و Yandex رقابت کند و در لیست رهبران جستجو در Runet قرار گیرد. متعاقباً ، شرکتی که این سیستم جستجو را ایجاد کرد توسط یک هلدینگ مخابراتی خریداری شد ، تمام توسعه متوقف شد و Aport به سرعت موقعیت خود را از دست داد و زمین را به رقبای اصلی خود از دست داد.

در حال حاضر، Aport یک پلت فرم تجارت الکترونیک با پایگاه داده بزرگی از شرکت ها و شرکت ها است که بیش از 8 میلیون کالا در 1400 دسته ارائه می دهد.

رامبلر

تیم شرکت مخابراتی Stack در سال 1994 تصمیم به ایجاد یک موتور جستجوی اصلی روسی گرفت. در آن زمان، Stack قبلاً تجربه ای در کار با اینترنت، سرورها و وب سایت ها داشت. با کار با بخش روسی اینترنت ، متخصصان این شرکت تشخیص دادند که موتورهای جستجوی خارجی عملاً الفبای سیریلیک و صفحات با رمزگذاری های متعدد را درک نمی کنند و سایت های Runet را بسیار ضعیف فهرست می کنند.

رامبلر» ترجمه شده از به انگلیسی- "سرگردان"، "ولگرد"، "فرد سرگردان".

هسته اصلی موتور جستجوی جدید توسط برنامه نویس دیمیتری کریوکوف تنها در چند ماه نوشته شد. کار بر روی ماشین جدید توسط شرکت Stack تأمین مالی شد که خالق آن سرگئی لیساکوف فعالانه به کریوکوف در کار بسیار دشوار خود کمک کرد. نام Rambler و آرم موتور جستجوی آینده، همچنین دیمیتری. دامنه rambler.ru در 26 سپتامبر 1996 ثبت شد و در 8 اکتبر موتور جستجویی به نام Rambler توسط سازنده آن در شبکه قرار گرفت. در آن زمان، موتور جستجوی جدید 100 هزار سند را نمایه کرده بود، که یک گام متفکرانه و مهم استراتژیک بود که به Rambler اجازه داد تا چندین سال به رهبر جستجوی بلامنازع در RuNet تبدیل شود.




بالا