Алгоритми Google історія розвитку пошукової системи Google

Вступ

Алгоритми Google, основа роботи пошукової системи Google. Створений Ларрі Пейджем і Сергієм Бріном, Google сьогодні здатний знайти документи двома сотнями мов і зробити обробку даних базових форматів (Microsoft Word, PDF, Excel і т.д.). У статті згадаємо основні етапи розвитку алгоритмів Google, створених для ранжування веб-сторінок у пошуковій видачі Google.

Алгоритми Google: історія розвитку

1998. У цей рік було засновано пошукову систему Google. У той же час було створено Page Rank (PR), алгоритм роботи якого ґрунтувався на передачі маси посилань і мав два основні параметри.

Офіційним творцем PR є Ларі Пейдж, а власником патенту на цей винахід – університет Стенфорда.

Цікавий факт - багато хто вважає, що Page Rank перекладається як «ранг сторінки». Насправді це словосполучення перекладається як ранг Пейджа, творець винаходу дав йому своє ім'я. Надалі багато пошукових систем перейняли ідею Page Rank як основу, розробивши власні аналоги інструменту.

Початок століття

2000 рік. Компанія Google представляє широкому загалу нову розробку -алгоритм під назвою Hilltop, який дозволяє найбільш точно розрахувати рівень PR. Даний алгоритм читає географію та ступінь новизни того чи іншого документа. Після цього Google починає сповіщати веб-майстрів про те, щоб вони не залишали посилання на підозрілих веб-сайтах та «лінко-смітниках».

2001 рік. У цьому році компанія Google реєструє патент наалгоритм Hilltop. На цьому ж етапі пошукова система поділяє результати пошуку для некомерційних та комерційних запитів.

2005 рік. Фахівці Googleвперше намагаються персоналізувати пошукову видачу, поставивши за основу попередні запити того чи іншого користувача.

2006 рік. Компанія запускає вдосконалений алгоритм, що базується на алгоритмі під назвоюOrion - дітище студента з Ізраїлю. Пошукова система тепер може знаходити збігаються за тематикою запиту веб-сторінки, які не містять ключових слів.

З цього моменту Google починає "уточнювати" запити користувача, пропонуючи варіанти, які найчастіше шукають із цим словом. Наприклад, користувач набирає у пошуковому рядку слово "коло". Система пропонує йому такі варіанти запиту, як "коло пісні", "коло для купання новонароджених" і т.д.

2007 рік. Цей рік ознаменований запуском новогоалгоритму Austin. Новинка здатна враховувати рівень трастовості того чи іншого веб-ресурсу та знижувати у пошуковій видачі ресурси з меншим показником трастовості. Таким чином, веб-сайти, які не встигли набрати траст.

Нове у 2009 році

2009 рік. Розробники Google впроваджують у роботу пошукової системи новийалгоритм Caffeine. Попередні алгоритми Google стали не відповідати виробничим потужностям, що зросли. Завдяки чому пошуковик починає набагато частіше проводити індексування сайтів.

Багато разів прискорюється формування сторінки з результатами пошукової видачі. Caffeine не сильно вплинув на формулу розрахунку релевантності, проте стали помітні такі зміни:

Постійна індексація всього простору всесвітньої павутини дозволила пошуковій видачі Google стати набагато динамічнішою та змінюватися протягом дня.

Друге десятиліття нашого століття

2011 рік. Фахівці поповнюють алгоритми Google своїм сміттярем. Цезапуск алгоритму під назвоюPanda - перший серйозний чистильник видачі. Новий алгоритм «чистить» пошукову видачу від «поганих» сайтів:

Творці вдосконаленого алгоритму Метт Катс та Аміт Сінгал зазначають, що їхнє нове дітище враховує наступні моменти:

Сьогодні можна впевнено відзначити, що практично всі сучасні пошукові системи враховують дані фактори, особливо – поведінкові. Чим цікавіший контент сайту для інтернет-користувача, тим більше він проведе часу на даному ресурсі. Тим вище, цей веб-сайт буде ранжуватися на сторінці пошукової видачі.

А з інтернет-магазинів він вибере лише ті, на сайтах яких максимально докладно описана інформація про умови доставки та їх переваги. Крім цього, алгоритм Hummingbird віддає перевагу довгим, докладним запитам. Але при цьому за запитами, за якими Google не зможе «пофантазувати», видача не змінилася.

Насамкінець варто відзначити, що український Google – один з найбільш зручних варіантів роботи пошукової системи.

В Україні Google не використовує більшу частину своїх «каральних» санкцій. Завдяки цьому просування сайтів для даної системи в Україні набагато простіше, ніж для інших пошукових систем.

Пінгвін та Панда, що далі

алгоритми

4.10. 2013 року вийшов алгоритм Пінгвін 2.1

Як і раніше пошуковик Google звертає увагу на підозрілі сайти та анкор-листи. Дане оновлення алгоритму відбилося на ранні сайти, що потрапляли під санкції алгоритму. Торкнулося 1% запитів.

19.05. 2014 вийшло оновлення Панда 4.0

Найсерйозніше оновлення цього пошукового алгоритму. Торкнулося 7.5% пошукових запитів.

24.08. 2014 рік, алгоритм Голуб

Алгоритм звернув увагу на геозалежні запити. Тепер, при отриманніГеозалежний запит пошуковик Google дає найбільш інформативні, локальні результати пошуку для користувача.

23.09. 2014. Оновлення алгоритму Панда 4.1

17.10. 2014. Алгоритм Пінгвін 3.0

Цей апдейт пошуковика Google знову дав зрозуміти, що пошуковик негативно ставиться до веб-спаму. Багато сайтів просіло у видачі.