Сначала хотел написать об алгоритме Снежинск, но потом стало интересно как появлялись и развивались алгоритмы поисковой системы Яндекс.
В итоге собрал достаточно интересный на мой взгляд материал:
20 декабря 2007 года - запуск новой поисковой платформы, обновление алгоритма ранжирования
17 января 2008 года - обновление алгоритма ранжирования "8-ки", алгоритм 8 sp 1
18 марта 2008 года - корректировка алгоритма, введение фильтров для борьбы с продажными ссылками
Далее названия алгоритмов Яндекс стал давать по принципу игры «Города», когда каждый следующий город начинается с последней буквы предыдущего: Магадан - Находка - Арзамас - Снежинск - Конаково.
-
16 мая 2008 года - алгоритм "Магадан"
-
Изменения алгоритма отразились в обработке русскоязычных текстов. Яндекс стал немного умнее, например, в поиске, кроме слов из текста страницы, участвуют перевод и транслитерация частей URL. Увеличена обучающая выборка для статистического морфологического анализатора, что повысило точность распознавания фамилий и географических названий.
-
2 июля 2008 года - изменение алгоритма ранжирования Яндекса "Магадан 2.0"
-
В нем сделано много улучшений в алгоритме ранжирования, например, добавлены новые факторы, учитывающие уникальность контента, классификатор порнографии, геоклассификатор запроса, классификатор коммерциализированности и т.д.
-
11 сентября 2008 года - алгоритм "Находка"
-
Основные изменения в программе связаны с новым подходом к машинному обучению и, как следствие, отличиями в способе учета факторов ранжирования в формуле.
-
Изменен способ учета стоп-слов (выросло качество ранжирования по запросам со стоп-словами). Заметно расширен тезаурус путем автоматического анализа проиндексированного корпуса текстов.
-
10 апреля 2009 года - "Арзамас" (сначала называвшийся Анадырь)
-
Яндекс научился еще лучше понимать русский язык, разрешая неоднозначности слов в запросах. Реализован алгоритм снятия омонимии, позволяющий во многих случаях определить, какое слово имеется в виду, и предлагаем в ответ только документы с формами нужного слова. поиск Яндекса учитывает регион пользователя. Начиная с "Арзамаса", результаты поиска по одному и тому же запросу могут быть разными в разных регионах. Улучшение алгоритма выдачи картинок по запросам.
-
Улучшена общая формула ранжирования. Она определяет порядок результатов поиска по гео-независимым запросам и запросам из городов, где нет локализованного ранжирования.
-
В дальнейших изменениях алгоритма Арзмас: Арзамас 1.1 (17 июня 2009), Арзамас 1.2 (17 июля 2009) и Арзамас 1.5 (23 сентября 2009) лишь изменяли расчетную формулу общего и регионального ранжирования. Добавляли новые регионы. В итоге их 19.
-
17 ноября 2009 года - "Снежинск"
-
В этой версии впервые применен новый алгоритм машинного обучения MatrixNet, который позволил в разы увеличить количество учитываемых при ранжировании параметров, и, благодаря этому, заметно повысил качество поиска.
-
22 декабря 2009 года - "Конаково" (это "неофициальное" название обновленного алгоритма "Снежинск")
-
Локальное ранжирование теперь работает не только для 19 крупнейших регионов, как это было в программе "Арзамас", но также и для 1250 городов по всей России.
-
Этот алгоритм на данный момент и применяется в Яндексе.
Вот и все вкратце об алгоритмах, которые применял Яндекс со дня своего запуска.




Все категории:

Предыдущая статья - Яндекс и новые алгоритмы
Следующая статья - Разные виды хостинга
