Алгоритмы Яндекса
12фев2010Сначала хотел написать об алгоритме Снежинск, но потом стало интересно как появлялись и развивались алгоритмы поисковой системы Яндекс.
В итоге собрал достаточно интересный на мой взгляд материал:
- 20 декабря 2007 года - запуск новой поисковой платформы,
обновление алгоритма ранжирования
- 17 января 2008 года - обновление алгоритма ранжирования "8-ки", алгоритм 8 sp
1
- 18 марта 2008 года - корректировка алгоритма, введение фильтров для борьбы с продажными ссылками
- 16 мая 2008 года - алгоритм "Магадан"
Изменения алгоритма отразились в обработке русскоязычных текстов. Яндекс стал немного умнее, например, в поиске, кроме слов из текста страницы, участвуют перевод и транслитерация частей URL. Увеличена обучающая выборка для статистического морфологического анализатора, что повысило точность распознавания фамилий и географических названий.
- 2 июля 2008 года - изменение алгоритма ранжирования Яндекса "Магадан
2.0"
В нем сделано много улучшений в алгоритме ранжирования, например, добавлены новые факторы, учитывающие уникальность контента, классификатор порнографии, геоклассификатор запроса, классификатор коммерциализированности и т.д.
- 11 сентября 2008 года - алгоритм "Находка"
Основные изменения в программе связаны с новым подходом к машинному обучению и, как следствие, отличиями в способе учета факторов ранжирования в формуле.
Изменен способ учета стоп-слов (выросло качество ранжирования по запросам со стоп-словами). Заметно расширен тезаурус путем автоматического анализа проиндексированного корпуса текстов.
- 10 апреля 2009 года - "Арзамас" (сначала
называвшийся Анадырь)
Яндекс научился еще лучше понимать русский язык, разрешая неоднозначности слов в запросах. Реализован алгоритм снятия омонимии, позволяющий во многих случаях определить, какое слово имеется в виду, и предлагаем в ответ только документы с формами нужного слова. поиск Яндекса учитывает регион пользователя. Начиная с "Арзамаса", результаты поиска по одному и тому же запросу могут быть разными в разных регионах. Улучшение алгоритма выдачи картинок по запросам.
Улучшена общая формула ранжирования. Она определяет порядок результатов поиска по гео-независимым запросам и запросам из городов, где нет локализованного ранжирования.
В дальнейших изменениях алгоритма Арзмас: Арзамас 1.1 (17 июня 2009), Арзамас 1.2 (17 июля 2009) и Арзамас 1.5 (23 сентября 2009) лишь изменяли расчетную формулу общего и регионального ранжирования. Добавляли новые регионы. В итоге их 19.
- 17 ноября 2009 года - "Снежинск"
В этой версии впервые применен новый алгоритм машинного обучения MatrixNet, который позволил в разы увеличить количество учитываемых при ранжировании параметров, и, благодаря этому, заметно повысил качество поиска.
- 22 декабря 2009 года - "Конаково"
(это "неофициальное" название обновленного алгоритма "Снежинск")
Локальное ранжирование теперь работает не только для 19 крупнейших регионов, как это было в программе "Арзамас", но также и для 1250 городов по всей России.
Этот алгоритм на данный момент и применяется в Яндексе.
Вот и все вкратце об алгоритмах, которые применял Яндекс со дня своего запуска.
Данную статью буду дополнять по мере появления новых алгоритмов.
Постовой:
Молодой и перспективный сео блог начинающего веб-мастера
Автономное отопление дома и коттеджа
Скачать обои для рабочего стола бесплатно, красивые картинки на рабочий стол.
Подписаться на RSS
12 февраля 2010, 10:22