В мире новостей



Что такое поисковая система Яндекс

Прежде чем пускаться в алгоритмические дебри, давайте вспомним, а как вообще устроена поисковая система.

Логическую структуру поисковой системы можно представить в виде трех модулей:

Яндекс

Робот (краулер, crawler) - специальная программа, которая обходит интернет-сайты и загружает их содержимое. У робота есть специальное расписание, согласно которому он осуществляет свой обход.

Страницы сайта, загруженные роботом, специальным образом обрабатываются и помещаются на хранение в базу данных. Может быть, вас удивит этот факт, но на данный момент Яндекс хранит содержимое более чем 5 миллиардов страниц в своей базе! Это гигантские объемы информации, и для их хранения используются специальные сервера.

Самая важная часть поисковой системы - клиентская, которая отвечает за обработку запросов пользователей и выдачу им результатов поиска. Ежедневно Яндекс обрабатывает более 50 млн пользовательских запросов! Для того чтобы выдавать на каждый запрос пользователя релевантные результаты, Яндекс ищет в своей базе все документы, отвечающие на запрос пользователя и выдает те, которые лучше всего отвечают на запрос. При этом в выдаче поисковой системы все сайты отсортированы по убыванию их релевантности запросу пользователю.

Качество работы поисковой системы определятся ее умением находить наилучшие ответы на запросы пользователей. Тут мы и приходим к такому понятию как алгоритм ранжирования.

Алгоритм ранжирования - это система математических формул для оценки определенных факторов, на базе которой поисковая система присваивает сайту (странице) определенный рейтинг. В качестве факторов выступают различные показатели, характеризующие документ: наличие слов из запроса, наличие ссылок на документ, авторитетность сайта и др.

На данный момент в Яндексе используется алгоритм ранжирования, который учитывает около 250 различных факторов.

Итак, представим упрощенно, что происходит в Яндексе, когда пользователь задает запрос, например, «пластиковые окна».

Яндекс

Запрос обрабатывается синтаксическим анализатором, приводится к начальной форме.

Далее по базе ищутся все документы, содержащие слова «пластиковый» и «окно». Естественно, Яндекс не производит прямой поиск информации по всем 5 млрд. документов в базе. Вся информация содержится в виде т.н. «обратного индекса» (см. рисунок ниже), т.е. для каждого слова указаны порядковые номера документов, где содержится это слово и позиции данного слова в документе.

После этого определяется релевантность каждого документа запросу, т.е. для всех 12 млн. документов, которые содержат слова «пластиковый» и «окно» считается значение релевантности. Далее документы ранжируются по убыванию релевантности, и формируется выдача.

На рисунке ниже представлена самая простая схема устройства обратного индекса. Естественно, в поисковых системах используются дополнительно различные методы оптимизации данной структуру, но я думаю, основной принцип понятен.

Аналогом обратного индекса является, например, алфавитный указатель в книге, где указано, на какой странице встречается тот или иной термин и вы можете с легкостью найти информацию, не пролистывая всю книгу.

3_ya

Как мы видим - алгоритм ранжирования - это одна из основных частей поисковой системы. Давайте теперь посмотрим, какие изменения претерпевал алгоритм Яндекса, и более подробно остановимся на последней версии алгоритма и особенностях продвижения в Яндексе в настоящее время.

Материал предоставлен http://www.i-vi.ru

 
набор ключей для автомобиля|индийские фильмы смотреть онлайн сериалы

Поисковая оптимизация. С чего все начинается

Поисковая оптимизация - это комплекс работ над сайтом и внешними факторами для достижения наилучших позиций в поисковых системах в соответствии с выбранными ключевыми словами. Поисковую оптимизацию можно разделить на внутреннюю и внешнюю. Внутренняя оптимизация сайта направлена на работу с самим сайтом.


Читать полностью

Процесс подбора ключевых слов

Представим ситуацию. У компании, занимающейся продажей пластиковых окон, есть сайт. Большинство людей, которые хотят приобрести окна, не знают названия фирмы. Как в этом случае найти интернет-ресурс? Ввести в строку запроса поисковой системы фразу, которая предположительно будет встречаться на страницах сайта необходимого Вам. Такими фразами могут быть: "пластиковые окна", "пластиковые окна...

Читать полностью

Алгоритм Арзамас

10 апреля 2009, сразу в основном поиске, без выкладки на тестовый, в Яндексе заработала поисковая программа Арзамас.


Читать полностью

Продвижение в регионах

В апреле 2009-го года «Яндекс» применил раздельное региональное ранжирование и этот день стал днем новой эпохи российского поискового маркетинга. Ранжирование Яндекс представил в составе алгоритма «Арзамас», из 3-х регионов в России (Москву, Санкт-Петербург и Россию целиком) и отдельные выдачи для почти десятка государств СНГ. Позднее презентовался «Арзамас 1.2» – ранжирование уже включило...
Читать полностью
Группа "Креативные Веб Проекты" 107140 Россия, Москва, Гусятников переулок д.7