«Накачка» текстов ключевыми словами

Новая идея алгоритма отбора и ранжирования в поисковых системах выглядела примерно так.

  • Индексируется текст документа.
  • Для каждого слова определяется его вес — отношение количества вхождений слова к общему количеству слов в документе.
  • В выдачу отбираются страницы, в которых содержатся слова поискового запроса, ранжирование происходит по убыванию суммы весов ключевых слов.

Формула эта. конечно, условная. Если бы она была справедливой, то документ, состоящий только из слов запроса, т.е. абсолютно неинформативный, получил бы наилучшее ранжирование. В качестве дополнительных параметров в «формулу релевантности» входят наличие слов запроса в титуле документа и тегах выделения, заголовках, положение на странице и комментарии к графике (см. главы об устройстве поисковиков и о внутренних факторах ранжирования). К тому же максимальный вес не обязательно является необходимым условием. Дело в том, что поисковики умеют определять, является ли плотность слов на странице естественной для языка или нет.

Формулы ранжирования поисковых систем сложны и закрыты. Но важен сам факт, что с переходом алгоритмов поисковых систем на учет текстовых факторов документов именно текстовые факторы стали ареной для различного рода экспериментов по выводу сайтов на верхние строчки поисковой выдачи.

Основной технический прием, который до сих пор используют как спамеры, так и специалисты по продвижению, — «накачка» текстов необходимыми ключевыми словами. Иначе говоря, искусственное, проводимое для улучшения ранжирования в поисковых системах увеличение весов ключевых слов.

Потребность варьировать весами слов на странице, которую видят пользователи, привела к появлению ряда приемов.

Скрытый и мелкий текст

Если белыми буквами заверстать текст на странице с белым фоном, пользователи в своих браузерах не увидят, что написано на странице. Но поисковые роботы этот скрытый текст увидят, проиндексируют его и будут считать его частью содержимого документа. Соответственно и ранжировать этот документ поисковая машина будет с учетом невидимого для пользователей текста.

В скрытом тексте легко разместить любое количество ключевых слов для завышения их веса на странице. Этот прием спамдексинга так и называется — скрытый текст.

Вариантом этого же способа является мелкий текст, когда нужные для «накачки» слова набирают очень мелким шрифтом. Внешне такой текст может выглядеть просто как линия для подчеркивания, настолько в нем неразличимы отдельные буквы.

Естественно, как только эти приемы стали применяться массово, поисковые системы их заметили и начали с ними бороться.

В настоящее время использование скрытого и мелкого текста очень быстро приводит к исключению сайта из индекса поисковых систем. Ясно, что никаким образом невозможно назвать информацию, которую пользователи попросту не могут увидеть, информацией «для пользователей». Правда, распознается такой текст не совсем автоматически. Поисковые системы многократно пытались автоматически определять наличие скрытого и мелкого текста на индексируемых страницах, но надежного решения найти не удалось.

Поисковые роботы пока не читают и не разбирают стилевую разметку (это сложно и очень дорого по ресурсам), а с помощью каскадных таблиц стилей (CSS) несложно придать тексту любой размер и цвет. Поэтому основным источником информации о спамерских приемах для поисковых систем являются вебмастера конкурирующих сайтов. Они сообщают модераторам об использовании запрещенных приемов и таким образом избавляются от ссылок на сайты нечестных конкурентов в поисковой выдаче.

Перенаправление посетителей, или редирект

«Накачанный» текст становится нечитаемым, поэтому, даже перейдя на такую страницу из результатов поиска, посетители вряд ли на ней задержатся. Но целью спамера является не позиция ссылки на страницу с «накачанными» текстами в результатах поиска, а показ посетителю своей страницы, где понятно, грамотно и хорошим стилем изложено какое-то коммерческое предложение или показана контекстная реклама.

Для решения такой задачи была предложена идея, реализация которой стала настоящим бичом поисковых систем. Его смысл заключается в использовании для продвижения не одной, а двух страниц. Первая страница должна занять нужное место в поисковой выдаче и быть входной для пользователей, переходящих с поисковой системы, а вторая — использоваться для отображения нужной информации посетителям. Специальная страница для поисковых систем так и называется — входная страница, или дорвеи (от англ. doorway — вход).

Перенаправление (редирект) посетителя в браузере с дорвея на целевую страницу обычно выполняется принудительно, поэтому содержимое входной страницы пользователь не успевает увидеть. Как видим, снова налицо создание контента не для пользователей, поэтому страницы, откуда посетитель вне своей воли перебрасывается на страницу с иным содержанием, должны быть исключены из индекса поисковой системы.

Поисковые машины стараются обнаружить страницы с редиректом и за-банить их. Однако некоторые способы редиректа по техническими причинам не определяются автоматически поисковыми роботами, и остается тот же способ борьбы с дорвеями — жалобы конкурентов в поисковую систему.

Размещение на сайте дорвейных страниц может привести к бану всего сайта, поэтому спамеры размещают целевые и входные страницы на разных сайтах и даже в разных доменах. Если при переходе из поисковой системы по ссылке вы оказались на сайте, домен которого отличается от указанного в результатах поиска, скорее всего, вы попали именно на дорвей с редиректом.

Входные страницы, или дорвеи

Баны сайтов за автоматическое перенаправление с дорвея на целевую страницу привели к появлению нового приема. Спамеры отказались от принудительного редиректа посетителей, изменив внешний вид входных страниц. На дорвеях нового типа крупными буквами в половину экрана красовалось приглашение — «Вход». Собственно, выбор посетителя дорвея был небольшим: или закрыть страницу, или все же попробовать зайти на сайт в надежде, что там окажется необходимая информация. Входили — многие.

Казалось бы, все без обмана. Содержимое входной страницы пользователь может увидеть («накачанный» текст располагался намного ниже приглашения войти, для его просмотра надо было воспользоваться прокруткой, но всем было и так ясно, что вся нужная информация есть на первом экране), скрытого и мелкого текста нет, принудительного перенаправления тоже нет. Но изготовители дорвеев стали стремительно развивать идею в другом направлении.

В работе по продвижению сайтов есть две объективные сложности. Во-первых, поисковые системы не раскрывают алгоритмы ранжирования и постоянно вносят корректировки в алгоритм. Что делать владельцу сайта, если его страница в результате изменений в алгоритме, о которых он не знает, опустилась в результатах поиска? Вспомним для примера текст Лицензии Яндекса:

«Яндекс понимает релевантность как наилучшее соответствие интересам пользователей, ищущих информацию, что может в общем случае не совпадать с интересами авторов сайтов».

Во-вторых, чаще всего технически невозможно продвигать одну страницу по большому количеству поисковых запросов, ведь один и тот же запрос пользователи могут задавать по-разному. Мы уже приводили пример, сколько вариантов написания слова «Фольксваген» встречается в поисковых запросах. Аналогичная картина и с «Мерседесами», «Тойотой» и т.п. Количество запросов, где слово написано с опечаткой, с ошибкой либо в ином регистре часто ненамного меньше, чем правильных. Кроме того, существует большое количество смысловых синонимов (разные запросы, означающие одно и то же), например туры в Египет, отдых в Египте, путевка в Египет. Если попытаться в одном тексте употребить все возможные варианты запросов, результат будет, по меньшей мере, выглядеть странно.

Идея использования дорвеев регцала обе названные проблемы. Так как текст входной страницы не предназначался для пользователей, можно было создать для какого-то запроса не один дорвей, а десять, сто, тысячу, в которых нужные ключевые слова сочетались бы в различных тегах и весовых вариантах. После индексации этой группы входных страниц, какую бы комбинацию параметров не устанавливала поисковая система для обеспечения наилучшего ранжирования, всегда находился дорвей, где комбинация этих параметров была близкой к идеалу. Соответственно ссылка на дорвей появлялась в первой десятке результатов поиска.

Для продвижения по многим запросам можно было для каждого запроса создать отдельную группу дорвеев, что и делалось. Входные страницы создавались специальными программами-генераторами, и «производство» нескольких тысяч страниц не занимало много времени.

В результате эпидемии дорвеев поисковые системы оказались в очень сложной ситуации. На одну страницу, предназначенную для пользователей, в индексах появлялись сотни и тысячи страниц, предназначенных только для поисковых роботов. Деятельность «дорвеестроителей» привела к тому, что поисковые системы вынуждены были пытаться ранжировать огромную гору мусора.

Исправить ситуацию удалось благодаря следующему шагу в развитии поисковых технологий — учету внешних ссылок для расчета ранжирования (подробнее об этом см. в главе об управлении ссылками).

Использование входных страниц одно время считалось технологией не спама поисковых систем, а методом продвижения сайтов. И споры о значении дорвеев еще не утихли. Например, прием с созданием на сайте нескольких страниц, «заточенных» под разные варианты одного запроса, применяется и сегодня.

Но однозначно отнесено к запрещенным методам создание входных страниц, не несущих полезной информации для пользователя и неряшливо оформленных. За размещение на сайте даже одной такой страницы из индекса может быть исключен весь сайт.

Posted in Продвижение сайта в поисковых системах.