Как продвигать сайты СМИ

  • Как ускорить индексацию сайтов СМИ
  • Как составить для СМИ семантическое ядро
  • Изменения на сайте 

Продвижение сайтов каждой тематики имеет свои особенности. Ниже для примера мы рассказываем о том, как работать с продвижением сайтов средств массовой информации (СМИ).

На первый взгляд, интернет-СМИ, а также онлайновые версии печатных изданий имеют огромное преимущество перед типичными сайтами: если разработчики обычных сайтов испытывают острый «контентный голод», то в новостных онлайн-проектах контент присутствует в огромных количествах, его неустанно производят редакции.

По логике вещей даже неоптимизированный сайт СМИ должен получать много посетителей из поисковиков по множеству низкочастотных запросов, если его страницы хорошо индексируются поисковыми роботами. И это действительно во многих случаях так.

Но существует и определенная сложность: большинство СМИ, за исключением узкоспециализированных, пишут «обо всем и ни о чем», поэтому семантическое ядро для такого сайта обычными методами составить практически невозможно. Оно получается слишком обширным, так как СМИ охватывает практически все области человеческих интересов: от политических новостей до советов садоводам. Поисковый трафик для таких интернет-СМИ малоэффективен и практически является нецелевым.

Кроме того, журналисты — люди творческие. Даже названия рубрик порой на новостных сайтах они дают иносказательные и метафорические.

Трудно представить себе пользователя, ищущего информацию по названиям рубрик «На злобу дня», «Вы нам писали», «Не в тему», «Будем здоровы!» и подобным. О названиях же статей вообще говорить не приходится — здесь журналисты используют все средства образной речи, что делает титулы статей абсолютно неиоископригодными.

Существует и вторая сложность: новостные сюжеты актуальны от силы двое-трое суток. Бывают и «долгоиграющие сюжеты», но это, скорее, исключение. Нужно успеть донести сюжет до аудитории через поисковые машины за то время, пока он «живет».

Далее мы отдельно рассмотрим пути возможного решения каждой из указанных проблем.

  • Как ускорить индексацию СМИ?
  • Как составить для СМИ семантическое ядро?
  • Как отредактировать сайт для лучшей индексации?

Как ускорить индексацию сайтов СМИ

Прежде чем рассказывать об ускорении индексации сайтов СМИ, следует разобраться, чем такие сайты отличаются от обычных сайтов: корпоративных либо рекламирующих или продающих услуги или товары.

Сайты СМИ отличает несколько характерных признаков.

  • Очень большое количество страниц на сайте.
  • Большое количество разнообразного текстового контента.
  • Быстрое устаревание контента (время жизни сюжета).
    • Быстро меняющаяся первая страница сайта, где чаще всего отображаетсялента новостей, актуальные темы и часто обновляемый контент.

Как ускорить индексацию такого сайта?

Закрытие страниц от поисковых роботов

При публикации одной статьи на сайте СМИ обычно появляется сразу несколько страниц: основная страница статьи, версия для печати, форма «отправить другу», страница комментариев пользователей для данной статьи (изначально пустая)… Иногда при неправильно спроектированной и реализованной системе публикации контента страница с новостями появляется одновременно по нескольким адресам.

Исходя из всего вышесказанного можно сформулировать одно из правил продвижения сайтов СМИ: для ускорения индексации сайта СМИ следует закрывать от роботов поисковых систем неинформативные и служебные страницы.

Другими словами, можно и нужно направлять роботов поисковых систем на основной контент сайта с помощью сужения области индексации. При этом роботы не только будут активнее индексировать новые страницы, но и чаще переиндексировать быстро изменяющиеся страницы. Дополнительным плюсом такого подхода будет также снижение исходящего трафика и нагрузки на сервер со стороны всевозможных поисковых роботов.

Как именно пользоваться файлом robots . txt, мы рассказали в соответствующей главе. Но так ли просто на самом деле закрыть от индексации вспомогательные, неинформативные и служебные страницы?

Далеко не всегда. Приведем простой пример: пусть адрес страницы «Новости» на сайте выглядит следующим образом:

http://www.site.ru/news/1234 Ъ/

где 12 34 5 — некий уникальный номер новости на сайте, а печатная версия этой же новости находится по адресу

http://www.site.ru/news/12345/print/

При такой схеме публикации нельзя написать однозначное правило в robots . txt, запрещающее индексацию страниц для печати, поскольку для каждой новости следовало бы писать свое правило. Можно, конечно, воспользоваться мета-тегом на странице для запрещения индексации, но тогда роботы поисковых систем, чтобы прочитать запрещающий мета-тег, все равно должны будут запросить с сервера и получить данный документ, так что это только полумера.

Было бы гораздо проще, если бы адрес страницы для печати любой статьи всегда формировался примерно так:

http://www.site.ru/print/12345/

Тогда все страницы для печати на сайте легко было быть закрыть для индексации всего одним правилом в файле robots . txt.

Можно даже не упоминать о том, что адреса страниц новостей должны иметь статический адрес, это требование скорее обязательное, чем желательное.

Обработка информации о датах

Для каждой страницы должна указываться дата ее создания или изменения, причем эта дата должна использоваться не только как время публикации новости, но и как служебная информация при обмене данными между веб-сервером и клиентом (браузерами пользователей и поисковыми роботами).

При правильной работе веб-сервера и клиента — строго по стандарту, — если клиент уже забирал страницу и после этого страница не изменялась, то при повторном запросе той же страницы от того же клиента веб-сервер может просто вернуть специальную служебную информацию и не отправлять повторно саму страницу.

Таким образом, при большом количестве страниц на сайте снижается нагрузка на сервер и уменьшается исходящий трафик. Роботы поисковых систем не запрашивают одну и ту же страницу по многу раз, а обращаются к новым или изменившимся страницам.

На практике, как обычно, все не так просто. Роботы разных поисковых систем по-разному работают с датами изменения страниц. А в некоторых поисковых системах даже корректная работа сервера с датами может привести к недо-индексации — снижению количества запрашиваемых роботом страниц!

Это связано с тем, что чем выше доля неизменных страниц, тем меньше, по мнению поисковой системы, изменяется сайт. А статичные сайты индексируются реже, чтобы сэкономить ресурсы поисковой системы.

RSSпотоки

В настоящее время активно развивается такой формат подачи часто изменяющегося контента, как RSS-потоки . Использование RSS-потоков на сайте СМИ более чем оправдано, поскольку позволит не только повторно привлекать на сайт активных интернет-пользователей, но и попасть в такие новостные сер-висы-агрегаторы, как Яндекс.Новости (http://news.yandex.ru), Новотека (http://www.novoteka.ru) и др.

RSS поток (RSS лента) это удобный формат получения уведомлений о новых ма териалах на сайте. В RSS-поток могут выдаваться полные тексты новостей или статей, поэтому чаще всего даже нет необходимости посещать сайт достаточно подписаться с помощью браузера или специальной программы на получение RSS-ленты и читать новости с сайта в специальной программе.

Новостные агрегаторы наряду с традиционными поисковиками играют роль генераторов трафика для СМИ и могут довольно значительно добавить посетителей сайту интернет-СМИ, так что требования новостных агрегаторов по оформлению контента выгодно выполнять.

На этапе разработки сайта или запуска RSS-потоков следует связаться с соответствующими сервисами, так как у каждого сервиса могут быть свои требования к RSS. Например, Яндекс добавил свой дополнительный тег в разметку RSS-ленты, Новотека просит размещать полный текст материала в теге описания и при этом разбивать его на абзацы, и т.д.

Дополнительно следует отметить, что RSS-потоки могут также использоваться для ускорения индексации сайта в системах Google и Yahoo.

Как мы видим, важную часть в продвижении сайтов СМИ играют:

•   система публикации и управления контентом;

•   корректная работа «движка» сайта ;

Движок сайта жаргонизм, означающий систему управления сайтом, т.е. интерфейс для создания, редактирования, удалении, перемещения страниц или разделов сайта, а также для настройки дизайна сайта.

• возможность закрывать неинформативные и служебные страницы от индексации поисковыми системами.

Важны также некоторые другие технологические факторы, о которых мы не упомянули: система управления рекламными банерами, структура архива новостей, связывание статей в темы и сюжеты. Все это говорит о необходимости привлечения специалиста по поисковой оптимизации на этапе проектирования сайта, чтобы еще во время написания ТЗ и проектирования выявить возможные проблемы и недостатки и исправить их, а не заниматься переработкой, иногда весьма существенной, уже запущенного проекта.

Как составить для СМИ семантическое ядро

В первую очередь нужно определить, нужно ли это делать вообще. Дело в том, что влиять на процесс работы журналистов со стороны команды, занимающейся сайтом СМИ, как правило, не получается. Они, в общем, обоснованно отмахиваются от рекомендаций специалиста по поисковой оптимизации и вебмастера использовать такие-то фразы и не использовать такие-то, так как это ограничивает их свободу творчества.

Однако у нас есть и противоположный опыт: иногда журналисты проникаются пониманием требований интернет-бизнеса. Несколько лекций о том, что же происходит с их статьями после того, как они выложены на сайт, способны в корне изменить ситуацию. Иногда между авторами даже начинаются негласные соревнования: чья статья попадет в топ новостей Google или — еще более изощренно — приведет к отказу в работе сервера от наплыва посетителей, перешедших с результатов поиска по новостям.

Таким образом, первый совет — организационного плана. Проведите «ликбез» с журналистами и приучите их пользоваться статистикой поискового спроса в любой форме: самостоятельно или при вашем посредничестве.

Если же ваши просветительские порывы оказались невостребованными, не тратьте время на составление каких бы то ни было семантических ядер на основании поискового спроса. Двигайтесь в этом направлении не от спроса на информацию, а от предложения — текстов конкретных статей СМИ.

Если сайт СМИ, который необходимо продвигать, уже имеет достаточно большой архив, проанализируйте его с помощью программ, которыми вы обычно пользуетесь для определения плотности ключевых слов. На выходе должен получиться сведенный воедино частотный словарь, показывающий частоту слов (абсолютную и относительную) по всему корпусу текстов (архиву). Это позволяет в кратчайшие сроки получить представление о том, о чем реально пишет СМИ. Заметим, что иногда это не соответствует представлениям самой редакции и ее претензиям на внимание определенной аудитории.

Зона значимых слов всего корпуса обычно находится в диапазоне от 3 до 7% относительной частоты, что не противоречит правилам оптимизации отдельных страниц.

Для СМИ широкой направленности нужно анализировать не весь корпус, а отдельные рубрики, и составлять список основных ключевых слов для каждой рубрики отдельно. Понятно, что в спортивных и политических рубриках они будут полностью отличаться, хотя могут и пересекаться в незначительной части.

Если сайт не имеет проблем с индексацией, воспользуйтесь функцией поисковика Поиск в пределах сайта и определите наиболее релевантные страницы сайта по полученному из частотного словаря списку ключевых слов и фраз. Составьте список соответствия, где каждому из наиболее популярных ключевых слов всего издания либо отдельной рубрики соответствуют конкретные страницы (одна или несколько).

Если к вашим рекомендациям все же прислушиваются и анализ поискового спроса целесообразен, приготовьтесь к тому, что делать вам его предстоит намного чаще, чем на любом сайте коммерческой направленности. У СМИ нет постоянного семантического ядра: оно с той или иной скоростью постоянно изменяется, и предвидеть что-либо практически невозможно, так как статистика поисковиков дается, как правило, за предыдущий месяц. Одной из важных задач как раз и является определение периодичности, с которой нужно обновлять ядро.

Некоторые рекомендации все же можно дать.

Найдите неизменную часть ядра. Неизменная часть семантического ядра существует и для сайта СМИ. Постарайтесь ее определить и отделить от изменяющейся части. Многие сервисы статистики, в частности и Рамблер, и Яндекс, дают возможность сравнивать спрос за несколько месяцев. Отдавайте предпочтение тем запросам, которые демонстрируют стабильность спроса.

Обратите внимание на периодические события. Например, для такого издания, как рассылка «Продвижение сайта — профессиональные советы экспертов» , периодическим событием является ежегодная конференция «Оптимизация и продвижение сайтов».

Для различных отраслей бизнеса такими событиями будут ежегодные отраслевые выставки; для различных видов спорта — чемпионаты мира, Олимпийские игры; для журнала мод — недели высокой моды в Париже, Милане, Лондоне или Нью-Йорке, также проходящие с определенной периодичностью; для сайта медицинской направленности — сезонные эпидемии гриппа.

Как правило, опытный журналист сам знает о подобных событиях в своей тематике. Ваше дело только опросить журналистов и проверить полученный список событий, помня о том, что спрос появляется где-то за месяц до подобного события и продолжается также не очень долго по его окончании, т.е. низкочас-тотность запроса в любое другое время еще ни о чем не говорит, важно только наличие его в списке запросов.

Оптимизируйте подобные запросы, вдохновляясь тем, что через год (месяц, квартал и т.п.) все повторится, а оптимизировать уже ничего не будет нужно, разве что поменять дату в титулах соответствующих страниц.

Такие периодические запросы обнаруживают себя, в частности, тем, что в них встречаются указания на годы либо на другие даты, например REX 2005, MAPIC 2003. (Киевский международный фестиваль рекламы и Международная выставка по недвижимости.)

Обратите внимание на «долгоиграющие» сюжеты. Это требует определенных навыков, но некоторые сюжеты просто предполагают дальнейшее развитие. Как правило, сами сотрудники редакции СМИ группируют их в виде статей, связанных ссылками «Читайте также» либо подобными. Свои предчувствия можно проверять при поиске по новостным интеграторам наподобие Новотеки, которые дают возможность просмотра сюжетов в хронологии со ссылками на количество новостей из разных изданий.

Обычно журналисты такие сюжеты сами хорошо чувствуют, ваше дело только «поддержать их технически». В 2006 году, например, в который раз была проиграна «долгоиграющая» тема газовых договоров между Россией и Украиной. Если покопаться в архивах, то обнаружится, что эту же тему вполне можно отнести и к периодичным. Только вот период будет привязан к украинским выборам.

Обратите внимание на номенклатуру названий. Каждая предметная область использует какие-то номены — имена собственные — названия компаний, фирм, организаций, торговые марки, названия изделий и т.п. Для сайта, посвященного украинскому футбольному чемпионату, это названия всех команд высшей лиги. Для СМИ, посвященного строительству, это названия всех крупных строительных компаний и т.п. Для новостей автомира — это наиболее популярные марки автомобилей. Для издания медицинской тематики — названия болезней или разделов медицины, которые «отвечают» за эти болезни.

Обратите внимание на персоналии. Всегда есть люди, умеющие поддерживать к себе неиссякаемый интерес аудитории. Это знаменитости или публичные люди. Постарайтесь определить круг таких людей для тематики, в которой работает издание. Это в первом приближении можно сделать при помощи Яндекс. Новостей, которые выводят справа от результатов поиска «Новости в лицах», «Спорт в лицах» и «Упомянутые лица» по запросу. Правда, существуют запросы, по которым упомянутых лиц не набирается в достаточном для статистики количестве.

При этом относитесь к списку достаточно критически, потому что встречаются фамилии, которые почему-то присутствуют во всех областях. Как правило, это политики, которые успевают высказаться обо всем на свете.

Некоторые из известных людей, в частности Билл Гейтс и Бритни Спирс, регулярно входят в топы поисковых запросов в мировом масштабе, и их фамилии можно черпать из сервисов вроде Word Tracker.

И главный совет — дерзайте. Каждое издание имеет уникальное лицо, иначе ему трудно будет выжить среди конкурентов. Постарайтесь на основании этого предложить ему уникальную стратегию продвижения.

Изменения на сайте

Ваши дальнейшие действия зависят от того, какие возможности предоставляет движок сайта СМИ. Идеальным является вариант, когда разработчики вносят изменения в движок в зависимости от специфики текстов конкретного издания по вашей просьбе. Например, в одном из изданий существовал стандарт заголовков статей, по которому основной заголовок должен быть иносказательно-метафорическим, а его содержание раскрывалось в подзаголовке ЭТАПЫ СЛОЖНОГО ПУТИ — Стратегия проектных продаж на рынке В2В. Понятно, что вынесение в титулы названия такой статьи не даст никакого эффекта. Вынесение же подзаголовка — очень информативно и способно принести пользу.

Иногда основную информационную нагрузку способны нести «лиды» или «брифы» (в различных изданиях их называют по-разному) — краткое содержание или наиболее «ударный» абзац статьи, поэтому логично его использование для автоматического формирования титула и описания страницы. Следовательно, из этого можно сформулировать следующий совет: определите наиболее информационно-ценные части статей конкретного издания. Исходя из этого сформулируйте правила формирования титулов и описания страницы.

Формулируйте правила для автоматического заполнения нужных тегов, а не надейтесь на собственные силы или на то, что авторы сами станут заполнять поля, важность которых им непонятна. Даже если правила сработают только в части случаев, это более продуктивно, так как авторский состав редакции меняется, всегда найдется журналист, который не слушал ваших лекций или был невнимателен. Компромиссом могут быть решения, когда теги формируются автоматически в том случае, если этого не было сделано вручную. Существуют даже программы автоматического реферирования текстов, ужимающие текст до нескольких строк, оставляя самые значимые его места.

Хороший эффект ссылочного ранжирования дают внутренние ссылки между различными статьями, организовать которые можно по-разному, как в автоматическом, так и в полуавтоматическом режиме.

Для автоматического режима подходят различные сортировки — по рубрике, по дате, по номеру журнала, по сюжетам, связанные статьи и т.п., текст ссылок должен соответствовать тексту титулов статьи. Если вы решили проблему с информативностью заголовков — это неплохо работает. Нужно только проследить, чтобы реализовано это было на прямых ссылках, а не скриптах и других недоступных для поисковиков методах.

При полуавтоматическом режиме различные статьи перелинковываются по определенным ключевым словам, причем «адресную страницу», на которую ведут ссылки, вы выбираете исходя из сформированного списка соответствия. Например, ссылки с текстом «страховая реклама» со всех статьей издания, где эта фраза встречается, ведут на страницу, которую поисковик выбрал наиболее релевантной по этому запросу. При этом желательно соблюдать правила юзаби-лити по максимальному количеству активных ссылок на одной странице, так как при большом количестве ключевых слов некоторые страницы могут превратиться в сплошные блоки ссылок.

Также будет полезна возможность такого же автоматического удаления ссылок по указанному ключевому слову. Второе требование необходимо потому, что самые релевантные страницы на сайте могут изменяться со временем, могут изменяться ключевые слова и т.п. Удалять ссылки вручную — такая же трудоемкая задача, как их размещение.

Еще одной проблемой СМИ является частая смена текстов основных страниц, например, главной страницы, где статьи выводятся в виде ленты по рубрикам, либо по другому принципу. Между тем постоянные запросы, по которым сайт все же должен находиться, существуют, особенно для отраслевых и тематических изданий.

Решением является использование ключевых слов в тех фрагментах текста, которые не изменяются от номера к номеру: названия пунктов меню и рубрик, атрибуты alt постоянно используемых изображений и пр. Также неплохо работает включение какого-либо «постоянного» текста как можно ближе к началу документа. Естественно, эти слова должны присутствовать также в титулах и мета-тегах.

Posted in Продвижение сайта в поисковых системах.