Оптимизация альтернативных форматов документов (Flash, PDF, DOC и XML)

Поисковые системы индексируют не только традиционные для Интернета HTML-документы. Их индексы пополняются информацией, полученной из документов, созданных в форматах, более привычных в «офлайновой» среде — PDF, DOC и XML. Расскажем чуть подробнее об этих форматах.

PDF (Portable Document Format). Этот формат записи документов был предложен в 1993 году компанией Adobe. Эта же компания предоставляет программу для просмотра и печати документов этого формата — Adobe Acrobat.

Одно из основных преимуществ данного формата — универсальность. PDF позволяет сохранять первоначальный вид документа со всеми шрифтами, графическими элементами и т.п. PDF-файлы можно открывать с помощью программы Adobe Acrobat Reader, существующей для любой платформы. Что не менее важно, разного рода графические схемы можно увеличивать или уменьшать без серьезных потерь в качестве — это достигается за счет использования элементов векторной графики. Последнее свойство PDF-формата объясняет его высокую популярность для сохранения технической документации, руководств пользователя и т.п., ведь не секрет, что PDF стал буквально стандартом для описания технических характеристик устройств (особенно электронных) у большинства разработчиков. Поэтому в Интернете нельзя не считаться с этим форматом.

DOC и XLS. Форматы популярнейшего текстового редактора MS Word и редактора таблиц MS Excel, входящих в стандартный пакет офисных программ Microsoft Office. В Интернете содержится много информации в этих форматах — рефераты, доклады, отчеты, таблицы и др. Поэтому желание поисковых систем извлекать информацию из этих документов и показывать пользователям вполне понятно.

Flash. Этот формат разработан компанией Macromedia (впоследствии приобретенной компанией Adobe) для мультимедийных объектов — анимационных роликов, звукового сопровождения и т.п. Средства воспроизведения распространяются как подключаемый к браузеру модуль (plug-in). В настоящее время этот формат получил широкое распространение, поскольку позволяет в относительно небольшом объеме данных описывать сложную анимацию и оперировать векторными объектами.

Если на вашем сайте есть электронные книги, технические описания, документация, демонстрационные ролики и т.п., записанные в рассматриваемых форматах, можно приложить определенные усилия для повышения видимости этих документов в поисковых системах.

Техника поисковой оптимизации Р1УР-, DOC- и XLS-файлов принципиально не отличается от работы с HTML-документами, необходимо лишь обратить внимание на одну особенность: в этих форматах текст, видимый пользователю, не всегда является текстом, доступным для поисковых машин.

В принципе поисковые системы могут индексировать текст и ссылки в этих форматах. Но в PDF-файлах часто видимый пользователю текст на самом деле является изображением, а для XLS-файлов вообще характерно малое количество текста. Поэтому необходимо следующее:

  • сохранять данные в файле именно в текстовом виде;
  • обеспечить наличие в текстах файлов PDF-, DOC- и XLS-форматов ключевых слов фраз, по которым вы бы хотели видеть ссылки на эти документы в результатах поиска (сделать это достаточно легко с помощьюописанной ранее текстовой коррекции и/или внесения в текст необходимых развернутых текстовых комментариев — особенно это касается табличных файлов XLS);
  • сделать доступными данные файлы для поисковых роботов, т.е. проверитьотсутствие защиты паролями и наличие легко индексируемых ссылок наэти файлы со страниц, известных поисковым системам;
  • заполнять поля метаданных документов, главным образом, поля title(заголовок документа), с внесением в них нужных ключевых слов и фраз. Пользователям содержимое титула практически не видно, но его содержимое учитывается поисковыми роботами.

Отдельно стоит остановиться на продвижении сайтов, где информация представлена в SWF-формате (Flash-ролики). Некоторые поисковые системы, например Яндекс, умеют индексировать Flash-документы — для этого поисковик сохраняет текстовое представление Flash-документа. Но во Flash-ролике невозможно разместить много текстовой информации, поэтому если вы хотите использовать этот очень привлекательный для пользователей формат на сайте, нужно размещать Flash-ролики на обычных текстовых HTML-страницах. При этом необходимо, по возможности, дублировать текстовую информацию из Flash внизу страницы, а также правильно заполнять титульные фразы страниц.

В итоге поисковые системы будут правильно индексировать текстовое содержимое из HTML и FLASH и эффективно отображать такую страницу в результатах поиска, а пользователи увидят на первом экране (изображение страницы на мониторе без использования прокрутки экрана) яркий Flash-ролик.

Выводы

Список необычных способов продвижения, описанных в данной главе, вряд ли можно назвать полным. Любой необычный и новый прием, приводящий к увеличению целевой посещаемости сайта, сначала изобретается и используется немногими. По мере увеличения количества осведомленных лиц растет и популярность метода, что позволяет отнести его к уже «обычным», «стандартным» технологиям.

Технологии продвижения не только рождаются, но и устаревают. Скорее всего, в будущем поисковые системы будут столь же уверенно работать с DOC-, Flash- и XML-форматами, а количество таких документов в Интернете увеличится настолько, что составит конкуренцию традиционному формату HTML.

Возможно также, что поисковые системы станут автоматически подставлять правильный вариант запроса в случаях, если слово написано с ошибкой или опечаткой. Конечно, при этом будет утрачен смысл продвижения по ошибочным запросам, а проблемы оптимизации новых форматов будут активно обсуждаться вебмастерами и специалистами по поисковому продвижению. Таким образом, подготовка таких документов к правильному индексированию и ранжированию станет общепринятой, стандартной процедурой.

Тогда оптимизаторам, желающим уйти со стандартного пути продвижения в конкурентной среде, придется придумать какие-то новые, необычные методы.

Не следует, однако, путать необычные и нестандартные методы с «черными», запрещенными методами продвижения. Существовали, существуют и будут появляться способы воздействия на поисковые системы, которые, несмотря на эффективность, в конечном счете приводят к негативным последствиям — уничтожению релевантности поисковой выдачи, ухудшению сайтов и нарушениям работы поисковых систем.

Их применение называется спамом поисковых индексов, шли спамдексин-гом. Нужно знать об этих методах, чтобы понимать, какие именно услуги предлагает вам оптимизатор и какие риски вы на себя берете. Следующая глава нашей книги— о спамдексинге, или о запрещенных технологиях.

Posted in Продвижение сайта в поисковых системах.