Статистика сайта и ее анализ

  • Интернет-статистика: цели и задачи
  • Какие параметры посещаемости сайта нужно оценивать
  • Откуда берутся данные для анализа
  • Обработка данных: собственный анализ данных или счетчик?
  • Счетчики: возможности, достоинства и недостатки
  • Обзор возможностей анализаторов журнальных файлов
  • Выводы

В этой главе речь пойдет об интернет-статистике: какие существуют способы получения и обработки статистических данных о ва шем сайте, что можно узнать о сайте и его продвижении с помощью статистики.

Интернет-статистика: цели и задачи

Сайт и реклама в Сети являются, как правило, не единственным средством продвижения и продаж продукта, одновременно используются и другие средства маркетинга — реклама в газетах и телевидении, промоушен-акции и т.п. Точно оценить вклад каждого из способов продвижения трудно, особенно в случае, когда проводится «смешанная кампания» и вклад может быть совместным.

Однако интернет-технологии позволяют детально изучить поведение привлеченных клиентов: на вашем сайте «все ходы записываются» и могут быть потом проанализированы. Результаты продвижения сайта или рекламной кампании могут оцениваться сразу после ее начала, что дает возможность быстро изменить параметры кампании или скорректировать усилия по поисковой оптимизации.

Для этого и служат средства интернет-статистики.

Статистика нужна для оценки эффективности сайта и рекламной кампании как инструментов решения конкретных коммерческих задач (обеспечение продаж, технической поддержки продукта и т.п.).

Вот какие задачи можно решать с помощью анализа статистики сайта.

Оценка общей аудитории сайта

  • Общая статистика: количество посетителей и просмотренных ими страниц, количество новых посетителей, региональное распределение посетителей, социо-демографические характеристики, сравнение с конкурентами.
  • Источники посетителей для сайта: откуда они пришли (с поисковыхсистем, благодаря рекламной кампании), какие поисковые фразы использовались.
  • Детальная оценка посещаемости сайта: какие разделы сайта популярны, какова средняя глубина просмотра сайта, по каким путям происходитпросмотр документов на сайте.

Оценка качества аудитории

  • Целевая аудитория: сколько посетителей оказались целевыми, т.е. совершили действия, желательные для владельца сайта (посетили целевые страницы, положили товар в корзину и т.п.).
  • Откуда приходят целевые посетители, т.е. какая реклама наиболее эффективна для конечной цели сайта.

Технические параметры

  • Объем, сроки и качество индексации сайта поисковыми роботами.
  • Наличие технических проблем: ссылки на несуществующие страницы,перегрузка сайта.

В настоящее время не существует единого средства статистики, которое могло бы решить все перечисленные задачи. В зависимости от ваших потребностей нужно использовать одно или несколько из описанных ниже решений.

Какие параметры посещаемости сайта нужно оценивать

Системы анализа посещаемости сайта предлагают пользователю множество отчетов о посещаемости, которые можно разбить на несколько групп, рассмотренных ниже.

Суммарные данные о посещаемости

В эту группу входят параметры, описанные ниже.

1. Показы. Количество страниц, просмотренных всеми пользователями. Этотпараметр показывает, сколько информационных страниц (текстовых, HTML,ASP, PHP) просмотрели пользователи. В разных системах данный параметрназывается по-разному: показ, просмотр, хит, загрузка. В ряде случаев разделяют «загрузки» (просмотры) и «перезагрузки» страницы (повторные просмотры посредством щелчка на кнопке Refresh/Reload в браузере).

2. Количество сессий. Под сессией понимается серия просмотров страницсайта одним посетителем. Сессия считается оконченной, если в течениекакого-то времени посетитель не обращался к сайту.

3. Количество пользователей, или аудитория сайта. Этот параметр показывает количество посетителей, просмотревших сайт за определенное время.Параметр определяется всеми по-разному, почему это так и какие бываютсложности определения размера аудитории, подробнее описано ниже.

4. Количество новых пользователей. Подсчитывается аудитория, посетившая сайт впервые. Этот параметр еще менее точен, чем общая аудитория,в силу сильно разнящихся определений того, что такое новый пользователь. В большинстве случаев данные о новой аудитории получаются несколько завышенными — ниже, в разделе о способах идентификации посетителей, мы подробнее объясним, почему это происходит.

5. Количество уникальных IP-адресов (или хостов). Показывает, с какого количества уникальных IP-адресов просматривались страницы сайта. Данный параметр ранее заменял подсчет аудитории сайта, так какего технически проще посчитать (у каждого пользователя есть какой-тоIP-адрес, в отличие от файлов cookie и прочих средств идентификации).Сейчас в большинстве систем статистики этот параметр поддерживаетсяскорее по историческим причинам.

Заметим, что количество просмотренных страниц и количество сессий можно складывать по часам, дням, неделям и т.п., чтобы получить суммарные показатели за какой-то период времени. А вот все остальные параметры напрямую не суммируются — например, у аудитории сайта есть повторяемость, повторные заходы, поэтому эти данные нельзя суммировать напрямую.

Характеристики аудитории сайта

Для аудитории сайта можно определить несколько параметров.

  • Географическое распределение аудитории. Для оценки этого параметраиспользуется тот факт, что IP-адреса, как правило, имеют географическуюпривязку и для каждого пользователя можно определить географическоеположение. (Исключение составляют большие распределенные корпоративные сети, как у Газпрома или ЛУКОЙЛа, у которых один и тот жеIP-адрес может означать как Москву, так и Новосибирск.) Точность этихданных достаточно хорошая — практически для 100% пользователейможно определить страну, для 95-98% посетителей из России — регионс точностью до субъекта федерации, а в ряде случаев и точнее. Необходимопонимать, что для пользователей, использующих серверы-посредники(proxy-сервисы), — корпоративные или публичные — часто определяетсяместоположение сервера-посредника, а не пользователя.
  • Активность аудитории. Под активностью понимается число страниц,просмотренных одним посетителем в течение сессии либо в течение всехсессий за одни сутки. В зависимости от способа подсчета данный параметрможет быть как совершенно бессмысленным (когда среднее число просмотренных страниц получается в результате деления числа просмотренных страниц на число посетителей), так и предоставляющим полезнуюинформацию (например, гистограмма распределения длин сессий, количество посетителей просмотревших больше чем V страниц).
  • Длительность сессии. Многие статистические системы подсчитывают показатель «время просмотра сайта пользователем» (длина сессии в минутах). Однако этот показатель сложно назвать осмысленным, посколькунеизвестно, когда пользователь покинул сайт. Действительно, невозможно выяснить время просмотра последней страницы сессии, а она с большой вероятностью была самой важной. Например, можно предположить,что пользователь в несколько быстрых навигационных кликов добралсядо страницы с содержанием и изучал его затем полчаса — так вот эти последние полчаса невозможно «засечь» (потому что потом пользователь могпросто набрать другой адрес в браузере, уже не обращаясь к вашему сайту, или вообще выключить компьютер).

Ссылающиеся сайты: источники посетителей

При переходах по ссылкам системам статистики обычно бывает доступна информация о странице, с которой пользователь перешел на ваш сайт. Используя эти данные, статистические сервисы предоставляют следующую информацию о переходах пользователей:

  • сайты, с которых был выполнен переход;
  • точные URL (сайт + страница на сайте), с которых был переход.

(Ну и, естественно, записываемая информация всегда включает дату и время перехода.)

Эти параметры могут быть выражены в «пользователях» (т.е. несколько переходов одного пользователя по ссылке считается за одного «пользователя») и в «переходах».

Детальный анализ переходов позволяет также получить данные, приведенные ниже.

  • Распределение сайтов-источников трафика по группам (поисковые системы, каталоги и рейтинги, форумы, остальные сайты).
  • Для поисковых систем как источников трафика — по каким поисковымзапросам осуществлялись переходы. Для получения данного отчета система статистики должна знать поисковую систему и уметь декодироватьпараметры ее адресной строки (URL) для получения исходного запроса.

Популярность страниц и разделов сайта

Информацию о посещаемости можно сгруппировать по страницам и каталогам посещаемого сайта. В результате будут получены такие отчеты.

  • Популярные страницы (документы). Для каждой отдельной страницыможно посчитать количество просмотров и количество просмотревших еепользователей.
  • Популярные группы страниц (подкаталоги). Аналогичные метрики длягруппы документов в одном подкаталоге.
  • Пути посетителей по сайту. На основании анализа пользовательскихсессий можно получить отчет «пути по сайту», т.е. списки страниц, просмотренных в течение одной сессии. Этот отчет обычно считается достаточно важным, однако на практике обычно получается, что число используемых пользователями путей очень велико, а сколько-нибудь популярными являются только переходы с головной страницы сайта в один изподразделов.

Целевая аудитория и фильтрация данных

Целевой аудиторией считаются те посетители, которые пришли на сайт с целью, приятной для владельца сайта (что-либо купить на продающем сайте, узнать о продукте на сайте поддержки продаж, ознакомиться с документацией на сайте техподдержки и т.п.). Так как прочитать мысли посетителя обычно затруднительно, целевую аудиторию отличают по действиям, совершенным на сайте. Такими действиями могут быть:

  • онлайн-покупка;
  • помещение товара в «корзину» или список пожеланий;
  • переход на страницу «контакты» или «как проехать»;
  • чтение описания товара или загрузка каталога;
  • заполнение формы запроса дополнительной информации или подпискина рассылку;
  • повторный заход на сайт;
  • просмотр определенного количества страниц сайта.

Какое именно действие является целевым, может определить только владелец сайта. Обычно для выявления целевого действия требуются изменения на сайте — например, расстановка меток, создание специальных «приземляющих страниц» для каждой рекламной кампании, размещение купонов со скидками с возможностью печати на принтере и т.п.

Если мы можем отличить целевого посетителя от случайного, то появляются дополнительные возможности по оценке как каналов привлечения посетителей вообще, так рекламных кампаний в частности. Тут можно действовать двумя способами.

  • Разделить всю аудиторию сайта по источникам (реклама, поисковые системы и т.п.) и для каждого источника оценить, сколько пользователей совершили целевое действие.
  • Выделить из аудитории всех тех, кто выполнил целевое действие, послечего посмотреть, с каких сайтов (рекламных кампаний, поисковых фраз)пришли данные посетители.

Обе методики будут давать близкие результаты с точностью до повторных посетителей (если посетитель приходил на сайт дважды и только один раз совершил целевое действие, то во втором случае он будет учтен, а в первом — нет).

Сравнимость результатов для разных статистических систем

Разные статистические системы по-разному подсчитывают пользователей. Результаты подсчета должны быть примерно одного порядка, однако даже расхождение посещаемости на десятки процентов в разных системах статистики может быть связано просто с различиями в методах подсчета и определения пов-торности захода, способа вычисления длительности сессии и т.п.

Вследствие этого все характеристики, которые напрямую или косвенно учитывают аудиторию сайта, оказываются несравнимыми для разных систем статистики.

Загрузки страниц всеми системами подсчитываются практически одинаково (в случае разделения «загрузок» и «перезагрузок» возможно сложить эти два параметра), поэтому все показатели, связанные с количеством просмотренных страниц, включая число переходов из поисковых машин и т.п., должны быть достаточно близкими (случаи потери данных и пользовательских ошибок подробно рассмотрены ниже).

Географические данные рассчитываются по самым разным базам данных, поэтому могут отличаться в разных системах статистики. При этом определение географии с точностью до страны происходит практически со 100%-ной точностью, а для географических баз данных по городам/регионам возможны большие расхождения.

Устойчивость и разброс данных

Как и большинство других естественных процессов, посещение сайта пользователями носит случайный или околослучайный характер. В первом приближении к цифрам посещаемости применимы обычные статистические критерии: можно считать, что естественный разброс посещаемости (сайта в целом, отдельной страницы, переходов с поисковика) пропорционален квадратному корню из основной величины.

Например, если в среднем за сутки на сайт заходит 400 человек, то посещаемость в диапазоне от 380 до 420 посетителей в очередные сутки укладывается в 95%-ные рамки «стандартности». Другими словами, если вчера у вас было 419 посетителей, а сегодня 385, бить тревогу не нужно, если только этот эффект падения не становится устойчивым.

С ростом величины посещаемости эта относительная величина естественных колебаний падает.

Posted in Продвижение сайта в поисковых системах.