Миф седьмой. Статистика от хостера
(Продолжение. Начало в №42'2006)
В базовый пакет услуг хостинг-провайдера обычно включен тот или иной лог-анализатор, например, AWStats или Webalizer. Хостер обещает, что с помощью этих программ вы получите "полную и объективную статистику" по вашему сайту. Однако, это не совсем верно.
Всем известно, что статистика является важнейшим исследовательским инструментом для проведения поисковой оптимизации, а также для улучшения дизайна, юзабилити, размещения ссылок на сайте. Да и вообще, с философской точки зрения, человечество сейчас вступило в эпоху математического моделирования мира1, где править бал будут математики (а не физики, как раньше). Так что и в прикладном, и в философском смысле важность статистики трудно переоценить.
Статистические интернет-сервисы исторически делятся на два вида: счетчики (более популярны в Рунете) и лог-анализаторы (более популярны на Западе). Счетчики представляют собой специальные скрипты, которые загружаются и выполняются вместе с каждой веб-страницей. Лог-анализаторы - это отдельные программы для анализа текстовых файлов (логов) на сервере.
Счетчики и лог-анализаторы обладают своими достоинствами и недостатками. Преимущества лог-анализаторов - более детальная информация о сессиях, о работе с мультимедийными объектами, а также сведения о посещении сайта поисковыми роботами. Преимущество счетчиков - идентификация конкретных пользователей с помощью cookies, так что возможности анализа расширяются за пределы отдельных сессий. К сожалению, не у всех пользователей браузеры поддерживают выполнение скриптов, так что счетчики тоже не могут обеспечить полную статистическую картину посещаемости сайта.
Стандартные лог-анализаторы
Хостинг-провайдеры частенько включают в базовый пакет услуг на сервере какую-нибудь бесплатную программу для анализа логов. Обычно это AWStats (awstats.sourceforge.net) или Webalizer (mrunix.net/webalizer). Бесплатные лог-анализаторы обладают довольно широкой функциональностью. Они показывают количество посетителей сайта (уникальные хосты), количество открытых ими страниц (хиты), объем трафика с поисковиков с указанием ключевых слов, объем скачанной с сервера информации (отдельно для HTML и изображений), анализ отдельных сессий по IP-адресам (сколько страниц открыл каждый пользователь, какие страницы чаще всего открывались первыми или последними), адреса ссылающихся страниц и объем трафика с них, статистику браузеров и т.д. Вся информация отображается в виде стандартных графиков и таблиц (по месяцам, дням недели, времени суток) и занимает пару десятков страниц.
К сожалению, лог-анализаторы не способны идентифицировать конкретных пользователей. Они работают исключительно с IP-адресами, вынужденно принимая за факт, что каждый IP-адрес - это отдельный пользователь. По этой причине возникают серьезные погрешности. Для объективной статистики желательно использовать одновременно и счетчики, и лог-анализаторы.
Счетчики старого поколения
Интернетчики со стажем помнят, как в Рунете появлялись первые бесплатные счетчики. Cначала это были Rambler Тоp 100 и TopMail. В Байнете в 1998 г. начал работать счетчик Akavita. В те годы счетчики использовались, главным образом, для ранжирования сайтов, то есть для создания тематического каталога сайтов, отсортированных по посещаемости. Сегодня такими каталогами практически никто не пользуется, а раньше они были очень популярны.
Архаичные счетчики старого типа работают до сих пор, и к этой категории можно отнести многие белорусские и российские счетчики. Главная их задача - составление рейтинга, генерация трафика и заработок на банерах, а вовсе не аналитика для сайтов-клиентов.
Затем пришло время более современных систем. Первой среди них была система Spylog, которая удерживала безусловное лидерство на рынке статистики в 1999-2003 гг., затем появились Hotlog, Liveinternet (Rax.ru) и прочие. Эти бесплатные сервисы "новой волны" весьма популярны до сих пор, они обеспечивают довольно глубокий уровень аналитики: хиты, хосты, сессии, различные варианты отчетов, рейтинги и т.д.
Главным преимуществом счетчиков с самого начала стало то, что они позволяли анализировать аудиторию не только на отдельных ресурсах, но во всей системе сайтов, где установлены их скрипты. Конечно же, это обеспечивает принципиально новый уровень анализа аудитории для каждого отдельного ресурса. Речь идет о поведенческом таргетинге, который, в принципе, не могут обеспечить лог-анализаторы. А если нужно обсчитывать группу сайтов на разных хостинг-площадках, то тут альтернативы счетчикам просто нет.
Благодаря счетчикам интернет-статистика стала незаменимым инструментом для маркетолога. Она помогает ответить практически на все вопросы в области маркетинга. Впрочем, это только в теории. На практике существовало много проблем, в том числе и технических.
Основной технической проблемой счетчиков была слишком большая нагрузка на центральные серверы, из-за чего терялась часть статистики: обычно от 5% до 30%, в среднем, около 10%2 (по сравнению с точными данными, полученными из логов сервера).
Кроме того, отсутствовали удобные аналитические инструменты для обработки того огромного потока цифр, который выдавала система статистики. Бесплатные счетчики Рунета с годами развивались: некоторые постепенно вводили платные услуги (туда включались именно такие аналитические инструменты).
Все изменилось осенью 2005 г., когда на этом рынке произошла настоящая революция. Дело в том, что интернет-гигант Google с потрохами выкупил аналитическую компанию Urchin и выложил в открытый доступ программу для анализа посещаемости сайтов Google Analytics (google.com/analytics), которая раньше продавалась под брендом Urchin за несколько сотен долларов и была одной из лучших в своем роде.
Счетчики нового поколения
Революцию на рынке интернет-статистики после появления Google Analytics можно сравнить с той, что произошла с почтовыми веб-сервисами после появления Gmail с ящиком на 2 Гб. Все остальные сразу последовали новой моде. Нечто похожее произошло на рынке интернет-статистики, причем российские разработчики среагировали очень быстро.
Например, вот интересная деталь. В системе Google Analytics вместо привычного большого кода, как было принято в российских сервисах, содержится только вызов скрипта www.google-analytics.com/urchin.js. Сам скрипт хранится на сервере Google. Подобная инициация счетчика мгновенно стала корпоративным стандартом.
Первой из российских систем интернет-статистики модернизировала свой код по такому принципу компания Spylog. В новом коде вызов скрипта производится оператором
script src="http://tools.spylog.ru/counter2.2.js"
После этого коды популярных в России счетчиков стали занимать3: Google Analytics - 167 символов, Liveinternet - 409 символов, HotLog - 1056 символов, новый SpyLog - 324 символа, старый SpyLog - 1203 символа (все значения даются для нераздельной кнопки и без учета комментариев). Вызываемый же размер кода у нового Spylog более 4 Кб, а у Google Analytics эта величина зашкаливает за 17 Кб.
Среди всех бесплатных счетчиков Google Analytics - наиболее продвинутый сервис. Там самые подробные отчеты, которые выглядят очень красочно. Этих отчетов настолько много, что изучать их можно несколько дней. Все отчеты в Google Analytics разбиты на три большие группы: административный, маркетинговый и для веб-мастеров. Каждый из них содержит десятки обзоров. Графики и диаграммы строятся с помощью флэша, доступен экспорт в офлайновые форматы. Сервис максимально интегрирован с рекламными системами AdWords и AdSense. Ничего подобного в Рунете никогда не было и нет.
К сожалению, для отечественных пользователей Google Analytics пока имеет ряд недостатков: наличие серверов за рубежом, запаздывание статистики, отсутствие русскоязычной техподдержки и проч. Можно надеяться, что это временные трудности. Недавно компания Google открыла российское представительство и теперь активно выпускает локализованные версии различных продуктов. Вполне возможно, что скоро появится и локализованная версия Google Analytics, где будут по умолчанию настроены отчеты по ключевым словам с российских поисковиков.
После начала работы осенью 2005 г. регистрация в Google Analytics осуществлялась только по специальным приглашениям, но сейчас она открыта для всех, а сервис работает вполне стабильно (в надежности дата-центров Google можно не сомневаться).
Таким образом, в эпоху Google Analytics самая продвинутая статистика по веб-сайту стала доступной любому желающему - она стала стандартом. Фактически, даже сам термин "счетчики" в новых условиях себя изжил.
Немного о будущем
По мнению ведущих специалистов в области интернет-статистики, победителем на этом рынке может стать тот, у кого получится связать математическую терминологию статистики и терминологию бизнеса, которая нужна для анализа работы сайта. Под "бизнесом" подразумеваются именно коммерческие веб-сайты, которые являются главными заказчиками систем интернет-статистики и анализа. Современный бизнес, который стоит за коммерческими сайтами, ищет инструменты для математически точных методов зарабатывания денег. Системы интернет-статистики могут дать такой инструмент, по крайней мере, они к этому стремятся. О том, как интернет-статистика вписывается в новую эпоху математического моделирования мира, например, говорил на последнем РИФе Андрей Травин из "Спайлога"4.
Если посмотреть на терминологию отчетов Google Analytics, то можно увидеть, что разработки идут именно в этом направлении, то есть статистика начинает говорить на языке бизнеса, интегрируется в него и от этого становится гораздо более эффективным инструментом.
Что касается примитивных лог-анализаторов, которые предлагает хостер, то это - прошлый век. Обещания "полной и объективной статистики по вашему сайту" - обычная маркетинговая уловка, рассчитанная на тех, кто не знаком с современными тенденциями в области интернет-статистики.
Полный статистический анализ по своему сайту вы способны составить самостоятельно или с помощью профессионалов, но в любом случае для этого придется использовать специальные инструменты, а не простенькие утилиты от хостера.
Анатолий АЛИЗАР
Материал подготовлен при содействии хостинг-провайдера "Экстмедиа"
1 newscientist.com/article/mg19225780.099-stephen-wolfram-forecasts-the-future.html
2 webplanet.ru/news/column/travin/2006/4/17/stat.html
3 webplanet.ru/news/technology/2006/6/28/spy.html
4 a-z.ru/rif2006/1_2/5_56.ram (видео)
Горячие темы