Мысли о веб-аналитике в реальном времени
У нас есть несколько веб-серверов, и мы планируем создать информационную панель для отображения IP-адреса статистики в реальном времени, географического местоположения и других пользовательских данных на основе поиска в базе данных. Splunk идеально подходит, но интересно, есть ли альтернатива с открытым исходным кодом. Я посмотрел на logstash и graylog2, но, насколько мне известно, они являются скорее инструментами анализа журналов. Piwik довольно интересен, за исключением того, что я не могу разместить на веб-страницах никакой javascript. Все, к чему у меня есть доступ, - это веб-журнал apache. Любые рекомендации, пожалуйста..
5 ответов
Good ol ' AWStats - это анализатор журналов в режиме реального времени, в котором есть информационные панели, виджеты, крылышки, порталы, панели стекла и другие подобные вещи. Вы даже можете настроить его с помощью плагинов по своему вкусу.
Для чего?
На самом деле есть две ветви веб-аналитики - маркетинговая информация и информация о производительности (и дизайн пользовательского интерфейса, который как бы охватывает оба).
Google Analytics, Open Web Analytics, Piwik и, в меньшей степени, AWstats, Analog и др. В основном занимаются сбором маркетинговой информации (какова ваша база клиентов, где они находятся, какие браузеры они используют, какой коэффициент конверсии...).
С точки зрения производительности выбор не так велик - но statsd + graphite обеспечивает потрясающий бэкенд для хранения и представления данных из нескольких источников (журналы, ошибки JavaScript). В настоящее время я планирую установку с использованием этого в бэкэнде и Yahoo Boomerang для сбора времени загрузки страницы. Посмотрите на графен для примера того, что он может сделать. Написание, скажем, сценария awk, для разбора логов и подачи бэкэнда было бы тривиально.
Есть также такие инструменты, как PastMon, которые могут анализировать и сообщать о большом количестве низкоуровневой сетевой статистики. Или мртг.
Посетители имеют режим реального времени и могут показать вам основную информацию, такую как наиболее посещаемые страницы, самые жаркие часы / дни и даже визуальный анализ пути.
Вы также можете передать свои журналы Apache в MySQL с помощью syslog-ng
а затем используйте внешние интерфейсы, такие как logzilla (ранее известный как php-syslog-ng) для запроса данных.
Кстати, интересный вопрос - я весь в ушах на лучшее решение! +1 к вашему вопросу из-за этого.:)
Как вы упомянули, есть Piwik, который имеет гибкий API отслеживания, вы можете вставить Javascript с помощью<noscript>
пометить или вставить простое изображение на ваших страницах.
Вставьте следующий код, как предлагается на официальной странице API отслеживания Piwik:
<!-- Piwik Image Tracker -->
<img src="http://demo.piwik.org/piwik.php?idsite={$IDSITE}&rec=1" style="border:0" alt="" />
<!-- End Piwik -->
Нет необходимости в JS для основных функций.:)
Спасибо за все советы. В настоящее время я настроил logstash на клиенте, чтобы отправить свои журналы доступа на центральный сервер rabbitmq и использовать другой экземпляр logstash для анализа данных в asticsearch. с помощью RESTApi из Flexiblesearch я смог создать несколько интересных панелей (например, текущее местоположение пользователей, обращающихся к веб-серверу).