Идентификация уникальных пользователей из файла журнала Apache?
Можно ли идентифицировать уникальных пользователей из лог-файла apache со 100% уверенностью?
Например, если 10 пользователей получают доступ к веб-сайту с прокси-сервера. Какой IP будет показывать файл журнала? IP прокси-сервера или пользователей?
Также, как лучше отслеживать пользователей?
Анализ файла журнала или встраивание на основе JavaScript в приложение?
С уважением Анкур Гупта
3 ответа
Общий формат журнала обычно показывает удаленный IP-адрес. Для пользователей за маршрутизатором или NAT, это будет адрес их маршрутизатора.
Логи Apache лучше всего подсчитывают необработанный трафик. Их можно использовать для отслеживания отдельных сеансов, если приложение, которое обслуживает Apache, помещает в URL некоторый уникальный идентификатор (например, идентификатор сеанса).
Отслеживание пользователей в лучшем случае сложно, и должно выполняться на уровне приложений. Веб-приложения могут отслеживать действия отдельных пользователей и соотносить их с тем, кто вошел в систему и т. Д.
Кроме того, вы можете использовать что-то вроде Google Analytics.
Можно ли идентифицировать уникальных пользователей из файла журнала apache со 100% уверенностью?
Я так не думаю, если только вы не заставите их войти в систему с аутентификацией Apache - в этом случае их имя пользователя будет отображаться в файле журнала.
Например, если 10 пользователей получают доступ к веб-сайту с прокси-сервера. Какой IP будет показывать файл журнала? IP прокси сервера или пользователей?
Вы увидите IP прокси-сервера, потому что пользователи подключаются к вам через прокси. Точно так же любая группа пользователей NAT в локальной сети будет происходить с одного IP.
Также, как лучше отслеживать пользователей?
Вы можете попробовать использовать куки / сессии для этой цели.
Как уже упоминалось в других ответах, вы не можете отслеживать пользователей вашего сайта с полной уверенностью.
При этом Apache httpd предоставляет хороший модуль с именем mod_usertrack, который использует куки для отслеживания пользователей на вашем сайте. Конечно, это будет работать только в том случае, если пользователи разрешают использование файлов cookie с вашего домена, а их веб-браузер вообще поддерживает файлы cookie.
То же самое будет справедливо для любого решения на основе JavaScript, такого как Google Analytics или Piwik: они работают только в том случае, если клиент поддерживает определенную технологию (JavaScript, файлы cookie...).