Таинственный посетитель скрытой страницы PHP

На моем веб-сайте у меня есть "скрытая" страница, которая отображает список самых последних посетителей. Там нет никаких ссылок на эту единственную страницу PHP, и, теоретически, только я знаю о ее существовании. Я проверяю это много раз в день, чтобы увидеть, какие у меня новые хиты.

Однако примерно раз в неделю я получаю попадание с адреса 208.80.194.* На этой предположительно скрытой странице (она записывает обращения к себе). Странно то, что этот загадочный человек / бот не посещает другие страницы моего сайта. Не общедоступные страницы PHP, а только эта скрытая страница, которая печатает посетителей. Это всегда один удар, а HTTP_REFERER пуст. Другие данные всегда являются некоторым изменением

Mozilla/4.0 (совместимо; MSIE 7.0; Windows NT 5.1; YPC 3.2.0; FunWebProducts;.NET CLR 1.1.4322; SpamBlockerUtility 4.8.4; yplus 5.1.04b)

... но иногда MSIE 6.0 вместо 7 и различных других плагинов. Браузер каждый раз отличается, как и с младшими битами адреса.

И это только так. Один удар в неделю или около того, на эту страницу. Абсолютно никакие другие страницы не тронуты этим загадочным посетителем.

Делать whois на этом IP-адресе было показано, что он из Нью-Йорка и интернет-провайдера "Websense". 8 младших разрядов адреса различаются, но они всегда из подсети 208.80.194.0 / 24.

С большинства компьютеров, которые я использую для доступа к своему веб-сайту, traceroute к моему серверу нигде нет роутера по пути с IP 208.80.*. Так что я могу подумать, что это исключает любой вид перехвата HTTP.

Как и почему это происходит? Это кажется совершенно мягким, но необъяснимым и немного жутким.

2 ответа

Решение

Websense? Websense занимается классификацией URL-адресов и поиском "порочных" вещей в Интернете. Их продукты обычно появляются в корпоративной среде.

Держу пари, что вы получили доступ на секретную странице HTTP от компании, которая установлена ​​Websense и они автоматически добавляются на странице их (предположительно Гаргантю) список страниц троллить проверки порно, варез, форумов и т.д.

Что касается изменяющегося заголовка, я предполагаю, что у их робота есть все возможные баннеры, чтобы выбрать из преднамеренно изменяющих их, чтобы маскировать себя от анализа и притворяться, что это не бот. Фактически, быстрый поиск в Google веб-смысла FunWebProducts почти подтверждает эту теорию.

Диапазон IP-адресов принадлежит Websense. Вы можете запустить один из их продуктов.

$ whois 208.80.194.0
[Querying whois.arin.net]
[whois.arin.net]

NetRange:       208.80.192.0 - 208.80.199.255
CIDR:           208.80.192.0/21
OriginAS:       AS13448
NetName:        WEBSENSE-NET2
NetHandle:      NET-208-80-192-0-1
Parent:         NET-208-0-0-0-0
NetType:        Direct Assignment
RegDate:        2007-07-25
Updated:        2012-03-02
Ref:            http://whois.arin.net/rest/net/NET-208-80-192-0-1
Другие вопросы по тегам