Робот Google не может получить доступ к моему сайту. Инструменты для веб-мастеров. Ответить Недоступно robots.txt
Когда я пытаюсь получить свой сайт как googlebot в инструментах для веб-мастеров, он возвращает Unreachable robots.txt, после исследования я понял, что робот Google может видеть мой сервер:
tcpdump | grep google
Он возвращает, что Google может получить доступ к моему серверу с IP-адресом aa.bb.cc.xx или aa.bb.cc.yy. но нет ничего в access_log или error_log или других логах apache.
cat access_log | grep google or cat error_log | grep aa.bb.cc.xx
Другой бот (Bing,...) может получить доступ к Apache, но Google не может.
В моем нет проблем robots.txt
или его разрешения, потому что, как вы знаете, robots.txt
нет необходимости, поэтому я удаляю его, но снова инструменты для веб-мастеров вернули "Unreachable robots.txt", а не 404 не найден!
Информация о сервере:
- Серверная ОС: CentOS 6
- Веб-сервер: Apache 2.x
- Брандмауэр: IPTables остановлен
- SELinux отключен
- На моем сервере больше не нужно думать о безопасности.
Как я могу исследовать проблему и есть ли какая-либо другая команда, которая может помочь мне найти проблему?
1 ответ
Вы удалили robots.txt
файл, конечно, "недоступен" - ошибка 404, которую Google получает в ответ на запрос о нем, заключается в том, что файл не существует.
Если инструмент требует robots.txt
чтобы существовать, то, вероятно, вам нужен.