Уважает ли GoogleBot User-agent: *

Я заблокировал страницу в robots.txt под User-agent: * и попытался вручную удалить этот URL из кэша Google в инструментах для веб-мастеров. Google сказал, что он не был заблокирован в моем файле robots.txt, поэтому я заблокировал его специально под User-agent: GoogleBot и попытался удалить его снова, и на этот раз это сработало. Означает ли это, что Google не уважает User-agent: * или что?

3 ответа

GoogleBot должен правильно следовать правилам User-agent: *Однако он не будет обновлять свой кеш, пока GoogleBot снова не просканирует ваш сайт, что занимает некоторое время. Google не сообщает точное минимальное время между обходами, но я бы предположил, что оно составляет от 15 до 30 минут.

Входящие ссылки также сделают URL проиндексированным Google. Не было бы индекса фактического содержания

Если бы инструменты для веб-мастеров сказали, что robots.txt не блокирует их, я бы сказал, что в вашем файле robots.txt произошла ошибка. Google определенно соблюдает User-Agent, поэтому что-то еще должно быть не так. Вы можете более подробно ознакомиться с файлом robots.txt на страницах справки в Инструментах Google для веб-мастеров.

В моем опыте удаление индекса занимает 24-48 часов, хотя я видел, что это происходит всего за 5 часов.

Другие вопросы по тегам