Что произойдет, если на сайте нет файла robots.txt?

Question

Что произойдет, если на сайте нет файла robots.txt?

Если robots.txt Файл отсутствует в корневом каталоге веб-сайта, как это трактуется:

сайт вообще не индексируется
Сайт проиндексирован без каких-либо ограничений

По моему мнению, это должно быть вторым. Я спрашиваю в связи с этим вопросом.

6

seo indexing robots.txt search-engine

Источник

Lazer 25 июн '10 в 11:39

6 ответов

Решение

Robots.txt является строго добровольным соглашением среди поисковых систем; они могут игнорировать это или реализовывать по своему усмотрению. Тем не менее, за исключением случайного паука, ищущего адреса электронной почты или тому подобное, они почти все уважают это. Его формат и логика очень и очень просты, и по умолчанию используется правило разрешить (поскольку вы можете только запретить). Сайт без robots.txt будет полностью проиндексирован.

7

Источник

BMDan 25 июн '10 в 13:55

robots.txt является полностью необязательным. Если у вас есть такой, совместимые со стандартами сканеры будут уважать его, если у вас его нет, все, что не запрещено в элементах HTML-META ( Википедия), можно сканировать.

2

Источник

weeheavy 25 июн '10 в 12:06

У меня не было robots.txt на десятках доменов, которые я зарегистрировал, некоторые еще в 1994 году, и у меня никогда не было проблем с их размещением в google/yahoo и т. Д.

Даже мой личный веб-сайт получает 150-200 пользователей в день от Google и не имеет файла robots.txt.

(Люблю требование трехминутной паузы между ответами на вопросы. Затем я получу капчу робота. Иногда это просто не стоит пытаться быть полезным.)

1

Источник

karmawhore 25 июн '10 в 11:51

(Я не смог найти способ добавить комментарий, но) Также я хотел бы добавить, что отсутствие robots.txt также является проблемой в том смысле, что вы не сможете предоставить Sitemap для него. Помните, что файлы Sitemap находятся только в том случае, если они указаны в файле Robots.txt, или через прямую отправку в поисковые системы, но, конечно, последнее означает, что вы должны делать это один за другим, а не просто быстро находить все Это.

1

Источник

Carlos Aguilar Mares 26 июн '10 в 17:57

Сайт будет проиндексирован без ограничений. пауки будут следовать за тем, что они найдут. Я не думаю, что ты этого хочешь. некоторые пауки, такие как байду, могут быть очень агрессивными в этом. он может даже оценить даже URL-адреса в кодах JavaScript.

вот подробная информация. http://www.robotstxt.org/orig.html

пс. также у вас будет много 404 журналов на вашем веб-сервере. это также недостаток при чтении журналов. И не забудьте поместить файл favicon.ico. это еще один глупый файл, который требуется всем браузерам на каждой странице.

1

Источник

risyasin 25 июн '10 в 12:06

Другие вопросы по тегам seo indexing robots.txt search-engine

ChrisF 25 июн '10 в 12:06 2010-06-25 12:06 · Accepted Answer · 2010-06-25 12:06

Цель robots.txt Файл предназначен для того, чтобы сканеры не попадали в определенные части вашего сайта. Отсутствие такового должно привести к тому, что весь ваш контент будет проиндексирован.

Подразумевалось, что из первого комментария по этому вопросу Мета было robots.txt файл существовал, но был недоступен (по какой-либо причине), а не отсутствовал вообще. Это может вызвать у веб-сканеров некоторые проблемы, но это предположение.

У меня нет robots.txt на моем блоге (самостоятельная установка Wordpress), и это проиндексировано.