Как удалить / проиндексировать страницу из Google?

На странице результатов, когда я Google "e-luminate", 3-я и 4-я ссылки указывают на конкретный каталог глубоко внутри папок, в которых хранятся изображения. Как я могу избавиться от этих 2 результатов из результатов поиска Google? Как я могу заставить Google удалить его из индекса?

Я проверил на сервере, и папки, похоже, не отличались от других папок, но эти 2 пути, похоже, индексируются Google.

Спасибо.

3 ответа

Решение

Сначала зарегистрируйте аккаунт Инструментов Google для веб-мастеров. Это позволит вам просматривать статистику Google о том, как они сканируют ваш сайт, и позволяет запрашивать удаление страниц из индекса (подробнее об этом позже).

Затем настройте robots.txt файл для вашего сайта. Вам не нужно блокировать весь ваш сайт от Google, чтобы использовать robots.txt, Все поисковые системы следуют robots.txtТаким образом, это также не позволит таким сайтам, как Bing или Yahoo, проиндексировать эти страницы.

Чтобы настроить это, создайте robots.txt в виде простого текстового файла в корневой директории вашего сайта (например, http://www.example.com/robots.txt). Синтаксис очень прост: вы указываете пользовательский агент, к которому он должен применяться, используя * в качестве подстановочного знака для всех роботов, и вы указываете, где роботы не должны ползать. Обратите внимание, что вы не должны включать какие-либо страницы, которые вы хотите быть полностью "секретными", так как это общедоступный файл. Синтаксис для robots.txt как следует:

User-agent: user agent name
Disallow: directory name
Disallow: another directory
Disallow: (etc)

Если вы хотите заблокировать любые поисковые системы от индексации данных в подкаталоге вашего каталога изображений, вы можете сделать что-то вроде этого:

User-agent: *
Disallow: /images/foo/bar/
Disallow: /images/foo/baz/

Вы даже можете запретить только определенный файл:

User-agent: *
Disallow: /images/foo/bar/qux.jpg

Настройка robots.txt предотвратит индексацию указанных каталогов и файлов в будущем. Со временем эти страницы будут удалены из поискового индекса, но это будет не сразу. Чтобы ускорить этот процесс, используйте свою учетную запись для веб-мастеров, чтобы отправить запрос на удаление URL-адреса из индекса. Нажмите на учетную запись веб-сайта, с которой вы хотите удалить URL, затем откройте "Конфигурация сайта" слева. Нажмите "Доступ для сканера", затем откройте вкладку "Удалить URL". Нажмите "Новый запрос на удаление" и введите URL, который вы хотите удалить. Затем нажмите Enter. Страница должна попросить вас подтвердить, что вы уже заблокировали URL через robots.txt (что вы только что сделали). Нажмите OK, и он должен отправить запрос. Обычно на обработку запроса уходит 1-3 дня. Вы можете проверить статус запроса, войдя в свою учетную запись инструментария для веб-мастеров в любое время.

удаление URL веб-мастеров Google

Вы пытались искать в первую очередь?

Я искал "Удалить страницу из индекса Google" и получил эту страницу: Удалить страницу или сайт из результатов поиска Google.

В нем говорится, что вы должны создать файл robots.txt.

После этого вы можете перейти в Инструменты Google для веб-мастеров и запросить ускоренное удаление.

Прочитайте о файлах robots.txt, и вы поймете, что вы просто помещаете файл robot.txt в любую папку, которую хотите полностью удалить из Google, и через несколько часов или дней он больше не должен отображаться. Robots.txt генерируется с помощью инструментов веб-мастеров в вашем аккаунте Google, попробуйте!

Другие вопросы по тегам