Как удалить / проиндексировать страницу из Google?
На странице результатов, когда я Google "e-luminate", 3-я и 4-я ссылки указывают на конкретный каталог глубоко внутри папок, в которых хранятся изображения. Как я могу избавиться от этих 2 результатов из результатов поиска Google? Как я могу заставить Google удалить его из индекса?
Я проверил на сервере, и папки, похоже, не отличались от других папок, но эти 2 пути, похоже, индексируются Google.
Спасибо.
3 ответа
Сначала зарегистрируйте аккаунт Инструментов Google для веб-мастеров. Это позволит вам просматривать статистику Google о том, как они сканируют ваш сайт, и позволяет запрашивать удаление страниц из индекса (подробнее об этом позже).
Затем настройте robots.txt
файл для вашего сайта. Вам не нужно блокировать весь ваш сайт от Google, чтобы использовать robots.txt
, Все поисковые системы следуют robots.txt
Таким образом, это также не позволит таким сайтам, как Bing или Yahoo, проиндексировать эти страницы.
Чтобы настроить это, создайте robots.txt
в виде простого текстового файла в корневой директории вашего сайта (например, http://www.example.com/robots.txt
). Синтаксис очень прост: вы указываете пользовательский агент, к которому он должен применяться, используя *
в качестве подстановочного знака для всех роботов, и вы указываете, где роботы не должны ползать. Обратите внимание, что вы не должны включать какие-либо страницы, которые вы хотите быть полностью "секретными", так как это общедоступный файл. Синтаксис для robots.txt
как следует:
User-agent: user agent name
Disallow: directory name
Disallow: another directory
Disallow: (etc)
Если вы хотите заблокировать любые поисковые системы от индексации данных в подкаталоге вашего каталога изображений, вы можете сделать что-то вроде этого:
User-agent: *
Disallow: /images/foo/bar/
Disallow: /images/foo/baz/
Вы даже можете запретить только определенный файл:
User-agent: *
Disallow: /images/foo/bar/qux.jpg
Настройка robots.txt
предотвратит индексацию указанных каталогов и файлов в будущем. Со временем эти страницы будут удалены из поискового индекса, но это будет не сразу. Чтобы ускорить этот процесс, используйте свою учетную запись для веб-мастеров, чтобы отправить запрос на удаление URL-адреса из индекса. Нажмите на учетную запись веб-сайта, с которой вы хотите удалить URL, затем откройте "Конфигурация сайта" слева. Нажмите "Доступ для сканера", затем откройте вкладку "Удалить URL". Нажмите "Новый запрос на удаление" и введите URL, который вы хотите удалить. Затем нажмите Enter. Страница должна попросить вас подтвердить, что вы уже заблокировали URL через robots.txt
(что вы только что сделали). Нажмите OK, и он должен отправить запрос. Обычно на обработку запроса уходит 1-3 дня. Вы можете проверить статус запроса, войдя в свою учетную запись инструментария для веб-мастеров в любое время.
Вы пытались искать в первую очередь?
Я искал "Удалить страницу из индекса Google" и получил эту страницу: Удалить страницу или сайт из результатов поиска Google.
В нем говорится, что вы должны создать файл robots.txt.
После этого вы можете перейти в Инструменты Google для веб-мастеров и запросить ускоренное удаление.
Прочитайте о файлах robots.txt, и вы поймете, что вы просто помещаете файл robot.txt в любую папку, которую хотите полностью удалить из Google, и через несколько часов или дней он больше не должен отображаться. Robots.txt генерируется с помощью инструментов веб-мастеров в вашем аккаунте Google, попробуйте!