Как запретить индексирование сайта или страниц
Иногда нужно, чтобы страницы сайта или размещенные на них ссылки не появлялись в результатах поиска. Скрыть содержимое сайта от индексирования можно с помощью файла robots.txt, HTML-разметки или авторизации на сайте.
- Запретить индексирование сайта, раздела или страницы
- Запретить индексирование части текста страницы
- Скрыть от индексирования ссылку на странице
Если какие-то страницы или разделы сайта не должны индексироваться (например, со служебной или конфиденциальной информацией), ограничьте доступ к ним следующими способами:
В файле robots.txt укажите директиву Disallow.
В HTML-коде страниц сайта укажите метатег robots с директивой noindex или none. Подробнее см. в разделе Метатег robots и HTTP-заголовок X-Robots-Tag.
Используйте авторизацию на сайте. Рекомендуем этот способ, чтобы скрыть от индексирования главную страницу сайта. Если главная страница запрещена в файле robots.

txt или с помощью метатега noindex, но на нее ведут ссылки, страница может попасть в результаты поиска.
Скрыть от индексирования часть текста можно несколькими способами:
В HTML-код страницы добавьте элемент noindex. Например:
<noindex>текст, индексирование которого нужно запретить</noindex>
Элемент не чувствителен к вложенности — может находиться в любом месте HTML-кода страницы. Если на странице отсутствует закрывающий тег, скрытым считается весь контент страницы. Не создавайте множественную вложенность тегов noindex — разметка будет учитываться только до первого закрывающего тега.
При необходимости сделать код сайта валидным возможно использование тега в следующем формате:
<!--noindex-->текст, индексирование которого нужно запретить<!--/noindex-->
В HTML-код страницы добавьте элемент noscript. Например:
<noscript>текст, индексирование которого нужно запретить</noscript>
Элемент noscript, как и noindex, запрещает индексирование, но при этом скрывает содержимое сайта от пользователя, если его браузер поддерживает технологию JavaScript.

Примечание. JavaScript поддерживают все популярные браузеры, если эта функция не отключена пользователем специально.
Посмотреть отчет о наличии JavaScript можно в Яндекс Метрике .
Рекомендуем использовать атрибут rel. Разные значения атрибута указывают на тип ссылки, что помогает поисковой системе лучше распознавать содержимое сайта.
rel=»ugc». Используйте, если на вашем сайте есть форум или возможность оставить отзыв и вы не уверены в качестве ссылок, которые оставляют посетители.
rel=»sponsored». Используйте, если ссылка носит рекламный характер, указывает на рекламное место или размещение в рамках партнерской программы с другим сайтом.
rel=»nofollow». Указывайте, чтобы робот не проходил по ссылке, не зависимо от ее типа.
Можно комбинировать несколько значений. Пример:
<a href="url" rel="nofollow,sponsored">текст ссылки</a> или <a href="url" rel="nofollow sponsored">текст ссылки</a>
Значения атрибута rel воспринимаются роботом как рекомендация не принимать ссылку во внимание.
Чтобы скрыть от индексирования все ссылки на странице, укажите в HTML-коде страницы метатег robots с директивой nofollow. Робот не перейдет по ссылкам при обходе сайта, но может узнать о них из других источников. Например, на других страницах или сайтах.
При использовании любого из перечисленных указаний ссылка может быть обработана роботом и отобразиться в Вебмастере как внутренняя или внешняя. Само отображение или отсутствие ссылки в Вебмастере не указывает на то, что поисковые алгоритмы учитывают ее.
Как полностью скрыть сайт от индексации?
#Оптимизация сайта #Индексация
#7
Ноябрь’17
17
Ноябрь’17
17
Про то, как закрыть от индексации отдельную страницу и для чего это нужно мы уже писали. Но могут возникнуть случаи, когда от индексации надо закрыть весь сайт или зеркало, что проблематичнее.
Существует несколько способов закрыть сайт от индексации.
Запрет в файле robots.txt
Файл robots.txt отвечает за индексацию сайта поисковыми роботами. Найти его можно в корневой папке сайта. Если же его не существует, то его необходимо создать в любом текстовом редакторе и перенести в нужную директорию. В файле должны находиться всего лишь две строчки:
User-agent: *
Disallow: /
Остальные правила должны быть удалены.
Этот метод самый простой для скрытия сайта от индексации.
С помощью мета-тега robots
Прописав в шаблоне страниц сайта следующее правило <meta name=»robots» content=»noindex, nofollow»/> или <meta name=»robots» content=»none»/> в теге <head>, вы запретите его индексацию.
Как закрыть зеркало сайта от индексации
Зеркало — точная копия сайта, доступная по другому домену. Т.е. два разных домена настроены на одну и ту же папку с сайтом.
Цели создания зеркал могут быть разные, но в любом случае мы получаем полную копию сайта, которую рекомендуется закрыть от индексации.
Сделать это стандартными способами невозможно, т.к. по адресам domen1.ru/robots.txt и domen2.ru/robots.txt открывается один и тот же файл robots.txt с одинаковым содержанием. В таком случае необходимо провести специальные настройки на сервере, которые позволят одному из доменов отдавать запрещающий robots.txt.
Похожее
Оптимизация сайта Индексация
Атрибут rel=canonical
Оптимизация сайта Индексация
Индексация ссылок
Оптимизация сайта Индексация
#133
Атрибут rel=canonical
Январь’23
11962
23Оптимизация сайта Индексация
#119
Индексация ссылок
Апрель’19
4627
Оптимизация сайта Индексация
#111
Описание и настройка директивы Clean-param
Апрель’19
9367
24Оптимизация сайта Индексация
#104
Как привлечь быстроробота Яндекс
Февраль’19
2271
21Оптимизация сайта Индексация
#94
Проверка индекса сайта.
Как найти мусорные или недостающие страницы
Декабрь’18
9471
28Оптимизация сайта Индексация
#86
Как закрыть ссылки и текст от поисковых систем
Ноябрь’18
5946
22Оптимизация сайта Индексация
#82
Почему Яндекс удаляет страницы из поиска
Ноябрь’18
3194
19Оптимизация сайта Индексация
#60
Правильная индексация страниц пагинации
Февраль’18
8114
19Оптимизация сайта Индексация
#47
Как узнать дату индексации страницы
Ноябрь’17
7800
18Оптимизация сайта Индексация
#46
Какие страницы надо закрывать от индексации
Ноябрь’17
10594
18Оптимизация сайта Индексация
#38
Как удалить страницу из индекса Яндекса и Google
Ноябрь’17
13972
20#37
Как добавить страницу в поиск Яндекса и Google
Апрель’17
19656
19Оптимизация сайта Индексация
#2
Как проверить индексацию сайта в поисковых системах
Ноябрь’17
17543
27Оптимизация сайта Индексация
#1
Как ускорить индексацию сайта
Ноябрь’17
5781
29Блокировать поисковое индексирование с помощью ‘noindex’ | Центр поиска Google | Документация
noindex — это набор правил с тег или заголовок ответа HTTP и используется для предотвращения индексации контента поисковыми системами, которые
поддерживают правило noindex , например Google.
Когда робот Googlebot сканирует эту страницу и
извлекает тег или заголовок, Google полностью удалит эту страницу из результатов поиска Google,
независимо от того, ссылаются ли на него другие сайты.
noindex было эффективным, страница
или ресурс не должен быть заблокирован файлом robots.txt, и он должен быть в противном случае
доступным для поискового робота. Если страница заблокирована
robots.txt или сканер не сможет получить доступ к странице, сканер никогда не увидит noindex правило, и страница все еще может отображаться в результатах поиска, например
если на него ссылаются другие страницы. Использование noindex полезен, если у вас нет root-доступа к вашему серверу, так как
позволяет контролировать доступ к вашему сайту на постраничной основе.
Есть два способа реализовать noindex : как тег и
как заголовок ответа HTTP.
Они имеют тот же эффект; выбрать метод, который больше
удобно для вашего сайта и соответствует типу контента. Указание правило noindex в файле robots.txt не поддерживается Google.
Вы также можете комбинировать правило noindex с другими правилами, управляющими индексацией. За
Например, вы можете объединить подсказку nofollow с правилом noindex : .
<мета> тег Чтобы запретить индексацию всеми поисковыми системами , которые поддерживают правило noindex странице вашего сайта, разместите следующие тег в раздел вашей страницы:
Чтобы запретить только поисковым роботам Google индексировать страницу:
Имейте в виду, что некоторые поисковые системы могут интерпретировать noindex правила разные.
В результате возможно, что ваша страница может
по-прежнему появляются в результатах других поисковых систем.
Узнайте больше о теге noindex .
Если вы используете CMS, например Wix, WordPress или Blogger , возможно, вы не сможете редактировать
ваш HTML напрямую, или вы можете предпочесть этого не делать. Вместо этого ваша CMS может иметь поисковую систему.
страницу настроек или какой-либо другой механизм, сообщающий поисковым системам о мета-тегах .
Если вы хотите добавить на свой веб-сайт метатег , выполните поиск инструкций.
о модификации вашей страницы на вашей CMS (например,
найдите «wix добавить метатеги»).
Вместо тега вы можете вернуть X-Robots-Tag Заголовок HTTP со значением noindex или none в вашем ответе.
Заголовок ответа можно использовать для ресурсов, отличных от HTML, таких как PDF-файлы, видеофайлы и изображения.
файлы. Вот пример HTTP-ответа с X-Robots-Tag 9.0004 заголовок
указание поисковым системам не индексировать страницу:
HTTP/1.1 200 ОК (...) X-Robots-Tag: noindex (...)
Узнайте больше о заголовке ответа noindex .
Отладка
noindex проблемы Нам нужно просканировать вашу страницу, чтобы увидеть тега и заголовки HTTP. Если
страница по-прежнему отображается в результатах, возможно, это связано с тем, что мы не сканировали страницу с
вы добавили noindex правило. В зависимости от важности страницы на
Интернет, роботу Googlebot может потребоваться несколько месяцев, чтобы повторно посетить страницу.
Вы можете запросить, чтобы Google
пересканировать страницу с помощью
Инструмент проверки URL.
Если вам нужно быстро удалить страницу вашего сайта из результатов поиска Google, см. документация об увольнении.
Другая причина также может заключаться в том, что файл robots.txt блокирует URL-адрес из сети Google. сканеры, поэтому они не могут видеть тег. Чтобы разблокировать свою страницу от Google, вы должны отредактируйте файл robots.txt. Вы можете редактировать и тестировать файл robots.txt с помощью robots.txt Тестер орудие труда.
Наконец, убедитесь, что правило noindex видно Googlebot. Чтобы проверить, если ваш noindex реализация правильная, используйте
Инструмент проверки URL
чтобы увидеть HTML-код, полученный роботом Googlebot при сканировании страницы.
Вы также можете использовать
Отчет об индексации страниц
в Search Console, чтобы отслеживать страницы вашего сайта, с которых робот Googlebot извлек noindex правило.
Таксономист-случайник: тегирование или индексирование
Я уже писал в блоге о разнице между тегами и категориями, но недавно кто-то спросил меня о разнице между тегами и индексацией (вручную). Это не простой ответ.
Одним из важных различий между маркировкой и индексированием является то, что маркировка включает в себя любое обозначение части контента, что это или что это о , в то время как индексирование ограничивается описательными метками для того, что контент представляет собой около . Теги могут включать тип контента, дату, создателя, источник, аудиторию, местоположение, права, ключевые слова и т. д., тогда как индексирование предназначено для тем контента. В этом смысле тегирование — это что-то вроде современного слова для каталогизации или присвоения метаданных.
Но что, если нас интересует только описательная маркировка содержимого, а не другие метаданные? Это можно назвать тегированием или индексацией.
В данном случае разница более тонкая и в определенной степени историческая.
Когда я впервые занялся этой областью в начале 1990-х годов, понятие «маркировка» еще не было известно. С другой стороны, индексирование было признанным видом деятельности. Существует два вида индексирования:
1) Закрытое индексирование или предварительное индексирование, когда индекс создается исключительно на основе понятий, содержащихся в одной монографии, а индекс создается для этой одной монографии и затем завершается. ("закрыто").
2) Открытое индексирование, или то, что тогда называлось индексированием базы данных, при котором индексные термины, взятые из контролируемого словаря или тезауруса, назначаются нескольким отдельным документам или цифровым больше документов с течением времени.
Затем, с появлением социальных сетей, стала популярной «метка» в виде присвоения ключевых слов и имен фотографиям, сообщениям в блогах или другому цифровому контенту. Изначально тегирование явно отличалось от индексации, потому что:
1) При тегировании не использовался контролируемый словарь (также известный как тезаурус или таксономия)
2) При тегировании использовались создатели и потребители контента, а не обученные индексаторы.
«Индексатор» — это профессия; "тагер" - нет.
Индексирование также отличается от тегирования тем, что получается в результате. Если мы посмотрим на происхождение слова «указательный», оно означает указывать или указывать (как с указательным пальцем). Таким образом, результатом индексации является «указатель», который пользователь может просмотреть, чтобы найти ссылочный (если в печатном виде) или связанный (в электронном виде) контент. Тезаурус/таксономия и индекс (структурированный список терминов, которые использовались для индексации) могут быть по существу одним и тем же. Иногда просматривается не весь индекс, а только его часть с помощью функции прокрутки с опережением ввода. С другой стороны, тегирование из-за отсутствия контролируемого словарного запаса не приводит к созданию какого-либо произведения, а только к фольксономии, которая из-за множества терминов с одинаковым или перекрывающимся значением не подходит для просмотра. При отображении теговые термины отображаются по популярности, например, в облаке тегов, что является интересным, но не точным методом поиска и извлечения контента.
Со временем корпоративное программное обеспечение переняло методы, пользовательские интерфейсы и функции социальных сетей. Как следствие, тегирование стало более формализованным как задача сотрудников, а фолксономии были отредактированы в контролируемые словари или таксономии, если не по крайней мере стали источниками терминов таксономии. Таким образом, теперь теги можно делать с контролируемым словарем или без него, и теги делают как потребители, так и профессиональные редакторы/контент-менеджеры (если не «теггеры»).
«Теги» и «пометки» теперь также обозначаются функциями программного обеспечения для управления контентом и цифровыми активами, а редакторы контента «помечают» терминами из контролируемого списка. Таким образом, различия между «индексированием» и «тегированием» стали размытыми, и то, как называется эта деятельность, может зависеть от поставщика программного обеспечения, отрасли (издательство может предпочесть называть это индексированием, тогда как электронная коммерция называет это тегированием) и корпоративная культура предпочитает называть это.

