Сайт о телевидении

Сайт о телевидении

» » Когда не обойтись без noindex и nofollow. Используем rel=nofollow и noindex для Yandex

Когда не обойтись без noindex и nofollow. Используем rel=nofollow и noindex для Yandex

Статья для тех, кому лень читать справку по GoogleWebmaster и ЯндексВебмастер

Закрывание ненужных страниц веб-ресурса от поисковой индексации очень важно для его SEO-оптимизации, особенно на начальном этапе становления сайта или блога «на ноги». Такое действие способствует продвижению в и рекомендовано к применению для служебных страниц. К служебным страницам относятся технические и сервисные страницы, предназначенные исключительно для удобства и обслуживания уже состоявшихся клиентов. Эти страницы с неудобоваримым или дублирующим контентом, который не представляет абсолютно никакой поисковой ценности. Сюда входят - пользовательская переписка, рассылка, статистика, объявления, комментарии, личные данные, пользовательские настройки и т.д. А, также - страницы для сортировки материала (пагинация), обратной связи, правила и инструкции и т.п.
  • Метатег robots
  • Метатег robots

    Для управления поведением поисковых роботов на веб-странице, в существует метатег robots и его атрибут content. закрытия веб-страницы от поисковой индексации,

  • Метатег robots
  • Почему метатег robots лучше файла robots.txt
  • Мета-теги позволяют указывать метаданные о странице сайта. Ряд мета-тегов также используется роботами поисковых систем.

    Робот Яндекса учитывает содержимое следующих мета-тегов:

    • - может учитываться при определении соответствия страницы поисковым запросам;
    • - содержание данного тега может использоваться в сниппетах (описаниях сайтов на странице результатов поиска);

      Примечание. Зачастую мета-тег Description создается автоматически, повторяет содержимое элемента title и не ориентирован на удобство для пользователей поисковой системы. Наличие мета-тегов с некачественным содержанием может стать причиной удаления страницы из результатов поиска .

    • . Подробнее см. в разделе Мета-тег robots и HTTP-заголовок X-Robots-Tag .
    • - используется для адаптации сайта к показу на мобильных устройствах . Позволяет контролировать масштабирование окна просмотра в браузере. Значение width=device-width адаптирует ширину окна просмотра к экрану устройства. Значение initial-scale=1 позволяет обеспечить соотношение 1:1 между пикселями CSS и независимыми пикселями устройства.

      Если мета-тег отсутствует, мобильные браузеры по умолчанию показывают страницу для экрана компьютера. Так как ширина экрана мобильного устройства значительно меньше экрана компьютера, браузеры пытаются оптимизировать содержание - увеличивают шрифт, масштабируют содержание по размеру экрана или показывают только часть контента, которая помещается на экране.

    • - робот может учитывать этот тег при определении типа документа и его кодировки;
    • - перенаправление (редирект) пользователя на страницу с адресом URL, после N секунд нахождения на данной странице. При небольших значениях N считается временным перенаправлением, аналогичным серверным редиректам с HTTP-кодом 302/303/307.

    Элемент noindex

    Используйте элемент noindex для запрета индексирования служебных участков текста. Чтобы закрыть от индексирования конфиденциальную информацию, используйте:

    • директиву Disallow в файле robots.txt ;
    • директиву noindex в мета-теге robots ;
    • авторизацию на сайте.

    Элемент noindex не чувствителен к вложенности - может находиться в любом месте HTML-кода страницы.

    При необходимости сделать код сайта валидным возможно использование тега в следующем формате:

    текст, индексирование которого нужно запретить

    Атрибут rel со значением nofollow элемента a

    Атрибут работает аналогично мета-тегу со значением nofollow , но распространяется только на ссылку, для которой указан.

    Атрибут rel со значением canonical элемента link

    Если на сайте присутствуют группы схожих по контенту страниц, вы можете указать для каждой группы предпочитаемый (канонический) адрес, который будет участвовать в поиске. Например, страница доступна по двум адресам:

    Www.example.com/pages?id=2\nwww.example.com/blog

    Если предпочитаемый адрес - /blog , это нужно отразить в коде страницы /pages?id=2 :

    Также если на странице атрибут rel=\"canonical\" расположен с указанием непосредственного адреса этой страницы, робот посчитает ее канонической. Данная страница будет индексироваться и появится в поисковой выдаче Яндекса.

    Например, робот может не использовать указанный вами адрес, если:

      Документ по каноническому адресу недоступен для индексирования.

      В качестве канонического адреса указывается URL в другом домене или поддомене. Сайты, доступные по адресам с префиксом www и без него, а также по протоколам HTTP и HTTPS, рассматриваются как разные ресурсы, если они не объединены в группу зеркал .

      Вы указали несколько канонических адресов.

    Также не рекомендуем создавать цепочки канонических адресов. Например: для адреса example.com/1 каноническим адресом является example.com/2 , в то время как для адреса example.com/2 указан канонический адрес example.com/3 .

    Начнем с того, что обозначим разные способы использования noindex и nofollow:

    • Тег и атрибут
    • Метатеги и
    Тег и атрибут

    Тег – это HTML-тег, который запрещает Яндексу индексировать ту или иную область страницы сайта. Для поисковой системы Google этот тег не работает, более того, в Google вообще не предусмотрена возможность исключения части текста страницы из индекса.

    Заблуждение №1. Основная ошибка людей, которые используют этот тег, заключается в убеждении, что если часть какого-либо текста помещена между открывающимся и закрывающимся тегом , то робот Яндекса не станет читать и анализировать этот текст.

    Единственное, что данный тег запрещает – это помещение содержимого в индексную базу, но это содержимое в любом случае будет прочитано и проанализировано роботом.

    Пример: На странице вашего сайта расположен некоторый текст, использующий прямые вхождения предложений из других сторонних источников. Следовательно, эти предложения снижают уникальность вашего текста, а вам необходимо, чтобы уникальность была 100%. Вы решаете закрыть эти предложения тегом , чтобы Яндекс считал ваш текст уникальным. Это заблуждение.

    Абсолютно весь текст вашей страницы будет прочитан и обработан роботом, и ему будет известно, что текст вашей страницы не является уникальным.

    Сама суть тега – «не индексировать», значит запрета на чтение нет.

    Предположим, что поисковый робот зашел на вашу страницу и начал сканировать содержимое. В какой-то момент робот находит открытие тега , что является сигналом роботу – дальше текст не индексировать. Но чтобы найти то место кода, где тег закрывается, роботу необходимо прочесть содержимое, идущее после открытия данного тега. Следовательно, даже теоретически нельзя запретить роботам читать содержимое с помощью тега .

    Для чего же тогда нужен тег ?

    Он нужен непосредственно для того, чтобы запретить роботу выдавать в выдаче своей поисковой системы какую-либо информацию. Это могут быть, к примеру, контакты, которые по каким-либо причинам не должны отображаться в выдаче.

    Заблуждение №2. Ещё одно заблуждение, которое часто встречается среди владельцев сайтов, – это мнение, что ссылка, помещенная в тег , не будет учтена поисковым роботом. Как я говорил ранее, всё, что находится внутри тега , будет прочитано и проанализировано роботом Яндекса. И ссылки не являются исключением. Единственное отличие размещенных обычным образом ссылок от ссылок в теге – это то, что текст (анкор) ссылки не будет проиндексирован.

    На помощь вебмастерам, которым необходимо, чтобы робот всё же не учитывал ссылки со страниц, приходит атрибут , который работает как для Яндекса, так и для Google. При использовании этого атрибута ссылка всё равно будет изучена роботом и по ней будет произведён переход, но без nofollow по ссылке будет передан вес адресату, а с nofollow вес будет сгорать.

    Пример 1:
    Создание и продвижение сайтов

    Яндекс не индексирует анкор, но учитывает ссылку на сайт и передает по ней вес

    Пример 2:
    Создание и продвижение сайтов

    Яндекс не индексирует анкор и не передает вес по ссылке на сайт

    Существует два способа написания тега в коде:

    1.

    2. Текст, запрещённый к индексированию

    Второй вариант более верный. Так как тег не входит в официальную спецификацию языка разметки HTML, то его присутствие в коде может вызвать недопонимание у других поисковых систем, которые будут считать его наличие за ошибку. Чтобы сделать код страницы валидным, для всех поисковых роботов рекомендуется использовать закомментированный вариант написания. Яндекс такое написание распознает, а другие поисковые роботы не будет обращать внимание на его присутствие.

    Метатеги и

    Использование метатега noindex в коде страницы запрещает Яндексу (Google, опять же, в данном случае не участвует) индексировать всё текстовое содержимое страницы, ссылки при этом будут проанализированы в полной мере. То есть наличие в коде страницы этого метатега не равнозначно закрытию страницы от индекса в robots.txt.

    Наличие в коде страницы метатега nofollow запрещает поисковым системам индексировать ссылки на страницах. Переходить по ссылкам со страницы при наличии этого метатега роботы также не будут. Но вот что написано в помощи Яндекса :
    «Робот не посетит документы, если ссылки на них стоят со страницы, содержащей метатег со значением nofollow, тем не менее, они могут быть проиндексированы, если в других источниках на них указаны ссылки без nofollow»

    Подведём итоги

    Тег используем только для того, чтобы запретить роботам Яндекс выдавать информацию в выдаче.

    Если мы хотим, чтобы вес ссылки не передавался адресату, то используем атрибут nofollow. При этом не забываем, что робот всё равно может пройти по ссылке (если информация о ней получена из других источников: карта сайта, ссылки) и проанализирует страницу, на которую она ссылается. Метод работает как для Яндекс, так и для Google.

    Доброго времени суток, уважаемые читатели. Часто сталкиваюсь с тем, что у многих начинающих вебмастеров и блоггеров полная каша в голове по поводу использования noindex и nofollow. Давайте разберемся что это такое, с чем едят и расставим все точки над i.

    Стоит начать с того, чтобы в дальнейшем у вас никогда не было путаницы в голове, что и noindex и nofollow используют в двух относительно разных значениях в web-документе.

    Первое – это внутри мета-тега ROBOTS (не путайте с файлом robots.txt) в значении атрибута content. Данный мета-тег имеет отношение ко всему документу в целом. Второе, используется только nofollow – внутри тега и имеет отношение к конкретной ссылке. Про тег noindex немного другая история, и о ней мы также сегодня поговорим. Стоит также отметить, что я буду рассматривать использование nofollow и noindex только в двух поисковых системах – Яндекс и Google.

    NOINDEX и NOFOLLOW в мета-теге ROBOTS

    Мета-тег robots отвечает за всю страницу целиком. Через данный мета-тег можно запрещать или разрешать индексировать контент страницы.

    Noindex отвечает за запрет индексации текста на странице.

    Nofollow отвечает за запрет индексации ссылок на странице.

    Используются данные значения следующим образом:

    что означает – данную страницу нельзя индексировать вообще.

    Могут быть и такие значения:

    можно индексировать контент, но игнорировать ссылки на странице, т.е. не индексировать их.

    Более подробно про мета-тег robots вы можете прочитать в моей статье .

    NOFOLLOW в ссылках

    Nofollow используется как значение атрибута rel в теге . И отвечает за индексацию каждой конкретной ссылки на странице.

    Атрибут rel показывает отношение данного документа к документу, на который ссылается.

    В данном случае, указывая атрибуту rel значение nofollow, мы просим поисковую систему не переходить по внешней ссылке, а также подчеркиваем то, что мы не отвечаем за содержание, на которое ссылаемся.

    По ссылкам, оформленным с данным значением, не передается авторитет нашей страницы, другими словами не передается тИЦ и Page Rank. Однако стоит также учитывать и то, что в случае с PR вес все же уходит, но не на сайт, на который мы ссылаемся, а в никуда в прямом смысле этого слова. По поводу тИЦ точной информации о том, уходит вес или остается на сайте - нет.

    Остановимся подробнее на распределении и передаче веса в Google.

    Итак, абсолютно не важно, сколько ссылок у вас имеют атрибут , а сколько без него. Если на странице стоит 10 ссылок, то каждая ссылка получит часть авторитета вашей страницы, и каждая из них передаст этот вес, но если в одном случае вес передастся на конкретный сайт, то в другом случае – вес просто уйдет в никуда.

    Давайте представим немного, как видит всемирную паутину поисковая система. Все сайты связаны между собой ссылками, абсолютно все. Первый ссылается на второй, второй на третий … тысячный на тысяча первый и миллион какой-то в итоге обязательно будет ссылаться на первый.

    Таким образом цепочка замыкается, все сайты находятся в цикле, и вес, который передает первый сайт всегда возвращается к нему через сотни и тысячи других сайтов. Также не забываем, и я уже писала об этом в , что этот вес передается не единожды, а постоянно, при этом с течением времени вес становится только больше, все сильнее увеличивая свой авторитет. Именно на этом принципе строится перелинковка сайта.

    Теперь представим, что первый сайт закрыл свои ссылки атрибутом . Вес не перейдет на второй сайт, а утечет в никуда, и второй сайт не получит ту часть веса, которую должен был, не сможет передать его дальше по цепочке, и в итоге, пройдя весь цикл, Х-какой-то сайт, который должен был передать вес на первый сайт, передаст его в значительно меньшем количестве, чем мог бы. Итак, каждый раз не получая ту часть веса, которую вы самостоятельно пускаете в никуда, закрывая свои ссылки атрибутом , сайт не может передать вам ее, из чего следует, что закрывая свои ссылки, вы сами лишаете себя увеличения веса, и такого показателя, как PR.

    Чтобы было проще это понять, представим, что каждая ссылка передает вес, равным единице.

    Таким образом, если первый сайт не закрыл ссылку атрибутом , то в конце цикла получит больший вес от входящих ссылок, чем в случае, если исходящие ссылки будут закрыты.

    Закрывать ссылку невыгодно, если вы действительно, по настоящему рекомендуете своим читателям статью, на которую ссылаетесь, свою страничку в социальной сети, на свою ленту RSS. Глупо закрывать ссылки на свои же страницы в социальных сетях, когда рекомендуете своим читателям подписаться на обновления блога через них. Ведь это же ваши собственные страницы, ваша собственная RSS лента, в которой транслируется ваше же содержание. Разве вы сами не отвечаете за него?

    Но есть ситуации, когда действительно необходимо закрывать ссылки значением nofollow. Обратимся к источникам, Яндекс и Google, что они говорят по этому поводу?

    Дополнительно к этому Google рекомендует обозначать продажные ссылки атрибутом . Также Google пишет, что с помощью nofollow мы можем указать роботу на закрытые разделы нашего сайта, но уточняет, что есть и другие способы указывать на это.

    Также мне хотелось бы уделить внимание ещё одному моменту. Некоторые ярые борцы за закрытые ссылки ставят не только в самих ссылках, т.е. в теге , но и везде, на что только хватает фантазии. И в теге , и , и в теге .

    Давайте не будем выдумывать свои собственные стандарты, а обратимся к существующим, которые разрабатывает международная организация W3C.

    Значение можно использовать только в теге , и в других тегах его использовать нельзя!

    Итак, мы выяснили, когда стоит пользоваться атрибутом ссылки , а когда это не целесообразно. Также мы больше не будем вставлять его никуда, кроме одного единственного тега, обозначающего ссылку. Теперь уделим внимание тегу noindex.

    NOINDEX – рудимент от Яндекса

    Когда-то Яндекс не понимал значение nofollow, и поэтому придумал свой собственные тег

    что-то внутри

    для того, чтобы можно было закрывать неугодные ссылки с его помощью. Все, что находилось внутри данного тега игнорировалось роботом Яндекса. Но с тех пор утекло немало воды, Яндекс повзрослел и начал понимать атрибут . Случилось это ещё весной 2010 года. Именно тогда тег noindex потерял свое значение в качестве инструмента для закрытия ссылок. Но при этом осталось другое значение – скрывать текстовый контент. Выдержка из раздела Помощь Яндекса :

    Им рекомендуется скрывать служебные участки текста. О каких служебных участках идет речь – не совсем ясно, но совершенно очевидно, что к ссылкам этот тег теперь не имеет никакого отношения. Т.е. получается, если мы поместим ссылку в данный тег:

    Можно смело отказаться от использования данного тега, тем более, учитывая ещё и его невалидность. Ведь по сути такого тега вообще не существует. Как мы знаем, стандарты HTML разрабатывает международная организация W3C, и в спецификации к языку HTML нет такого тега, это полностью выдумка Яндекса.

    Остался ещё один вопрос, на который мне хотелось бы обратить ваше внимание. Часто, когда я пытаюсь объяснить то, о чем написала в данной статье, мне возражают:

    "Я делаю анализ сайта таким-то инструментом, и он показывает мне, что у меня ссылки не закрыты…

    Вы можете верить всем этим инструментам, это ваше полное право, но не лучше ли верить официальной документации поисковиков, и не лучше ли думать собственной головой?

    Удачи в оптимизации сайтов.

    Всем Hello! Сегодня хочу рассказать про теги noindex и атрибут nofollow.

    Тег noindex – что такое?

    Если говорить коротко, то No index запрещает поисковым роботам индексировать какой-либо элемент на сайте. Данный тег не валидный, поэтому многие html-редакторы не воспринимают его. Например, чтобы редактор Wordpress учитывал тег, то необходимо прописать:

    Если прописать в таком формате тег не исчезнет. Еще нужно понимать, что тег noindex актуален только для поисковой системы Яндекс. В Google он никак не учитывается.

    Не путайте тег noindex с атрибутом noindex , который прописывает 1 раз в шапке сайта.

    запрещает индексировать контент внутри этого тега. Что касается meta name=”robots” content=”noindex, nofollow”, он закрывает всю страницу от индексации, но этом я рассказал в данной статье.

    Рассмотрим пример noindex:

    Этот текст не появится в поисковой системе Яндекс

    Также вложенность не столь важна, и тег может располагаться на в любом месте html кода.

    Не забывайте! Если есть открывающий тег , то должен быть и закрывающий