Приветствую вас, друзья!
Продолжаем готовить наши сайты к продвижению. На прошлом уроке мы создали файл , а сегодня наша цель — создать файл sitemap, по-другому «карта сайта».
Sitemap.xml — это файл, где указываются страницы подлежащие индексированию с определенным приоритетом для .
С одной точки зрения sitemap.xml вообще не нужен: робот и сам прекрасно справляется со своей работой. Но если посмотреть с другой стороны, то карта сайта действительно нужна. Все дело в том, что одни страницы имеют гораздо большее значение, нежели другие. И в первую очередь робот должен проиндексировать важные страницы, а потом другие.
Файл Sitemap.xml позволяет указать роботу, какие страницы нужно индексировать первыми, а какие последующими. С этой точки зрения карта сайта нужна. Поэтому и выходит этот урок.
Ну что? Погнали!
Чтобы полностью понять зачем нужна карта, давайте поговорим об . Если говорить в простой и понятной для всех форме, то процес выглядит так:
Представьте такую ситуацию: вам нужно что-то найти в книге по физике и вы пошли в библиотеку, чтобы найти там ту самую книгу. Пришли и нашли, открыли ее. После этого, начинаете искать нужную вам информацию без какого-либо ориентирования. Таким образом, листая книгу, вы начали воспринимать всю информацию, какая там только есть, то есть индексировать.
Примерно так выглядит процесс индексации. Вы, как робот, начали просматривать все, что только есть в книге и запоминать, хотя большая часть из содержания имеет второстепенное значение. Чтобы быстро ориентироваться по книге, предусмотрено содержание: страница с названиями глав и номерами страниц (ссылки). Файл Sitemap.xml, как раз-таки, является неким содержанием, но только для поискового робота.
Создать карту сайта можно, используя специальные онлайн-генераторы, которых пруд пруди в Интернете. А для тех, чьи сайты работают на CMS, можно использовать плагины (блог работает на WordPress, я использую плагин Yoast SEO).
Есть и те, кто хочет написать сам Sitemap.xml, следующая часть урока именно для вас. Но сначала я хочу, чтобы вы скачали редактор Notepad ++, в этом редакторе можно сохранить файл в формате.xml:
Теперь подробнее остановимся на значениях в теге
Остановимся на приоритете подробнее. Не нужно указывать высокий приоритет для каждой страницы в sitemap.xml. Он указывается исключительно относительно страниц, указанных в файле. То есть, если в карте сайте страница site.ru/1.html имеет приоритет 1 (высокий), а страница site.ru/2.html имеет приоритет 0.5, то site.ru/1.html будет проиндексирована первой, а вторая страница, соответственно, второй. Таким образом, тег
Вывод : для продвигаемых страниц ставьте приоритет 1, для других, менее важных, значения ниже.
Залить sitemap.xml нужно в корень папки сайта!
Карта сайта должна быть доступна по адресу: http://site.ru/sitemap.xml
Если по этому адресу карта не доступна, то вы залили ее не туда!
С тем, как создать файл sitemap.xml мы разобрались, теперь поговорим об ограничениях в файле:
Иногда случается так, что в один файл не вмещается вся информация, в этом случае поможет индексный файл.
Индексный файл — это тот же sitemap.xml, в котором указываются ссылки на карты сайта, которые мы создавали чуть выше.
После добавления файл попадает в очередь на обработку. Робот загрузит его в течение двух недель. Каждый добавленный файл, в том числе вложенный в файл индекса Sitemap , обрабатывается роботом отдельно.
После загрузки напротив каждого файла вы увидите один из статусов:
Статус | Описание | Примечание |
---|---|---|
«OK» | ||
«Редирект» | Удалите редирект и сообщите роботу об обновлении | |
«Ошибка» | Файл сформирован неправильно | сообщите роботу об обновлении |
«Не проиндексирован» | Проверка ответа сервера |
|
Disallow | сообщите роботу об обновлении |
Статус | Описание | Примечание |
---|---|---|
«OK» | Файл сформирован правильно и загружен в базу робота | Напротив файла отобразится дата последней загрузки. Проиндексированные страницы появятся в результатах поиска в течение двух недель |
«Редирект» | Указанный URL перенаправляет на другой адрес | Удалите редирект и сообщите роботу об обновлении |
«Ошибка» | Файл сформирован неправильно | Нажмите ссылку Ошибка , чтобы узнать подробности. После внесения изменений в файл сообщите роботу об обновлении |
«Не проиндексирован» | При обращении к Sitemap сервер возвращает HTTP-код, отличный от 200 | Проверьте, доступен ли файл для робота с помощью инструмента Проверка ответа сервера , указав полный путь к файлу. Если файл недоступен, обратитесь к администратору сайта или сервера, на котором он расположен. |
Доступ к файлу запрещен в robots.txt с помощью директивы Disallow | Разрешите доступ к Sitemap и сообщите роботу об обновлении |
Если вы изменили добавленный в Яндекс.Вебмастер файл Sitemap , его не надо удалять и загружать снова - робот регулярно проверяет файл на обновления и ошибки.
Чтобы ускорить обход файла, нажмите значок . Если вы используете файл индекса Sitemap , можно запустить обработку каждого перечисленного в нем файла. Робот загрузит данные в течение трех дней. Использовать функцию можно до 10 раз для одного хоста.
Когда вы израсходуете все попытки, следующая будет доступна через 30 дней после первой. Точная дата отображается в интерфейсе Вебмастера.
В интерфейсе Яндекс.Вебмастера можно удалить те файлы, которые были добавлены на странице Файлы Sitemap : Если для Sitemap была добавлена директива в файле robots.txt , удалите ее. После внесения изменений информация о Sitemap пропадет из базы робота и Яндекс.Вебмастера в течение нескольких недель.
Статья обновлена!
XML карта – это путеводитель по вашему сайту. Этот путеводитель создается специально для поисковых роботов и помогает им найти все страницы, которые нужно проиндексировать.
XML карта находится в корне вашего сайта и обычно доступна по адресу site.ru/sitemap.xml . Роботы узнают о ее существовании двумя путями (которые не взаимоисключают, а взаимодополняют друг друга):
Прежде всего, карта сайта содержит список страниц сайта – это обязательно. Также она может содержать параметры этих страниц , такие как:
Карту сайта можно сделать самому вручную, но согласитесь, зачем тратить на это время, если есть бесплатные онлайн генераторы XML карт? Ниже я рассмотрю некоторые из них.
Один из самых простых в использовании сервисов генерации XML карты. Здесь достаточно указать только адрес сайта и нажать кнопку «Создать». Но такая простота является и минусом: в карту включаются и ссылки на картинки, и динамические адреса страниц.
Тут есть ограничение 5 раз в сутки с одного IP. Учитывает тег noindex. Также можно указать запрещенные к обходу пути в виде конкретных адресов страниц. Мне кажется, это не очень удобно, особенно, если таких страниц много. При генерации XML карты этот тул включает ссылки на картинки.
Учитывает директивы в robots.txt, noindex, пропускает ссылки с атрибутом nofollow. Также присутствует функция фильтра данных, которая позволяет убрать из карты страницы с определенными частями в адресе (например, .jpg). Правда, в бесплатной версии доступен только один такой фильтр. Также бесплатная версия позволяет загружать максимум 500 страниц и генерировать 3 XML карты в день с одного IP адреса.
Бесплатная версия этого генератора ограничивает количество страниц до 500. Полезная функция – исключение динамических параметров при генерации XML карты. Лично мне этот тул понравился тем, что он по умолчанию не включил картинки, когда я его тестила.
Здесь с одного IP адреса можно генерировать одну XML карту в день. Как и предыдущий сервис, этот позволяет исключать урлы с указанными параметрами, а также по умолчанию не добавляет ссылки на картинки. Примечательно, что этот сервис позволяет включать и поддомены в XML карты, единственное условие: эти поддомены должны быть добавлены в Google Webmaster Tools. Обратите внимание, что в бесплатной версии адрес сайта нужно вводить без слэша “/”. Этот сервис также помогает , так что после генерации карты появляется 2 ссылки на скачивание: на саму XML карту и на список битых ссылок, найденных при ее генерации.
После генерации карты, стоит ее проверить: не остались ли там лишние страницы, которые не нужны в индексе (например, те, которые исключены в robots.txt). Правильность составления карты можно проверить с помощью специального
Создать Sitemap xml (карту сайта) необходимо для улучшения индексации сайта поисковыми системами. Существует приличное количество программ и онлайн инструментов, сервисов в Интернете, позволяющих быстро создать sitemap.
Наиболее удобным из них я считаю бесплатный онлайн генератор - бесплатно до 500 страниц, чего вполне достаточно для молодых сайтов. Назначение остальных форматов sitemap: xml.gz, html - опишу ниже.
Почему я выбрал этот англоязычный сервис, если есть аналогичные на русском языке? Потому что на нём не требуется регистрация, а в файлах sitemap нет ошибок, как на других. Всё делается в два этапа и очень быстро. Вводим адрес сайта, выбираем частоту обновления сайта, например: Weekly (еженедельно) и жмем «Start». Всё. Остальные параметры можно не менять.
Через несколько секунд получаем такой список и просто щелкаем по нужному файлу sitemap - он молниеносно загружается на ваш компьютер. Нижняя ссылка позволит получить zip-архив со всеми видами sitemap:
Справа в окошке - дополнительная информация, обратите внимание: время создания - 25 секунд, а последняя строчка - отсутствие ошибок. Сервис поддерживает отправку карты сайта в Инструменты для веб-мастеров Google, а для Pro-аккаунтов - в Яндекс Вебмастер. Поясню насчёт «необязательных» настроек, в некоторых случаях они могут быть востребованы:
Готовый sitemap требуется поместить в корневую папку сайта, там, где находится index.html. Рекомендую не ограничиваться файлом xml и использовать также sitemap в более сжатом формате xml.gz, что будет актуальным для всех поисковых систем. А в файле Robot.txt пропишите следующие строчки (или одну), изменив доменное имя на своё:
Sitemap: http://сайт/sitemap.xml..xml
Для чего нужен sitemap? Объясню на примере карты сайта html. Изначально нужно исходить из того, что сайт должен иметь понятную структуру, а любая значимая страница находиться не далее чем в 2-х кликах от главной. На практике этого добиться непросто: структура получается сложной, а вложенность страниц многоуровневой (для больших сайтов).
Если создать sitemap, то пользователь получает возможность в два шага попасть на любую страничку, а задача становится решена. Этой же возможностью воспользуются пауки поисковых систем. А sitemap XML позволяет паукам проиндексировать новые страницы за один шаг. Поясню: спайдеры ПС находят новые страницы по ссылкам с уже проиндексированных.
Приведу, на всякий случай, еще один бесплатный сервис: Sitemapgenerator . Он русскоязычный, поддерживает отправку sitemap на поисковые системы, что идёт ему в плюс. А в минус: требуется регистрация, очередь на бесплатную генерацию - задержка по времени, и возможны ошибки, хотя на XML-Sitemaps - их нет.
Представлю ещё бесплатную программу SiteMap Generator , которая позволит быстро создать sitemap в нескольких форматах, показывает файл Robots.txt и битые ссылки, ведущие в «никуда».
Наличие этого файла подсказывает поисковым роботам, как именно организована структура сайта. Соответственно, Яндекс, Google, Bing и другие поисковики получают возможность более качественно индексировать Интернет-проект.
В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Вместе с тем использование Карты сайта может заметно ускорить процесс полной индексации, особенно если:
Во всех этих случаях всеобъемлющая индексация сайта поисковыми системами может оказаться под вопросом, если своевременно не позаботиться о файле Sitemap.
К созданию Карты сайта выдвигается несколько основных требований, о которых веб-мастер должен всегда помнить.
Во-первых , количество URL-адресов в файле Sitemap не должно превышать 50 тысяч единиц. Если их больше, то необходимо создать несколько отдельных Карт сайта, которые прописываются в файле индекса Sitemap .
Во-вторых , максимальный размер файла – 10 Мб. Если несжатый файл превышает этот размер, его можно уменьшить при помощи архиватора gzip .
В-третьих , файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.
В-четвертых , составление Карты сайта предполагает использование кодировки UTF-8, а также латинских букв и цифр.
В-пятых , ответом сервера на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.
Особое требование предъявляется к формату файла Sitemap. Так, Карта сайта может быть создана в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. При этом наиболее распространенным форматом, который распознают все поисковые системы, считается XML-файл. С его помощью поисковикам можно сообщить не только о правильном местоположение страницы в иерархии сайта, но и:
Пример Карты сайта в формате XML для сайт, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:
При желании составить Карту сайта можно самому (вручную), что, впрочем, выглядит весьма трудозатратной затеей. Поэтому лучше создавать файл Sitemap автоматически, обратившись к услугам бесплатных онлайн-сервисов таких, как этот или этот .
После того, как Карта сайта готова, файл необходимо определить в корневую директорию. В этом случае ссылка, указывающая поисковым системам путь к файлу Sitemap, может быть следующей: http://www..xml
Чтобы о новом файле Sitemap как можно быстрее узнали поисковые роботы, веб-мастеру необходимо внести изменения в , прописав в нем особую директиву, указывающую точный маршрут к Карте сайта:
Sitemap: http://www..xml
Кроме того, готовый файл Sitemap проверяется на наличие ошибок и добавляется в Яндекс или Гугл при помощи Яндекс.Вебмастера или Google Search Console .
Подводя итог, необходимо отметить, что наличие у веб-ресурса правильно составленной Карты сайта не является 100%-ной гарантией индексации абсолютно всех его страниц. Данный файл – всего-навсего серьезная подсказка поисковикам, как тщательнее просканировать ваш сайт.