Файл sitemap.xml

29 июня 2022 года, 00:02

Файл sitemap.xml

Sitemap.xml - это файл в специальном расширяемом формате XML (Extensible Markup Language) с ссылками на страницы сайта и информации о дате, частоте и приоритизации этих страниц. Карта сайта xml нужна для того, чтобы помогать поисковым роботам правильно определять частоту и время изменения страниц.

Требования к sitemap.xml

Требования к sitemap.xml обобщенные для yandex и google:

  1. Кодировка UTF-8. Кириллические URL робот Яндекса распознает как в закодированном виде, так и в оригинале;
  2. Максимальное количество ссылок — 50 000;
  3. Максимальный размер файла в несжатом виде — 50 МБ;
  4. Ссылки на страницы только того домена, на котором расположен файл;
  5. Файл должен быть расположен на том же домене, что и сайт, для которого он составлен;
  6. При обращении к файлу сервер должен возвращать HTTP-код 200.

Теги sitemap.xml

Теги указывают рекомендации для поисковых ботов, которые могут быть как проигнорированы, так и учтены:

Тег Обязательный Описание
loc Да URL-адрес страницы
lastmod Нет Дата последнего изменения страницы
changefreq Нет Частота изменения контента
priority Нет Приоритет относительно других страниц

Если необязательные теги не указаны, поисковые роботы будут индексировать страницы на своё усмотрение.

Тег loc

В теге loc располагается основной url-адрес страницы включая протокол, адрес пишется целиком, без относительных адресов. Рассмотрим примеры использования директивы loc:

Для основного адреса сайта: https://seobut.com, в значение тега loc должны попадать страницы вида:

<loc>https://seobut.com</loc>

Для основного адреса сайта с подобным видом url-адресов: http://www.seobut.com/, в значение тега loc должны попадать страницы вида:

<loc>http://www.seobut.com/</loc>

Тег lastmod

Тег lastmod содержит значение, которое подсказывает поисковым ботам дату и время последнего изменения страницы:

<lastmod>2022-06-28T00:43:54+03:00</lastmod>

В данном теге может быть не указано точное время и корректна будет такая запись:

<lastmod>2022-06-28</lastmod>

Тег changefreq

Тег changefreq позволяет указывать частоту изменений контета. Данный параметр определяется примерно и должен отвечать на следующий вопрос: "Как часто меняется указанная страница?". Тег changefreq может содержать следующие значения:

Значение chngefreq Расшифровка
always всегда, постоянно
hourly Часы
daily День
weekly Неделя
monthly Месяц
yearly Год
never Никогда

Тег priority

Тег priority позволяет определять значимость страницы по отношению к другим страницам и может принимать значение от 0 до 1 включительно, тег обычно содержит дробные значения. Приоритетность определяется таким образом, чтобы самые важные для индексации странцы имели большее значение - 1, менее значимые, служебные - 0, например так:

Страница Значение priority
Главная 1
Все статьи/услуги/категории 0.8
Конкретный товар/статья/услуга 1
Страницы тегов/подборок 0.6
Дополнительные страницы 0.4
Служебные страницы 0

Понравилась публикация?

Подпишитесь и получайте лучшие публикации на темы поискового продвижения и маркетинга