Файл sitemap.xml

18 ноября 2022 года, 22:29

Файл sitemap.xml

Sitemap.xml - это файл в специальном расширяемом формате XML (Extensible Markup Language) с ссылками на страницы сайта и информации о дате, частоте и приоритизации этих страниц. Карта сайта xml нужна для того, чтобы помогать поисковым роботам правильно определять частоту и время изменения страниц.

Зачем нужна sitemap.xml

Sitemap.xml нужна для того, чтобы помогать поисковым ботам быстрее определять изменения страниц сайта. Карта сайта требуется чтобы:

  • ускорить индексацию,
  • переклеивать страницы,
  • указать канонические (основные) страницы,
  • удалить ненужные страницы,

Важно помнить, что карта сайта не гарантирует попадание страницы в индекс поисковых систем, а лишь подсказывает боту частоту изменения и актуальность страниц.

Требования к sitemap.xml

Требования к sitemap.xml обобщенные для yandex и google:

  1. Кодировка UTF-8. Кириллические URL робот Яндекса распознает как в закодированном виде, так и в оригинале;
  2. Максимальное количество ссылок — 50 000;
  3. Максимальный размер файла в несжатом виде — 50 МБ;
  4. Ссылки на страницы только того домена, на котором расположен файл;
  5. Файл должен быть расположен на том же домене, что и сайт, для которого он составлен;
  6. При обращении к файлу сервер должен возвращать HTTP-код 200.

Расположение sitemap.xml

Обычно карту раполагают в корне, с именем sitemap.xml, поэтому, чтобы найти карту достаточно ввести в адресной строке:

https://seobut.com/sitemap.xml

Однако, ограничений на название и расположение для xml карты нет, поэтому некоторые веб-мастеры могут расположить карту по случайному адресу со случаным именем. Если требуется найти xml карту на чужом сайте, можно проверить файл robots.txt, в котором обычно указывается полный адрес. Других способов найти xml с кастомным расположением или названием на чужом сайте нет.

Теги sitemap.xml

Теги указывают рекомендации для поисковых ботов, которые могут быть как проигнорированы, так и учтены:

Тег Обязательный Описание
loc Да URL-адрес страницы
lastmod Нет Дата последнего изменения страницы
changefreq Нет Частота изменения контента
priority Нет Приоритет относительно других страниц

Если необязательные теги не указаны, поисковые роботы будут индексировать страницы на своё усмотрение.

Тег loc

В теге loc располагается основной url-адрес страницы включая протокол, адрес пишется целиком, без относительных адресов. Для основного адреса сайта: https://seobut.com, в значение тега loc должны попадать страницы вида:

<loc>https://seobut.com</loc>

Для основного адреса сайта с подобным видом url-адресов: http://www.seobut.com/, в значение тега loc должны попадать страницы вида:

<loc>http://www.seobut.com/</loc>

Тег lastmod

Тег lastmod содержит значение, которое подсказывает поисковым ботам дату и время последнего изменения страницы:

<lastmod>2022-06-28T00:43:54+03:00</lastmod>

В данном теге может быть не указано точное время и корректна будет такая запись:

<lastmod>2022-06-28</lastmod>

Тег changefreq

Тег changefreq позволяет указывать частоту изменений контета. Данный параметр определяется примерно и должен отвечать на следующий вопрос: "Как часто меняется указанная страница?". Тег changefreq может содержать следующие значения:

Значение chngefreq Расшифровка
always всегда, постоянно
hourly Часы
daily День
weekly Неделя
monthly Месяц
yearly Год
never Никогда

Тег priority

Тег priority позволяет определять значимость страницы по отношению к другим страницам и может принимать значение от 0 до 1 включительно, тег обычно содержит дробные значения. Приоритетность определяется таким образом, чтобы самые важные для индексации странцы имели большее значение - 1, менее значимые, служебные - 0, например так:

Страница Значение priority
Главная 1
Все статьи/услуги/категории 0.8
Конкретный товар/статья/услуга 1
Страницы тегов/подборок 0.6
Дополнительные страницы 0.4
Служебные страницы 0

Виды sitemap.xml

Карт сайта xml существует 2 основных вида: обычная и индексная. Обычная xml карта сайта содержит адреса страниц. Индексная xml карта содержит в себе адреса на обычные. В индексные карты собирают обычные, когда на сайте более 50000 полезных url-адресов. Именно 50000 url - ограничение, которое выдвигают поисковые системы для одной карты. 

Пример содержимого обычной карты xml

В примере приведена карта сайта, которая содержит в себе адреса на 2 страницы:

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
  <loc>https://seobut.com</loc>
  <lastmod>2022-11-14T14:53:47+03:00</lastmod>
  <changefreq>monthly</changefreq>
  <priority>1</priority>
 </url>
 <url>
  <loc>https://seobut.com/services</loc>
  <lastmod>2022-11-14T15:08:56+03:00</lastmod>
  <changefreq>monthly</changefreq>
  <priority>1</priority>
 </url>
</urlset>

Пример содержимого индексной карты xml

В примере приведена карта сайта, которая содержит в себе адреса на 2 обычные карты xml:

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <sitemap>
  <loc>https://seobut.com/sitemap-general.xml</loc>
  <lastmod>2022-11-14T11:59:41+03:00</lastmod>
 </sitemap>
 <sitemap>
  <loc>https://seobut.com/sitemap-publications-1.xml</loc>
  <lastmod>2022-11-14T11:59:41+03:00</lastmod>
 </sitemap>
</sitemapindex>

Как создать sitemap.xml

Существует 4 способа создания и добавления карты xml:

  • Ручное создание
  • Через online сервисы
  • Через плагины CMS
  • Написать самостоятельно генератор

Создание руками

Создание руками выглядит так:

  1. Открываете любой редактор кода (Напр.: notepad++ (для win), emmet (для macos));
  2. Пишите код, структуру можно взять из статьи;
  3. Сохраняете с расширением xml в кодировке utf-8;
  4. Загружаете полученный файл в корень сайта.

Процесс ручного создания sitemap.xml неблагодарный. Если страницы на сайте постоянно изменяются, тогда придется постоянно следить за актуальностью sitemap.xml. Если же страницы на сайте не будут изменяться, тогда в целом не обязательно иметь sitemap.xml.

Через онлайн сервисы

В онлайн сервисах всё просто, вставляете в поле адрес сайта, для которого требуется сгенерировать карту, создаете, качаете, загружаете в корень сайта.

Через плагины CMS

Генератор своими руками

Сегодня на рынке dev'ops услуг слишком много технологий, перечислить всевозможные варианты просто невозможно. 

Понравилась публикация?

Подпишитесь и получайте лучшие публикации на темы поискового продвижения и маркетинга