XML Sitemap

XML Sitemap

Suitable when you need to quickly create a sitemap for a small web site (up to 500) pages.

No registration required and you get sitemaps ready immediately.

You can download xml sitemap file or receive it via email and put it on your website after that.

You are on the online generator home page right now, just enter your website URL using the form above and click “START” to proceed!

PRO Sitemaps

Powerful, yet easy to use

PHP Script

Installable version

We offer a server-side script written in PHP language that you can install on your server and create sitemap for your website.

The script doesn’t have the limit on number of pages included in sitemap, although server resources required to create sitemap depend on the website size.

There are add-ons for it to create images, video and news sitemaps.

* Please note that sitemap generator can be used for own personal website only, i.e. it cannot be used to create sitemaps for 3rd party sites or provided as a service.

We had XML Sitemap for many years and it works perfectly, esay to install easy to use.

Your support it’s just outstanding, thanks!

Keep up the good work

Team | Indian Wedding Studio
www.indianweddingstudio.com

I have been using a ror sitemap that seemed to work well until recently, then Google reported errors on it that I didn’t really understand. I found your online xml sitemap generator, created and submitted the sitemap to Google and within minutes they reported it as ok. I am so pleased, I am going to recommend your website to friends and also in forums.

Strongly recommend this for webmasters who’s managing multiple websites. This tool has literally cut down our work time for around 30 minutes per site. Multiply that with the number of sites we’re managing, that is alot of hours!

It’s also made our job of updating the sitemap alot easier. Thanks for keeping this tool free.

I am using Xml Sitemap for years, the one only reliable sitemap generator, with easy options even a user not having much experience can use it.

Highly recommended tool for website users and seo, thanks keep it up.

Unbelieveable! This was extremely easy to understand–especially for the “not so computer savvy” and the tech support helped me incredibly.

The SAME day my sitemap was submitted to Google by tech support, my site was indexed. I am absolutely thrilled and wish I had found you all sooner!

This is a great service. Does the job, spot on! Very clear with useful advise as well.

Peter Kearney
Quick Move Waste Skip Hire
www.quickmovewaste.ie

Thank you so much for such an easy to use product. I can’t believe I finally found a product that does exactly as promised. I have recommended this to many of my associates that run websites. It is well worth the price.

Hollie Schultz
http://www.babygizmo.com/

Hi, a quick note to say thank you for your excellent online XML Google & Ror sitemap generator. It is so easy to use and implement. Thank you again for such an excellent free service.

Webmaster,
Micrositez Web Design Studio
http://www.micrositez-seo.co.uk/

This is undoubtedly the greatest script to generate sitemaps. Thank you for great service and a great tool that we use for over thirteen million pages.

Todd Dunning
http://www.dunningmarketing.com/

I just wanted to say that your sitemap service is the absolute easiest and most convenient way to create a sitemap that I’ve ever found.

You’ve saved me tons of time. Keep up the good work!

Ideal Eyewear,
http://www.IdealEyewear.net/

This is a great service. Does the job, spot on! Very clear with useful advise as well.

Peter Kearney
Quick Move Waste Skip Hire
www.quickmovewaste.ie

Very impressed by your service. My initial questions were answered in minutes, the installation was speedy and the follow up support is excellent.

James Dunworth
www.ECigaretteDirect.co.uk

I had been struggling to get a site map set up for my web site, using various programs offered by Google.

I downloaded your software and got the necessary .xml file up, working and accepted by Google within 20 minutes of the download!!

David Gibbs,
Twistlink Ltd

XML Standalone PHP Sitemap generator is very easy to install and very easy to use.

Compared to the online version it saves time and we can now create a fully customized HTML sitemap.

Thanks for this great software !

Actium.nl Webmaster
www.actium.nl

Absolutely the best jargon-free, all options – let’s make it work service.

So happy I could get this done easily at the click of a button! This service can give your systems admin a nice coffee break!

Инструкция по работе с sitemap.xml

Для того, чтобы страницы сайта и их содержимое начали ранжироваться — отображаться по запросам пользователей, их должен проиндексировать робот поисковой системы. Когда у ресурса есть карта сайта, Google проще обнаружить адреса страниц.

Из статьи вы узнаете
  1. Что такое карта сайта
  2. Для чего используют карту сайта
  3. Как создать sitemap XML
  4. Правила для создания файла sitemap
  5. Карта сайта для разных типов контента
  6. Карта сайта для мультиязычных сайтов
  7. Как сделать карту сайта видимой для Google
  8. Как проверить sitemap XML на ошибки
  9. Шпаргалка по карте сайта

Что такое карта сайта

Карта сайта или sitemap — это файл, содержащий список URL всех страниц ресурса, которые нужно проиндексировать. Он размещен в корневой папке и в большинстве случаев называется sitemap.xml.

Структура сайта напоминает структуру книги с разделами, подразделами и страницами. Когда читателю нужно что-то найти в учебнике или энциклопедии, он сначала смотрит содержание и находит нужную страницу. Файл sitemap XML выполняет роль содержания на сайте, помогая поисковым роботам обнаружить страницы.

Как посмотреть карту сайта

Содержимое карты сайта доступно не только роботам, но и посетителям сайта. Поскольку список URL обычно размещают в папке с серверными файлами, адрес sitemap состоит из двух элементов — имени сайта и названия карты.

Как посмотреть карту чужого сайта? Возьмем для примера сайт компании Apple и добавим к доменному имени в адресной строке /sitemap.xml.

Читайте также:
Зеленый чай может вылечить ревматоидный артрит

Для чего используют карту сайта

Основная роль sitemap — это навигация робота и направление его к важным URL, чтобы они попали в индекс поисковика.

Важно учесть, что наличие карты не гарантирует индексацию страниц. Также поисковики могут находить URL без карты, например, если на него ведет ссылка с другой веб-страницы. В то же время, Google рекомендует добавлять на сайт список адресов для индексирования.

Как и инструкция по сканированию страниц для роботов — robots.txt, карта сайта — важный атрибут оптимизации. Проверить правильность настроек sitemap можно в инструментах от поисковых систем, на сайтах-валидаторах и на платформах, которые анализируют SEO сайта онлайн.

Когда полезна карта сайта:

Представим себе крупный интернет-магазин или другой многостраничный сайт. При большом количестве страниц робот может пропустить какие-то из них. Карта сайта повышает вероятность попадания важных URL в индекс и, как следствие, появления их в результатах выдачи.

Чтобы новый ресурс начал ранжироваться, нужно помочь поисковику обнаружить его страницы. Если упоминаний URL нет на других страницах в интернете, роботу будет сложнее найти этот URL и проиндексировать.

Создание карты сайта и информирование краулеров о ее наличии ускорит индексацию страниц и их отображение по поисковым запросам.

Для сайта, который уже в индексе, тоже может быть актуально ускорение индексации страниц. Например, новостные и развлекательные порталы постоянно добавляют новые статьи и заинтересованы в том, чтобы пользователи быстрее находили свежие материалы в выдаче.

Также в карте может быть указана дата последнего обновления страницы или периодичность, с которой она обновляется. Таким образом роботы получают информацию, когда нужно повторно индексировать URL.

Как правило, страницы внутри сайта связаны друг с другом. Например, на главной странице находятся ссылки на категории продукции, страницы категорий содержат URL на карточки товара, карточки товара могут ссылаться на страницу про оплату и доставку.

Когда робот находит ссылки на странице, он может переходить по ним, постепенно сканируя больше и больше URL. Если же адрес не связан с другими страницами сайта, краулер сможет его найти благодаря sitemap.

В результатах ранжирования могут участвовать не только страницы сайта, но и их отдельные элементы. Например, в Google есть разделы, где отображаются только картинки или видео.

Картинки и видео, которые видит пользователь на сайте, в коде страниц выглядят как ссылки на файлы. Браузер обращается по этим ссылкам к медиафайлам и отображает визуальный контент на экране. Если создать отдельную карту для таких URL, это обратит внимание роботов на данный тип контента.

Любите продавать?
Держите хостинг для интернет-магазина с гарантированным аптаймом и +30% экономии при годичной оплате

Как создать sitemap XML

XML-файл можно получить, используя инструменты, которые автоматически генерируют список URL на основании страниц сайта, или составить карту вручную.

Автоматическая генерация карты сайта

Есть несколько способов получить готовый sitemap.xml.

Онлайн-сервисы для создания файлов

Это сервисы, которые формируют файлы и фиды по URL сайта, в том числе sitemap. Чтобы запустить генератор, в специальном окне укажите имя домена. Через несколько минут вы сможете скачать готовую XML-карту.

Многофункциональные платформы для SEO-специалистов

Есть сервисы, которые в числе различных инструментов для оптимизации предоставляют опцию для создания карты. Из плюсов — вы можете задать дополнительные параметры для sitemap, например, тип страниц, частоту изменений и приоритет.

Примеры сервисов для SEO, где можно создать карту сайта: SE Ranking, СайтРепорт.

Плагины для систем управления сайтом (CMS)

Разработчики CMS предлагают дополнительные программы для SEO-настроек, включая карту сайта. Плагины автоматически создают файл sitemap.xml и обновляют список URL, когда вы добавляете или удаляете страницы.

Примеры плагинов: All in One SEO Pack и Google XML Sitemap Generator для WordPress, Simple XML sitemap для Drupal, OSMap для Joomla!.

Статья по теме:

Самостоятельное создание файла sitemap

Поскольку есть автоматические сервисы, необходимости составлять список страниц вручную, как правило, нет. Но если вы все-таки хотите создать карту сайта самостоятельно:

  • добавьте в корневую папку на хостинге файл с расширением XML;
  • согласно синтаксису и общим правилам для sitemap перечислите все URL, которые должен проиндексировать поисковик.

Правила для создания файла sitemap

Выделим общие рекомендации поисковых систем для создания карты сайта.

  • Допустимое количество ссылок в карте — до 50 000, а максимальный размер sitemap не более 50 МБ.
  • Ссылка не должна быть длиннее 2048 символов.
  • Все URL должны начинаться с http или https.
  • Ссылки должны быть указаны в формате UTF-8.
  • Кроме XML допустим другой формат sitemap: для Google это файл TXT, RSS, mRSS и Atom 1.0.
  • В sitemap должны быть только канонические URL — страницы, отмеченные как приоритетные из нескольких похожих. Это актуально для сайтов, у которых есть копии страниц, чтобы не допустить попадания в индекс дублей контента.
  • Ссылку на карту сайта можно указать в файле robots.txt — инструкции для роботов, которую они просматривают перед тем, как просканировать ресурс.
  • В списке URL не должно быть страниц с тегом noindex, запрещающим индексацию.
  • В списке URL не должно быть страниц, сканирование которых запрещено в файле robots.txt.

Как разместить карту сайта в файле robots.txt

Перед тем, как добавить страницы в индекс, робот сначала делает обход сайта и сканирует его содержимое. Первый файл, который он просматривает — это robots. В него нужно добавить директиву Sitemap и ссылку на карту сайта.

В файле robots могут быть указаны ссылки на несколько XML-файлов.

Из чего состоит карта сайта

Файл sitemap состоит из элементов — тегов, которые имеют начало <> и конец и содержат определенные данные. Некоторые теги могут быть родительскими и включать в себя дочерние. Синтаксис карт сайта для Google соответствует протоколу Sitemap.

У XML-карты есть обязательные теги:

— тег, содержащий ссылку на текущий стандарт протокола;

— тег для каждого URL, который включает дочерние теги с адресом страницы и дополнительной информацией о ней;

— дочерний тег , в котором находится адрес страницы.

— тег, который размещают в начале и конце файла, когда у сайта несколько файлов sitemap, а его дочерние теги содержат ссылки на эти карты.

Теперь рассмотрим теги, которые используют при необходимости:

— дата последнего обновления страницы в формате YYYY-MM-DD.

Читайте также:
Возраст, срок и выдержка пуэра - правда и мифы

— указывает периодичность обновления страниц и когда роботу рекомендуется индексировать контент: всегда (always), ежечасно (hourly), ежедневно (daily), еженедельно (weekly), ежемесячно (monthly), ежегодно (yearly), никогда (never).

— тег для обозначения приоритетных для индексации страниц с помощью параметра от 0 до 1.

в своем руководстве, но в данный момент не учитывает их. Они актуальны для других поисковых систем.

Как добавить несколько карт на сайт

Если у сайта несколько sitemap, о которых нужно сообщить поисковикам, используйте для этого один из двух вариантов:

  1. файл robots.txt, где указаны ссылки на карты с помощью директив Sitemap;
  2. файл sitemap.xml, содержащий ссылки на все карты сайта.

Рассмотрим пошагово второй способ, как объединить несколько карт в одном файле.

Шаг 1 Создайте XML-файлы и проверьте, чтобы общее количество URL не превышало 50 000, а вес — 50 МБ.

Шаг 2 Дайте файлам названия, отличные от sitemap.

Шаг 3 Проверьте карты на ошибки с помощью специальных инструментов.

Шаг 4 Создайте файл sitemap.xml и добавьте в него ссылки на все карты внутри родительского тега . Для размещения каждого URL используйте тег , содержащий .

Пример sitemap.xml, содержащего две карты сайта:

Расширение gz говорит о том, что для файлов sitemaps применялось gzip-сжатие.

Чтобы поисковые системы обнаружили все «вложенные» карты сайта, достаточно их уведомить об основном файле sitemap.xml через специальный инструмент, например, Google Search Console.

Попробуйте хостинг с кучей плюшек: автоустановщиком 330 движков, конструктором сайтов и теплой поддержкой 24/7!

Карта сайта для разных типов контента

Чтобы содержимое страниц попадало в специальные разделы поисковиков (для фото, видео, новостей), рекомендуется создавать отдельные карты сайта. Узнаем, как создавать sitemaps для популярных видов контента — изображений и видео.

Sitemap для изображений

Когда стоит использовать sitemap для картинок:

  1. на сайте много изображений и нужно помочь краулеру не упустить важные из них;
  2. поисковику трудно найти ссылки на фото, например, если они появляются на экране в качестве элемента JavaScript.

Sitemap для изображений состоит из тегов . Внутри каждого из них дочерний тег , содержащий ссылку на страницу с изображением, и тег с информацией о самом изображении. Внутри родительского тега может быть до 1000 блоков .

Обязательные теги:

— тег, который содержит URL картинки и может включать информацию об изображении, например, название и подписи к фото, место съемки.

— тег для URL картинки.

Необязательные теги:

— место, где было сделано фото, например, Berlin, Germany .

— название (заголовок) картинки.

— подпись к картинке.

— ссылка на лицензию фото.

Пример фрагмента Sitemap для изображений:

Информация о настройке карты для изображений есть в официальной справке Google.

Sitemap для видео

Если нужно уведомить Google о недавно добавленных видео или помочь ему проиндексировать сайт с большим количеством мультимедийного контента, используют карту для видео.

Sitemap для видео по структуре похож на карту для изображений. Информацию о файлах размещают в родительском теге и добавляют — URL страницы, на которой находятся видео. В качестве контейнера с данными о видеофайлах страницы применяют тег .

Обязательные теги:

— тег, который содержит дочерние теги с адресом видеофайла и дополнительной информацией о нем, например, описанием, длительностью или датой публикации;

— тег, который содержит URL видео;

— место размещения проигрывателя для видеоролика;

— название (заголовок) видео с рекомендуемой длиной до 100 символов;

— описание к видео, близкое по смыслу к контенту страницы, с максимальной длиной в 2048 символов.

— URL файла со значком видео в мини-версии от 60×30 пикселей;

Необязательные теги:

— дата размещения видео в формате YYYY-MM-DD;

— продолжительность видео в секундах с максимальным значением 28800 (8 часов);

— описание тематической категории видео до 256 символов;

— тег, который обычно используют для запрета показов видео на определенных платформах: ПК (web), мобильных устройствах (mobile), телевизорах (tv);

— тег для запрета показа видео в определенных регионах, в котором коды стран приведены в формате ISO 3166;

— тег для безопасного поиска, т.е. ограничения просмотра видео по возрасту;

— тег в формате YYYY-MM-DD для видео, которые будут доступны до определенной даты;

— имя пользователя или название компании, добавившей видео, с допустимой длиной до 255 символов;

— тег, который используют для видео с платным просмотром или загрузкой, указывая валюту (атрибут currency) в формате ISO 4217;

— тег для доступа к видео по подписке;

— тег, в котором указано, сколько просмотров получило видео;

— рейтинг видеоролика в диапазоне от 0.0 до 5.0;

— тег для пометки прямых трансляций;

— теги в виде ключевых слов, которые помогают целевой аудитории находить контент.

Пример фрагмента Sitemap для видео:

Как создать файл Sitemap и сделать его доступным для Google

Из этой статьи вы узнаете, как создать файл Sitemap и предоставить доступ к нему роботам Google. Подробнее о файлах Sitemap…

  1. Выберите подходящий формат файла Sitemap.
  2. Создайте файл Sitemap автоматически или вручную.
  3. Сделайте файл Sitemap доступным для Google. Для этого добавьте ссылку на него в файл robots.txt или отправьте его непосредственно в Google с помощью Search Console.

Форматы файлов Sitemap

В Google поддерживается несколько форматов файлов Sitemap.

Во всех форматах следует использовать стандартный протокол. В настоящее время Google не учитывает в файлах Sitemap атрибут

Для всех форматов действуют следующие ограничения: файл Sitemap может содержать не более 50 000 URL, а его размер в несжатом виде не должен превышать 50 МБ. Если объем файла или количество перечисленных в нем адресов превышают эти лимиты, разбейте его на несколько частей. Вы можете создать и отправить в Google индекс Sitemap, который содержит данные об отдельных файлах Sitemap. При необходимости можно отправить несколько файлов или индексов Sitemap.

Вот пример простого XML-файла Sitemap с одним URL:

Подробную документацию и более сложные примеры вы можете найти на сайте sitemaps.org.

RSS, mRSS и Atom 1.0

Если у вас есть блог с фидом RSS или Atom, можно отправить URL этого фида в качестве источника файла Sitemap. Большинство сервисов для ведения блогов позволяют создать фид, но нужно учитывать, что в нем может быть представлена информация только о последних URL.

  • Google допускает использование фидов RSS 2.0 и Atom 1.0.
  • Отправить в Google сведения о видеоконтенте можно также с помощью фида mRSS (media RSS).
Читайте также:
Может ли чай вызывать аллергию у взрослых и детей?

Текст

Если в файле Sitemap есть только адреса страниц, вы можете отправить Google обычный текстовый файл с этими URL (по одному в каждой строке). Пример:

Правила создания текстовых файлов Sitemap
  • Необходимо использовать кодировку UTF-8.
  • В файл Sitemap можно добавлять только URL.
  • Этому текстовому файлу можно дать любое имя, но необходимо использовать расширение .txt (например, sitemap.txt).

Файлы Sitemap с расширенным синтаксисом

Google поддерживает расширенный синтаксис файлов Sitemap для перечисленных ниже MIME-типов. С помощью дополнительных элементов можно описывать видео, изображения и другой плохо поддающийся анализу контент, чтобы они лучше индексировались.

Общие рекомендации в отношении файлов Sitemap

  • Указывайте полные URL, используя один и тот же синтаксис. Google будет сканировать в точности те URL, которые вы перечислите. Например, если адрес сайта – https://www.example.com/ , не указывайте URL https://example.com/ (без www ) или ./mypage.html (относительный).
  • Файл Sitemap может быть размещен в любой части сайта, но влияет только на каталоги уровнем ниже родительского. Поэтому если вам нужно, чтобы действие файла Sitemap распространялось на все разделы сайта, мы рекомендуем располагать его на корневом уровне.
  • Не указывайте в добавляемых URL идентификаторы сеансов. Это может привести к избыточному сканированию страниц.
  • Отмечайте иноязычные версии страницы атрибутом hreflang.
  • Файлы Sitemap должны создаваться в кодировке UTF-8, а в URL необходимо применять экранирование.
  • Разбивайте большие файлы Sitemap на файлы поменьше. Файл Sitemap может содержать до 50 000 URL и не должен занимать больше 50 МБ в несжатом виде. Вместо отдельных файлов Sitemap отправляйте в Google их индекс.
  • Включайте в файлы Sitemap только канонические URL. Если у вас две версии страницы, укажите только ту, которая должна появляться в результатах поиска. Если у вас две версии сайта (например, с префиксом www и без него), выберите основную и разместите файл Sitemap в ней, а на страницы второго сайта добавьте атрибут rel=canonical или реализуйте на них переадресацию.
  • Если у мобильной и обычной версии страницы разные URL, советуем указывать только одну из них. Если все же требуется включить в файл оба URL, добавьте для них аннотации, чтобы обозначить эти версии.
  • Используйте файлы Sitemap с расширенным синтаксисом для указания дополнительных MIME-типов, в частности изображений, видео и новостей.
  • Если существуют версии страницы на других языках или для других регионов, вы можете указать их с помощью атрибута hreflang в файле Sitemap или тегах HTML.
  • Символы помимо букв латинского алфавита и цифр требуют особого обращения. Файл Sitemap обязательно должен быть в кодировке UTF-8 (обычно ее можно выбрать при сохранении). Как и в любых других XML-файлах, при вводе значений (включая URL) необходимо экранировать символы в соответствии с приведенной ниже таблицей. Файл Sitemap может содержать только символы ASCII. В нем не должно быть расширенных символов ASCII, определенных управляющих кодов и специальных символов, таких как * и <> . Если они содержатся в URL, то при попытке добавить файл появится сообщение об ошибке.
    Название Символ Код экранирования
    Амперсанд & &
    Одинарные кавычки
    Двойные кавычки
    Больше > >
    Меньше

Кроме того, все URL (включая адрес вашего файла Sitemap) должны быть правильно экранированы и закодированы, чтобы их мог обработать веб-сервер. Обычно это выполняется автоматически, если для создания URL вы применяете какой-либо скрипт, инструмент или файл журнала, то есть не вводите адреса вручную. Если при отправке файла Sitemap вы получаете оповещение о том, что Google не удалось найти ваши URL, убедитесь, что они соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и стандарту XML.

Ниже приведен пример URL, где есть символ, не относящийся к кодировке ASCII ( ü ), а также символ, который требует экранирования ( & ):

Этот же URL в кодировке ISO-8859-1 (для размещения на сервере, использующем ее) и с экранированием:

Этот же URL в кодировке UTF-8 (для размещения на сервере, использующем ее) и с экранированием:

Этот же URL, содержащий маскирование:

  • Мы не гарантируем сканирование каждого URL в файле Sitemap. Такие файлы лишь помогают Google определить, какие страницы вы считаете важными.
  • Значения в тегах

    и игнорируются.

  • В Google используется значение в теге , если оно всегда является гарантированно точным (например, если его точность проверяется путем сравнения с последней измененной версией страницы).
  • Позиция того или иного URL в файле Sitemap не важна. Google сканирует URL, не учитывая их порядок в этом файле.
  • Как создать файл Sitemap

    Создавая файл Sitemap, вы сообщаете поисковым системам, какие из ваших URL следует выбирать для показа в результатах поиска. Такие URL называются каноническими. Если вы разместили одинаковый контент по нескольким URL, выберите основной вариант страницы и включите в файл Sitemap только его.

    Выбрав URL, которые следует добавить в файл Sitemap, создайте его одним из перечисленных ниже способов. Оптимальный вариант будет зависеть от архитектуры и размеров сайта.

    • Файл Sitemap можно сгенерировать с помощью системы управления контентом.
    • Если в файле несколько десятков URL или меньше, попробуйте создать его вручную.
    • Если ожидается, что файл Sitemap будет очень велик, создавайте его автоматически.

    Как создать файл Sitemap с помощью системы управления контентом

    Если вы работаете с системой управления контентом, такой как WordPress, Wix или Blogger, то возможно, что она уже сгенерировала файл Sitemap, доступный поисковым системам. Попробуйте найти сведения о том, как ваша система управления контентом создает файлы Sitemap, или о том, как подготовить такой файл, если она не сделала этого автоматически. Например, если вы работаете с Wix, введите в Google Поиске запрос “wix sitemap”.

    В остальных случаях вам потребуется создать файл Sitemap самостоятельно.

    Как создать файл Sitemap вручную

    Если вы планируете добавить в файл Sitemap не более чем несколько десятков URL, его можно будет создать вручную. Для этого откройте текстовый редактор, такой как Блокнот (Windows) или nano (Linux, macOS), и начните вносить в новый файл данные в соответствии с синтаксисом, который описан в разделе Форматы файлов Sitemap выше.

    Вручную можно создавать и крупные файлы Sitemaps, но это очень трудоемкий процесс.

    Как создать файл Sitemap автоматически

    Если вам нужно включить в файл Sitemap множество URL, то удобнее будет создавать его автоматически. Сгенерировать файл Sitemap можно с помощью различных инструментов, но лучше всего воспользоваться для этого средствами вашего сайта. Например, вы можете извлечь URL, относящиеся к сайту, из его базы данных и экспортировать эти адреса на экран или в файл на вашем веб-сервере. При необходимости обратитесь к разработчикам или менеджеру сервера. Ознакомьтесь с нашей подборкой сторонних генераторов файлов Sitemap: вы можете создать на их основе аналогичный инструмент.

    Читайте также:
    Чай по-якутски: полезные свойства, рецепт приготовления

    Как сделать файл Sitemap доступным для Google

    Файл Sitemap анализируется только при первом его обнаружении, а не при каждом сканировании сайта. Чтобы файл был обработан повторно, сообщите нам, что данные в нем изменились. Это делается с помощью запроса ping. Не добавляйте несколько раз одинаковые файлы Sitemap и не отправляйте запросы ping, если в файл не вносились изменения и он не новый.

    Если вы обновляли страницы, включенные в такой файл, отметьте их с помощью поля . В XML-файлах других типов есть аналогичные поля (например, в Atom XML это поле ). Подробнее о том, как определить нужную дату…

    Предоставить Google доступ к файлу Sitemap можно несколькими способами:

    • Отправьте файл через интерфейс специального отчета.
    • Выполните запрос ping. В браузере или командной строке отправьте запрос GET на приведенный ниже адрес, указав полный URL файла Sitemap и убедившись, что этот файл доступен:
  • Вставьте в любом месте файла robots.txt строку с путем к файлу Sitemap (она будет обнаружена при следующем сканировании файла robots.txt). Пример:
  • Если вы используете Atom или RSS и хотите уведомить о внесенных вами изменениях не только Google, но и другие поисковые системы, сделайте это с помощью протокола WebSub.
  • Устранение неполадок, возникающих при обработке файлов Sitemap

    Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.

    Правильная карта сайта ускоряет индексацию в 3,14 раз

    Карта сайта (sitemap) — это html страница сайта или специальный xml файл, в котором отражены ссылки на все важные страницы сайта. Чтобы понять, что такое карта сайта, достаточно представить книжное оглавление и сразу же станет ясно, зачем нужна карта сайта. Карта сайта помогает посетителю, будь это человек или поисковый робот, быстро найти любую страницу сайта, совершая минимальное число переходов. На простых, небольших сайтах все страницы могут быть доступны через 1-2 клика от главной страницы, но что делать, если сайт большой и структура его непроста? Подобный сайт будет неудобен не только посетителям, но и неочевиден для поисковых систем.

    Какие бывают карты сайта

    Поисковые системы индексируют сайт постепенно, уровень за уровнем, начиная с главной страницы. Если на сайте много уровней вложенности страниц, то пока все страницы сайта проиндексируются пройдут многие месяцы. Значит, необходимо создать карту сайта, на которой будут все ссылки на все страницы сайта сразу, чтобы робот не тратил время на переходы по уровням вложенности, верно? И да и нет. Ответ зависит от того зачем делается карта и какой она будет. Давайте рассмотри, какие бывают карты сайта.

    Карта сайта HTML Sitemap

    Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта — это страница сайта, на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей, нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограния по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

    Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

    Обычно, карта сайта в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

    HTML карта сайта — это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

    Карта сайта XML Sitemap

    XML карта сайта — это файл формата xml, вида sitemap.xml, который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта. Sitemap xml — это специальный формат карты сайта, который определяется всеми популярными поисковыми системами, например Google и Яндекс. В xml sitemap можно указать до 50.000 ссылок. Более того, в sitemap xml можно указать относительный приоритет и частоту обновления страниц.

    Стоит сказать, что содержимое карты сайта является лишь рекомендацией для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

    Карта сайта xml имеет определенный синтаксис, давайте рассмотрим структуру xml карты сайта подрбнее.

    Пример файла карты сайта sitemap.xml

    Правильный sitemap.xml должен иметь кодировку UTF8. Содержимое файла карты сайта sitemap.xml выглядит следующим образом:

    Где используются следующие обязательные теги:

    • — родительский тег, в него заключаются все url-адреса;
    • — тег, в котором указываются сведения о конкретном url-адресе;
    • — в данном теге указывается непосредственно url.

    Далее, следуют необязательные теги:

    • — этот тег заключает в себе дату последнего изменения страницы;
    • — тег используется, чтобы указать насколько часто изменяется страница: always, hourly, daily, weekly, monthly, yearly, never;

    — указывает приоритет определенной страницы, относительно других страниц сайта от 0,1 – низкий приоритет, до 1 – высокий приоритет.

    Так же, в файле карты сайта в формате xml должно содержаться указание на пространство имен языка XML:

    Если файл карты сайта включает более 50 тысяч ссылок или размер sitemap.xml превышает 10 мб, рекомендуется разделить карту сайта на несколько файлов. В таком случае, в карте сайта необходимо указать несколько ссылок на разные файлы карт.

    Здесь используются уже знакомые нам теги и , а так же обязательные теги:

    • — родительский тег, в который заключаются адреса всех карт сайта;
    • — тег, в котором заключается параметры для каждой карты сайта.
    Пример файла карты сайта sitemap.txt

    Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

    Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt — это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

    Как создать карту сайта

    Создание карты сайта важный процесс, в котором необходимо четко указать, какие страницы сайта нужно индексировать и как лучше их индексировать. В зависимости от того о каком типе карты сайта идет речь, используются различные способы создания карты сайта. Как создать html карту сайта обсуждать отдельно смысла нет. Рассмотрим как сделать карту карта в формате xml файла. Существует несколько основных способов создания карты сайта, но все их объединяет то, где находится карта сайта и как файл sitemap определяется поисковыми системами.

    Как уже было написано выше — файл карты сайта размещается в корне сайта. Поисковые системы способны самостоятельно обнаружить файл карты сайта. Но существует несколько способов указания прямой ссылки на файл(ы) карты сайта(ов) для более скорого обнаружения поисковыми системами. Самый простой способ указать место расположения файла карты сайта — это непосредственное указание ссылки или нескольких ссылок на файлы карт сайта в инструментах для вебмастеров от Yandex и Google. Там же можно проверить карту сайта, провести анализ карты сайта на корректность, соответствие того, какие страницы из карты сайта найдены поисковой системой и сколько из них находится в индексации.

    Второй способ указать поисковым системам на расположение файла карты сайта — это директива Sitemap файла robots.txt.

    Указание ссылки на карту сайта в robots.txt:

    В robots.txt можно указать несколько файлов sitemap, после чего, он автоматически будут добавлены в инструменты для вебмастеров. Как найти карту сайта мы рассмотрели, теперь перейдем к тому, как создать карту сайта.

    Основные способы создания карты сайта

    1. Генерация карты сайта силами системы управления сайта, если CMS имеет подобную встроенную возможность.
    2. Скачать карту сайта со стороннего онлайн сервиса. Существует множество online генераторов карт сайта с различным возможностями и ограничениями. Напрмер xml-sitemaps.com обладает возможностью настройки параметров карты сайта, но имеет ограничение по количеству ссылок в файле sitemap.xml в 500 штук.
    3. Скачать программу-генератор карты сайта. Подобные программы генераторы обычно платные, но при их помощи можно можно регулярно генерить sitemap xml для одного или нескольких сайтов. Вот пара примеров подобных программ-генераторов: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generatior.
    4. Автоматическое создание sitemap карты сайта в Joomla (Джумла), WordPress (Вордпресс), Bitrix (Битрикс).
    5. Создание карты сайта вручную.

    Карта сайта — один из важнейших инструментов SEO оптимизации сайта. Не важно, как будет создана карта сайта. Важно — какие ссылки будут перечислены в карте сайта и как часто она будет обновляться. Иногда, в карту сайта выгружается все подряд и даже те ссылки, которые запрещены в robots.txt или неканонические ссылки. А обновление карты сайта происходит раз в месяц или реже. Подобное отношение к карте сайта может не просто сделать ее бесполезной, но того хуже — запутать поискового робота, что негативно отразится на индексации и позициях сайта в поиске.

    Создайте карту сайта для своего ресурса. Но будте внимательны и хорошо подумайте, что выгружать в sitemap, а что нет.

    sitemaps.org

    XML-формат файла Sitemap

    В этом документе приведено описание XML-схемы протокола Sitemap.

    Формат протокола Sitemap состоит из XML-тегов. Для всех значений данных в файле Sitemap должно использоваться маскирование. В файле необходимо использовать кодировку UTF-8.

    • В начале поставьте открывающий тег , а в конце поставьте закрывающий тег .
    • Укажите область имен (стандарт протокола) в теге .
    • Включите запись для каждого URL-адреса как родительский тег XML.
    • Включите дочернюю запись для каждого родительского тега .

    Все теги необязательны. Поддержка необязательных тегов может отличаться в зависимости от поискового сервера. Чтобы получить более подробную информацию, обратитесь к документации поискового сервера.

    Также все URL-адреса в файле Sitemap должны быть с одного узла, например www.example.com или store.example.com. Дополнительные сведения см. в разделе Расположение файла Sitemap

    Пример XML-файла Sitemap

    Ниже приведен пример файла Sitemap, в котором содержится только один URL-адрес и использованы все необязательные теги. Необязательные теги выделены курсивом.

    Определения XML-тегов

    Ниже описаны доступные XML-теги.

    Инкапсулирует этот файл и указывает стандарт текущего протокола.

    Родительский тег для каждой записи URL-адреса. Остальные теги являются дочерними для этого тега.

    URL-адрес страницы. Этот URL-адрес должен начинаться с префикса (например, HTTP) и заканчиваться косой чертой, если Ваш веб-сервер требует этого. Длина этого значения не должна превышать 2048 символов.

    Дата последнего изменения файла. Эта дата должна быть в формате W3C Datetime. Этот формат позволяет при необходимости опустить сегмент времени и использовать формат ГГГГ-ММ-ДД.

    Обратите внимание, что этот тег не имеет отношения к заголовку “If-Modified-Since (304)”, который может вернуть сервер, поэтому поисковые системы могут по-разному использовать информацию из этих двух источников.

    Вероятная частота изменения этой страницы. Это значение предоставляет общую информацию для поисковых систем и может не соответствовать точно частоте сканирования этой страницы. Допустимые значения:

    • always
    • hourly
    • daily
    • weekly
    • monthly
    • yearly
    • never

    Значение”всегда” должно использоваться для описания документов, которые изменяются при каждом доступе к этим документам. Значение “никогда” должно использоваться для описания архивных URL-адресов.

    Имейте в виду, что значение для этого тега рассматривается как подсказка, а не как команда. Несмотря на то, что сканеры поисковой системы учитывают эту информацию при принятии решений, они могут сканировать страницы с пометкой “ежечасно” менее часто, чем указано, а страницы с пометкой “ежегодно” – более часто, чем указано. Сканеры могут периодически сканировать страницы с пометкой “никогда”, чтобы отслеживать неожиданные изменения на этих страницах.

    необязательно

    Приоритетность URL относительно других URL на Вашем сайте. Допустимый диапазон значений — от 0,0 до 1,0. Это значение не влияет на процедуру сравнения Ваших страниц со страницами на других сайтах — оно только позволяет указать поисковым системам, какие страницы, по Вашему мнению, более важны для сканеров.

    Приоритет страницы по умолчанию — 0,5.

    Следует учитывать, что приоритет, который Вы назначили странице, не влияет на положение Ваших URL на страницах результатов той или иной поисковой системы. Поисковые системы используют эту информацию при обработке URL, которые относятся к одному и тому же сайту, поэтому можно использовать этот тег для увеличения вероятности присутствия в поисковом индексе Ваших самых важных страниц.

    Кроме того, следует учитывать, что назначение высокого приоритета всем URL на Вашем сайте не имеет смысла. Поскольку приоритетность – величина относительная, этот параметр используется для того, чтобы определить очередность обработки URL в пределах сайта.

    Маскирование символов

    В файле Sitemap должна использоваться кодировка UTF-8 (обычно ее можно выбрать при сохранении данного файла). В XML-файлах для всех значений данных (включая URL-адреса) должно использоваться маскирование символов, перечисленных ниже в таблице.

    Символ Маскирование
    Амперсанд & &
    Одинарные кавычки
    Двойные кавычки
    Больше > >
    Меньше

    Кроме того, для всех URL (включая URL из вашего файла Sitemap) должны использоваться маскирование и кодировка для удобочитаемости веб-сервером, на котором они размещаются. Однако, если для создания своих URL Вы используете какой-либо вид скрипта, инструментального средства или журнала (любой способ кроме ввода их вручную), то маскировка и кодировка применяются автоматически. Убедитесь в том, что все URL-адреса соответствуют стандарту RFC-3986 для URI, стандарту RFC-3987 для IRI и XML-стандарту.

    Ниже приведен пример URL-адреса, в котором используется символ, отличный от ASCI ( ü ), а также символ, для которого необходимо маскирование ( & ):

    Ниже этот же URL-адрес приведен в кодировке ISO-8859-1 (для размещения на сервере, который использует эту кодировку) с маскированием:

    Ниже этот же URL-адрес приведен в кодировке UTF-8 (для размещения на сервере, который использует эту кодировку) и с использованием маскирования:

    Ниже приведен тот же URL-адрес, но с использованием маскирования:

    Пример XML-файла Sitemap

    В следующем примере показан файл Sitemap в XML-формате. Sitemap в этом примере содержит небольшое число URL-адресов, каждый из которых использует разное сочетание необязательных параметров.

    Использование файлов индекса Sitemap (для создания группы из нескольких файлов Sitemap)

    Можно предоставить несколько файлов Sitemap, однако в каждом из этих файлов должно быть не более 50000 URL, а размер каждого из этих файлов не должен превышать 50 МБ. При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы уменьшить требования к пропускной способности канала. Однако размер файла sitemap без сжатия не должен превышать 50 МБ. Если необходимо перечислить более 50000 URL-адресов, следует создать несколько файлов Sitemap.

    Если требуется передать несколько файлов Sitemap, необходимо перечислить каждый из этих файлов в файле индекса Sitemap. В файле индекса Sitemap может быть перечислено не более 50000 файлов Sitemap. Размер этого файла не должен превышать 50 МБ (52 428 800 байт) и может быть сжат. У вас может быть несколько файлов Sitemap. Формат XML-файла индекса Sitemap очень похож на формат XML-файла Sitemap.

    Файл индекса Sitemap должен:

    • В начале поставьте открывающий тег , а затем поставьте закрывающий тег .
    • Добавьте запись для каждого файла Sitemap как родительский XML-тег.
    • Включите дочернюю запись для каждого родительского тега .

    Необязательный тег также доступен для файлов индекса Sitemap.

    Примечание. Файл индекса Sitemap может указывать только файлы Sitemap, которые находятся на том же сайте, что и файл индекса Sitemap. Например, файл индекса http://www.vashsait.ru/sitemap_index.xml может включать файлы Sitemap, размещенные на сайте http://www.vashsait.ru, но не на сайте http://www.primer.ru или http://vashkhost.vashsait.ru. Для файла индекса Sitemap, как и для файлов Sitemap, необходимо использовать кодировку UTF-8.

    Пример индекса XML Sitemap

    В следующем примере показан файл индекса Sitemap, который содержит два файла Sitemaps.

    Примечание: для URL-адресов Sitemap, как и для всех значений в XML-файлах, должно использоваться маскирование .

    Определения XML-тегов индекса Sitemap

    Указывает местоположение файла Sitemap.

    Этим местоположением может быть файл Sitemap, файл Atom, файл RSS или простой текстовый файл.

    Указывает время изменения соответствующего файла Sitemap. Не соответствует времени изменения ни одной из страниц в этом файле Sitemap. Значение тега “lastmod” должно быть представлено в формате W3C Datetime.

    Предоставляя отметку времени последнего изменения, Вы позволяете сканерам поисковой системы извлекать только часть файлов Sitemap в индексе, то есть сканер может извлекать только те файлы Sitemap, которые были изменены после определенной даты. Этот механизм частичного извлечения файлов Sitemap позволяет быстро обнаруживать новые URL на сайтах больших размеров.

    Другие форматы файла Sitemap

    Протокол Sitemap дает возможность обеспечить поисковые системы подробной информацией о страницах, и мы рекомендуем его использовать, поскольку при этом можно указать дополнительные сведения о страницах сайта, а не только их URL. Помимо протокола XML мы также поддерживаем каналы RSS и текстовые файлы, которые предоставляют более ограниченную информацию.

    Канал синдикации

    Вы можете предоставить канал RSS 2.0, Atom 0.3 или 1.0. Как правило, этот формат используется только в том случае, если на сайте уже есть канал синдикации. Обратите внимание, что в этом случае поисковые системы, возможно, не получат информацию обо всех URL на вашем сайте, поскольку данный канал предоставляет информацию только по последним URL. Однако поисковые системы могут использовать эту информацию, чтобы обнаружить другие страницы сайта, переходя по ссылкам на страницах канала в процессе обычного сканирования. Убедитесь, что канал расположен в каталоге самого высокого уровня, который должен сканироваться поисковой системой. Поисковые системы извлекают информацию из канала следующим образом.

    • поле – указывает URL
    • поле даты изменения (поле

    для каналов RSS и дата для каналов Atom) – указывает, когда каждый URL был изменен в последний раз. Использовать поле даты изменения необязательно.

    Текстовый файл

    Вы можете предоставить простой текстовый файл, содержащий один URL в строке. Этот текстовый файл должен соответствовать следующим требованиям.

    • В этом текстовом файле в каждой строке должен быть только один URL. Эти URL не могут содержать новые внедренные строки.
    • Необходимо указать URL полностью, включая префикс http.
    • Каждый текстовый файл может содержать не более 50 000 URL, и его размер не должен превышать 50 МБ (52 428 800 байт). Если сайт включает более 50000 URL, можно разделить этот список на несколько текстовых файлов и передать каждый файл отдельно.
    • Для этого текстового файла необходимо использовать кодировку UTF-8. Ее можно задать при сохранении файла (например, в программе “Блокнот” она указана в меню “Кодировка” диалогового окна “Сохранить как”).
    • Этот текстовый файл не должен включать никаких других данных, кроме списка URL.
    • Этот текстовый файл не должен содержать данных заголовка или нижнего колонтитула.
    • При необходимости файл Sitemap можно сжать с помощью архиватора gzip, чтобы уменьшить требования к пропускной способности канала.
    • Этому текстовому файлу можно присвоить любое имя. Убедитесь, что ваши URL-адреса соответствуют стандарту RFC-3986 для URI-адресов и стандарту RFC-3987 для файлов IRI.
    • Загрузите этот текстовый файл в каталог самого высокого уровня, который должен сканироваться поисковой системой, и убедитесь, что в файл не внесены адреса URL, находящиеся в каталоге более высокого уровня.

    Ниже приведен пример строк текстового файла.

    Местоположение файла Sitemap

    Местоположение файла Sitemap определяет набор URL-адресов, которые можно включить в этот Sitemap. Файл Sitemap, расположенный в каталоге http://primer.ru/catalog/sitemap.xml, может включать любые URL-адреса, начинающиеся с http://primer.ru/catalog/, но не должен включать URL-адреса, начинающиеся с http://primer.ru/images/.

    Если у Вас есть разрешение на изменение файла http://primer.org/path/sitemap.xml, можно предположить, что у Вас также имеется разрешение на предоставление информации для URL с префиксом http://primer.org/path/. Примеры допустимых URL в http://primer.ru/catalog/sitemap.xml включают:

    К недопустимым URL-адресам в файле http://primer.ru/catalog/sitemap.xml относятся следующие:

    Это значит, что все URL-адреса, перечисленные в файле Sitemap, должны использовать один и тот же протокол (в данном случае — HTTP) и должны быть размещены на том же хосте, что и файл Sitemap. Например, если файл Sitemap расположен по адресу http://www.primer.ru/sitemap.xml, в нем могут быть указаны URL-адреса из субдомена http://subdomen.primer.ru.

    URL-адреса, которые считаются недопустимыми, исключаются из дальнейшего рассмотрения. Настоятельно рекомендуется поместить файл Sitemap в корневой каталог Вашего веб-сервера. Например, если адрес Вашего сервера — primer.ru, Ваш файл индекса Sitemap должен быть размещен по адресу http://primer.ru/sitemap.xml. Возможно, в некоторых случаях нужно будет создать различные файлы Sitemap для различных путей на Вашем сайте (например, если полномочия доступа в Вашей организации установлены таким образом, что доступ с правом записи к различным каталогам предоставляется отдельно).

    Если при передаче файла Sitemap используется путь, содержащий номер порта, необходимо включить этот номер порта в путь в каждом URL, перечисленном в файле Sitemap. Например, если Ваш файл Sitemap находится в http://www.primer.ru:100/sitemap.xml, то каждый URL, перечисленный в файле Sitemap, должен начинаться с http://www.primer.ru:100.

    Файлы Sitemap и перекрестная отправка

    Чтобы отправить файлы Sitemap на несколько узлов с одного, необходимо “подтвердить” владение узлом(-ами) для которого URL-адреса отправляются в файле Sitemap. Ниже приведен пример. Допустим, необходимо отправить файлы Sitemap на 3 узла:

    Более того, необходимо разместить все три файла Sitemap на одном узле: www.sitemaphost.com. Таким образом, URL-адреса Sitemaps будут следующими:

    По умолчанию это приведет к ошибке “перекрестная отправка”, так как была произведена попытка отправить URL-адреса для узла www.host1.com через файл Sitemap, который расположен на узле www.sitemaphost.com (то же самое и для двух других узлов). Первый способ избежать этой ошибки — это доказать свое владение (например право изменять файлы) узлом www.host1.com. Это можно сделать, изменив файл robots.txt на узле www.host1.com, чтобы указать на файл Sitemap на узле www.sitemaphost.com.

    В этом примере файл robots.txt на узле http://www.host1.com/robots.txt содержал бы строку “Sitemap: http://www.sitemaphost.com/sitemap-host1.xml”. Изменив файл robots.txt на узле www.host1.com с указанием на файл Sitemap на узле www.sitemaphost.com, вы косвенно доказали, что являетесь владельцем узла www.host1.com. Другими словами, кто бы не управлял файлом robots.txt на узле www.host1.com, он доверяет файлу Sitemap на узле http://www.sitemaphost.com/sitemap-host1.xml на предмет содержания URL-адресов для узла www.host1.com. Эту же процедуру можно повторить для двух других узлов.

    Теперь можно отправлять файлы Sitemap на узел www.sitemaphost.com.

    Если в файле robots.txt указан определенный узел, например http://www.host1.com/robots.txt, это указывает на файл Sitemap или файл индекса Sitemap на другом узле. Скорее всего это означает, что для каждого конечного файла Sitemap, например http://www.sitemaphost.com/sitemap-host1.xml, все URL-адреса принадлежат узлу, который на них указывает. Это происходит потому, что, как было указано ранее, ожидается, что файл Sitemap будет содержать URL-адреса только с одного узла.

    Проверка файла Sitemap

    Для определения элементов и атрибутов, которые могут появляться в Вашем файле Sitemap, используются следующие XML-схемы. Эту схему можно загрузить с помощью приведенных ниже ссылок.

    Ряд инструментов может помочь при проверке структуры файла Sitemap на основе этой схемы. Вы можете найти список инструментов для работы с XML-файлами в каждом из следующих местоположений:

    Для проверки Вашего файла Sitemap или файла индекса Sitemap по этой схеме в XML-файл нужно добавить дополнительные заголовки, как показано ниже.

    Sitemap:

    Файл индекса Sitemap:

    Расширение протокола Sitemaps

    Протокол Sitemap можно расширить с помощью Вашего собственного пространства имен. Просто укажите это пространство имен в корневом элементе. Например:

    Уведомления для сканеров поисковых систем

    После того как файл Sitemap создан и размещен на веб-сервере, необходимо сообщить о местонахождении этого файла поисковым системам, поддерживающим этот протокол. Это можно сделать следующим образом.

    Затем поисковые системы смогут извлечь файл Sitemap и разрешить своим сканерам доступ к URL-адресам.

    Передача файла Sitemap с помощью интерфейса поисковой системы

    Чтобы отправить файл Sitemap напрямую в поисковую систему, которая предоставляет возможность получать информацию о статусе и ошибках обработки, обратитесь к документации поисковой системы.

    Как указать местоположение файла Sitemap в файле robots.txt

    Можно указать местоположение файла Sitemap, используя файл robots.txt. Для этого просто добавьте следующую строку:

    Эта инструкция не зависит от строки агента пользователя, поэтому неважно, где она размещается в файле. При наличии файла индекса Sitemap можно включить местоположение только этого файла. Перечислять каждый отдельный файл Sitemap, указанный в файле индекса, не нужно.

    Можно указать несколько файлов Sitemap для каждого файла robots.txt.

    Передача файла Sitemap с помощью запроса HTTP

    Чтобы отправить файл Sitemap с помощью HTTP-запроса (замените на URL, указанный поисковой системой), создайте запрос для следующего URL-адреса.

    Например, если файл Sitemap находится в архивном файле http://www.primer.ru/sitemap.gz, URL-адрес будет следующим:

    Добавьте кодировку URL для всех символов после /ping?sitemap=:

    Можно отправить http-запрос, используя “wget”, “curl” или другой механизм по выбору. Успешный запрос возвратит код отклика HTTP 200; если получен другой отклик, необходимо повторно передать запрос. Код отклика HTTP 200 указывает только на то, что поисковая система получила Ваш файл Sitemap, но это не значит, что сам файл Sitemap или содержащиеся в нем URL допустимы. Самый простой способ — создать автоматическое задание для регулярного создания и передачи файлов Sitemap.
    Примечание. Предоставляя файл индекса Sitemap, необходимо инициировать только один http-запрос, который включает местоположение файла индекса Sitemap; отправлять отдельные запросы для каждого файла Sitemap, указанного в этом индексе, не нужно.

    Как создать и настроить карту сайта sitemap.xml в 2021 году

    Обновил Сергей Алмакин

    Даже в 2021 году XML-карта нужна: этот инструмент по-прежнему используется краулерами Google и «Яндекс» – для ускорения индексации и получения технической информации о страницах. Из этой статьи вы узнаете, что такое sitemap.xml, зачем нужна XML-карта сайта, как ее создать и настроить правильно.

    Что такое карта сайта, и зачем она нужна

    В этом руководстве будем говорить преимущественно о картах сайта для поисковых систем. Это XML-документы, которые содержат служебную информацию. Они помогают поисковым роботам ориентироваться на сайтах и эффективно их индексировать.

    Также существуют карты сайта для живых посетителей. Их еще называют HTML-картами. Они представляют собой каталог страниц сайта с отображением иерархии. HTML-карта помогает посетителям путешествовать по сайту и искать нужные страницы.

    XML и HTML – языки разметки.

    HTML-карты – устаревший и не очень удобный элемент навигации, поэтому уделим им немного внимания в конце статьи. А пока сосредоточимся на XML-картах, которые важны для корректной индексации ресурсов.

    Зачем нужна карта сайта sitemap.xml

    Подробно об этом можно прочитать в справочниках от Google и «Яндекса». Краткая суть: в sitemap.xml содержится важная для поисковых роботов информация. Это:

    • Список URL страниц сайта и их иерархия.
    • Тип опубликованного контента, например, изображения или видео.
    • Информация об изображениях и видео, которые поисковики используют для индексирования сайта и формирования выдачи.
    • Сведения о частоте обновления и последнем обновлении страницы.
    • Сведения о приоритетности страницы.
    • Данные об альтернативных версиях страницы.

    Те есть карта сайта – навигатор для поисковых систем.

    Можно ли обойтись без sitemap.xml

    Можно. Поисковые системы считают XML-карту сайта рекомендованным инструментом. Например, если на сайте нет sitemap.xml, «Яндекс» отметит это в списке возможных, а не критичных или фатальных проблем.

    Роботы – не дураки, они проиндексируют сайт и без sitemap.xml. Но в некоторых ситуациях отсутствие XML-карты приводит к проблемам с индексированием. Вот примеры:

    • На сайте есть страницы, на которые нет ссылок с других страниц сайта.
    • Сайт очень большой, у него сложная структура.
    • Новый сайт.
    • Многие страницы сайта регулярно обновляются.
    • На сайте есть более и менее важные страницы.

    Рекомендация: если у вас коммерческий сайт, от посещаемости которого зависит успех бизнеса, создайте и подключите sitemap.xml. Ниже подробно описано, как это сделать.

    Как создать и подключить файл sitemap.xml

    Создать карту сайта можно двумя способами. Первый – сделать sitemap.xml можно с помощью внешнего онлайн-генератора. Второй – понадобится модуль или внутренний генератор для конкретной CMS. Рассмотрим оба способа.

    Как создать карту сайта онлайн с помощью генератора

    Этот способ хорош тем, что вы не привязываетесь к конкретному движку. С помощью онлайн-генераторов можно сделать sitemap.xml для сайта на любой CMS или для статичного сайта на HTML.

    У этого способа есть недостаток. Он подходит для сайтов с ограниченным количеством страниц, например, для сайтов-визиток. Если на сайте пять страниц, а новые создавать вы не планируете, сделайте sitemap.xml один раз с помощью бесплатного внешнего сервиса. Примеры будут дальше.

    Если на сайте постоянно появляются новые страницы, бесплатные внешние генераторы не подходят. Они не включают в карту сайта новые URL, поэтому sitemap.xml теряет актуальность.

    Вот несколько генераторов карты сайта:

    Чтобы создать sitemap.xml с помощью XML-Sitemaps, укажите URL сайта и нажмите кнопку Start.

    В зависимости от масштабов сайта и суммарного количества страниц придется подождать. От нескольких секунд до нескольких минут:

    В нашем случае сканирование сайта с 541 страницей в поиске «Яндекса» заняло около 4 минут. После того, как карта будет сформирована, скачайте файл sitemap.xml на жесткий диск. Для этого нажмите кнопку VIEW SITEMAP DETAILS:

    Откроется подробная детализация созданной карты. Можете ознакомиться с ней и затем нажать DOWNLOAD YOU XML SITEMAP FILE:

    Теперь загрузите sitemap.xml в корневую директорию на сайте. Это можно сделать с помощью FTP-клиента, например, FileZilla. У нас есть руководство по работе с этой программой. Еще легче – при помощи файлового менеджера используемого вами хостинга. Например, вот файловый менеджер хостинга Beget:

    Если не знаете, где находится корневой каталог сайта, найдите файл index.html или index.php:

    Как создать карту сайта с помощью дополнительных модулей для CMS

    Этот способ создания карты сайта более удобный по сравнению с бесплатными онлайн-генераторами. Он обеспечивает дополнительную гибкость: вебмастер может управлять параметрами sitemap.xml. Кроме того, надстройки автоматически обновляют карту сайта после создания новых страниц и уведомляют об этом поисковые системы.

    Если ваш сайт работает на WordPress, обратите внимание на плагин Google XML Sitemaps. Установите и активируйте модуль. Перейдите на страницу настроек. В базовых параметрах включите уведомления для Google, добавьте URL карты сайта в robots.txt и включите сжатие файла sitemap.xml:

    В разделе «Приоритет статьи» отключите автоматический расчет приоритета публикаций. Позже вы укажете приоритеты страниц вручную.

    Уделите внимание разделу «Содержание карты сайта». Включите в sitemap.xml только те типы страниц, которые нужны вам в индексе поисковых систем.

    Например, если у вас интернет-магазин, имеет смысл включить в карту сайта страницы категорий и меток. В этом случае поисковики будут показывать пользователям страницы каталога, например, рубрику «Смартфоны» или страницу каталога с товарами, помеченными тегом «детский». Если страницы меток и категорий в выдаче не нужны, не включайте их в карту сайта.

    Обязательно отметьте галочкой опцию Include the last modification time. В этом случае плагин укажет в карте сайта дату последнего обновления публикации. Эта информация нужна роботам, чтобы планировать повторное сканирование страниц.

    В разделе Excluded Items при необходимости исключите из карты сайта отдельные категории или страницы.

    В разделе Change Frequencies можно попросить поисковые системы индексировать те или иные типы страниц с определенной периодичностью. Поисковики, скорее всего, проигнорируют параметр changefreq в sitemap.xml, так как они сами планируют краулинговый бюджет сайта. Тем не менее, плагин дает возможность указать эти настройки в карте сайта.

    В разделе «Приоритеты» укажите приоритетность страниц сайта. Допустимы значения от 0,1 до 1,0. По умолчанию страница имеет приоритет 0,5. Присвойте высокий приоритет страницам, которые считаете важными по сравнению с остальными страницами сайта. Например, если на главной появляются анонсы новостей или новых товаров, она может считаться самой приоритетной страницей.

    Обратите внимание: время последнего обновления, желаемая частота индексации и приоритетность страниц – необязательная информация. Поисковые системы могут ее учитывать, а могут и не учитывать. Вы ничего не потеряете, если оставите в этих разделах дефолтные значения.

    Сохраните изменения. После этого о плагине Google XML Sitemaps можно навсегда забыть, так как он работает в фоновом режиме, автоматически обновляется и сам актуализирует карту сайта. Вам останется только добавить sitemap.xml в Google Search Console и «Яндекс.Вебмастер».

    Google XML Sitemaps – не единственный плагин для WordPress, с помощью которого можно создать карту сайта. Например, в комбайне All in One SEO есть модуль «Sitemaps»:

    После активации модуля можно создать карту сайта и настроить ее параметры:

    Если вы публикуете на сайте видео и хотите, чтобы они ранжировались в поиске, то в этом же плагине можно создать карту сайта для видео:

    Кроме этого, для создания отдельной карты сайты для видео можно воспользоваться специально предназначенным для этого генератором, например, Sitemap Generator.

    Вот генераторы sitemap.xml для других движков:

    После создания карты сайта добавьте ее в Google Search Console и «Яндекс.Вебмастер».

    Как добавить карту сайта в Google Search Console и «Яндекс.Вебмастер»

    Чтобы добавить карту сайта в Search Console, выберите раздел «Файлы Sitemap». Добавьте URL карты и нажмите кнопку «Отправить». Обычно карта сайта доступна по адресу типа vash-site.ru/sitemap.xml.

    Поисковику понадобится какое-то время, чтобы проиндексировать карту сайта. После индексации появится статус «Успешно» или сообщение об ошибках. Чтобы просмотреть отчет об индексировании карты сайта в новом интерфейсе Search Console, нажмите на отмеченную на иллюстрации пиктограмму.

    В отчете можно увидеть данные об индексировании sitemap.xml. Например, если на сайте есть закрытые от индексирования страницы, уведомление об этом появится в отчете.

    Чтобы добавить sitemap.xml в «Яндекс.Вебмастер», выберите раздел «Индексирование – Файлы Sitemap»:

    Укажите URL карты сайта в соответствующем поле и нажмите кнопку «Добавить».

    В «Яндекс.Вебмастере» уведомление о проблемах с картой сайта появляется в разделе «Диагностика сайта». Также корректность файла можно проверить с помощью специального инструмента.

    Как создать HTML-карту сайта

    Как отмечалось выше, HTML-карта – элемент навигации для живых пользователей. Если у сайта логичная структура и удобное меню, HTML-карта не нужна. Если сайт большой, а пользователи жалуются на запутанность структуры, попробуйте решить проблему с помощью карты сайта.

    Когда искал пример HTML-карты сайта, почему-то сразу подумал про сайты государственных пенсионных фондов. И не ошибся. Видимо, пожилым пользователям сложно ориентироваться на сайте с помощью меню. Учитывайте это, когда будете решать целесообразность добавления карты сайта в формате HTML.

    Создать карту сайта в формате HTML на WordPress можно с помощью плагина Simple Sitemap от разработчика David Gwyer или аналогичных решений. Достаточно установить и активировать надстройку, а затем вставить предложенный шорткод на страницу, где нужна карта сайта.

    Вот решения для других CMS:

    • OSMap для Joomla.
    • Sitemap для Drupal.

    В OpenCart карта сайта в формате HTML создается автоматически.

    Карта сайта: создать и забыть

    Именно так выглядит идеальный алгоритм работы с картой сайта sitemap.xml. Чтобы его реализовать, лучше пользоваться плагинами и модулями для CMS. Они автоматически генерируют файл sitemap.xml и актуализируют его при появлении на сайте новых страниц.

    Созданную карту сайта нужно добавить в Search Console и «Яндекс.Вебмастер». После этого о sitemap.xml действительно можно забыть. Если у поисковых систем возникнут проблемы с индексированием карты, они вас уведомят. Чтобы решить проблемы, скорее всего, будет достаточно повторно сгенерировать карту и отправить ее на индексацию.

    В Google и «Яндексе», соцсетях, рассылках, на видеоплатформах, у блогеров

    Как сделать XML-карту и задать режим обхода сайта

    Создание XML-карты сайта (sitemap.xml) — обязательный пункт в списке работ по внутренней оптимизации. Зачем нужен файл sitemap, где он находится и как его создать, разбираемся в статье.

    Под термином «карта сайта» понимают 2 вида документов:

    • HTML (веб-страница) — перечень ссылок на страницы сайта. Нужна для навигации пользователей, обычно оформлена как древовидная структура, имеет адрес вида site.com/sitemap/ или site.com/karta-saita/ и т.п.
    • XML — файл в корневой папке сайта, который содержит список URL с информацией об их последнем обновлении и приоритете в индексировании. Нужна для поисковых роботов, должна быть доступна по адресу site.com/sitemap.xml.

    На сайте должны присутствовать и HTML карта, и XML. Первая нужна для пользователей, вторая — для роботов. Далее будем говорить об XML-карте сайта.

    XML-карту удобно использовать для парсинга данных с сайтов. Парсер мета-тегов и заголовков системы PromoPult: быстро, с любого сайта. Соберем мета-теги и заголовки H1 с любого сайта. Подгрузите список страниц или карту сайта.

    Первой строкой в файле sitemap указывается ссылка на пространство имен языка XML (описание стандарта, на основе которого составлен файл). Строка стандартная и всегда выглядит вот так:

    XML-карта сайта должна иметь кодировку UTF-8 и содержать следующие теги:

    • — открывающий/закрывающий тег, в него заключаются все ссылки файла sitemap.
    • — заключает в себе всю необходимую для робота информацию о каждой ссылке: URL, с какой периодичностью обновляется информация по этому адресу, дату последнего обновления и приоритет в индексировании.
    • — ограничивает конкретный URL:
    • — задает периодичность обновления информации на странице: always, hourly, daily, weekly, monthly, yearly, never (всегда, ежечасно, ежедневно, еженедельно, ежемесячно, ежегодно, никогда). Благодаря этому тегу робот может понять, насколько часто меняется содержание в документе и нужно ли его сканировать. Тег необязателен и сейчас используется крайне редко.
    • — указывает на дату последнего обновления страницы. Так робот понимает, изменилось ли что-нибудь с момента его предыдущего посещения.

    — дает роботам рекомендацию о приоритете индексирования. Главная страница всегда имеет

    1, остальные можно расставить в зависимости от предпочтений оптимизатора (например, 0,8, 0,6 и так далее до 0,1).

    Рекомендация по количеству ссылок в файле sitemap.xml — не более 50 тысяч. Если количество страниц сайта превышает это число, нужно сделать несколько карт, а в файле по адресу site.com/sitemap.xml указать на них ссылки:

    Модуль SEO в системе Promopult: все инструменты для улучшения качества сайта и поискового продвижения. Полный комплекс работ — с нами вы не упустите ни одной мелочи. Чек-листы, подсказки, прозрачная отчетность и рекомендации профессионалов. Гарантии, оплата работ в рассрочку.

    Краулер (паук) — поисковый робот, который сканирует страницы сайта и добавляет их в индекс. Краулинговый бюджет — это количество страниц за одно посещение робота, для разных сайтов бюджет ограничен — это может быть несколько десятков или сотен документов. Именно поэтому нужно направить краулера по тем страницам, которые важны для продвижения сайта, и сделать все, чтобы он не добрался до некачественных, малоинформативных, служебных страниц.

    Важно понимать, что указания в файлах robots.txt и sitemap.xml — только рекомендации для роботов.

    Отсутствие файла sitemap не является критичной ошибкой. Но если поисковый бот не найдет файл sitemap.xml, он станет сканировать и добавлять в индекс документы по своему усмотрению, и тогда наличие «мусорных», служебных страниц, дублей, страниц с ошибкой 404 в индексе может стать препятствием к выходу сайта в топ.

    Роботы всех поисковых систем могут самостоятельно обнаружить XML-карту сайта, если она доступна по адресу site.com/sitemap.xml, но есть способы донести до поисковиков важную информацию быстрее.

    1. Указать ссылку на файл в директиве sitemap файла robots.txt:

    2. Добавить файл sitemap.xml в разделы «Индексирование — Файлы Sitemap» Яндекс.Вебмастера и «Файлы Sitemap» в Google Search Console.

    Яндекс и Google не только просканируют добавленный файл, но и укажут на возможные ошибки.

    1. Вручную, руководствуясь правилами синтаксиса, которые мы описали выше. Этот вариант подходит для небольших сайтов. Не забудьте разместить файл sitemap.xml в корневой папке сайта (потребуется доступ к хостингу или ftp) и проверить, открывается ли он корректно по адресу site.com/sitemap.xml.
    2. Использовать платные и бесплатные программы для генерации XML-карты сайта (например, Sitemap Generator, Sitemap Writer Pro, SiteMap XML Dynamic). Такой софт использовался до широкого распространения онлайн-генераторов. На момент написания статьи все три программы давно не обновлялись.
    3. Использовать генераторы карты сайта онлайн — самый простой и бесплатный способ создать файл sitemap.xml.
    4. Воспользоваться возможностями системы управления сайтом.
    • Разместить файл sitemap.xml нужно в корень сайта.
    • Ссылки в sitemap не должны конфликтовать с правилами в файле robots.txt. Иначе говоря, страниц, закрытых от индексации в robots.txt, не должно быть в XML-карте сайта.
    • После автоматической генерации нужно проверить и скорректировать XML-карту на предмет попадания в нее ненужных для индексации URL.

    Рассмотрим подробнее самые популярные способы создания XML-карты.

    Если на сайте небольшое количество страниц, создайте sitemap при помощи онлайн-генераторов.

    • Mysitemapgenerator: бесплатно сканирует до 500 страниц, есть платный тариф и подписка на автоматически обновляемый файл sitemap.xml.
    • Xml-sitemaps: бесплатно без регистрации позволяет просканировать до 500 страниц, есть платный аккаунт и php-версия для установки на сервер. Англоязычный сервис.
    • Web-Site-Map: количество бесплатных страниц для генерации динамически меняется с учетом реальной нагрузки на сервер. Имеет валидатор и сообщает о битых ссылках.
    • Gensitemap: бесплатно можно просканировать до 1000 страниц.

    Большой недостаток онлайн-генераторов — они создают файл sitemap.xml раз и навсегда. Если на сайт постоянно добавляются новые страницы, такой способ не подходит.

    Во всех популярных системах управления сайтом (CMS) есть возможность создать XML-карту. Файлы sitemap в этом случае обновляются автоматически, вам не придется генерировать карту сайта заново после каждой добавленной страницы.

    Настройка sitemap.xml доступна в разделе «Маркетинг» административной панели сайта:

    Добавьте файл, назовите его и активируйте чекбокс о добавлении ссылки в robots.txt:

    Во вкладке «Файлы» выберите разделы, которые вы хотите предоставить для индексации поисковым роботам:

    То же самое проделайте во вкладке «Инфоблоки».

    Сохраните все изменения и нажмите кнопку «Запустить»:

    После создания карты сайта вы увидите сообщение, что генерация закончена:

    XML-карта сайта настраивается в двух популярных SEO-плагинах: All in One SEO Pack и Yoast SEO. Есть также отдельный плагин для создания XML-карты — Google XML Sitemaps.

    Покажем настройку на примере первого.

    Сначала нужно установить плагин. Это делается в разделе «Плагины» консоли сайта. После установки он будет доступен для настройки. Нам нужен раздел «Управление модулями»:

    В нем активируем модуль, который отвечает за XML-карту:

    После активации модуль становится доступным для редактирования:

    Далее вы можете оставить настройки по умолчанию или задать свои. Полная документация по модулю — здесь. Она на английском языке, но даже встроенный переводчик в Chrome поможет вам разобраться.

    В Yoast SEO карта сайта создается автоматически по адресу site.com/sitemap_index.xml. Модуль также доступен для редактирования или можно оставить настройки по умолчанию.

    • Joomla: используйте плагины OSMap (бесплатная версия Free и платная Pro), jSitemap (платное расширение, фактически целый набор SEO-инструментов).
    • Drupal: модуль XML Sitemap.
    • Magento: настройте Site Map Configuration.

    Выбирайте подходящий способ создания XML-карты сайта и сообщайте поисковым роботам, какие страницы им стоит посетить — это даст вам уверенность в том, что поисковый робот проиндексирует все нужные страницы вовремя.

    Использовать новый дефолтный битриксовский генератор никому не советую: он генерит sitemap исходя из инфоблоков, в результате в карту сайта постоянно попадает разный мусор, который пользователю на сайте вообще не выводится. И еще при его использовании одна карта сайта разбивается на много мелких файлов, что нецелесообразно если только у вас не портал на миллионы страниц.

    Старый генератор (Который не в “Маркетинге”, а “Настройки” – “Поиск” – “Google Sitemap”) адекватнее работает.

    Для себя на битриксовских сайтах генерирую карту через Screaming Frog SEO Spider в ручном режиме. Им же генерится и отдельный sitemap для изображений, чего “из коробки” никак не сделать.

    Анализировать эффективность рекламы Facebook можно в отчёте User Acquisition и в продуктовых отчетах с помощью сегментации.

    Рейтинг
    ( Пока оценок нет )
    Понравилась статья? Поделиться с друзьями:
    Добавить комментарий

    ;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: