it-swarm.com.ru

Как найти путь к sitemap.xml на сайтах?

Как я могу найти файл sitemap.xml сайтов?

например Переход к stackoverflow/sitemap.xml дает мне 404. 

В stackoverflow/robots.txt написано следующее:

«технически это недопустимо, поскольку по какой-то богом забытой причине пути к карте сайта должны быть АБСОЛЮТНЫМИ, а не относительными. Карта сайта: /sitemap.xml»

37
jacktrades

Я не думаю, что есть стандарт в отношении расположения карты сайта. Вот почему вы должны указывать произвольный URL-адрес для вашей карты сайта, когда вы добавляете ее с помощью Инструментов Google для веб-мастеров.

15
maksimov

Там нет стандарта, поэтому нет гарантии. С учетом вышесказанного, обычно для карты сайта самозаверяем и в корне, как это:

example.com/sitemap.xml

На некоторых серверах регистр чувствителен, так что имейте это в виду. Если его там нет, посмотрите файл robots в корне:

example.com/robots.txt

Если вы не видите его в файле роботов, отправляйтесь в Google и выполните поиск:

site:example.com filetype:xml

Это ограничит результаты XML-файлами на целевом домене. На данный момент это метод проб и ошибок, основанный на специфике сайта, с которым вы работаете. Если вы получили несколько страниц результатов из поисковой фразы Google выше, попробуйте еще больше ограничить результаты:

filetype:xml site:example.com inurl:sitemap

или же

filetype:xml site:example.com inurl:products

Если вы все еще не можете найти его, вы можете right-click > "View Source" и выполнить поиск (aka: «control find» или Ctrl + F) для .xml, чтобы увидеть, есть ли ссылка на него в коде.

89
Kirkland

Расположение карты сайта влияет на то, какие URL-адреса он может включать, но в остальном стандарт отсутствует. Вот хорошая ссылка с дополнительными пояснениями: http://www.sitemaps.org/protocol.html#location

3
Johan Falk

Согласно протокольной документации есть как минимум три варианта, которые дизайнеры веб-сайтов могут использовать, чтобы сообщить местоположению sitemap.xml поисковым системам:

  • Информирование каждой поисковой системы о местоположении через предоставленный интерфейс
  • Добавление URL в файл robots.txt
  • Отправка URL в поисковых системах через http

Поэтому, если они не решили опубликовать местоположение карты сайта в своем файле robots.txt, вы не сможете точно знать, где они разместили свои файлы sitemap.xml.

2
Jens

Используйте операторы поиска Google, чтобы найти его для вас

поиск в Google с кодом ниже ..

inurl: domain.com тип файла: xml

измените domain.com на домен, который вы хотите найти карту сайта. Это должно перечислить все файлы xml, перечисленные для данного домена .. включая все файлы Sitemap :)

0
Rejneesh Raghunath