Модератор форума: Yuri_G  
Sitemap.xml карта сайта
Модератор форума
Сообщение # 1 | 18:01:55
Sitemap.xml это карта сайта в формате XML предназначенная для поисковых роботов. В ней содержатся ссылки и метаданные (дата последнего изменения и частота изменения) о страницах подлежащих индексации. Карта сайта не является полной гарантией того, что все ссылки в ней находящиеся будут проиндексированы и попадут в поисковый индекс. Этот файл является вспомогательным, но не обязательным.
Карта сайта не должна содержать более 50000 URL.


Для сайтов системы uCoz не надо создавать карту сайта для поисковых роботов вручную с помощью локальных программ на компьютере или с помощью онлайн сервисов, система автоматически генерирует карты:
  • sitemap-site.xml - Редактор страниц
  • sitemap-blog.xml - Блог
  • sitemap-news.xml - Новости
  • sitemap-load.xml - Каталог файлов
  • sitemap-publ.xml - Каталог статей
  • sitemap-dir.xml - Каталог сайтов
  • sitemap-board.xml - Доска объявлений
  • sitemap-stuff.xml - Онлайн игры
  • sitemap-faq.xml - FAQ
  • sitemap-forum.xml - Форум
  • sitemap-photo.xml - Фотоальбом
  • sitemap-gb.xml - Гостевая книга
  • sitemap-shop.xml - Интернет-магазин
  • для самого сайта отдельно site.ru/sitemap.xml
  • Сгенерированные системой карты содержат 10000 URL
В файловом менеджере файлы sitemap появляются после первого обращения к любому из адресов карт сайта полученных в ПУ в модуле Поиск по сайту

Так же в файле robots.txt по окончании карантина появляются ссылки на карты сайта. До окончания карантина адреса карты сайта можно получить в панели управления - модуль поиск по сайту -


Важно! Карта сайта для гостевой книги sitemap-gb.xml генерируется лишь в том случае, если в Премиум настройках Seo-модуля не активна опция - "Запретить индексацию Гостевой книги поисковыми системами". Если опция активна, карта генерироваться не будет.

Что еще важно! Чтобы не генерировались пустые карты сайта автоматически, не нужно держать активными пустые модули в которых совсем нет материалов. Если не планируете наполнять модуль материалами, лучше удалите его совсем и лишняя пустая карта сайта не будет генерироваться.

Начиная с обновления от 13.09.2023 в карты сайтов модулей где создаются категории, URL категорий теперь так же добавляются в sitemap.

Важно! Если при добавлении карты сайта в вебмастер Google вам в колонке статус сообщается "Не получено", это не проблема с стороны uCoz, это некорректная работа именно Google Webmaster. Обычно чтобы эта ошибка устранилась, достаточно чтобы прошло несколько суток, иногда бывает и несколько часов достаточно.

Стоит усвоить основное понимание по данной ошибке, если карта сайта по прямой ссылке у вас доступна, это уже хорошо и ошибок с стороны uCoz нет. То что гугл сообщает вам об ошибке, это конкретно ошибки вебмастера и скорость обработки sitemap с стороны Google.


До окончания карантина адреса sitemap не надо передавать поисковым системам через панели вебмастера
После окончания карантина можно добавить карты в панель вебматера Яндекса //u.to/32kB
и в инструменты для вебмастеров Google


Некоторые проблемы и причины возникновения проблем


Проблема: Ошибки в вебмастере Яндекса или Google
Некорректный URL (не соответствует местоположению файла Sitemap) или Пути не совпадают или Неизвестный тип ошибки (ERR_HOST_NOT_CONFIRM)

Причины: Вы неправильно указали адрес сайта. Ваш сайт настроен на отображение без www, а в вебмастер вы добавили сайт с www . Или ошибка в написании адреса карты сайта в robots.txt где вы опять же неправильно указали адрес с www или без. Читать подробней о главном зеркале сайта


Проблема: Ошибки в вебмастере Яндекса "Неверный формат документа" В страницах с ошибкой в списке URL и sitemap.xml
Причины:
1)Такую ошибку Яндекс обычно выдает, если находит ссылку на адрес карты сайта в коде страницы. Робот не принимает карту сайта в формате xml со страниц. Это ещё раз говорит о том, что прописывать адреса sitemap.xml в код страниц не стоит. Индексацию это точно не улучшит, а ошибки иногда будете получать

2) Вы закачали свою карту сайта, или стандартную, но исправленную вами на компьютере. Такую ошибку робот выдает при сохранении в неправильной кодировке (должна быть utf-8) или у документа неправильное форматирование. Это значит, что создавать свою карту сайта не надо, достаточно системной. А так же совершенно категорически не стоит заниматься самостоятельными правками sitemap.xml


Проблема: Ошибка в вебмастере Google
Файл не содержит URL
Причина: Такое обычно бывает, если робот Google на новом сайте после окончания карантина в robots.txt находит ссылку на карту сайта форума например, а модуль форума запущен, но пустой. То есть нет форумов, нет тем, нет сообщений
Поэтому пока сайт на карантине старайтесь наполнять информацией все запущенные модули


Проблема: В списке URL карты сайта отсутствуют ссылки на страницы залитые через файловый менеджер
Причина: Страницы залитые в файловый менеджер не попадают в карту сайта, так как не являются системными или страницами модулей. Отсутствие URL на залитые страницы в карте сайта не влияют на индексацию подобных страниц. Для индексации вам надо вывести ссылки на такие страницы на сайт


Проблема: Ошибки сканирования - В файле sitemap - Вебмастер Google (сайт давно снят с карантина)
Причина: Добавленная страница через редактор страниц или любые другие страницы прописаны запретом в файле robots.txt. Проверьте правильно ли составлен у вас robots.txt
Если вы сами прописывали страницу/ы в роботс, то ничего предпринимать не надо - Гугл выдает техническую информацию


Проблема: Количество отправленных (загруженных роботом) и проиндексированных URL не совпадает.Проиндексированных меньше
Причина: Карта сайта не является залогом того, что все URL на вашем сайте будут проиндексированы и попадут в поисковый индекс. Нормальной считается ситуация, когда проиндексировано около 80% загруженных url


Полезная информация


Карта сайта обновляется автоматически раз в 2-4 дня, при условии, что на сайт были добавлены новые материалы.

Если надо по каким либо причинам обновить карту не дожидаясь автоматического обновления, то заходим в файловый менеджер и удаляем карту сайта (карту форума или карту интернет-магазина). Удаленная карта тут же заменится новой, но уже с обновленной информацией. Для первого вызова удаленной карты надо пройти по её адресу, например: site.ru/sitemap.xml

Никогда не выводите ссылки на карту сайта в формате xml на страницы сайта. Индексацию это точно не улучшит, как и степень доверия к вашему сайту у поисковой машины. Роботы имеют доступ к карте через корневую директорию файлового менеджера так же по умолчанию адреса прописаны в robots.txt и не нужно дублировать адрес на страницах.

Не пытайтесь генерировать sitemap с помощью различных программ или всяких сервисов. Кроме блокировки вашего ip и различных вы ничего не получите. Системной карты вполне достаточно, она автоматически обновляется. А залитую карту вам придется каждый раз обновлять вручную. А если учесть настройки запросов во избежании блокировки ip, то это получается бесконечный никчемный труд

Не пытайтесь скачивать карту сайта, вручную делать изменения и закачивать её снова. Любая ошибка с вашей стороны и вы получите массу ошибок индексации или проблем с самой картой сайта. Лучше ничего не трогать

При добавлении карты сайта в форму вебмастера Яндекса нужно добавлять полный адрес карты. Например: //u.to/4AwQ
При добавлении карты в форму вебмастра Google нужно добавлять только sitemap.xml адрес сайта с закрывающим слешем Google подставляет сам.
Прикрепления: 7551743.jpg (2.2 Kb)
I=_Andriuxa_=I
Репутация: 0

Сообщение # 31 | 23:27:59
у меня есть вопрос на счет яндекса там где ошибки яндекс пишет мне пишет вот это

Неверный формат документа - 1
URL /sitemap.xml
Сообщение отредактировал I=_Andriuxa_=I - Вторник, 13 Мар 2012, 01:55:20
frusha
Сообщений: 4
Репутация: 5

Сообщение # 32 | 14:18:31
вот уже 2 месяца яндекс мне показывает такую картинку



подскажите пожалуйста как исправить эту ошибку

вот карта сайта

User-agent: *
Disallow: /a/
Disallow: /stat/
Disallow: /index/1
Disallow: /index/2
Disallow: /index/3
Disallow: /index/5
Disallow: /index/7
Disallow: /index/8
Disallow: /index/9
Disallow: /panel/
Disallow: /admin/
Disallow: /secure/
Disallow: /informer/
Disallow: /mchat
Disallow: /search
Disallow: /shop/order/

Host: new-iskushenie.ru
Sitemap: http://new-iskushenie.ru/sitemap.xml
Sitemap: http://new-iskushenie.ru/sitemap-forum.xml
Sitemap: http://new-iskushenie.ru/sitemap-publ.xml
Прикрепления: 2560608.jpg (250.8 Kb)
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 33 | 16:27:58
I=_Andriuxa_=I, адрес сайта дайте и прочитайте первое сообщение темы с этого места Некоторые проблемы и причины возникновения проблем

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
I=_Andriuxa_=I
Репутация: 0

Сообщение # 34 | 18:03:10
ice-zona.ru прочитал но так и не понял точно
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 35 | 18:35:34
I=_Andriuxa_=I,
Code
<link rel="alternate" type="application/rss+xml" title="Sitemap XML" href="/sitemap.xml" />
или удалите карту оттуда или вставьте адрес рсс канала

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
I=_Andriuxa_=I
Репутация: 0

Сообщение # 36 | 21:23:55
еще 1 вопрос поставил новый домен и скажите пожалуйста время скоко мне ждать хоть приблизительно а то у меня уже терпение кончаеться я уже от 17.01.2012 жду пока меня проиндексують и токо 300 страниц в гугле и яндексе 173.............. меня ето убивает

Добавлено (24-Мар-2012, 21:23:55)
---------------------------------------------

Quote (webanet)
I=_Andriuxa_=I, Code<link rel="alternate" type="application/rss+xml" title="Sitemap XML" href="/sitemap.xml" /> или удалите карту оттуда или вставьте адрес рсс канала

я вообще удалил ету строку
vital78
Репутация: 2

Сообщение # 37 | 11:36:40
А когда Гугл пишет "Файл Sitemap содержит URL, доступ к которым заблокирован в файле robots.txt. " стандартный robots.txt. не трогал, я только сегодня загрузил карту,все по пунктам из "ваших" примеров...и вот сразу ошибка.Пройдет?Или не так что то?
Сообщение отредактировал vital78 - Вторник, 27 Мар 2012, 11:37:10
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 38 | 12:50:19
vital78, а адрес сайта кто давать будет? дайте адрес сайта

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
vital78
Репутация: 2

Сообщение # 39 | 13:42:58
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 40 | 15:04:59
vital78, у вас только сегодня снят с сайта карантин. удалите из вебмастера гугла все карты сайта которые вы добавили. и после этого добавьте снова. ошибок быть не должно

или поставьте выделение на все карты и нажмите на кнопочку отправить ещё раз

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
vital78
Репутация: 2

Сообщение # 41 | 19:51:45
снова все удалил и и добавил снова, первое время все нормально,а щас, под вечер опять туже ошибку показывает... на яндексе все без ошибок
Сообщение отредактировал vital78 - Вторник, 27 Мар 2012, 20:34:24
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 42 | 22:31:12
vital78, дайте скрин страницы с ошибкой

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
oriflame4000
Сообщений: 38
Репутация: 0

Сообщение # 43 | 22:31:22
Скажите, пожалуйста, раньше были сервисы, которые создавали Sitemap.
затем ее скачивали и кидали в корневую папку хостинга.

Сейчас этого не надо делать? все автоматически на сайте происходит? Созданная автоматически на сайте и созданная на сторонних ресурсах - чем-нибудь между собой отличаются?
спасибо
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 44 | 23:15:02
oriflame4000,
Quote
Сейчас этого не надо делать?
не надо. карты сайта генерируются автоматически на каждом сайте

Quote
Созданная автоматически на сайте и созданная на сторонних ресурсах - чем-нибудь между собой отличаются?
отличается тем, что вам ничего делать не надо. не надо её генерировать, не надо вручную постоянно обновлять

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
vital78
Репутация: 2

Сообщение # 45 | 10:34:41
Quote (webanet)
дайте скрин страницы с ошибкой

Сообщение отредактировал vital78 - Среда, 28 Мар 2012, 10:39:51
Поиск: