Модератор форума: Yuri_G  
Сообщество uCoz » Вебмастеру » Раскрутка сайта » Sitemap.xml карта сайта (Sitemap.xml карта сайта для поисковых роботов)
Sitemap.xml карта сайта
Модератор форума
Сообщение # 1 | 18:01:55
Sitemap.xml это карта сайта в формате XML предназначенная для поисковых роботов. В ней содержатся ссылки и метаданные (дата последнего изменения и частота изменения) о страницах подлежащих индексации. Карта сайта не является полной гарантией того, что все ссылки в ней находящиеся будут проиндексированы и попадут в поисковый индекс. Этот файл является вспомогательным, но не обязательным.
Карта сайта не должна содержать более 50000 URL.


Для сайтов системы uCoz не надо создавать карту сайта для поисковых роботов вручную с помощью локальных программ на компьютере или с помощью онлайн сервисов, система автоматически генерирует карты:
  • sitemap-site.xml - Редактор страниц
  • sitemap-blog.xml - Блог
  • sitemap-news.xml - Новости
  • sitemap-load.xml - Каталог файлов
  • sitemap-publ.xml - Каталог статей
  • sitemap-dir.xml - Каталог сайтов
  • sitemap-board.xml - Доска объявлений
  • sitemap-stuff.xml - Онлайн игры
  • sitemap-faq.xml - FAQ
  • sitemap-forum.xml - Форум
  • sitemap-photo.xml - Фотоальбом
  • sitemap-gb.xml - Гостевая книга
  • sitemap-shop.xml - Интернет-магазин
  • для самого сайта отдельно site.ru/sitemap.xml
  • Сгенерированные системой карты содержат 10000 URL
В файловом менеджере файлы sitemap появляются после первого обращения к любому из адресов карт сайта полученных в ПУ в модуле Поиск по сайту

Так же в файле robots.txt по окончании карантина появляются ссылки на карты сайта. До окончания карантина адреса карты сайта можно получить в панели управления - модуль поиск по сайту -


Важно! Карта сайта для гостевой книги sitemap-gb.xml генерируется лишь в том случае, если в Премиум настройках Seo-модуля не активна опция - "Запретить индексацию Гостевой книги поисковыми системами". Если опция активна, карта генерироваться не будет.

Что еще важно! Чтобы не генерировались пустые карты сайта автоматически, не нужно держать активными пустые модули в которых совсем нет материалов. Если не планируете наполнять модуль материалами, лучше удалите его совсем и лишняя пустая карта сайта не будет генерироваться.

Начиная с обновления от 13.09.2023 в карты сайтов модулей где создаются категории, URL категорий теперь так же добавляются в sitemap.

Важно! Если при добавлении карты сайта в вебмастер Google вам в колонке статус сообщается "Не получено", это не проблема с стороны uCoz, это некорректная работа именно Google Webmaster. Обычно чтобы эта ошибка устранилась, достаточно чтобы прошло несколько суток, иногда бывает и несколько часов достаточно.

Стоит усвоить основное понимание по данной ошибке, если карта сайта по прямой ссылке у вас доступна, это уже хорошо и ошибок с стороны uCoz нет. То что гугл сообщает вам об ошибке, это конкретно ошибки вебмастера и скорость обработки sitemap с стороны Google.


До окончания карантина адреса sitemap не надо передавать поисковым системам через панели вебмастера
После окончания карантина можно добавить карты в панель вебматера Яндекса //u.to/32kB
и в инструменты для вебмастеров Google


Некоторые проблемы и причины возникновения проблем


Проблема: Ошибки в вебмастере Яндекса или Google
Некорректный URL (не соответствует местоположению файла Sitemap) или Пути не совпадают или Неизвестный тип ошибки (ERR_HOST_NOT_CONFIRM)

Причины: Вы неправильно указали адрес сайта. Ваш сайт настроен на отображение без www, а в вебмастер вы добавили сайт с www . Или ошибка в написании адреса карты сайта в robots.txt где вы опять же неправильно указали адрес с www или без. Читать подробней о главном зеркале сайта


Проблема: Ошибки в вебмастере Яндекса "Неверный формат документа" В страницах с ошибкой в списке URL и sitemap.xml
Причины:
1)Такую ошибку Яндекс обычно выдает, если находит ссылку на адрес карты сайта в коде страницы. Робот не принимает карту сайта в формате xml со страниц. Это ещё раз говорит о том, что прописывать адреса sitemap.xml в код страниц не стоит. Индексацию это точно не улучшит, а ошибки иногда будете получать

2) Вы закачали свою карту сайта, или стандартную, но исправленную вами на компьютере. Такую ошибку робот выдает при сохранении в неправильной кодировке (должна быть utf-8) или у документа неправильное форматирование. Это значит, что создавать свою карту сайта не надо, достаточно системной. А так же совершенно категорически не стоит заниматься самостоятельными правками sitemap.xml


Проблема: Ошибка в вебмастере Google
Файл не содержит URL
Причина: Такое обычно бывает, если робот Google на новом сайте после окончания карантина в robots.txt находит ссылку на карту сайта форума например, а модуль форума запущен, но пустой. То есть нет форумов, нет тем, нет сообщений
Поэтому пока сайт на карантине старайтесь наполнять информацией все запущенные модули


Проблема: В списке URL карты сайта отсутствуют ссылки на страницы залитые через файловый менеджер
Причина: Страницы залитые в файловый менеджер не попадают в карту сайта, так как не являются системными или страницами модулей. Отсутствие URL на залитые страницы в карте сайта не влияют на индексацию подобных страниц. Для индексации вам надо вывести ссылки на такие страницы на сайт


Проблема: Ошибки сканирования - В файле sitemap - Вебмастер Google (сайт давно снят с карантина)
Причина: Добавленная страница через редактор страниц или любые другие страницы прописаны запретом в файле robots.txt. Проверьте правильно ли составлен у вас robots.txt
Если вы сами прописывали страницу/ы в роботс, то ничего предпринимать не надо - Гугл выдает техническую информацию


Проблема: Количество отправленных (загруженных роботом) и проиндексированных URL не совпадает.Проиндексированных меньше
Причина: Карта сайта не является залогом того, что все URL на вашем сайте будут проиндексированы и попадут в поисковый индекс. Нормальной считается ситуация, когда проиндексировано около 80% загруженных url


Полезная информация


Карта сайта обновляется автоматически раз в 2-4 дня, при условии, что на сайт были добавлены новые материалы.

Если надо по каким либо причинам обновить карту не дожидаясь автоматического обновления, то заходим в файловый менеджер и удаляем карту сайта (карту форума или карту интернет-магазина). Удаленная карта тут же заменится новой, но уже с обновленной информацией. Для первого вызова удаленной карты надо пройти по её адресу, например: site.ru/sitemap.xml

Никогда не выводите ссылки на карту сайта в формате xml на страницы сайта. Индексацию это точно не улучшит, как и степень доверия к вашему сайту у поисковой машины. Роботы имеют доступ к карте через корневую директорию файлового менеджера так же по умолчанию адреса прописаны в robots.txt и не нужно дублировать адрес на страницах.

Не пытайтесь генерировать sitemap с помощью различных программ или всяких сервисов. Кроме блокировки вашего ip и различных вы ничего не получите. Системной карты вполне достаточно, она автоматически обновляется. А залитую карту вам придется каждый раз обновлять вручную. А если учесть настройки запросов во избежании блокировки ip, то это получается бесконечный никчемный труд

Не пытайтесь скачивать карту сайта, вручную делать изменения и закачивать её снова. Любая ошибка с вашей стороны и вы получите массу ошибок индексации или проблем с самой картой сайта. Лучше ничего не трогать

При добавлении карты сайта в форму вебмастера Яндекса нужно добавлять полный адрес карты. Например: //u.to/4AwQ
При добавлении карты в форму вебмастра Google нужно добавлять только sitemap.xml адрес сайта с закрывающим слешем Google подставляет сам.
Прикрепления: 7551743.jpg (2.2 Kb)
Amati5210
Сообщений: 125
Репутация: 16

Сообщение # 151 | 12:11:20
Цитата (dragon2012)
ребят помогите у меня сайт ен может никак проиндексироваться и что это за sitemap и где его искать?. вообще не пойму
Такое впечатление, что на каждой странице этой темы, прямо сверху, ничего по Вашему вопросу не написано и 9 предыдущих страниц ни о чём. А почему Вы решили что индексация не получается именно из-за sitemap? Сколько времени после регистрации на Юкозе? Будет неудивительно если Вы только на днях создали свой сайт или ещё чего то...

Мой сайт РемДомТех
Сообщение отредактировал Amati5210 - Воскресенье, 13 Янв 2013, 12:14:25
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 152 | 12:21:28
dragon2012,
Цитата
где его искать?.
Ни искать, ни тем более изменять его от нечегоделать не стоит, сайт нормально проиндексируется и без вашего вмешательства в saitmap.

dragon2012
Сообщений: 27
Репутация: 0

Сообщение # 153 | 21:39:57
Цитата (класс9498)
Цитата dragon2012Sitemap.xml это карта сайта в формате XML предназначенная для поисковых роботов. В ней содержатся ссылки и метаданные (дата последнего изменения и частота
изменения) о страницах подлежащих индексации. Карта сайта не является
полной гарантией того, что все ссылки в ней находящиеся будут
проиндексированы и попадут в поисковый индекс. Этот файл является
вспомогательным, но не обязательным.
Карта сайта не должна содержать более 50000 URL. Например: http://site.ru/sitemap.xml находится в файловом менеджере
а теперь если можно по русски не заумными а простыми словами

Добавлено (13 Янв 2013, 21:39:18)
---------------------------------------------

Цитата (Amati5210)
Такое впечатление, что на каждой странице этой темы, прямо сверху, ничего по Вашему вопросу не написано и 9 предыдущих страниц ни о чём. А почему Вы решили что индексация не получается именно из-за sitemap? Сколько времени после регистрации на Юкозе? Будет неудивительно если Вы только на днях создали свой сайт или ещё чего то...
ха. ты будеш удивлен. 2 месяца и сайту и столько я зарегистрирован на юкозе. сверху каждой тему я не понимаю кто о чем пишет. вы меня извените я не мастер я не знаю что какое слово обозначает. мне бы эллементарно простыми словами где он находится и что с ним надо делать

Добавлено (13 Янв 2013, 21:39:57)
---------------------------------------------

Цитата (Miss_Esq)
Ни искать, ни тем более изменять его от нечегоделать не стоит, сайт нормально проиндексируется и без вашего вмешательства в saitmap.
сколько надо ждать?
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 154 | 21:54:35

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
dragon2012
Сообщений: 27
Репутация: 0

Сообщение # 155 | 22:18:26
Цитата (webanet)
читайте
Спасибо. я во всем разобрался
класс9498
Сообщений: 7
Репутация: 0

Сообщение # 156 | 17:17:16
извините наверно не в тему но почему гугал проиндексировал всего 2 страницы моего сайта хотя у меня их 102 не справедливо и что мне теперь делать
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 157 | 17:18:44
класс9498, ждите и не задавайте при этом пустых вопросов ни о чем, нечитая названия тем. сразу все не бывает. индексация дело постепенное

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
Тёплый_Котя
Репутация: 0

Сообщение # 158 | 11:59:22
Почему вы игнорируете вопросы такого типа..

Цитата
Здравствуйте!
Что делать, если на сайте больше, чем 10000 URLов? Можно ли каким-то образом создавать несколько файлов sitemap по 10000 урлов

У меня такая же проблема.. На сайте http://referatzone.com более 15к страниц.. Естественно в сайтмап не убирается существенная часть.. так что вы посоветуете? Может есть возможность сделать сайтмап резиновый.. и растянуть, например, на 100к урлов?

Очень болезненная проблема.. ответьте пожалуйста хоть что-нибудь..
milkor
Репутация: 0

Сообщение # 159 | 19:57:17
Здравствуйте, подскажите, пожалуйста, при генерации Sitemap появляются страницы, которых нет на сайте, http://www.site.ru/?dppage=3, http://www.site.ru/?dppage=2, http://www.site.ru/?dppage=1, они полностью дублируют главную страницу http://www.site.ru/index.html, [url=javascript://]Отправить[/url] что это такое?
Admin3346
Сообщений: 3
Репутация: 0

Сообщение # 160 | 22:58:25
Здравствуйте,поменял на сайте домен,раньше было ucoz.com теперь .net но в яндексе выдает такую ошибку (
07.04.2013 наш робот получил полный запрет на индексирование сайта в Вашем файле robots.txt. Пожалуйста, воспользуйтесь формой проверки. Если запрет все еще присутствует, то по вопросу устранения этой
проблемы Вам нужно обратиться к администратору Вашего сайта или хостеру.
Если сейчас запрет отсутствует, то сообщение обновится в течение 2–3
дней.) а в гугли (Блокирует ли файл robots.txt важные страницы?Некоторые важные страницы блокируются в файле robots.txt)
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 161 | 23:05:15
Admin3346,
Цитата
раньше было ucoz.com теперь .net
это наверное очень информативно, но только для вас. нужен адрес сайта, а не тексты конспирации

при прикреплении домена, если не стоит галка в общих настройках на индексацию по обоим доменам, старый юкозовский закрывается от индексации и индексируется только новый. а вы по какому адресу инфо смотрите?

Цитата
а в гугли (Блокирует ли файл robots.txt важные страницы?Некоторые важные страницы блокируются в файле robots.txt)
нужны примеры урлов, а не ссылка на ваш аккаунт, доступ к которому имеете только вы

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
Admin3346
Сообщений: 3
Репутация: 0

Сообщение # 162 | 23:22:41
не какой конспираци...а вы по какому адресу инфо смотрите? по старый адрес irzu.ucoz.com новый irzu.net,надо ли мне менять адрес в robot.txt-e?
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 163 | 23:54:04
Admin3346, это то, что я говорила вот роботс по старому домену http://irzu.ucoz.com/robots.txt вот роботс по новому http://irzu.net/robots.txt
старый закрыт от индексации и это правильно. теперь сайт будет индексироваться по новому. новый адрес и нужно добавить в поисковики и уже смотреть статистику по новому

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
Admin3346
Сообщений: 3
Репутация: 0

Сообщение # 164 | 14:45:50
webanet спасибо вам.

Добавлено (12 Апр 2013, 14:45:50)
---------------------------------------------
webanet, Здравствуйте,после смены домена у меня посешаемость сайта сильно упало...Это нормально или я что-то должен сделать? подскахите пожалуйста...

webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 165 | 15:07:05
Admin3346, читаем //forum.ucoz.ru/forum/21-38634-1

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
Сообщество uCoz » Вебмастеру » Раскрутка сайта » Sitemap.xml карта сайта (Sitemap.xml карта сайта для поисковых роботов)
Поиск: