Модератор форума: Yuri_G  
Сообщество uCoz » Вебмастеру » Раскрутка сайта » Sitemap.xml карта сайта (Sitemap.xml карта сайта для поисковых роботов)
Sitemap.xml карта сайта
Модератор форума
Сообщение # 1 | 18:01:55
Sitemap.xml это карта сайта в формате XML предназначенная для поисковых роботов. В ней содержатся ссылки и метаданные (дата последнего изменения и частота изменения) о страницах подлежащих индексации. Карта сайта не является полной гарантией того, что все ссылки в ней находящиеся будут проиндексированы и попадут в поисковый индекс. Этот файл является вспомогательным, но не обязательным.
Карта сайта не должна содержать более 50000 URL.


Для сайтов системы uCoz не надо создавать карту сайта для поисковых роботов вручную с помощью локальных программ на компьютере или с помощью онлайн сервисов, система автоматически генерирует карты:
  • sitemap-site.xml - Редактор страниц
  • sitemap-blog.xml - Блог
  • sitemap-news.xml - Новости
  • sitemap-load.xml - Каталог файлов
  • sitemap-publ.xml - Каталог статей
  • sitemap-dir.xml - Каталог сайтов
  • sitemap-board.xml - Доска объявлений
  • sitemap-stuff.xml - Онлайн игры
  • sitemap-faq.xml - FAQ
  • sitemap-forum.xml - Форум
  • sitemap-photo.xml - Фотоальбом
  • sitemap-gb.xml - Гостевая книга
  • sitemap-shop.xml - Интернет-магазин
  • для самого сайта отдельно site.ru/sitemap.xml
  • Сгенерированные системой карты содержат 10000 URL
В файловом менеджере файлы sitemap появляются после первого обращения к любому из адресов карт сайта полученных в ПУ в модуле Поиск по сайту

Так же в файле robots.txt по окончании карантина появляются ссылки на карты сайта. До окончания карантина адреса карты сайта можно получить в панели управления - модуль поиск по сайту -


Важно! Карта сайта для гостевой книги sitemap-gb.xml генерируется лишь в том случае, если в Премиум настройках Seo-модуля не активна опция - "Запретить индексацию Гостевой книги поисковыми системами". Если опция активна, карта генерироваться не будет.

Что еще важно! Чтобы не генерировались пустые карты сайта автоматически, не нужно держать активными пустые модули в которых совсем нет материалов. Если не планируете наполнять модуль материалами, лучше удалите его совсем и лишняя пустая карта сайта не будет генерироваться.

Начиная с обновления от 13.09.2023 в карты сайтов модулей где создаются категории, URL категорий теперь так же добавляются в sitemap.

Важно! Если при добавлении карты сайта в вебмастер Google вам в колонке статус сообщается "Не получено", это не проблема с стороны uCoz, это некорректная работа именно Google Webmaster. Обычно чтобы эта ошибка устранилась, достаточно чтобы прошло несколько суток, иногда бывает и несколько часов достаточно.

Стоит усвоить основное понимание по данной ошибке, если карта сайта по прямой ссылке у вас доступна, это уже хорошо и ошибок с стороны uCoz нет. То что гугл сообщает вам об ошибке, это конкретно ошибки вебмастера и скорость обработки sitemap с стороны Google.


До окончания карантина адреса sitemap не надо передавать поисковым системам через панели вебмастера
После окончания карантина можно добавить карты в панель вебматера Яндекса //u.to/32kB
и в инструменты для вебмастеров Google


Некоторые проблемы и причины возникновения проблем


Проблема: Ошибки в вебмастере Яндекса или Google
Некорректный URL (не соответствует местоположению файла Sitemap) или Пути не совпадают или Неизвестный тип ошибки (ERR_HOST_NOT_CONFIRM)

Причины: Вы неправильно указали адрес сайта. Ваш сайт настроен на отображение без www, а в вебмастер вы добавили сайт с www . Или ошибка в написании адреса карты сайта в robots.txt где вы опять же неправильно указали адрес с www или без. Читать подробней о главном зеркале сайта


Проблема: Ошибки в вебмастере Яндекса "Неверный формат документа" В страницах с ошибкой в списке URL и sitemap.xml
Причины:
1)Такую ошибку Яндекс обычно выдает, если находит ссылку на адрес карты сайта в коде страницы. Робот не принимает карту сайта в формате xml со страниц. Это ещё раз говорит о том, что прописывать адреса sitemap.xml в код страниц не стоит. Индексацию это точно не улучшит, а ошибки иногда будете получать

2) Вы закачали свою карту сайта, или стандартную, но исправленную вами на компьютере. Такую ошибку робот выдает при сохранении в неправильной кодировке (должна быть utf-8) или у документа неправильное форматирование. Это значит, что создавать свою карту сайта не надо, достаточно системной. А так же совершенно категорически не стоит заниматься самостоятельными правками sitemap.xml


Проблема: Ошибка в вебмастере Google
Файл не содержит URL
Причина: Такое обычно бывает, если робот Google на новом сайте после окончания карантина в robots.txt находит ссылку на карту сайта форума например, а модуль форума запущен, но пустой. То есть нет форумов, нет тем, нет сообщений
Поэтому пока сайт на карантине старайтесь наполнять информацией все запущенные модули


Проблема: В списке URL карты сайта отсутствуют ссылки на страницы залитые через файловый менеджер
Причина: Страницы залитые в файловый менеджер не попадают в карту сайта, так как не являются системными или страницами модулей. Отсутствие URL на залитые страницы в карте сайта не влияют на индексацию подобных страниц. Для индексации вам надо вывести ссылки на такие страницы на сайт


Проблема: Ошибки сканирования - В файле sitemap - Вебмастер Google (сайт давно снят с карантина)
Причина: Добавленная страница через редактор страниц или любые другие страницы прописаны запретом в файле robots.txt. Проверьте правильно ли составлен у вас robots.txt
Если вы сами прописывали страницу/ы в роботс, то ничего предпринимать не надо - Гугл выдает техническую информацию


Проблема: Количество отправленных (загруженных роботом) и проиндексированных URL не совпадает.Проиндексированных меньше
Причина: Карта сайта не является залогом того, что все URL на вашем сайте будут проиндексированы и попадут в поисковый индекс. Нормальной считается ситуация, когда проиндексировано около 80% загруженных url


Полезная информация


Карта сайта обновляется автоматически раз в 2-4 дня, при условии, что на сайт были добавлены новые материалы.

Если надо по каким либо причинам обновить карту не дожидаясь автоматического обновления, то заходим в файловый менеджер и удаляем карту сайта (карту форума или карту интернет-магазина). Удаленная карта тут же заменится новой, но уже с обновленной информацией. Для первого вызова удаленной карты надо пройти по её адресу, например: site.ru/sitemap.xml

Никогда не выводите ссылки на карту сайта в формате xml на страницы сайта. Индексацию это точно не улучшит, как и степень доверия к вашему сайту у поисковой машины. Роботы имеют доступ к карте через корневую директорию файлового менеджера так же по умолчанию адреса прописаны в robots.txt и не нужно дублировать адрес на страницах.

Не пытайтесь генерировать sitemap с помощью различных программ или всяких сервисов. Кроме блокировки вашего ip и различных вы ничего не получите. Системной карты вполне достаточно, она автоматически обновляется. А залитую карту вам придется каждый раз обновлять вручную. А если учесть настройки запросов во избежании блокировки ip, то это получается бесконечный никчемный труд

Не пытайтесь скачивать карту сайта, вручную делать изменения и закачивать её снова. Любая ошибка с вашей стороны и вы получите массу ошибок индексации или проблем с самой картой сайта. Лучше ничего не трогать

При добавлении карты сайта в форму вебмастера Яндекса нужно добавлять полный адрес карты. Например: //u.to/4AwQ
При добавлении карты в форму вебмастра Google нужно добавлять только sitemap.xml адрес сайта с закрывающим слешем Google подставляет сам.
Прикрепления: 7551743.jpg (2.2 Kb)
contoplus
Сообщений: 5
Репутация: 3

Сообщение # 211 | 01:26:41
Цитата webanet ()
все обновляется. нужно кеш сбросить, если не видите изменений
спасибо, все ок.
remvologda28485
Сообщений: 7
Репутация: 0

Сообщение # 212 | 23:57:22
Цитата webanet ()
класс9498, ждите и не задавайте при этом пустых вопросов ни о чем, нечитая названия тем. сразу все не бывает. индексация дело постепенное
Ага индексация дело постепенное, а воровство контента мгновенное. Я сайт запорол таким образом. Выложил на etxt за год почти 25000 р. в итоге получил 100% воровство вследствие неэфективности вашего автогенерируемого сайтмапа и АГС от Яндекса. Все сайт на помойку.

Совет перекачивайте этот файл. убирайте ненужные страницы (где вы всего лишь запятую допустим новую поставили или новую страницу с какой-то технической информацией, другими словами нужный копипаст, страницы которые вы запретили к индексации самостоятельно) и основа закачивайте в файловый менеджер, тогда роботы не будут в полном шоке, что сайтмап сообщает им о всякой ерунде, а будет сообщать только о новом хорошем, полезном и уникальном на вашем сайте.

Помните что для того чтобы поисковые боты жили на вашем сайте вам необходимо очень круто развить ресурс, а пока они сканируют страниц по 10 и выбирая из сайтмапа все это де...мо не больно торопятся приходить на него снова.
planetaD
Сообщений: 104
Репутация: 74

Сообщение # 213 | 14:53:22
Помогите пожалуйста разобраться. Я решила проверить файл sitemap в валидаторе яндекса, а он мне выдал что страница закрыта для индексации robot.txt нужно ли это исправлять, а то я сама не очень разбираюсь, но я почитала, что он должен индексироваться.

Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 214 | 15:16:06
planetaD, У вас сайт на карантине ? Вообще то sitemap не индексируется роботами а просто читается ими для поиска страниц по адресам указанным в нём ..

planetaD
Сообщений: 104
Репутация: 74

Сообщение # 215 | 15:39:58
Miss_Esq, нет он у меня уже давно http://www.razvitierebenka.net
Может я просто чего не допонимаю, у меня просто после около месяца индексация стала очень медленная, вот я влезла в какие-то дебри

Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 216 | 15:54:26
planetaD,
Цитата
стала очень медленная
Что значит медленная ? Пишите по 100 страниц новых в день а в индексе прибавляется только по 10 ?

planetaD
Сообщений: 104
Репутация: 74

Сообщение # 217 | 16:13:32
Miss_Esq, нет я в среднем добавляю 3-4 страницы ежедневно, у меня группы в соц сетях, я делаю туда постинг, страницы индексировались в течение нескольких дней всегда, максимум неделя, теперь вот месяц нормально не индексируются, хотя робот на сайт заходит каждый день. Не могу понять в чем дело.

Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 218 | 16:48:25
planetaD,
Цитата
Не могу понять в чем дело
Может тема материалов настолько замылена в интернете что ваши страницы поисковикам и даром не нужны ...

planetaD
Сообщений: 104
Репутация: 74

Сообщение # 219 | 17:01:47
Miss_Esq, статьи я пишу разные, стараюсь, чтобы было интересно людям. У меня идет смена структуры сайта, я раньше не использовала каталог статей, сейчас будет новый шаблон и новая структура. Я старые статьи переношу в каталог (материал получается дублируется), потом как все сделаю настрою переадресацию со старых на новые . И получается как раз в каталоге добавляю много статей (а текст их уже выходит не уникален совсем). Я в яндекс писала об этом, сказали, что ничего страшного не произойдет. Ну может быть все таки из-за этого. Можно как их пока закрыть для индексации? Только чтобы не каждую прописывать ( а то я без каталога за 3 года насоздавала более 700 страниц)

webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 220 | 18:47:15
planetaD, у вас правильно настроенный файл robots.txt там нет запретов страниц сайта. приведите пример на страницу, которую вам выдает валидатор карты сайта

и ошибок у вас нет

Прикрепления: 6119551.jpg (54.3 Kb)

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
planetaD
Сообщений: 104
Репутация: 74

Сообщение # 221 | 13:31:06
webanet, хотела вам скинуть файл, стала сегодня формировать, а мне тоже выдал, что ошибок нет. Не поняла, что это было вчера. И сегодня наконец-то все страницы за месяц проиндексировал.

Лена1858
Сообщений: 23
Репутация: 0

Сообщение # 222 | 17:23:57
Здравствуйте, подскажите все ли с моим сайтом сделано верно. нет ни каких ошибок с sitemap и robot.txt, правильно ли в поисковиках индексируется мой сайт. http://webmaster-profi.ru/
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 223 | 17:42:33
Лена1858, Если эти файлы, формируются системно, без вашего вмешательства, беспокоится о чём либо не стоит ...

Лена1858
Сообщений: 23
Репутация: 0

Сообщение # 224 | 18:00:32
Тогда подскажите мне что следует тут выбрать

и почему есть страницы с ошибками?

и вот в вебмастере яндекс написано "файл запрещен на индексацию в robo.txt"
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 225 | 18:09:42
Лена1858, Допишите дерективу host

Цитата
User-agent: *
Disallow: /a/
Disallow: /stat/
Disallow: /index/1
Disallow: /index/2
Disallow: /index/3
Disallow: /index/5
Disallow: /index/7
Disallow: /index/8
Disallow: /index/9
Disallow: /panel/
Disallow: /admin/
Disallow: /secure/
Disallow: /informer/
Disallow: /mchat
Disallow: /search
Disallow: /shop/order/
Disallow: /?ssid=
Disallow: /abnl/

Host: webmaster-profi.ru

Sitemap: http://webmaster-profi.ru/sitemap.xml
Sitemap: http://webmaster-profi.ru/sitemap-forum.xml
Sitemap: http://webmaster-profi.ru/sitemap-shop.xml


Цитата
файл запрещен на индексацию в robo.txt
3 страницы возможно из за числа 10 в начале ЧПУ ... (личное фантастическое предположение)

Сообщество uCoz » Вебмастеру » Раскрутка сайта » Sitemap.xml карта сайта (Sitemap.xml карта сайта для поисковых роботов)
Поиск: