Модератор форума: Yuri_G  
Сообщество uCoz » Вебмастеру » Раскрутка сайта » Robots.txt (индексация сайта)
Robots.txt
Модератор форума
Сообщение # 1 | 16:57:58
Joolz
Сообщений: 81
Репутация: 27

Сообщение # 106 | 20:16:46
Quote (fllop)
Что то его уже неделю нет

Появится при первом обращении к нему (будет виден в файловом менеджере)
_http://ваш сайт/robots.txt
Nemby
Репутация: 3

Сообщение # 107 | 20:19:27
прикрепил новый домен к сайту, ни старый ни новый домен не индексировались, надо что-либо менять в настойках, или просто индексировать новый домен?
Kyronok
Сообщений: 6
Репутация: 3

Сообщение # 108 | 02:51:14
Появилось такое свойство...
Robots.txt стандартный. В нём есть строчка: Disallow: /secure/ чтобы это не индексировалось.
По этому адресу располагаются картики кодов безопасности, например при отправки сообщения.
НО! Дело в том, что в "Инструментах для веб-мастеров гугл" в сводке "Заблокирован файлом robots.txt" ‎со временем накопилось уже 936 исключений вида honeystorm.org/secure/?k=464070428172659684;m=addcom55148114;tm=/secure/?k=464070428172659684;m=addcom55148114;tm=
Т.е. это ссылки на картинки изображения капчи.
Это нормально? Проcто я смотрел их было вначале 20, потом 100, 300 и вот сейчас 938... так глядишь до бесконечности будет расти. Вобщем нормально ли это?

Сообщение отредактировал Kyronok - Воскресенье, 18 Дек 2011, 02:51:45
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 109 | 02:56:14
Kyronok,
Quote
Вобщем нормально ли это?
Для Google это нормально biggrin Иногда кажется что ему вообще всё равно что написано в файле . Он может проиндексировать даже то чего фактически проосто не существует из страниц ...

Сообщение отредактировал Miss_Esq - Воскресенье, 18 Дек 2011, 02:57:05
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 110 | 03:12:25
Kyronok, по мере индексации количество растет. можно не обращать на это внимание. можно робота вообще отвадить соваться в эти картинки
инструменты для веб-мастеров - конфигурация сайта - параметры url - прописать параметр ?k - и оставить на усмотрение гуглебота. и вот тогда он точно начнет исполнять предписание роботтекста. его просто нужно направить и все

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
Arclayd
Сообщений: 18
Репутация: 3

Сообщение # 111 | 19:43:35
Добрый день.
У меня такой вопрос. Я создал сайт 26.11.2011 в 17:51 по МСК, а на сегодняшнее число и время файл robots.txt все еще на карантине. Сейчас около 8 вечера, почему сайт еще не снят с карантина? Или надо ждать 27 декабря? Подскажите пожалуйста)
Вот сайт тыкнуть

Сообщение отредактировал Arclayd - Понедельник, 26 Дек 2011, 19:44:37
Ferro7
Сообщений: 285
Репутация: 230

Сообщение # 112 | 20:07:36
Arclayd, надо ждать следующего дня. У меня так же было smile

Вы полюбили меня. Здесь я. (с)
Arclayd
Сообщений: 18
Репутация: 3

Сообщение # 113 | 01:02:16
Quote (Ferro7)
Ferro7
Я так понимаю, надо ждать до 17:51 27 декабря, поскольку до сих пор сайт на карантине(

resident
Сообщений: 17
Репутация: 2

Сообщение # 114 | 13:32:12
как запретить индексацию определенной категории в каталоге файлов?
1sys
Сообщений: 6
Репутация: 9
Уровень замечаний:

Сообщение # 115 | 22:03:41
resident, вписать адрес категории в роботс.
Кинолог
Сообщений: 32
Репутация: 2

Сообщение # 116 | 15:02:29
У меня яндекс выдает:

dressirovkasib.ucoz.ru
Список страниц, исключённых роботом при обходе сайта. Причиной исключения может быть ошибка при загрузке или обработке страницы. Кроме того, в поисковый индекс не попадают страницы, запрещённые в файле robots.txt и т.п.

Исключение страниц из индекса не всегда является ошибкой в настройках сайта. Вы можете указать степень серьёзности той или иной причины исключения в Настройках.
XLS
CSV
Причина Количество
Замечания: нельзя с уверенностью сказать, страницы намеренно запрещены к индексированию или нет.
HTTP-статус: Ресурс не найден (404)
36
Информация: страницы намеренно запрещены к индексированию или не должны индексироваться.
Документ запрещен в файле robots.txt
1
Неверный формат документа
3
Ошибка по разделам
Раздел Количество
dressirovkasib.ucoz.ru
1
index/
1
Страницы с ошибкой
XLS
CSVПоказать: все, за весь период
URL Ссылки на страницу Последнее изменение Последнее посещение
/index/3

25.12.2011 -

Добавлено (29-Дек-2011, 15:02:29)
---------------------------------------------
И вот еще:

Причина Количество
Замечания: нельзя с уверенностью сказать, страницы намеренно запрещены к индексированию или нет.
HTTP-статус: Ресурс не найден (404)
36
Информация: страницы намеренно запрещены к индексированию или не должны индексироваться.
Документ запрещен в файле robots.txt
1
Неверный формат документа
3
Ошибка по разделам
Раздел Количество
dressirovkasib.ucoz.ru
3
blog/
1
forum/
1
publ/
1
Страницы с ошибкой
XLS
CSVПоказать: все, за весь период
URL Ссылки на страницу Последнее изменение Последнее посещение
/blog/rss/

11.09.2011 11.09.2011
/forum/0-0-0-37

11.09.2011 11.09.2011
/publ/rss/

11.09.2011 11.09.2011

Вопрос что с этим делать?


http://dogsib.ru
fllop
Сообщений: 72
Репутация: 45

Сообщение # 117 | 18:55:42
что прописать что бы запретить индексацию сайта?
Кинолог
Сообщений: 32
Репутация: 2

Сообщение # 118 | 18:03:53
Если вот так сделать, то что будет?

User-agent: *
Disallow: /a/
Disallow: /stat/
Disallow: /panel/
Disallow: /admin/
Disallow: /secure/
Disallow: /informer/
Disallow: /mchat
Disallow: /search
Disallow: /shop/order/

Sitemap: http://dressirovkasib.ucoz.ru/sitemap.xml
Sitemap: http://dressirovkasib.ucoz.ru/sitemap-forum.xml
Sitemap: http://dressirovkasib.ucoz.ru/sitemap-shop.xml

http://dogsib.ru
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 119 | 18:14:14
Кинолог, Проиндексирует кучу страниц совершенно ненужных в индексе

от /index/1 до /index/9

Сообщение отредактировал Miss_Esq - Пятница, 30 Дек 2011, 18:15:08
Кинолог
Сообщений: 32
Репутация: 2

Сообщение # 120 | 19:03:01
Quote (Miss_Esq)
Проиндексирует кучу страниц совершенно ненужных в индексе

Это плохо?
Мне кажется пусть лучше проиндексирует кучу страниц, чем вообще не индексирует. Или я не прав?

http://dogsib.ru
Сообщество uCoz » Вебмастеру » Раскрутка сайта » Robots.txt (индексация сайта)
Поиск: