Модератор форума: Yuri_G  
Robots.txt
Модератор форума
Сообщение # 1 | 16:57:58
Gorbunov-Valera
Репутация: 0

Сообщение # 286 | 15:41:55
webanet

А так не получиться, если прост закрыть конкретную стр.
(как гостевую или обратную связь)
/index/0-3
/gb


Я сделал в архиве 50!
Переключателей нет (главное чтобы глюка не было) :)))

Вообще у меня ссылок на архив нет, все ссылки только на нужные стр.!

Мешает теперь только (/news) архив!!!

Quote (webanet)
если вы не хотите индексации новостей на сайте и хотите оставить только главную, то тоже можете прописать <link rel="canonical" href="адрес главной"/> в шаблон архива материалов. но тогда новости добавленные в модуль новости и ваши категории не будут индексироваться и выпадут из индекса.


Категории нужны!!!!!!!!
upucka
Сообщений: 14
Репутация: 0

Сообщение # 287 | 10:02:44
Подскажите, пожалуйста, являются ли запрещенными к индексации комментарии и, если да, какое из правил в robots.txt нужно убрать в директиве Disallow, чтобы отменить запрет индексации комментариев к материалам?
Раша
Сообщений: 13
Репутация: 0

Сообщение # 288 | 10:05:10
Уважаемые друзья. Из инструментов ГУГЛ Вебмастер получил такую запись -
Доступ запрещен
URL http://obkon.ucoz.com/index/sub/

1. Скажите Что означает эта запись?
2. Что такое /index/sub/
3. Что делать?

У меня, действительно, с конца марта месяца перестал, вдруг, индексироваться сайт.
fflesh
Сообщений: 1784
Репутация: 1314

Сообщение # 289 | 10:09:15
Раша,
Quote (Раша)
Доступ запрещен
URL http://obkon.ucoz.com/index/sub/
1. Скажите Что означает эта запись?

Что доступ в директорию запрещён в роботс.

Quote (Раша)
2. Что такое /index/sub/

Служебная директория.

Quote (Раша)
3. Что делать?

По поводу?
Ничего не делать, так и должно быть, это служебная директория и роботам в ней нечего делать.
...

Quote (Раша)
У меня, действительно, с конца марта месяца перестал, вдруг, индексироваться сайт.

Как вы это определили?
Адрес сайта.
...

Всё написанное выше - моё личное мнение и на абсолютную правоту не претендует.
Есть вопросы лично ко мне - пиши сюда: http://likbezz.ru/forum/8
Сообщение отредактировал fflesh - Среда, 11 Апр 2012, 10:09:38
Раша
Сообщений: 13
Репутация: 0

Сообщение # 290 | 13:26:24
fflesh ! Даю адрес сайта http://obkon.ucoz.com/

Вот дополнительная информация:
Добрый день!
1. У меня пропал из индексации сайт http://obkon.ucoz.com/
Некоторые говорят, что провайдер его заблокировал.
Если это так, то прошу Вас посодействовать в разблокировании и доступе
к индексации роботу Googlebot.

Вот письмо по этому поводу в Вебмастере ГУГЛ -

"Роботу Googlebot не удалось просканировать URL, поскольку для доступа
к странице требуется аутентификация на сервере или доступ к сайту для
робота Googlebot блокируется сервером".

2. Вот ещё письмо:
Доступ запрещен URL: http://obkon.ucoz.com/index/sub/

Сведения об ошибке

В файле Sitemap

Ссылающиеся домены

Дата последнего сканирования: 29.03.12

Роботу Googlebot не удалось просканировать URL, поскольку для доступа
к странице требуется аутентификация на сервере или доступ к сайту для
робота Googlebot блокируется сервером. Подробнее...

В корне сайта стоит стандартный файл Роботса.

Помогите - что делать. Владимир.
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 291 | 14:57:36
Раша, ваш сайт присутствует в выдаче
яндекс http://yandex.ru/yandsearch?text=host:obkon.ucoz.com&lr=213
гугл http://www.google.ru/search?....e=UTF-8

страница http://obkon.ucoz.com/index/sub/ индексироваться не должна. информация о невозможности её проиндексировать является технической информацией

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
sany101
Сообщений: 5
Репутация: 0

Сообщение # 292 | 15:18:16
Как изменить Robots.txt и как запретить индексирования моего сайта всеми поисковами системами?
tilipaka
Сообщений: 42
Репутация: 5

Сообщение # 293 | 15:24:27
Quote (sany101)
Как изменить Robots.txt и как запретить индексирования моего сайта всеми поисковами системами?

User-agent: *
Disallow: /
sany101
Сообщений: 5
Репутация: 0

Сообщение # 294 | 15:31:17
А где мне его изменить? Или как?
Quote (tilipaka)
User-agent: * Disallow: /
что бы это вписать
tilipaka
Сообщений: 42
Репутация: 5

Сообщение # 295 | 15:37:48
Quote (sany101)
А где мне его изменить? Или как?

Создаете файл *.txt (Блокнот) с именем robots.txt, вписываете в него
User-agent: *
Disallow: /
И заливаете через Файловый менеджер в корень сайта! (просто открыли ФМ и закачали)
sany101
Сообщений: 5
Репутация: 0

Сообщение # 296 | 15:39:32
А если я потом этот файл удалю стандартный будет?
Сообщение отредактировал sany101 - Четверг, 12 Апр 2012, 15:42:01
Selena
Сообщений: 15657
Репутация: 1100

Сообщение # 297 | 15:41:33
sany101, да. Если не будет вашего, то подставится стандартный.

Отправляя сообщение о помощи, приводите ссылку на свой сайт. Это не считается рекламой, зато снимает массу вопросов.
Tyzemec
Сообщений: 82
Репутация: 0

Сообщение # 298 | 18:29:13
Добрый день, коллеги!
Может ли быть такое, что в связи с тем, что в корневике сидел файл robot.txt, а не robots.txt сайт не индексировался в течение полугода?
А если быть точнее, то индексировал первую страницу, а потом выкидывал и её тоже
webanet
Сообщений: 24067
Репутация: 4985

Сообщение # 299 | 21:18:28
Tyzemec, ещё точнее можно сказать будет при осмотре сайта. если вы сами залили файл с названием robot.txt, то он не заменил системный и системный работал параллельно в прежнем режиме. если вы предлагали файл с неверным именем роботам в вебмастерах, то должны были получать ошибку по предлагаемому файлу, в тоже время поисковые системы брали стандартный роботс

ТУТ можно оставить своё мнение по любому вопросу
https://webanetlabs.net/
Tyzemec
Сообщений: 82
Репутация: 0

Сообщение # 300 | 22:04:47
Quote (webanet)
Tyzemec, ещё точнее можно сказать будет при осмотре сайта. если вы сами залили файл с названием robot.txt, то он не заменил системный и системный работал параллельно в прежнем режиме. если вы предлагали файл с неверным именем роботам в вебмастерах, то должны были получать ошибку по предлагаемому файлу, в тоже время поисковые системы брали стандартный роботс


Т.е. по всей логике сайт под фильтром просто, поэтому он не индексируется? До покупки доменного имени всё было нормально, ucoz.com индексировался, потом все страницы выпали из индекса и больше не попадали. А сегодня нашел эту кляузу с роотс.тхт, обрадовался, подумал изза него. А Вы меня опять огорчили((((((
Поиск:
Telegram
Будьте в курсе всех обновлений: подпишитесь на наш официальный Telegram-канал uCoz и задавайте вопросы в чате сообщества!