Страница 1 из 11
Модератор форума: Yuri_G 
Сообщество uCoz » Вебмастеру » Общие вопросы от вебмастеров » Как запретить индексацию страницы?
Как запретить индексацию страницы?
indiec
Сообщений: 13
Репутация: 5

Сообщение # 1 | 05:08:59
Подскажите, пожалуйста,куда необходимо вписать тег
<meta name="robots" content="noindex" />
для запрета индексации роботам страницы? В начало страницы при редактировании кода? Или куда? Вот образец,

<!DOCTYPE html><html><head>
<meta name="robots" content="noindex" />(…)</head>
<body>(…)</body></html>

но такого места на странице при редактировании нет.
novikk
Сообщений: 227
Репутация: 25
Уровень замечаний:

Сообщение # 2 | 07:06:58
indiec, Дерективой прописывается в robots.txt

Код
Disallow: /index/номер страницы

Информация

Сообщение отредактировал novikk - Воскресенье, 01 Май 2016, 07:09:08
dogothic
Сообщений: 4
Репутация: 0

Сообщение # 3 | 13:22:48
смешно
люди до сих пор верят что можно закрыть от индексации что то..
ну что же.. удачи

Тяжело было сделать такое на Юкоз ------> www.dogica.com
novikk
Сообщений: 227
Репутация: 25
Уровень замечаний:

Сообщение # 4 | 13:28:14
dogothic, Вот На, нарисовался ))) А чо шифруемся ? У вас вроде другой профиль Ну ка расскажите ваши предположения. В двух словах не интересно. Факты нужны.
Может вам лучше поспорить с разрабами Поисковых систем ? Чо тут то умничать. Вот прям щас сядте и напишите Яше, и скажите, что ваши разработчики дебилы. Может они вас возьмут систему дорабатывать, исправлять ? Вы всё таки шарите.

Элементарный пример приведу. Найдите любой профиль ползователя uCoz в ПС , например Мой . Найдёте ? вышлю шоколадку. ,При условии, если профиль не закрыт дерективой.

Цитата
User-agent: *
Disallow: /a/
Disallow: /stat/
Disallow: /index/1
Disallow: /index/2
Disallow: /index/3
Disallow: /index/5
Disallow: /index/7
Disallow: /index/8
Disallow: /index/9
Disallow: /panel/
Disallow: /admin/
Disallow: /secure/
Disallow: /informer/
Disallow: /mchat
Disallow: /search
Disallow: /shop/order/
Disallow: /?ssid=
Disallow: /index/uran_landing/0-18

Sitemap: http://forum.ucoz.ru/sitemap.xml
Sitemap: http://forum.ucoz.ru/sitemap-forum.xml
Sitemap: http://forum.ucoz.ru/sitemap-shop.xml

Сообщение отредактировал novikk - Воскресенье, 01 Май 2016, 14:15:33
indiec
Сообщений: 13
Репутация: 5

Сообщение # 5 | 14:04:22
Цитата novikk ()
Дерективой прописывается в robots.txt
Спасибо. Как его изменить и где этот текст находится? Если СЕО модуль не оплачен.
novikk
Сообщений: 227
Репутация: 25
Уровень замечаний:

Сообщение # 6 | 14:08:47
Цитата indiec ()
Спасибо. Как его изменить и где этот текст находится? Если СЕО модуль не оплачен.

indiec, Вам уже написали выше. Ссылка для нформации В этом посте

Сообщение отредактировал novikk - Воскресенье, 01 Май 2016, 14:17:21
indiec
Сообщений: 13
Репутация: 5

Сообщение # 7 | 23:26:11
Цитата novikk ()
indiec, Вам уже написали выше. Ссылка для нформации В этом посте
Через поисковик не нашел ответа. 134 страницы (по ссылке) великовато для быстрого ознакомления и решения вопроса.
Что удалось понять:
1. Исключить часть текста от индексации для поисковика Гугла тегами не получается. Для Яндекса - возможно.
2. Убрать страницу от просмотра роботами через robots.txt, который создан средствами ЮКОЗА - не возможно, если не оплачен сео-модуль. Нужно заливать свой текстовый файл. Он не будет меняться автоматически при изменении сайта. У меня мало знаний и нет пока времени, что бы учесть все нюансы для изменений в robots.txt. параллельно с изменениями на сайте, увы.

Решение моей задачи нашлось иное. Спасибо за советы.
_Alcyona_Haramix_
Сообщений: 63
Репутация: 39

Сообщение # 8 | 00:54:10

Цитата novikk ()
Может вам лучше поспорить с разрабами Поисковых систем ? Чо тут то умничать. Вот прям щас сядте и напишите Яше, и скажите, что ваши разработчики дебилы. Может они вас возьмут систему дорабатывать, исправлять ? Вы всё таки шарите.


novikk, в 2010 были подобные случаи > http://stackoverflow.com/questio....ndexing ,

++ были подобные случаи > http://stackoverflow.com/questio....-not-to ,

++ были подобные случаи > http://stackoverflow.com/questio....d-my-ip ,

примерно было это так , ( если я всё правильно помню wacko ) :

для каждого нового IP адреса / сервера , ставили роботс.тхт типо так :

User-agent: Googlebot
Disallow: /

где то через месяц , голый IP адрес сервера , всё равно попадал в поиск гугла... да и в логах сервера , реально было видно , что гугл лезет на разные урлы сервера , которые запрещены в роботс...

но это было в 2010 году... как сейчас с этим дела обстоят... я не знаю... тесты по этому поводу , мне просто влом проводить... сами понимаете...

-- ставить сервак на свой комп
-- цеплять домен
-- регить этот домен в гугле
-- писать разные версии роботс.тхт
-- ждать месяц

,

у меня на обеих руках , целые реальные созвездия из родинок , чувствую себя просто богиней )) > Youtube
Сообщение отредактировал _Alcyona_Haramix_ - Понедельник, 02 Май 2016, 04:12:52
novikk
Сообщений: 227
Репутация: 25
Уровень замечаний:

Сообщение # 9 | 11:07:25
_Alcyona_Haramix_, Незнаю, у меня для Яндекса свой robots.txt , для Гугла свой настроен. Не жалуюсь. Всё что мне нужно индексирует, то что мне не нужно не индексирует. Не замечал ещё косяков. А так то Гугл не предсказуем. Может брать контент, который закрыт, были такие случаи. Но ещё раз повтарюсь, что лично у меня тьфу, тьфу не было подобных случаев.

Добавлено (02 Май 2016, 11:07:25)
---------------------------------------------
Цитата indiec ()
1. Исключить часть текста от индексации для поисковика Гугла тегами не получается. Для Яндекса - возможно.
2. Убрать страницу от просмотра роботами через robots.txt, который создан средствами ЮКОЗА - не возможно, если не оплачен сео-модуль. Нужно заливать свой текстовый файл. Он не будет меняться автоматически при изменении сайта. У меня мало знаний и нет пока времени, что бы учесть все нюансы для изменений в robots.txt. параллельно с изменениями на сайте, увы.

indiec, как это невозможно изменить ? Я что то пропустил пока отсутствовал ?
Насколько я помню делаеш свой робот, заливаеш и пользуешся. Причом тут сео-модуль ? он вообще никакого отношения не имеет к редактированию вашего робота.
Дайте адрес сайта и страницы которые нужно закрыть.

Сообщение отредактировал novikk - Понедельник, 02 Май 2016, 11:31:05
_Alcyona_Haramix_
Сообщений: 63
Репутация: 39

Сообщение # 10 | 06:10:48
Цитата novikk ()
Не жалуюсь. Всё что мне нужно индексирует, то что мне не нужно не индексирует. Не замечал ещё косяков.


понятно... сейчас я вспомнил ещё , что гугл у меня и , голый бесконечный MP3 радио поток , кушал... правда там роботса.тхт совсем не было... даже удалось , не совсем старые логи ( /December/2015/ ) от сервера Icecast найти , в дебрях компа...

знаю что должны быть у меня , и очень старые логи , тоже когда гугл лез на радио поток , но эти логи где то на DVD+RW дисках... и их теперь фиг найдёш , среди 333+++ DVD+RW дисков... wacko

вот скрин , со всеми логами которые удалось найти... и которые я просто вырезал в отдельный блокнот... дабы видно было более понятно и наглядно...

,



,

Цитата novikk ()
А так то Гугл не предсказуем. Может брать контент, который закрыт,


ну да... я поэтому и написал сюда в тему , только потому , что сам , когда то давно в прошлом , сталкивался с таким... wacko

Цитата novikk ()
что лично у меня тьфу, тьфу не было подобных случаев.


ну значит повезло тебе... smile
Прикрепления: 2631194.png(70Kb)

у меня на обеих руках , целые реальные созвездия из родинок , чувствую себя просто богиней )) > Youtube
indiec
Сообщений: 13
Репутация: 5

Сообщение # 11 | 23:25:57
Цитата novikk ()
indiec, как это невозможно изменить ? Я что то пропустил пока отсутствовал ?Насколько я помню делаеш свой робот, заливаеш и пользуешся. Причом тут сео-модуль ? он вообще никакого отношения не имеет к редактированию вашего робота.
Дайте адрес сайта и страницы которые нужно закрыть.
1. Часть текста на странице? Как исключить с помощью robots.txt? Мне это не известно, дайте, пожалуйста, ссылку - посмотреть как именно это сделать..
2. Зачем мне это (закрыть от индексации страницу или текст) было надо? По двум причинам:
  • Повысить уникальность остального текста.
  • Скрыть от индексации страницу - дубль, в которой проводятся изменения (с последующей заменой оригинальной страницы).

Увы, простых решений не оказалось.

Насчет СЕО-модуля:
  • Активировать форму редактирования файла robots.txt

Это там указано. Значит - имеет отношение.
Сообщение отредактировал indiec - Четверг, 05 Май 2016, 23:47:50
aleksandr_braun
Сообщений: 78
Репутация: 3

Сообщение # 12 | 18:39:43
в robot.txt
Koba0433
Сообщений: 9
Репутация: 0

Сообщение # 13 | 18:09:34
Сообщение отредактировал Koba0433 - Воскресенье, 29 Май 2016, 18:34:02
Сообщество uCoz » Вебмастеру » Общие вопросы от вебмастеров » Как запретить индексацию страницы?
Страница 1 из 11
Поиск: