Модератор форума: Yuri_G  
Дублирование страниц в поиске
Vintash
Сообщений: 379
Репутация: 172

Сообщение # 1 | 14:58:01
Шаблон Главной страницы:
Код
<?if($REQUEST_URI$='/')?><?else?><link rel="canonical" href="$HOME_PAGE_LINK$"/><?endif?>


Шаблон "Страница со списком материалов раздела":
Код
<?if($REQUEST_URI$=substr($SECTION_URL$,len($HOME_PAGE_LINK$)))?><?else?><link rel="canonical" href="$SECTION_URL$"/><?endif?>


Шаблон "Страница со списком материалов категории":
Код
<?if($REQUEST_URI$=substr($CAT_URL$,len($HOME_PAGE_LINK$)))?><?else?><link rel="canonical" href="$CAT_URL$"/><?endif?>


Шаблон "Страница материала и комментариев к нему":
Код
<?if($REQUEST_URI$=$ENTRY_URL$)?><?else?><link rel="canonical" href="$HOME_PAGE_LINK$$ENTRY_URL$"/><?endif?>


* $REQUEST_URI$ - означает текущий адрес страницы в браузере.

Разберем код по частям:
Цитата
<?if($REQUEST_URI$=$ENTRY_URL$)?><?else?><link rel="canonical" href="$HOME_PAGE_LINK$$ENTRY_URL$"/><?endif?>

Если (текущий адрес в браузере = настоящему адресу страницы) то ничего не делать, (в противном случае) активировать код с canonical (конец)

Как видите, теперь каноникал будет прописываться только в том случае, если текущий адрес в браузерной строке не будет совпадать с настоящим адресом страницы.

И напоследок объясню, что значит кусок кода: substr($CAT_URL$,len($HOME_PAGE_LINK$)
Он означает: $CAT_URL$ (вычесть) количество символов в доменом имени site.ru.
Это делается для того, что бы $CAT_URL$ принял вид /razdel/category вместо стандартного site.ru/razdel/category, что впоследствии позволит производить операцию <?if($REQUEST_URI$=$CAT_URL$)?>

Вообщем если найдутся люди, которые понимают весь этот бред, просьба отписаться, что вы думаете по этому поводу. Заранее благодарю. biggrin


The Cake Is a Lie
Сообщение отредактировал Vintash - Пятница, 07 Мар 2014, 15:00:16
GoGa3344
Сообщений: 2
Репутация: 0

Сообщение # 46 | 08:25:52
Ну например для категории 1 я ставлю "$URI_ID$='IdCat1'",а вот как для стр второй (http://theminecrafts.ru/load/mody/igra/1-2-2) сделать не знаю...
Сообщение отредактировал GoGa3344 - Воскресенье, 11 Авг 2013, 09:54:37
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 47 | 08:25:52
Baddy,

Disallow: /?ssid=
Disallow: /photo
Disallow: /photo/*-*-*-*-*
Allow: /photo/

Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 48 | 08:26:02
GoGa3344, В админ баре на сайте в пункте дизайн - переменные страницы .... перед этим отключите конструктор и смотрите , откройте нужную страницу и смотрите переменную для неё ...

Baddy
Сообщений: 58
Репутация: 18
Уровень замечаний:

Сообщение # 49 | 08:26:02
?ssid - запрет стоит по умолчанию, но Гугл продолжает возвращать ошибку.
А есть ли некое универсальное решение для слеша, дабы не городить массу условий и на все прочие модули? На примере вариантов с www и без, который решается в глобальных настройках сайта?

Любой Путь верный, что ведёт к Добру и Свету
GoGa3344
Сообщений: 2
Репутация: 0

Сообщение # 50 | 08:26:12
Miss_Esq, Открыл стр http://theminecrafts.ru/load/mody/igra/1, посмотрел, показывает "IdCat1".
Открыл стр http://theminecrafts.ru/load/mody/igra/1-2-2, и показывает тоже самое.
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 51 | 08:26:12
Baddy,
Цитата
А есть ли неко ... очие модули
Мне не известно. Проблемы дублей были на сайте в котором всего 2 модуля и проблемы были из за календаря, решение нашли, на этом и остановились. А универсальное решение, может кто ещё что подскажет ..
Цитата
решение для слеша
На практике, у нас проблема слеша возникла по нашей же ошибке, где то указаны адреса с ним где то без, перешерстили весь сайт, привели адресацию к одному знаменателю и проблемы слеша-календаря исчезла ...

Сообщение отредактировал Miss_Esq - Пятница, 31 Янв 2014, 11:49:54
wartemw8496
Сообщений: 26
Репутация: -7
Уровень замечаний:

Сообщение # 52 | 08:26:22
Здравствуйте, у меня такая проблема, главная страница открывается через модуль каталог статей, на сайте получилось 2 идентичные страницы, когда создавал сайт, я не придал этому значение, а сейчас решил добавить на главную страницу текст и обратил внимание (пример ссылок дублей http://mobikin.ucoz.com и http://mobikin.ucoz.com/publ) Что делать? Как избавиться от дубля? что посоветуете?
Сообщение отредактировал wartemw8496 - Среда, 16 Окт 2013, 02:58:21
Baddy
Сообщений: 58
Репутация: 18
Уровень замечаний:

Сообщение # 53 | 08:26:22
Какая может быть ошибка с моей стороны, если система сама присваивает адрес страницам сайта? в частности, в том же корне фотоальбома? (/photo/ vs /photo)
Мне, все же, видится, что ошибка системная и должна решаться системно, а не нашими вечными анти-юкозовскими костылями

Любой Путь верный, что ведёт к Добру и Свету
Сообщение отредактировал Baddy - Пятница, 31 Янв 2014, 11:59:06
Baddy
Сообщений: 58
Репутация: 18
Уровень замечаний:

Сообщение # 54 | 08:26:32
Гугл находит дубли одной страницы с путями типа:
http://mastermozaik.ru/photo/obrazcy_obrabotki_stekla/8-1-0-0-0-0
http://mastermozaik.ru/photo/obrazcy_obrabotki_stekla/8

или кракозябистые вариации главной страницы типа:
/?l3lTM9

Вопрос тривиальнейший и, поди, давно уже есть решение, но так и не нарыл ответ
Также не смог найти, как закрыть к индексированию ссылки на несуществующие страницы

Добавлено (23 Янв 2014, 09:48:22)
---------------------------------------------
Еще Гугл возвращает дубли по ссылкам с "/" и без


Любой Путь верный, что ведёт к Добру и Свету
Сообщение отредактировал Baddy - Пятница, 17 Янв 2014, 13:44:12
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 55 | 08:26:32
Baddy,
Цитата
если система сама присваивает адрес страницам сайта
Если вручную адреса ни где не пишите то возможно и так ...
Материалы в несколько категорий не пихаете ?

Baddy
Сообщений: 58
Репутация: 18
Уровень замечаний:

Сообщение # 56 | 08:26:42
"адреса вручную" - это чпу или что-то другое? чпу на сайте задействован, да и вхождение в несколько категорий, кажется, где-то встречалось. Но опять же, упираемся в "за рыбу деньги": если данный сервис (вхождение в категории и чпу) присутствует в пользовательской системе, то он должен работать как часы без дополнительных мозговых штурмов энтузиастов, действующих зачастую наугад!

Любой Путь верный, что ведёт к Добру и Свету
85oospn
Сообщений: 1
Репутация: 0

Сообщение # 57 | 08:26:42
Цитата webanet ()
включите аякс переключатель страниц. в последнем случае будет индексироваться только первая страница категорий и разделов и каталогов

Цитата GoGa3344 ()
Т.е материалы которые находятся например на второй стр индексироваться не будут?
Цитата webanet ()
GoGa3344, будут.

Что то я вас совсем не понял... Можно получить более развернутый ответ, будут индексироваться или нет? Очень нужна помощь.
Miss_Esq
Сообщений: 13859
Репутация: 4159
Уровень замечаний:

Сообщение # 58 | 08:26:52
Baddy,
Цитата
"адреса вручную" - это чпу или что-то другое?
нет это типа в материалах, в самодельных меню и т п и т д пишите адреса на страницы вручную самостоятельно ...
Цитата
кажется, где-то встречалось
А вот как раз вхождение в категории более одной и даёт дубли. Для адресации в системе это не имеет значения, ни вхождение в разные категории, ни даты, ни ЧПУ, всё это системой не учитывается, игнорируется. Адрес страницы , материала, определяется только по её ID ... как правило ID это последняя цифра ...
Для системы это одно и то же, один и тот же материал, пример:

photo/2014-01-15-2
photo/ЧПУ_бла_бла/2014-01-15-2
photo/категория_тру_ля_ля/2014-01-15-2
photo/ЧПУ_бла_бла/категория_тру_ля_ля/2014-01-15-2
photo/ЧПУ_ха_ха/категория_тик_так/2014-01-15-2

А для поисковиков это всё дубли, хотя страница и материал у вас всего один ..

Baddy
Сообщений: 58
Репутация: 18
Уровень замечаний:

Сообщение # 59 | 08:27:02
Miss_Esq, еще один вопрос по (Disallow: /photo/): строчка запретит индексацию четко по коревому адресу или и все вложенные ветки /photo/бла-бла...

Любой Путь верный, что ведёт к Добру и Свету
Delisa7971
Репутация: 0

Сообщение # 60 | 08:27:12
Я тоже материал добавляла раньше в несколько категорий, из-за этого получилось очень много дублей. В веб-мастере Яндекса вот такое - скрин прилагаю, материалов на сайте у меня даже гораздо меньше чем 723, ну а 1066 я так понимаю что сайт очень разбухший, очень маленькая посещаемость из-за этого.

А если я сменю домен, и буду добавлять материал только в одну категорию, когда сайт проиндексируется робот не посчитает старые дубли страниц, ну копии все равно же остаются в юкозе наверное?
Прикрепления: 8844845.jpg (7.7 Kb)
Поиск: