Forumlar / National / Russian / Тех. поддержка / Вопрос по урлам

Wadik
#1 2013-12-27 18:10

Вопрос относится к Большой проблеме - дублированию контента страниц.

Все дело в построении урл. К примеру одна и та же статья может быть открыта:

1) По id

2) По алиасу

Далее, если использовать плагин urleditor и к примеру пресет handy, то к урлу добавляются еще вложенность категорий. 

И получается, что одна и та же статья доступна по адресам:

/uslugi/about/contacts

/uslugi/about/50

index.php?e=page&id=50

Как запретить это безобразие? Не хочется дублей контента. Хочется только один действующий вариант. Остальные должны быть недоступными. 

 

 

Kort
#2 2013-12-27 20:40

Такого безобразия по техническим причинам избежать нельзя. Кстати, в некоторых случаях оно здорово помогает при поиске страниц вручную.

А для различения дублей, вернее для указания наиболее релевантной страницы из числа идентичных, используется элемент link с атрибутом rel=canonical
 

SED.by - создание сайтов, разработка плагинов и тем для Котонти
Wadik
#3 2013-12-28 06:00

А как rel=canonical везде проставить?

Добавлено 59 минуты спустя:

Ошибся, оно итак везде проставлено.

Bu gönderi Wadik tarafından düzenlendi (2013-12-28 06:59, 11 yıllar önce)
Dayver
#4 2013-12-28 08:47

В своих проектах делаю минимплуг с 301 редиректом. Видел кстати, кажысь, подобный плагин от доктора .... надо бы поискать.

Pavlo Tkachenko aka Dayver
Kort
#5 2013-12-28 09:41

Проблема дублирования страниц была актуальна только во времена Генуи. Под Сиеной все хорошо и без редиректов. У меня после перевода www.sed.by в течение месяца-двух, например, "некрасивые" ссылки были заменены поисковиками на правильные без моего участия.

r301 я лично использую для корректировки посадочных страниц или при переводе сайта на Сиену с изменением структуры.

SED.by - создание сайтов, разработка плагинов и тем для Котонти
Yusupov
#6 2013-12-28 12:15

Для поисковиков достаточно базового canonical в котором указывается основной url на страницу.

Wadik
#7 2013-12-28 13:41

Только вот минус в постраничной разбивке. Ее упустили.

К примеру 4 страница - урл cat?d=4

у него rel=canonical должен быть просто cat, а не cat?d=4

Yusupov
#8 2013-12-28 14:52
#38823 Wadik:

Только вот минус в постраничной разбивке. Ее упустили.

К примеру 4 страница - урл cat?d=4

у него rel=canonical должен быть просто cat, а не cat?d=4

Так если d разное, то и содержимое страницы разное, следовательно и ссылка на страницу должна быть своя.

Wadik
#9 2013-12-28 15:08

Обычно это хламные страницы с контентом (в основном ссылками на страницы), который не несет никакой логической нагрузки. И если смотреть со стороны СЕО, то я бы хотел, чтобы прокачивалась одна страница cat , а не чтобы вес расползался на n страниц cat?d=n

Yusupov
#10 2013-12-28 15:10

Тогда их надо закрыть от индексирования через robots.

Wadik
#11 2013-12-28 15:20

В таком случае робот не проиндексирует ссылки на страницы, которые находятся на этих страницах.

Yusupov
#12 2013-12-28 15:27

В Яндекс.вебмастере можно проверить как будет вести себя робот. Можно использовать регулярные выражения и запретить индексирование только заданных страниц в зависимости от заданных параметров. Это вы и без меня знаете.

Wadik
#13 2013-12-28 15:39

Правильнее сделать  rel=canonical просто cat, для страниц cat?d=n

Yusupov
#14 2013-12-28 16:47
#38829 Wadik:

Правильнее сделать  rel=canonical просто cat, для страниц cat?d=n

Так вроде так и сделано, canonical правильный для пагинации. Вы же говорите, что эти страницы не нужны для индексации.

Добавьте в robots запрет на индексацию страниц c параметром d и все. При этом первая страница cat будет индексироваться.

Disallow: /cat?d=*

Wadik
#15 2013-12-28 17:09

При таком варианте робот не найдет ссылок на страницы с контентом, которые обычно находятся на  /cat?d=*

А указание rel=canonical для списков подстраниц просто передаст вес на первую страницу списков. На мой взгляд удаление параметра d из canonical_uri логичнее. 

Хотел бы ограничить это обсуждение к сведению его к 1 вопросу (т.к. в остальных случаях аналогично). Какой смысл включать в page.list.php в параметр $out['canonical_uri']  таких переменных, как : $d,$dc ?

Чтобы понятнее была мысль, приведу простейший пример. Есть категория "Плагины", в ней 5 страниц. Разве смысл категории "плагины" поменяется, если я применю эти параметры? Нет. Это все так же будет категория плагины. 

Другое дело - параметры $o,$p. Они, согласен, нужны. Ведь могут быть "плагины для siena", "плагины для ..." ...