info navigation

phpbb-belk.ru

темы, связанные с форумом phpbb 3.0.x



Новая тема  [ Сообщений: 5 ]  Просмотры: 38

Автор Сообщение
Не в сети
(Андрей)  
Администратор
Аватара пользователя

Стаж: 9 лет 19 дней
Сообщения: 1230
Откуда: здешние мы


Стиль: subsilver2


Репутация: 11


Russia

Тиц и PR

перейти на сайт пользователя
Найти темы пользователя


найденный рабочий вариант проверен: post2357.html#p2357

с чего всё началось:

недавно мне пришло предупреждение от Вебмастера Яндекса о том, что на сайте много страниц дубликатов, отличающихся get-параметром f :

Вложение:
2024-09-11.png
2024-09-11.png [ 25.31 КБ | Просмотров: 34 ] 2024-09-11.png



страницы

Код: Выделить всё

https://***/viewtopic.php?f=32&t=539


и

Код: Выделить всё

https://***/viewtopic.php?t=539


ссылки ведут на одну и ту же страницу и различаются только get-параметром f. то есть нужно убрать ссылку на форум (f=32), оставив только ссылку на страницу (t=539).

почитав сеть я понял, что эта проблема волнует многих и вроде в более новых версиях форума она решена (у меня версия 3.14).

сначала, по совету в сети и на сайте Вебмастера пытался решить проблему директивой Clean-param прописав в robots.txt для User-agent: Yandex

строку объединения:

Код: Выделить всё

Clean-param: f /viewtopic.php


не прошло. Яндекс отсканировал robots, но ошибка и предупреждение никуда не исчезли.

тогда, полазив по сети, я нашёл код перенаправления с адресов с параметром f на адреса без них с помощью сервера. то есть строка прописывается в файле .htaccess:

Код: Выделить всё

RewriteCond %{QUERY_STRING} ^f=([0-9]+)&t=([0-9]+)(.*)$ [NC]
RewriteRule ^viewtopic\.php$ /viewtopic.php?t=%2%3 [L,R=301]


а вот этот код сразу сработал. в браузере ссылки на страницу сразу стали показываться без f*, а, спустя 4 дня, робот Яндекса при очередном обходе убрал предупреждение о дубликатах.

может кому пригодится. я искал решение этой проблемы (со временем ожидания обхода робота Яндекса) около месяца.

:idea:


трёхголовый белк семейства рептилоидов:
"три головы - хорошо, на как же трудно придти к согласию..."
форум,проблема,ссылка,get,f,f=,phpbb,удалить
Не в сети
(Андрей)  
2024-09-21 
Администратор
Аватара пользователя

Стаж: 9 лет 19 дней
Сообщения: 1230
Откуда: здешние мы


Стиль: subsilver2


Репутация: 11


Russia

Тиц и PR

перейти на сайт пользователя
Найти темы пользователя


прикольно. Яша сработал с замедлением и всё-таки обработал как надо тэг

Код: Выделить всё

Clean-param: f /viewtopic.php


19.09.2024 /viewtopic.php?f=32&t=1841 Исключена по Clean-param..

удалил море страниц (почти 2000). как оказалось, все отсканированные им страницы имели имели в своём составе f=, а страниц только с t= было немого. в результате количество страниц в поиске просто рухнуло.

но зато убедился, что тэг работает. :?

скорее всего теперь придётся просто ждать, пока робот не отсканирует все страницы с t=.

на поиск от Гугла это не повлияло, так как директории Clean-param тот не признаёт.

Добавлено спустя 18 часов 19 минут 35 секунд:
20.09.2024 прикольно. исчезли все турбо-страницы Яндекса.

было

Код: Выделить всё

Турбо-страниц в поиске: 1753


стало:

Код: Выделить всё

Турбо-страниц в поиске: 0


на Гугле так ничего и не изменилось. Видимо все эти "улучшения" идут от тэга

Код: Выделить всё

Clean-param


подожду ещё несколько дней и, наверное, уберу этот тэг.

перенаправление в .htaccess продолжает работать.

Добавлено спустя 23 часа 30 минут 50 секунд:
яша снёс с поиска практически всё. и теперь начал сравнивать новые страницы без f= с их каноническим адресом (а он остался с f=). можно себе представить что он там выведет после этого.

оставил для Яши Clean-param, но временно закомментировал правку в .htaccess - посмотрю что будет. если Яша опять выведет "нарушение GET" - буду думать думу дальше...

может быть просто пошлю Яшу с его хотелками... :(


трёхголовый белк семейства рептилоидов:
"три головы - хорошо, на как же трудно придти к согласию..."
Не в сети
(Андрей)  
2024-09-23 
Администратор
Аватара пользователя

Стаж: 9 лет 19 дней
Сообщения: 1230
Откуда: здешние мы


Стиль: subsilver2


Репутация: 11


Russia

Тиц и PR

перейти на сайт пользователя
Найти темы пользователя


Яша продолжает сканировать и добавлять страницы с php?t= без всякого упоминания идентификатора форума (где-то что-то видимо закешировалось),
при этом пишет, что страница неканоническая (само собой, ведь она выводится с f=.
поэтому решил сделать "ход конём":

1. поставил другой мод вывода канонической ссылки без упоминания форума (seo_mini)
2. раскомментировал (ввел в работу) перенаправление в файле .htaccess

Код: Выделить всё

RewriteCond %{QUERY_STRING} ^f=([0-9]+)&t=([0-9]+)(.*)$ [NC]
RewriteRule ^viewtopic\.php$ /viewtopic.php?t=%2%3 [L,R=301]


3. очистил кэш форума в админке.

теперь все ссылки (и вывод канонической) идут без f=, просто

Код: Выделить всё

viewtopic.php?t=*


буду ждать и смотреть на реакцию Яндекса.


трёхголовый белк семейства рептилоидов:
"три головы - хорошо, на как же трудно придти к согласию..."
Не в сети
(Андрей)  
2024-10-02 
Администратор
Аватара пользователя

Стаж: 9 лет 19 дней
Сообщения: 1230
Откуда: здешние мы


Стиль: subsilver2


Репутация: 11


Russia

Тиц и PR

перейти на сайт пользователя
Найти темы пользователя


похоже всё прошло удачно. Яша больше не ругается, страницы сканирует. правда и с Яшей и с Гуглой наблюдается массив страниц с новыми и старыми видами ссылок. не знаю - может со временем "самоочистится"?


трёхголовый белк семейства рептилоидов:
"три головы - хорошо, на как же трудно придти к согласию..."
Не в сети
(Андрей)  
2024-10-07 
Администратор
Аватара пользователя

Стаж: 9 лет 19 дней
Сообщения: 1230
Откуда: здешние мы


Стиль: subsilver2


Репутация: 11


Russia

Тиц и PR

перейти на сайт пользователя
Найти темы пользователя


7 октября. бот Яндекса вроде начал нормально отрабатывать новый вид ссылок, а вот до бота Гугла только дошло и началась массовая потеря "кликов". то есть скорее всего клики есть, но на страницах с f, а отдаются боту они без этого параметра. поэтому старые страницы он уже не видит (вместе с кликами), а новые ещё не успел переварить. наверное.

может всё-таки есть проблема в robots.txt , хотя Яндекс-то обрабатывает... :?


трёхголовый белк семейства рептилоидов:
"три головы - хорошо, на как же трудно придти к согласию..."
Показать сообщения за:  Поле сортировки  
Ответить на тему  [ Сообщений: 5 ] 

Кто сейчас на сайте:

Всего посетителей: 0, из них зарегистрированных: 0, скрытых: 0 и гостей: 0 (основано на активности пользователей за последние 5 минут)
Больше всего посетителей (122) здесь было 19 дек 2023, 12:10

Сейчас этот раздел просматривают: нет зарегистрированных пользователей и гости: 0

Часовой пояс: UTC + 2 часа



Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения
Вы не можете защищать свои темы паролем

Найти:
Перейти:  




cron

Текущее время: 11 окт 2024, 04:37

Создано на основе phpBB® Forum Software © phpBB Group
Яндекс.Метрика

Полная версия Мобильный вид