Уважаемые пользователи!
C 7 ноября 2020 года phpBB Group прекратила выпуск обновлений и завершила дальнейшее развитие phpBB версии 3.2.
С 1 августа 2024 года phpBB Group прекращает поддержку phpBB 3.2 на официальном сайте.
Сайт официальной русской поддержки phpBB Guru продолжит поддержку phpBB 3.2 до 31 декабря 2024 года.
С учетом этого, настоятельно рекомендуется обновить конференции до версии 3.3.

robots.txt для 3.x

Вопросы без привязки к версии. Установлена авточистка (2 года).
Правила форума
Местная Конституция | Шаблон запроса | Документация (phpBB3) | Переход на 3.0.6 и выше | FAQ | Как задавать вопросы | Как устанавливать расширения

Ваш вопрос может быть удален без объяснения причин, если на него есть ответы по приведённым ссылкам (а вы рискуете получить предупреждение ;) ).
Sirius777
phpBB 1.4.0
Сообщения: 36
Стаж: 3 года 3 месяца
Благодарил (а): 13 раз

Re: robots.txt для 3.x

Сообщение Sirius777 »

Убил час времени, перечитал топик о столь наболевшем для новичков вопросе с robots.txt
Да, можно сказать, что роботс может быть «у каждого свой», но не все так просто, скажу я вам. Как уже кто-то ранее здесь же справедливо заметил, что сия ветка вызывает еще больше вопросов….

Какие первичные выводы можно сделать:
1. robots.txt не зависит от версий phpbb 3, по крайней мере, для 3.1. – покатит и для 3.3.х.
2. Мнения насчет наличия robots.txt, как такового, диаметрально разделились, - нужен ли он для завоевания большей благосклонности поисковиков, или еще больше может навредит, - хз. Я все же больше сторонник того, что "надо Федя, надо"....
Но вопросы. увы, остаются.

Итак, исходные данные:
Форум хостится на домене «mysite.ru». Никуда не вложен, не является дополнением к какому-то там основному сайту. Никаких приватных\скрытых тем не не предполагается, а админку и профили юзеров надо бы закрыть от индексации. Других «особых» пожеланий пока не предвидется.
Следовательно, robots.txt разместим в корте сайта, это понятно.
За основу я взял robots с сайта Шрёдера:

Код: Выделить всё

User-agent: *
Disallow: /adm/
Disallow: /faq.php
Disallow: /mcp.php
Disallow: /index.php?
Disallow: /memberlist.php
Disallow: /posting.php
Disallow: /report.php
Disallow: /search.php
Disallow: /style.php
Disallow: /ucp.php
Disallow: /viewonline.php
Disallow: /*&st=*
Disallow: /*&sk=*
Disallow: /*&sd=*
Disallow: /*&hilit=*
Disallow: /*&view=*
Disallow: /viewtopic.php*p=*
Disallow: /viewtopic.php?t=*
Disallow: /view*&start=0$

# Google Image
User-agent: Googlebot-Image
Disallow:

# Google AdSense
User-agent: Mediapartners-Google
Disallow:

User-agent: Yandex
Disallow: /adm/
Disallow: /faq.php
Disallow: /mcp.php
Disallow: /index.php?
Disallow: /memberlist.php
Disallow: /posting.php
Disallow: /report.php
Disallow: /search.php
Disallow: /style.php
Disallow: /ucp.php
Disallow: /viewonline.php
Disallow: /*&st=*
Disallow: /*&sk=*
Disallow: /*&sd=*
Disallow: /*&hilit=*
Disallow: /*&view=*
Disallow: /viewtopic.php*p=*
Disallow: /viewtopic.php?t=*
Disallow: /view*&start=0$

Host: mysite.ru
Sitemap: http://www.mysite.ru/sitemap.php

Clean-param: sid /index.php
Clean-param: sid /viewforum.php
Clean-param: sid /viewtopic.php
Именно такой вариант должен подойти мне, по условиям выше (форум на домене без вложенности без особых прибамбасов).
Но!

В этом сообщении

Re: robots.txt для 3.1

Siava критикует vic4884 за то, что строчки

Disallow: /index.php?
Disallow: /viewtopic.php?t=*
Disallow: /viewtopic.php*p=*


как бы не очень хорошо закрывать от индексации.
Но ведь именно такие сточки есть в robots от Шрёдера.
(И там еще момент с sitemap.php - надо бы sitemap.xml, но это уже мелочи)
И тут как бы вопрос...

Я так понимаю, что без указанных 3-х сомнительных строчек для моих условий подойдет роботс от Шрёдера?
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12426
Стаж: 12 лет 8 месяцев
Благодарил (а): 166 раз
Поблагодарили: 2477 раз

Re: robots.txt для 3.x

Сообщение Татьяна5 »

Sirius777 писал(а): 22.09.2021 20:07 Disallow: /viewtopic.php?t=*
Эта строчка однозначно вредна. Закроет от индексации канонические ссылки

Две других - под вопросом
Sirius777
phpBB 1.4.0
Сообщения: 36
Стаж: 3 года 3 месяца
Благодарил (а): 13 раз

Re: robots.txt для 3.x

Сообщение Sirius777 »

Татьяна5 писал(а): 22.09.2021 22:01 Две других - под вопросом
Татьяна, а лично вы оставили бы эти 2 строчки или удалили?
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12426
Стаж: 12 лет 8 месяцев
Благодарил (а): 166 раз
Поблагодарили: 2477 раз

Re: robots.txt для 3.x

Сообщение Татьяна5 »

Лично я бы robots.txt не создавала. От него толку нет
Sirius777
phpBB 1.4.0
Сообщения: 36
Стаж: 3 года 3 месяца
Благодарил (а): 13 раз

Re: robots.txt для 3.x

Сообщение Sirius777 »

Татьяна5 писал(а): 23.09.2021 18:28 Лично я бы robots.txt не создавала. От него толку нет
Довольно неожиданный ответ))

Но там и к

10. Disallow: /style.php тоже есть вопросы. Где-то тут видел мысль о том, что ПС не увидят наличия адаптированных стилей под мобильные, примерно как-то так, может, не точно....
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12426
Стаж: 12 лет 8 месяцев
Благодарил (а): 166 раз
Поблагодарили: 2477 раз

Re: robots.txt для 3.x

Сообщение Татьяна5 »

К той строчке вопросов нет, т.к. нет того файла
Sirius777
phpBB 1.4.0
Сообщения: 36
Стаж: 3 года 3 месяца
Благодарил (а): 13 раз

Re: robots.txt для 3.x

Сообщение Sirius777 »

Татьяна5 писал(а): 24.09.2021 12:39 К той строчке вопросов нет, т.к. нет того файла
Мда(( Много воды утекло с 2014 года...
Аватара пользователя
sas333
phpBB 1.4.4
Сообщения: 171
Стаж: 6 лет 10 месяцев
Благодарил (а): 13 раз
Поблагодарили: 4 раза

Критические проблемы в Яндекс Вебмастер

Сообщение sas333 »

Здравствуйте. Сегодня заметил Предупреждения в Яндекс Вебмастер
Скриншот 17-11-2021 225437.jpg
Помогите правильно составить robots.txt На данный момент сейчас стоит такой.

robots.txt 

Код: Выделить всё

#Forum
#User-agent: *
#Disallow: /forum/*?hash=*
#Disallow: /forum/*?style=*
#Disallow: /forum/adm/
#Disallow: /forum/download/
#Disallow: /forum/mcp.php
#Disallow: /forum/memberlist.php
#Disallow: /forum/posting.php
#Disallow: /forum/report.php
#Disallow: /forum/search.php
#Disallow: /forum/style.php
#Disallow: /forum/ucp.php
#Disallow: /forum/viewtopic.php?f=*&t=*&start=0$
#Disallow: /forum/viewtopic.php?f=*&t=*&view=next
#Disallow: /forum/viewtopic.php?f=*&t=*&view=previous
#Disallow: /forum/viewtopic.php?p=*
#Disallow: /forum/viewtopic.php?f=*&p=*
#Disallow: /forum/viewtopic.php?t=*&p=*
#Disallow: /forum/viewtopic.php?style=*&t=*&p=*
#Disallow: /forum/viewtopic.php?f=*&t=*&view=print
#Disallow: /forum/viewtopic.php?f=*&t=*&start=*&view=print
#Disallow: /forum/delete_session_anonimous.php

User-agent: Yandex
Disallow:
Clean-param: style&ver /forum/
Clean-param: view */dlext/details
Clean-param: f /forum/viewtopic.php
Clean-param: sid /forum/index.php
Clean-param: sid /forum/viewforum.php
Clean-param: sid /forum/viewtopic.php

Host: amx.host-v.ru

Sitemap: https://amx.host-v.ru/sitemap.xml

#User-agent: Yandex
#Disallow:
#Clean-param: style&ver forum/*
#Clean-param: view forum/app.php/dlext/details
#Clean-param: f forum/viewtopic.php
#Clean-param: sid /forum/index.php
#Clean-param: sid /forum/viewforum.php
#Clean-param: sid /forum/viewtopic.php
#User-agent: Googlebot
#Disallow: /forum/app.php/dl_ext/*
#Allow: /forum/*?hash=*
#Allow: /forum/*?style=*
#Allow: /forum/download/
#User-agent: Googlebot-Mobile
#Disallow: /forum/app.php/dl_ext/*
#Allow: /forum/*?hash=*
#Allow: /forum/*?style=*
#Allow: /forum/download/
#User-agent: YandexImageResizer
#Disallow: /forum/app.php/dl_ext/*
#User-agent: Mediapartners-Google
#Disallow:
#User-agent: Adsbot-Google
#Disallow:
#User-agent: YandexMetrika
#Disallow:
#User-agent: YandexDirect
#Disallow:
Может нужно что то убрать или наоборот добавить?
У вас нет необходимых прав для просмотра вложений в этом сообщении.
Аватара пользователя
Siava
Поддержка
Поддержка
Сообщения: 5284
Стаж: 19 лет 3 месяца
Откуда: Питер
Благодарил (а): 186 раз
Поблагодарили: 793 раза

Re: robots.txt для 3.x

Сообщение Siava »

sas333, всё менять. У вас форум в корне сайта, а в robots все пути /forum/
Еще одно нарушение правил и будете забанены. © Mr. Anderson
Ты очистил кеш? © Sheer
https://siava.ru (phpbb 2.0.x 3.5.x)
Аватара пользователя
sas333
phpBB 1.4.4
Сообщения: 171
Стаж: 6 лет 10 месяцев
Благодарил (а): 13 раз
Поблагодарили: 4 раза

Re: robots.txt для 3.x

Сообщение sas333 »

Siava писал(а): 17.11.2021 18:03 всё менять. У вас форум в корне сайта, а в robots все пути /forum/
Достаточно ли просто сменить путь или может что то ещё нужно добавить?
Alex-sm
phpBB 1.0.0
Сообщения: 7
Стаж: 8 лет 4 месяца
Благодарил (а): 2 раза

Re: robots.txt для 3.x

Сообщение Alex-sm »

Всех приветствую и поздравляю с новым годом! Видел, что подобный вопрос уже задавался. Тем не менее...
Яндекс ругается: Найдены страницы-дубли с GET-параметрами:

https://site.ru/forum/viewtopic.php?f=55&t=1865&p=4161
https://site.ru/forum/viewtopic.php?f=55&p=4161

то есть, через robot.txt необходимо скрыть страницы с GET-параметром t. И всё бы ничего, но параллельно Яндекс ругается уже на то, что в ссылках немного иной конструкции:

https://site.ru/forum/viewtopic.php?f=6 ... &start=100
https://site.ru/forum/viewtopic.php?t=1332&start=100

необходимо убрать страницы с GET-параметром f.

Но, поскольку и там, и там префиксом будет /forum/viewtopic.php, то я не смогу закрыть страницы с GET-параметром t, который во вторых ссылках уже играет большую роль. Аналогично, закрытие страниц с GET-параметром f станет критичным для первого вида ссылок. Подскажите пожалуйста, как быть в этой ситуации? Уже всю голову сломал.
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12426
Стаж: 12 лет 8 месяцев
Благодарил (а): 166 раз
Поблагодарили: 2477 раз

Re: robots.txt для 3.x

Сообщение Татьяна5 »

Alex-sm, что со стилем? Куда из него делся canonical?
Alex-sm
phpBB 1.0.0
Сообщения: 7
Стаж: 8 лет 4 месяца
Благодарил (а): 2 раза

Re: robots.txt для 3.x

Сообщение Alex-sm »

Татьяна5 писал(а): 03.01.2022 22:31 Куда из него делся canonical?
Татьяна, в том-то и проблема, что стиль дефолтный Prosilver с минимумом изменений (и те только по цвету), canonical, естественно, на месте в виде: <link rel="canonical" href="https://site.ru/forum/viewtopic.php?t=756">. Но Яндекс уже несколько месяцев держит данную проблему, как критическую. Писал в поддержку, ответили, что, мол, если сделать ничего невозможно, тогда игнорируйте. Игнорировал, параллельно искал решение проблемы. Понял, что Clean-param: sid в robot.txt - не вариант, т.к., убрав t и f, всё закрою от индекса.
dotez
phpBB 2.0.1
Сообщения: 289
Стаж: 13 лет 4 месяца
Благодарил (а): 4 раза

Добавить в Роботс параметр clean

Сообщение dotez »

Яндекс стал ругаться-
Вот примеры страниц и дублирующих их страниц с незначащими GET-параметрами:

view:
https://forum.ru/phpBB3/viewtopic.php?f=17&t=1770
https://forum.ru/phpBB3/viewtopic.php?f ... iew=unread


Если эти страницы действительно являются дублями, рекомендуем использовать директиву Clean-param в robots.txt, чтобы робот игнорировал незначащие GET-параметры и объединил все сигналы со страниц-копий на основной странице.


как это правильно в роботс прописать?
ciiz1
phpBB 2.0.4
Сообщения: 440
Стаж: 6 лет 8 месяцев
Благодарил (а): 100 раз
Поблагодарили: 30 раз

Re: robots.txt для 3.x

Сообщение ciiz1 »

User-agent: Yandex

Clean-param: uid&f&sid&e&hilit&view&unwatch /viewtopic.php
Clean-param: sid&
Clean-param: &mode&view

Вернуться в «phpBB-пространство»