robots.txt для 3.x

Вопросы без привязки к версии. Установлена авточистка (2 года).
Правила форума
Местная Конституция | Шаблон запроса | Документация (phpBB3) | Переход на 3.0.6 и выше | FAQ | Как задавать вопросы | Как устанавливать расширения

Ваш вопрос может быть удален без объяснения причин, если на него есть ответы по приведённым ссылкам (а вы рискуете получить предупреждение ;) ).
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12987
Стаж: 14 лет 8 месяцев
Благодарил (а): 162 раза
Поблагодарили: 2363 раза

Re: robots.txt для 3.x

Сообщение Татьяна5 »

Kuskow писал(а): 28.02.2026 8:06Что плохого?
Как минимум, все страницы от расширений будут по-умолчанию запрещены
Аватара пользователя
Kuskow
phpBB 2.0.3
Сообщения: 358
Стаж: 9 лет 10 месяцев
Откуда: 🇰🇿 Караганда
Благодарил (а): 25 раз
Поблагодарили: 34 раза

Re: robots.txt для 3.x

Сообщение Kuskow »

А этого недостаточно?
Kuskow писал(а): 28.02.2026 8:06Allow: /ext/
phpBB 3.3.15 • Manticore 17.5 • MariaDB 11.4 (2.8 GB) • Redis • PHP 8.3-FPM • Nginx • HestiaCP • Debian 12 • 4GB DDR4 • 60GB NVMe • 2 vCPU 4GHz
Аватара пользователя
Perfecthus
phpBB 2.0.13
Сообщения: 924
Стаж: 15 лет 5 месяцев
Откуда: Оттуда
Благодарил (а): 53 раза
Поблагодарили: 102 раза

Re: robots.txt для 3.x

Сообщение Perfecthus »

Kuskow, Вообще-то Allow - это, разрешить, а не запретить, как выше написала Татьяна.
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12987
Стаж: 14 лет 8 месяцев
Благодарил (а): 162 раза
Поблагодарили: 2363 раза

Re: robots.txt для 3.x

Сообщение Татьяна5 »

Kuskow писал(а): 28.02.2026 17:51 А этого недостаточно?
Нет. Причём тут ext, когда ссылка будет, скажем, вида knowledgbase/123?
Аватара пользователя
Perfecthus
phpBB 2.0.13
Сообщения: 924
Стаж: 15 лет 5 месяцев
Откуда: Оттуда
Благодарил (а): 53 раза
Поблагодарили: 102 раза

Re: robots.txt для 3.x

Сообщение Perfecthus »

Татьяна5, Видимо у некоторых, боты, ходят по каталогам на сервере. :)
Аватара пользователя
Kuskow
phpBB 2.0.3
Сообщения: 358
Стаж: 9 лет 10 месяцев
Откуда: 🇰🇿 Караганда
Благодарил (а): 25 раз
Поблагодарили: 34 раза

Re: robots.txt для 3.x

Сообщение Kuskow »

Татьяна5 писал(а): 28.02.2026 19:57 когда ссылка будет, скажем, вида knowledgbase/123?
А можно какой-нибудь реальный пример из какого-нибудь популярного расширения? Хотя бы на сайте www.phpbbguru.net/community. Другие страницы типа списка благодарностей точно не надо индексировать - они и закрыты у многих. Файлы стилей и так открыты.

Мне кажется, ничего критичного в таком файле robots.txt нет, а если что-то и случится, Google пришлёт письмо "Новые причины препятствуют индексированию страниц с сайта". И тогда я добавлю новые строчки.
Последний раз редактировалось Kuskow 01.03.2026 6:18, всего редактировалось 1 раз.
phpBB 3.3.15 • Manticore 17.5 • MariaDB 11.4 (2.8 GB) • Redis • PHP 8.3-FPM • Nginx • HestiaCP • Debian 12 • 4GB DDR4 • 60GB NVMe • 2 vCPU 4GHz
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12987
Стаж: 14 лет 8 месяцев
Благодарил (а): 162 раза
Поблагодарили: 2363 раза

Re: robots.txt для 3.x

Сообщение Татьяна5 »

Kuskow писал(а): 01.03.2026 6:16 реальный пример
rules/
Аватара пользователя
Kuskow
phpBB 2.0.3
Сообщения: 358
Стаж: 9 лет 10 месяцев
Откуда: 🇰🇿 Караганда
Благодарил (а): 25 раз
Поблагодарили: 34 раза

Re: robots.txt для 3.x

Сообщение Kuskow »

Так это, как раз, у всех закрыто: всякие rules, faq, ucp и иже с ними. И я не открываю. А что именно из расширений нужно открыть, которое не в папке /ext/?
phpBB 3.3.15 • Manticore 17.5 • MariaDB 11.4 (2.8 GB) • Redis • PHP 8.3-FPM • Nginx • HestiaCP • Debian 12 • 4GB DDR4 • 60GB NVMe • 2 vCPU 4GHz
Аватара пользователя
rxu
phpBB Guru
phpBB Guru
Сообщения: 17174
Стаж: 19 лет 11 месяцев
Откуда: Красноярск
Благодарил (а): 580 раз
Поблагодарили: 1765 раз

Re: robots.txt для 3.x

Сообщение rxu »

Kuskow, вам поясняют, что Disallow: / запрещает ссылки на все контроллеры phpBB. Например, встроенный /help/faq, и любые другие, которые добавляют какие бы то ни было расширения. Если у вас таких нет, или не хотите их скармливать ботам, то нет и проблем.
Изображение
Аватара пользователя
Kuskow
phpBB 2.0.3
Сообщения: 358
Стаж: 9 лет 10 месяцев
Откуда: 🇰🇿 Караганда
Благодарил (а): 25 раз
Поблагодарили: 34 раза

Re: robots.txt для 3.x

Сообщение Kuskow »

Sergey73 писал(а): 23.01.2025 8:15 Disallow: /view*&start=0$
Эта строка вредная. Если бот проиндексировал такую, значит ссылка встретилась где-то в сообщении пользователя. В этом случае хорошо бы повысить вес страницы в поиске за счёт ссылки, а из-за этой строки плюсик не будет даден. Если убрать эту строку, страница не будет проиндексирована как отдельная за счёт link rel="canonical", но зато бот не обидится, что ссылка есть, а проиндексировать не дали.
Sergey73 писал(а): 23.01.2025 8:15 Clean-param: sid /index.php
Clean-param: sid /viewforum.php
Clean-param: sid /viewtopic.php
Параметр sid= не нужно конкретизировать для каких-то страниц, он поисковикам не нужен на любой странице, а бывает он и для главной страницы форума. Чтобы не создавать отдельный раздел в robots.txt специально для Яндекса, лучше забить игнорирование парметров в интерфейсе Яндекс.Вебмастер -> Индексирование -> Настройка GET-параметров.
GET.png
Sergey73 писал(а): 23.01.2025 8:15 Host: https://-----.ru
Это вообще нужно убрать, так как игнорируется уже почти всеми.
У вас нет необходимых прав для просмотра вложений в этом сообщении.
phpBB 3.3.15 • Manticore 17.5 • MariaDB 11.4 (2.8 GB) • Redis • PHP 8.3-FPM • Nginx • HestiaCP • Debian 12 • 4GB DDR4 • 60GB NVMe • 2 vCPU 4GHz
Аватара пользователя
Kuskow
phpBB 2.0.3
Сообщения: 358
Стаж: 9 лет 10 месяцев
Откуда: 🇰🇿 Караганда
Благодарил (а): 25 раз
Поблагодарили: 34 раза

Re: robots.txt для 3.x

Сообщение Kuskow »

Kuskow писал(а): 28.02.2026 8:06 А что если сделать всё наоборот?
Переработано:

Код: Выделить всё

User-Agent: *
Disallow: /

User-Agent: Googlebot
User-Agent: YandexBot
Disallow: /
Allow: /$
Allow: /viewforum.php?
Allow: /viewtopic.php?
Allow: /sitemap
Allow: /assets/
Allow: /download/
Allow: /ext/
Allow: /styles/

User-Agent: Applebot
User-Agent: Bingbot
User-Agent: GPTBot
Disallow: /
Allow: /$
Allow: /viewforum.php?f=
Allow: /viewtopic.php?t=
Allow: /sitemap
Allow: /assets/
Allow: /download/
Allow: /ext/
Allow: /styles/

Sitemap: https://СВОЙДОМЕН/sitemap.xml

* Неожиданно: Если в инструкциях файла robots не упоминается Applebot, но есть Googlebot, робот Apple будет следовать инструкциям для Googlebot.
phpBB 3.3.15 • Manticore 17.5 • MariaDB 11.4 (2.8 GB) • Redis • PHP 8.3-FPM • Nginx • HestiaCP • Debian 12 • 4GB DDR4 • 60GB NVMe • 2 vCPU 4GHz
Аватара пользователя
Kuskow
phpBB 2.0.3
Сообщения: 358
Стаж: 9 лет 10 месяцев
Откуда: 🇰🇿 Караганда
Благодарил (а): 25 раз
Поблагодарили: 34 раза

Re: robots.txt для 3.x

Сообщение Kuskow »

Татьяна5 писал(а): 28.02.2026 19:57 Нет. Причём тут ext, когда ссылка будет, скажем, вида knowledgbase/123?
Это даже хорошо. На форумах уникальный контент генерируют только пользователи. Весь он собран только в viewtopic.php, частично повторяясь в viewforum.php. А значит индексация всего остального бессмысленна, бесполезна и даже вредна, поскольку крадёт краулинговый бюджет. Вряд ли кто-то хочет, чтобы новый пользователь пришёл из Яндекса на страницу со списком благодарностей.
Опять же, Гугл с Яндексом и сами потом решат, что эти страницы мусорные, выкинут их из раздачи. Так зачем же их скармливать поисковикам изначально? FAQ и RULES вообще одинаковые для тысяч сайтов - однозначно умные поисковики не возьмут их в свой индекс.
phpBB 3.3.15 • Manticore 17.5 • MariaDB 11.4 (2.8 GB) • Redis • PHP 8.3-FPM • Nginx • HestiaCP • Debian 12 • 4GB DDR4 • 60GB NVMe • 2 vCPU 4GHz
Аватара пользователя
Татьяна5
Поддержка
Поддержка
Сообщения: 12987
Стаж: 14 лет 8 месяцев
Благодарил (а): 162 раза
Поблагодарили: 2363 раза

Re: robots.txt для 3.x

Сообщение Татьяна5 »

Kuskow писал(а): Вчера 17:19 только пользователи
И админы, как в случае с knowledgbase, pages, и прочим-прочим-прочим

Вернуться в «phpBB-пространство»