Атака китайских ботов

Вопросы без привязки к версии. Установлена авточистка (2 года).
Правила форума
Местная Конституция | Шаблон запроса | Документация (phpBB3) | Переход на 3.0.6 и выше | FAQ | Как задавать вопросы | Как устанавливать расширения

Ваш вопрос может быть удален без объяснения причин, если на него есть ответы по приведённым ссылкам (а вы рискуете получить предупреждение ;) ).
Аватара пользователя
Kuskow
phpBB 2.0.4
Сообщения: 422
Стаж: 10 лет
Откуда: 🇰🇿 Караганда
Благодарил (а): 27 раз
Поблагодарили: 42 раза

Re: Атака китайских ботов

Сообщение Kuskow »

Код: Выделить всё

https://www.phpbbguru.net/community/viewtopic.php?p=572251&sid=df6bdddf6b10c994162313d5689e21d1#p572251
https://www.phpbbguru.net/community/viewtopic.php?p=572251&sid=888bbbbf6b10c994162313d5689e9876#p572251

Для кэша это две разные страницы, которые будут сохранены отдельно и отданы из кэша только при полном совпадении sid=. Но для форума и сайта это одна страница, содержимое и внешний вид которой не нужно генерировать заново, если другие пользователи запросят её. Если не чистить sid=, hilit=, view=, то кэш на стороне сервера будет бессмысленным и неэффективным, потому что не будет совпадений адреса страницы именно из-за этих sid=. И боты именно это и стараются сделать - максимально разнообразить запросы, чтобы движок phpBB напрягался. А кэш делается для того, чтобы повторяющиеся запросы не передавать для генерации в PHP, а выдавать сохранённую ранее сгенерированную копию. Так вот, чтобы повторения случались чаще, нужно очистить URL от параметров, не влияющих на отображение.
Аватара пользователя
волчара
phpBB 1.4.3
Сообщения: 95
Стаж: 9 лет 4 месяца
Благодарил (а): 4 раза
Поблагодарили: 13 раз

Re: Атака китайских ботов

Сообщение волчара »

:hat
После того как я добавил блокировку согласно этой инструкции Re: Атака китайских ботов, количество гостей не доходит и до 200 за сутки, как то аж подозрительно. До того как мой форум стал долбить gptBot, у меня максимум 1,5 тысячи за сутки набегало, а тут тишь да гладь :) , ведать всех "паразитов" блокирует :D
Мудрость заключается не в том, что бы не делать ошибки, а уметь их исправлять вовремя!
Vlad__
phpBB 2.0.7
Сообщения: 586
Стаж: 9 лет 6 месяцев
Благодарил (а): 246 раз
Поблагодарили: 53 раза

Re: Атака китайских ботов

Сообщение Vlad__ »

Kuskow писал(а): Сегодня 4:22 Для кэша это две разные страницы
Я это понимаю, вопрос был в другом. Кэш у вас, как я понял, в nginx, а url "чистите" в php.
nginx стоит перед php, поэтому логичнее "чистить" url средствами nginx, потому что php бэкенд для него, и очистка там не совсем понятна.

Грубо говоря, nginx кеширует страницы с sid=aaa, sid=bbb, sid=ccc как разные, и ему по барабану, что дальше вырезается в самом php. Это второй для него уровень.

Или как вы это все увязали?
Последний раз редактировалось Vlad__ 22.06.2026 13:33, всего редактировалось 1 раз.
Аватара пользователя
Kuskow
phpBB 2.0.4
Сообщения: 422
Стаж: 10 лет
Откуда: 🇰🇿 Караганда
Благодарил (а): 27 раз
Поблагодарили: 42 раза

Re: Атака китайских ботов

Сообщение Kuskow »

волчара писал(а): Сегодня 11:47 количество гостей не доходит и до 200 за сутки
Наконец-то Вы увидели, сколько их реально. А не то, что было раньше, даже до всех атак это число было неправильным.
волчара писал(а): Сегодня 11:47 До того как мой форум стал долбить gptBot
GPTBot хороший - пусть долбит, это недолго, он не агрессивный и можно отключать в robots.txt.
ChatGPT - плохой, потому что наивный - его используют плохие, и он именно долбит без разбору и без правил.
волчара писал(а): Сегодня 11:47 видать всех "паразитов" блокирует
Теперь действительно всех. В первой версии было не всех, потому что бывают боты, которые запоминают и передают куки phpBB. А начиная со второй версии внедрена кука, которая не используется в phpBB и формируется не сервером, а Java, поэтому она может быть только у людей.
Аватара пользователя
Kuskow
phpBB 2.0.4
Сообщения: 422
Стаж: 10 лет
Откуда: 🇰🇿 Караганда
Благодарил (а): 27 раз
Поблагодарили: 42 раза

Re: Атака китайских ботов

Сообщение Kuskow »

Vlad__ писал(а): Сегодня 13:28 Кэш у вас, как я понял, в nginx
Да, его там специально настраивал. Если нет доступа к root сервера, то настроить его невозможно. И провайдер web-хостинга не будет это делать.
Vlad__ писал(а): Сегодня 13:28 а url "чистите" в php
Потому что такую "сложную" логику организовать в правилах Nginx невозможно - это задача только для языков более высокого уровня.
Vlad__ писал(а): Сегодня 13:28 nginx стоит перед php, поэтому логичнее "чистить" url средствами nginx
1) Да, логичней, если можно было прописать в Nginx то, что написано в PHP.
2) Этот скрипт для всех, а не только для тех, кто имеет доступ к Nginx.
Vlad__ писал(а): Сегодня 13:28 php бэкенд для него, и очистка там не совсем понятна
У меня и блокировка есть как в Nginx, так и в PHP. Первый больше для дела, второй для души и для сообщества. Чтобы всем.
Vlad__ писал(а): Сегодня 13:28 nginx кеширует страницы с sid=aaa, sid=bbb, sid=ccc как разные, и ему по барабану
Да, только для того, чтобы из закешировать, нужно выполонить всё это три раза в phpBB. И толку в этом кэше нет, потому что повторно эти страницы запрошены не будут (ну может быть только пару раз). А суть кэша, чтобы страницы при повторе отдавались из кэша, а не из phpBB. Поэтому одинаковые страницы должны быть с одинаковым URI.
Vlad__ писал(а): Сегодня 13:28 Или как вы это все увязали?
Кэш Nginx технически никак не связан с очисткой и с этим скриптом в config.php. Я их не увязывал. Переадресация в PHP должна сделать так, чтобы запросы одинаковых страниц, попавшие в phpBB, были с одинаковыми URI. Больше никакой связи и связки с Nginx нет. А уже кэш Nginx, который работает отдельно и не знает, что есть какой-то мой скрипт в PHP, только кэширует и всё.
То есть, Вы напрасно ищеме связь между этим скриптом PHP и настройками Nginx. Они друг другу помогают, но действуют совершенно отдельно самостоятельно.
Vlad__
phpBB 2.0.7
Сообщения: 586
Стаж: 9 лет 6 месяцев
Благодарил (а): 246 раз
Поблагодарили: 53 раза

Re: Атака китайских ботов

Сообщение Vlad__ »

Kuskow писал(а): Сегодня 13:44 Потому что такую "сложную" логику организовать в правилах Nginx невозможно
Без комментариев )
Kuskow писал(а): Сегодня 13:44 Они друг другу помогают, но действуют совершенно отдельно самостоятельно.
Ладно, проехали. Вы так и не поняли мою мысль.
Аватара пользователя
Kuskow
phpBB 2.0.4
Сообщения: 422
Стаж: 10 лет
Откуда: 🇰🇿 Караганда
Благодарил (а): 27 раз
Поблагодарили: 42 раза

Re: Атака китайских ботов

Сообщение Kuskow »

Вот мне тоже так показалось, что я чего-то не понял.
Сйечас ещё вот чего хотел дописать: даже если перенести очистку URI от лишних параметров в Nginx, она будет совсем не там, где происходит настройка кэша. То есть, всё равно это останутся две несвязанных адачи, которые реализуются в разных местах.
Аватара пользователя
волчара
phpBB 1.4.3
Сообщения: 95
Стаж: 9 лет 4 месяца
Благодарил (а): 4 раза
Поблагодарили: 13 раз

Re: Атака китайских ботов

Сообщение волчара »

Kuskow писал(а): Сегодня 13:31 GPTBot хороший - пусть долбит
Не не, очень даже нехороший, он то мне и положил форум судя по логам, а вот ChatGPT даже рядом не было, только GPTBot долбил.
Мудрость заключается не в том, что бы не делать ошибки, а уметь их исправлять вовремя!
Аватара пользователя
Kuskow
phpBB 2.0.4
Сообщения: 422
Стаж: 10 лет
Откуда: 🇰🇿 Караганда
Благодарил (а): 27 раз
Поблагодарили: 42 раза

Re: Атака китайских ботов

Сообщение Kuskow »

волчара писал(а): 18.06.2026 22:17 74.7.242.1 - - [18/Jun/2026:21:56:03 +0300] "GET /viewforum.php?f=32&sid=03e566f3aa0df2a7e3c1590955fb380e HTTP/1.1" 404 153 "http://sibir-omsk.ru/viewforum.php?f=62 ... 98af13fabd" "Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GPTBot/1.4; +https://openai.com/gptbot)"
Это не настоящий GPTBot. Перед нами классический спуфинг юзер-агента (User-Agent Spoofing). Злоумышленник или спам-бот намеренно маскируется под официального робота OpenAI, чтобы обойти блокировки или не привлекать к себе лишнего внимания. На то, что это фальшивый бот (Scraper/Exploit Scanner), указывают сразу несколько неопровержимых фактов:

## 1. Сканирование сессий (sid=)
Официальный краулер GPTBot ходит исключительно по «чистым», статическим URL-адресам, которые он находит в карте сайта (sitemap.xml) или в коде страниц. Он принципиально игнорирует динамические идентификаторы сессий (sid=) в ссылках.
А вот фальшивый бот просто бездумно «парсит» все ссылки подряд из HTML-кода вашего форума phpBB (где ссылки для гостей часто содержат sid) или пытается подобрать активную сессию. [1]

## 2. IP-адреса не принадлежат OpenAI
* 74.7.242.1: Этот IP-адрес принадлежит американскому провайдеру Charter Communications (коммерческий кабельный интернет Spectrum). Настоящие боты OpenAI работают только из специализированных дата-центров (в основном Microsoft Azure), а не со стандартных домашних или офисных IP-линий США. [2]

## 3. Версия GPTBot/1.4
Официальный робот OpenAI использует строку GPTBot/1.0. Появление в логах несуществующей версии GPTBot/1.4 — это явный признак того, что скрипт парсера написан сторонним разработчиком «на коленке».
Аватара пользователя
волчара
phpBB 1.4.3
Сообщения: 95
Стаж: 9 лет 4 месяца
Благодарил (а): 4 раза
Поблагодарили: 13 раз

Re: Атака китайских ботов

Сообщение волчара »

О как :shock:
Мудрость заключается не в том, что бы не делать ошибки, а уметь их исправлять вовремя!
Ne_Guru
phpBB 1.2.1
Сообщения: 27
Стаж: 5 дней
Благодарил (а): 3 раза

Re: Атака китайских ботов

Сообщение Ne_Guru »

Простите, что вмешиваюсь в ваш разговор, но такая тема на форуме одна: больше писать некуда.
В продолжение моей истории...
Ne_Guru писал(а): 20.06.2026 21:34 Черт знает что...
Похоже на DDOC-атаку
Изображение

Завтра буду разбираться... :(
Я обратился в техподдержку форума.
Мне дословно сказали следующее:

Основная причина повышения нагрузки - множество запросов из подсетей ACEVILLEPTELTD-SG и Alibaba Cloud к сайту cubanos.ru:


[u-0][21/Jun/2026:00:32:27 +0300] 0.000 0.008 200 43.173.180.159 cubanos.ru GET /forum/rpquncls?validate_bot=600fce77c005b7dba78bc18fa660d105&validate_bot=a9945b693b84e4be50faa53a1bf813cf HTTP/1.1 "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/131.0.0.0 Safari/537.36" "https://cubanos.ru/forum/rpquncls?validate_bot=600fce77c005b7dba78bc18fa660d105" 694 193.168.131.166 cubanos
[u-0][21/Jun/2026:00:32:27 +0300] 0.000 0.021 200 43.173.177.96 cubanos.ru GET /forum/lhjfdrbu?validate_bot=db8990cb4498afd56128974cdcc00600&validate_bot=509554367767862db16194d819b7803c HTTP/1.1 "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.0.0 Safari/537.3" "https://cubanos.ru/forum/lhjfdrbu?validate_bot=db8990cb4498afd56128974cdcc00600" 697 193.168.131.166 cubanos


Для фильтрации подобных запросов добавьте правило в файл .htaccess в директории сайта:



<RequireAll>
Require all granted
Require not ip 43.173.0.0/16
Require not ip 47.82.0.0/16
Require not ip 43.172.0.0/16
</RequireAll>


Я вставил этот фрагмент в файлы .htaccess в директории сайта и в директории форума (у меня всегда атаки почему-то идут исключительно на форум, не на сайт) и сейчас ситуация такая:
stat2.jpg
stat3.jpg
И защиту от DDOS-атак платную я тоже убрал, потому что она вообще никак в данном случае на ситуацию не влияла.
У вас нет необходимых прав для просмотра вложений в этом сообщении.

Вернуться в «phpBB-пространство»