Уважаемые пользователи!
C 7 ноября 2020 года phpBB Group прекратила выпуск обновлений и завершила дальнейшее развитие phpBB версии 3.2.
С 1 августа 2024 года phpBB Group прекращает поддержку phpBB 3.2 на официальном сайте.
Сайт официальной русской поддержки phpBB Guru продолжит поддержку phpBB 3.2 до 31 декабря 2024 года.
С учетом этого, настоятельно рекомендуется обновить конференции до версии 3.3.

Антиботы

Есть любые вопросы, связанные со стилями/темами для phpBB 2.0.x? Ишите ответы здесь!
Аватара пользователя
avm
Former team member
Сообщения: 582
Стаж: 19 лет 2 месяца
Откуда: Москва

Сообщение avm »

apsik не знаю что вы понимаете под термином нейросети и к чему тут finereader... но распознать большинство картинок, которые никогда не распознает FR, очень легко! интересных материалов по этому поводу можно найти как на этом сайте (тут это обсуждалось еще года полтора назад) так и в интернете. Начните отсюда: http://www.captcha.ru/
apsik писал(а):они просто находят сам код. Это возможно, если код проверочных хранится в куках
неужели бывают такие идиоты?

Распознавать вручную - это может оказаться слишком дорого (временные затраты).

Распознавать автоматом нужно применительно к каждому алгоритму генерации картинок, но общая схема такая:
1) избавляемся от фона - это несложно.
2) избавляемся от "помех" - обычно цвет, "ширина" линий, отдельно стоящие точки, ...
3) пытаемся определить границы символа
4) вот тут в зависимости от алгоритма:
4.1) векторизуем знак по внешним границам, далее сводим контур до получения кривой, которую сравниваем с предопределенными шаблонами кривых для знаков (в %). и не важен ни наклон ни смещение, ни изначальный шрифт ;)
4.2) если возможно (как напримр у phpbb), то просто сравниваем максимальный % попадания черных точек в маску знака.
и т.д. - типов не много!...

и какие уж тут нейросети?... :lol:

естественно я описал крайне укрупненную логику, но ведь тут не форум юных хакеров?!

а вот то с чем этой логике будет бодаться сложнее: Изображение
из-за того что контуры знаков "разорваны"...
выделенный сервер по цене обычного хостинга - менее 150 рублей в месяц
Благодарности принимаются в Яндекс.Деньгах на счет 4100143316948
VovikV
phpBB 1.4.4
Сообщения: 119
Стаж: 18 лет 4 месяца

Сообщение VovikV »

avm писал(а):apsik не знаю что вы понимаете под термином нейросети и к чему тут finereader... но распознать большинство картинок, которые никогда не распознает FR, очень легко! интересных материалов по этому поводу можно найти как на этом сайте (тут это обсуждалось еще года полтора назад) так и в интернете. Начните отсюда: http://www.captcha.ru/
apsik писал(а):они просто находят сам код. Это возможно, если код проверочных хранится в куках
неужели бывают такие идиоты?

Распознавать вручную - это может оказаться слишком дорого (временные затраты).

Распознавать автоматом нужно применительно к каждому алгоритму генерации картинок, но общая схема такая:
1) избавляемся от фона - это несложно.
2) избавляемся от "помех" - обычно цвет, "ширина" линий, отдельно стоящие точки, ...
3) пытаемся определить границы символа
4) вот тут в зависимости от алгоритма:
4.1) векторизуем знак по внешним границам, далее сводим контур до получения кривой, которую сравниваем с предопределенными шаблонами кривых для знаков (в %). и не важен ни наклон ни смещение, ни изначальный шрифт ;)
4.2) если возможно (как напримр у phpbb), то просто сравниваем максимальный % попадания черных точек в маску знака.
и т.д. - типов не много!...

и какие уж тут нейросети?... :lol:
Если вам неизвестен термен нейросети посмотрите в словаре :) Что еще под ним можно подразумевать в этой теме…
Как вы бойко рассуждаете о том, как легко распознать код, не зная, что неросети лежат в основе алгоритмов распознавания. В том числе и такого мощного продукта как FR.

1 Хм, фон и делают таким чтоб бот мог принять его за часть символа, это на глаз может не сложно…
2 помехи могут ложиться на символы, вся фишка чтоб не перепутать символ и помеху
3 опять же отделять от фона и помех…
4.1 Вы видели какие замутные шрифты используют, замучаетесь шаблоны делать, а в итоге еще и символ из фона захватите :)

Вы в некотором роде описали принцип роботы нейросетей при распознавании, вот такие нейросети. :)

И к сложности распознавания, прибавьте еще, что все это нужно реализовать математически, программно.

Если следовать вашей логики то и разорвание контуры распознать труда не составит, проводите кривую от точке к точке используя информацию о предыдущей (не разорванной) части символа + работа с шаблоном.
Это все очень просто на словах...
Аватара пользователя
VVVas
Former team member
Сообщения: 4463
Стаж: 19 лет 4 месяца
Поблагодарили: 13 раз
Контактная информация:

Сообщение VVVas »

apsik писал(а):Поискал, но так и не нашёл
http://www.phpbbguru.net/community/viewtopic.php?t=2072
Тема с названием "Визуальное подтверждение для гостей" это конечно же не то что нужно вам...
я люблю daft punk | новый sugoi.ru
Аватара пользователя
rxu
phpBB Guru
phpBB Guru
Сообщения: 16313
Стаж: 17 лет 10 месяцев
Откуда: Красноярск
Благодарил (а): 533 раза
Поблагодарили: 2119 раз
Контактная информация:

Сообщение rxu »

Ламерская фантастика:
а что, если усложнить ВП так, чтобы с картинки последовательность символов нажно было вводить не так, как они расположены по порядку, а:
- в обратном порядке;
- в случайном порядке, задаваемом rand в каждом конкретном случае.
Либо, вместо картинки использовать аудио (еще сильнее - видео) подтверждение :!: :D
Аватара пользователя
crash
Former team member
Сообщения: 6517
Стаж: 19 лет 8 месяцев
Откуда: Бердск
Поблагодарили: 15 раз
Контактная информация:

Сообщение crash »

rxu писал(а):Либо, вместо картинки использовать аудио (еще сильнее - видео) подтверждение
запах и все остальное
Как правильно задавать вопросы
Для особо одаренных: поиск - это есть круто.
FAQ v.2 | FAQ v.3 | Шаблон запроса
Аватара пользователя
rxu
phpBB Guru
phpBB Guru
Сообщения: 16313
Стаж: 17 лет 10 месяцев
Откуда: Красноярск
Благодарил (а): 533 раза
Поблагодарили: 2119 раз
Контактная информация:

Сообщение rxu »

запах и все остальное
:) Как говорится, от тюрьмы и от сумы...
Достанут боты - может, и не такие фокусы творить придется :lol:
Изображение
Аватара пользователя
avm
Former team member
Сообщения: 582
Стаж: 19 лет 2 месяца
Откуда: Москва

Сообщение avm »

Хмм.. я вам про то что в применении к данной тематике нейросети не нужны, а вы мне опять про свой FR. Да забудьте вы о нем! Не нужно думать в "ту сторону", ибо не такие решения используются для распознавания captcha...
VovikV писал(а):1 Хм, фон и делают таким чтоб бот мог принять его за часть символа, это на глаз может не сложно…
ерунда! если фон легко отделим глазом, значит у такого метода есть формальные признаки отделения, которые можно сформулировать! с градиентами несколько больше возни, правда... А в большинстве captcha-решений фон очень просто определяется по количеству рядом расположенных точек (для многих решений можно даже заранее указать палитру фона, что еще и облегчает задачу). Различные "сетки" тоже улетают на этом этапе...
VovikV писал(а):2 помехи могут ложиться на символы, вся фишка чтоб не перепутать символ и помеху
ну и что... при нормальной реализации п.1 фона уже максимально нету на этом этапе. Из помех остаются отдельно стоящие точки и линии, чья "толщина" меньше толщины символа (надеюсь понятно что именно я имею ввиду).
После этого этапа, результат - только те помехи которые по критериям очень подходят под характеристики символа...
VovikV писал(а):3 опять же отделять от фона и помех…
не "опятьже", а на этом этапе считаем, что уже нет ни фона не помех. Все что есть приведено к монохрому. Вот исходя из этого и определяем границы. Либо по разомкнутости, либо пытаясь определить места слияний (методы можете попытаться представить себе сами).
VovikV писал(а):4.1 Вы видели какие замутные шрифты используют, замучаетесь шаблоны делать, а в итоге еще и символ из фона захватите Smile
еще раз говорю - шрифт не сильно важен! Важна возможность построения векторной кривой, которую и попытаемся сравнить по ключевым точкам с имеющимся универсальным шаблоном с допуском определенной погрешности на искажения (вы ведь понимаете, что наборы ключевых точек характеризующих "2" и "5" разные?). Ну и как вы можете уже дагадаться сами - тут не сложно чуть-чуть смасштабировать макет, и еще повращать макет в пределах +-45град (с шагом 10-12град) или иметь в библиотеке некоторое множество шаблонов ключевых точек для каждого символа.

Ну и наконец, если не удалось на определенном приемлемом уровне допусков и погрешностей получить правильный результат, значит запрашиваем следующую картинку и повторяем снова. Если из 10-100 попыток не получилось получить нужного результата - забиваем на эту captcha и объявляем ее достаточно надежной.

Добавлено спустя 49 минут 26 секунд:
VovikV писал(а):И к сложности распознавания, прибавьте еще, что все это нужно реализовать математически, программно.
вы шутите? те "специальсты" для кого это сложность, даже и не рассматриваются... А тех кто описанные мной шаги способен понять/придумать самостоятельно и реализовать - не мало!
VovikV писал(а):Если следовать вашей логики то и разорвание контуры распознать труда не составит, проводите кривую от точке к точке используя информацию о предыдущей (не разорванной) части символа + работа с шаблоном.
в том то и дело, что ВСЕ части разорваны и представляют собой самостоятельные замкнутые контуры. Просто я привел простейший случай в качестве примера, в котором символы значительно удалены друг от друга, а "разрывы" только по вертикали.
выделенный сервер по цене обычного хостинга - менее 150 рублей в месяц
Благодарности принимаются в Яндекс.Деньгах на счет 4100143316948
apsik
phpBB 1.2.0
Сообщения: 12
Стаж: 17 лет 6 месяцев

Сообщение apsik »

avm писал(а): 1) избавляемся от фона - это несложно.
Почти не спорю. Но градиет - рулит.
avm писал(а):2) избавляемся от "помех" - обычно цвет, "ширина" линий, отдельно стоящие точки, ...
Не согласен. Тут великие сложности. https://www.e-gold.com/acct/login.html - отсюда я стырил свой способ рисовать картинку. Линии толщиной с буквы и сливаются. Там сложно даже глазом иногда отделить. Приходится додумывать.
avm писал(а):3) пытаемся определить границы символа
Чаще всего бесполезно. Смотреть ту же ссылку.
avm писал(а):4.2) если возможно (как напримр у phpbb), то просто сравниваем максимальный % попадания черных точек в маску знака.
и т.д. - типов не много!...
Это правильно, но можно тогда и не особо париться с фоном, мусором и т.д.
Если маска находит что-то на картике, где она вписывается очень хорошо, то найдено. Можно поизменять размер маски, наклон, какое-нибудь смещение придумать. Тогда и Ваши разорванные контуры не помогут.

Добавлено спустя 3 минуты 55 секунд:
VVVas писал(а):
apsik писал(а):Поискал, но так и не нашёл
http://www.phpbbguru.net/community/viewtopic.php?t=2072
Тема с названием "Визуальное подтверждение для гостей" это конечно же не то что нужно вам...
И правда, то, что я хотел.. Ну ладно... Поздо найдено уже. Но всё равно большое спасибо за помощь. :D
Аватара пользователя
avm
Former team member
Сообщения: 582
Стаж: 19 лет 2 месяца
Откуда: Москва

Сообщение avm »

apsik писал(а):
avm писал(а):4.2) если возможно (как напримр у phpbb), то просто сравниваем максимальный % попадания черных точек в маску знака.
и т.д. - типов не много!...
Это правильно, но можно тогда и не особо париться с фоном, мусором и т.д.
Если маска находит что-то на картике, где она вписывается очень хорошо, то найдено. Можно поизменять размер маски, наклон, какое-нибудь смещение придумать. Тогда и Ваши разорванные контуры не помогут.
в данном случае ваш ход мысли совершенно неверен! Метод масок (самый простой и тупой), подходит только для наипростейших captcha. А для тех что используют нелинейные искажения он вообще не даст никаких результатов, намного более результатвной тут окажется векторизация.

До сего момента я обсуждал не вашу реализацию, а говорил лишь об абстрактных несложных методиках. Потому что вы спрашивали:
apsik писал(а):Кстти, а кто-нибудь задумывался как боты обходят картинку?
А что касается вашего варианта captcha (прикрепил ниже), то во первых толщина линий там значительно меньше толщины контура цифр, имеется явное различие в алиасинге, нет деформации символов, и т.д.
Вложения
Картинка с http://www.rusgalfb.ru
Картинка с http://www.rusgalfb.ru
imggen.php.png (1.1 КБ) 3872 просмотра
выделенный сервер по цене обычного хостинга - менее 150 рублей в месяц
Благодарности принимаются в Яндекс.Деньгах на счет 4100143316948
apsik
phpBB 1.2.0
Сообщения: 12
Стаж: 17 лет 6 месяцев

Сообщение apsik »

avm писал(а): толщина линий там значительно меньше толщины контура цифр
На е-голде они почти одинаковые.
Я просто упростил это для пользователей, чтобы проще было на глаз вопринимать, но раз проще на глаз, то и боты могут, тут Вы правы.
А насчёт
avm писал(а):нет деформации символов, и т.д.
лень было заморачиваться. Мне будет проще сменить имя у поля ввода или ещё что, кроме того это будет слишком большая честь, если для одного меня будут писаться боты :D

Добавлено спустя 1 минуту 58 секунд:

Спасибо, кстати, за ликбез по распознаванию без нейросетей. Даже самому захотелось бота написать попробовать :D
Очень рад, что смог с Вами подискутировать :D
Аватара пользователя
avm
Former team member
Сообщения: 582
Стаж: 19 лет 2 месяца
Откуда: Москва

Сообщение avm »

apsik писал(а):На е-голде они почти одинаковые.
apsik писал(а):Тут великие сложности. https://www.e-gold.com/acct/login.html
посмотрел я эту ссылку... :lol: думал там монстр какой-то, а там....

итак, там всегда 6 цирф, которые практически всегда в пределах своей 1/6 части картинки, никаких значительных искажений шрифтов... в общем - методом подбора масок с вероятностью около 80-85% его можно читать, даже не очищая картинку от этих вертикальных линий... причем не самым замороченным алгоритмом.

Добавлено спустя 2 минуты 3 секунды:
apsik писал(а):Даже самому захотелось бота написать попробовать
вот блин, поэтому я сразу и говорил что не хочу расписывать детали... :D
выделенный сервер по цене обычного хостинга - менее 150 рублей в месяц
Благодарности принимаются в Яндекс.Деньгах на счет 4100143316948
apsik
phpBB 1.2.0
Сообщения: 12
Стаж: 17 лет 6 месяцев

Сообщение apsik »

Я ради пробы сделал толщину мусорных линий случайной., а конечную картинку "замусорил" ещё и линиями цвета фона.
Глядите какая красота получилась:
http://www.rusgalfb.ru/imgp.htm
тут и разорваные контуры и слияния с линиями. :D
Боты маст дай!!! :D
apsik
phpBB 1.2.0
Сообщения: 12
Стаж: 17 лет 6 месяцев

Сообщение apsik »

На нашем форуме просили меня оформить эту фишку в мод. Руки так и не дошли, но я полностью описал это всё-таки.
Кому нужно это, описание прикрутки тут:
http://www.rusgalfb.ru/viewtopic.php?t=120&start=15
Закрыто

Вернуться в «Стили для phpBB 2.0.x»