Хмм.. я вам про то что в применении к данной тематике нейросети не нужны, а вы мне опять про свой FR. Да забудьте вы о нем! Не нужно думать в "ту сторону", ибо не такие решения используются для распознавания captcha...
VovikV писал(а):1 Хм, фон и делают таким чтоб бот мог принять его за часть символа, это на глаз может не сложно…
ерунда! если фон легко отделим глазом, значит у такого метода есть формальные признаки отделения, которые можно сформулировать! с градиентами несколько больше возни, правда... А в большинстве captcha-решений фон очень просто определяется по количеству рядом расположенных точек (для многих решений можно даже заранее указать палитру фона, что еще и облегчает задачу). Различные "сетки" тоже улетают на этом этапе...
VovikV писал(а):2 помехи могут ложиться на символы, вся фишка чтоб не перепутать символ и помеху
ну и что... при нормальной реализации п.1 фона уже максимально нету на этом этапе. Из помех остаются отдельно стоящие точки и линии, чья "толщина" меньше толщины символа (надеюсь понятно что именно я имею ввиду).
После этого этапа, результат - только те помехи которые по критериям очень подходят под характеристики символа...
VovikV писал(а):3 опять же отделять от фона и помех…
не "опятьже", а на этом этапе считаем, что уже нет ни фона не помех. Все что есть приведено к монохрому. Вот исходя из этого и определяем границы. Либо по разомкнутости, либо пытаясь определить места слияний (методы можете попытаться представить себе сами).
VovikV писал(а):4.1 Вы видели какие замутные шрифты используют, замучаетесь шаблоны делать, а в итоге еще и символ из фона захватите Smile
еще раз говорю - шрифт не сильно важен! Важна возможность построения векторной кривой, которую и попытаемся сравнить по ключевым точкам с имеющимся универсальным шаблоном с допуском определенной погрешности на искажения (вы ведь понимаете, что наборы ключевых точек характеризующих "2" и "5" разные?). Ну и как вы можете уже дагадаться сами - тут не сложно чуть-чуть смасштабировать макет, и еще повращать макет в пределах +-45град (с шагом 10-12град) или иметь в библиотеке некоторое множество шаблонов ключевых точек для каждого символа.
Ну и наконец, если не удалось на определенном приемлемом уровне допусков и погрешностей получить правильный результат, значит запрашиваем следующую картинку и повторяем снова. Если из 10-100 попыток не получилось получить нужного результата - забиваем на эту captcha и объявляем ее достаточно надежной.
Добавлено спустя 49 минут 26 секунд:
VovikV писал(а):И к сложности распознавания, прибавьте еще, что все это нужно реализовать математически, программно.
вы шутите? те "специальсты" для кого это сложность, даже и не рассматриваются... А тех кто описанные мной шаги способен понять/придумать самостоятельно и реализовать - не мало!
VovikV писал(а):Если следовать вашей логики то и разорвание контуры распознать труда не составит, проводите кривую от точке к точке используя информацию о предыдущей (не разорванной) части символа + работа с шаблоном.
в том то и дело, что ВСЕ части разорваны и представляют собой самостоятельные замкнутые контуры. Просто я привел простейший случай в качестве примера, в котором символы значительно удалены друг от друга, а "разрывы" только по вертикали.