Как работает декодер символьной CAPTHA

Хакерские программы по вводу CAPTHA ориентированы, как правило, на определенный сетевой ресурс. В этом случае программа разработки алгоритма упрощается тем, что тип CAPTHA известен и количество символов определено, к тому же, имеется представление о сложности и методе генерирования надписи. Основу алгоритма в таком случае составляет распознавание контуров символа и его идентификация.

Дополнительным или подготовительным действием является очищение поля надписи от шумов. Здесь надо решить вопрос, что является шумом, а что нет. Порою даже разработчики документации испытывают сложность в определении, даже когда делают описание тендеры (разработка) технических терминов. Чаще всего убираются единичные пиксели контрастные с фоном. После того как шум убран, определяются сами символы. Знание алгоритма генерации позволяет уточнить степень поворота цифр, возможность их соединения или «наезда». Как только символы выделены, начинается их распознавание.

В основу методики определения символа лежит сравнение с эталоном: с каким эталоном минимальное отличие, таким он и считается. Чем больше база эталонных значений в библиотеке программы, тем точнее распознавание.

468 ad

Оставить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *