Капча: новое поле битвы между ИИ и людьми

Принцип работы CAPTCHA

На протяжении долгого времени веб-сайты и мобильные приложения подвергались масштабным атакам ботов.

Эти вредоносные боты запрограммированы на автоматическое потребление большого количества вычислительных ресурсов, публикацию спама, сбор данных с сайтов и даже регистрацию и прохождение пользовательской аутентификации.

В 2022 году почти половина (47,4%) всего интернет-трафика исходила от ботов, что на 5,1% больше, чем в предыдущем году. Доля человеческого трафика (52,6%) упала до самого низкого уровня за восемь лет.

В этих условиях появилась CAPTCHA (полное название "Полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей"), известная нам сегодня как капча.

Как компьютерный ученый, Там Нгуен считает, что капча является эффективным барьером для предотвращения автоматических атак на веб-сайты, усиления кибербезопасности и улучшения пользовательского опыта, по крайней мере, в краткосрочной перспективе.

Капча разработана как вопросы или задачи, которые легко решить людям, но трудно компьютерным ботам.

Она делится на четыре типа: текстовая, изображения, аудио и поведенческая.

Текстовая

Текстовая капча была популярна с самого начала существования интернета.

Этот тип капчи требует от пользователей прочтения искаженного и сложного текстового изображения и ввода ответа в текстовое поле.

Вариантом текстовой капчи является требование решить простую математическую задачу, например, "18+5" или "23-7".

Однако, из-за распространения глубокого обучения в искусственном интеллекте, недавно продвинутые алгоритмы оптического распознавания символов решили эту проблему.

Иронично, что когда текст делается более искаженным и сложным, настоящие люди не могут дать правильный ответ.

Журнал Wired опубликовал статью "Я дважды на этой неделе не прошел тест капчи, я все еще человек?"

Аудио

Аудио капча воспроизводит короткий аудиофрагмент, содержащий серию цифр или букв, произнесенных человеческим или синтезированным голосом, которые пользователь должен ввести в предоставленное текстовое поле после прослушивания.

Введенное содержание проверяется на соответствие правильному ответу, чтобы определить, является ли пользователь человеком.

Как и текстовая капча, аудио капча может быть трудна для понимания людьми из-за фонового шума, плохого качества звука, сильного искажения и незнакомого акцента.

Изображения

Капча на основе изображений была введена для повышения сложности для ботов.

Пользователи должны идентифицировать определенные объекты на изображениях, например, выбрать все блоки изображений, содержащие светофоры.

Эта задача использует визуальное восприятие человека, которое все еще превосходит большинство ботов, основанных на компьютерном зрении.

Однако этот тип капчи также может вызывать замешательство у людей во многих случаях.

"Капча всегда заставляет меня сомневаться в тех маленьких краях"

Поведенческая

Поведенческая капча анализирует поведение пользователя, такое как движения мыши и паттерны набора текста.

Популярная поведенческая капча reCAPTCHA требует от пользователей отметить галочкой поле "Я не робот".

В этом процессе reCAPTCHA анализирует движения и клики мыши, чтобы различить людей и ботов. Поведение людей обычно более вариативно и менее предсказуемо, в то время как поведение ботов обычно точно и последовательно.

ИИ против людей

В, казалось бы, бесконечной борьбе между искусственным интеллектом и людьми, капча является еще одним полем битвы.

Изначально идея капчи на основе изображений была призвана помочь обучить ИИ лучше выполнять распознавание текста при оцифровке книг.

Это изобретение Луиса фон Ана (соучредителя Duolingo) показывало людям нечеткие отсканированные слова в качестве капчи, и, распознавая эти слова, мы обучали искусственный интеллект.

Сегодня ИИ стал более продвинутым и может использовать современные технологии, такие как глубокое обучение и компьютерное зрение, для решения задач капчи.

Например, алгоритмы оптического распознавания символов постоянно совершенствуются, делая текстовую капчу менее эффективной. Продвинутые технологии преобразования речи в текст могут обойти аудио капчу. Аналогично, модели ИИ, обученные на больших наборах данных изображений, могут решать многие задачи капчи на основе изображений с высокой точностью.

Ссылка на статью: https://arxiv.org/pdf/2307.12108

На другой стороне поля битвы исследователи капчи создают более сложные технологии капчи.

Например, reCAPTCHA может оценивать поведение пользователя при взаимодействии и вычислять вероятность того, что они являются людьми.

Иронично, что люди помогают ИИ решать сложные задачи капчи.

Например, фермы кликов нанимают большое количество низкооплачиваемых работников для кликов по рекламе, включая посты в социальных сетях, подписки на аккаунты, написание фальшивых отзывов и даже решение задач капчи.

Ферма кликов в социальных сетях во Вьетнаме

Их работа заключается в том, чтобы помочь системам ИИ вести себя как люди, тем самым побеждая капчу и другие технологии защиты от мошенничества.

Будущее капчи

Постоянная гонка вооружений между мерами безопасности и теми, кто стремится их обойти, способствует постоянным инновациям.

По мере развития ИИ будут развиваться и методы, используемые специалистами по кибербезопасности и теми, кто стремится преодолеть цифровые барьеры.

Можно предположить, что будущее капчи будет находиться под влиянием постоянного прогресса ИИ.

Традиционные методы капчи теряют эффективность, поэтому будущие системы капчи могут больше фокусироваться на анализе поведения пользователей, например, как люди взаимодействуют с веб-сайтом, что затруднит ботам имитацию такого поведения.

Веб-сайты могут перейти к использованию биометрической капчи, такой как распознавание лиц или сканирование отпечатков пальцев, но это вызовет проблемы с конфиденциальностью.