Princípio de funcionamento do CAPTCHA
Por muito tempo, sites e aplicativos móveis têm sido alvo de ataques em larga escala por bots.
Esses bots maliciosos são programados para consumir automaticamente grandes quantidades de recursos computacionais, publicar spam, coletar dados de sites e até mesmo registrar e executar verificações de usuários.
Em 2022, quase metade (47,4%) de todo o tráfego da internet veio de bots, um aumento de 5,1% em relação ao ano anterior. A proporção de tráfego humano (52,6%) caiu para o nível mais baixo em oito anos.
Nesse contexto, surgiu o CAPTCHA (Teste de Turing Público Completamente Automatizado para Diferenciação entre Computadores e Humanos), que conhecemos hoje como código de verificação.
Como cientista da computação, Tam Nguyen acredita que o CAPTCHA é uma barreira eficaz para os sites prevenirem ataques automáticos, reforçarem a segurança na web e melhorarem a experiência do usuário, pelo menos no curto prazo.
Os CAPTCHAs são projetados como perguntas ou desafios que são fáceis para os humanos, mas difíceis para os bots de computador responderem.
Eles podem ser divididos em quatro tipos: baseados em texto, baseados em imagem, baseados em áudio e baseados em comportamento.
Baseados em texto
Os CAPTCHAs baseados em texto têm sido populares desde o início da internet.
Este tipo de CAPTCHA requer que os usuários leiam uma imagem de texto distorcida e complexa e insiram a resposta em um campo de texto.
Uma variação do CAPTCHA baseado em texto é pedir aos usuários que resolvam problemas matemáticos simples, como "18+5" ou "23-7".
No entanto, devido à popularização da inteligência artificial de aprendizado profundo, algoritmos avançados de reconhecimento óptico de caracteres resolveram recentemente esse problema.
Ironicamente, quando o texto é ajustado para ser mais distorcido e complexo, os humanos reais não conseguem fornecer a resposta correta.
A Wired publicou um artigo intitulado "Falhei em dois testes de CAPTCHA esta semana, ainda sou humano?"
Baseados em áudio
CAPTCHAs de áudio reproduzem um breve clipe de áudio contendo uma série de números ou letras falados por uma voz humana ou sintetizada, que os usuários devem digitar em um campo de texto fornecido após ouvir.
A entrada é verificada em relação à resposta correta para determinar se o usuário é humano.
Assim como os CAPTCHAs baseados em texto, os CAPTCHAs de áudio podem ser difíceis para os humanos interpretarem devido a ruídos de fundo, má qualidade de áudio, distorção severa e sotaques não familiares.
Baseados em imagem
CAPTCHAs baseados em imagem foram introduzidos para aumentar o desafio para os bots.
Os usuários devem identificar objetos específicos em imagens, por exemplo, selecionar todos os blocos de imagem que contêm semáforos.
Esta tarefa aproveita a percepção visual humana, que ainda é superior à maioria dos bots baseados em visão computacional.
No entanto, esse tipo de CAPTCHA também pode ser confuso para as pessoas em muitas situações.
"Os CAPTCHAs sempre me deixam em dúvida sobre aquelas pequenas bordas"
Baseados em comportamento
CAPTCHAs baseados em comportamento analisam o comportamento do usuário, como movimentos do mouse e padrões de digitação.
O popular CAPTCHA baseado em comportamento reCAPTCHA requer que os usuários marquem a caixa "Não sou um robô".
Durante este processo, o reCAPTCHA analisa o movimento e o clique do mouse para distinguir entre humanos e bots. O comportamento humano geralmente é mais variável e menos previsível, enquanto o comportamento dos bots é geralmente preciso e consistente.
IA vs. Humanos
Na aparentemente interminável batalha entre IA e humanos, os CAPTCHAs são mais um campo de batalha.
Inicialmente, a ideia dos CAPTCHAs baseados em imagem era ajudar a treinar a IA para realizar melhor o reconhecimento de texto ao digitalizar livros.
Esta inovação, inventada por Luis von Ahn (co-fundador do Duolingo), apresentava palavras digitalizadas pouco claras como CAPTCHAs para os humanos, e ao identificar essas palavras, ensinamos a IA.
Hoje, a IA se tornou cada vez mais avançada, capaz de resolver desafios de CAPTCHA usando tecnologias modernas como aprendizado profundo e visão computacional.
Por exemplo, algoritmos de reconhecimento óptico de caracteres melhoraram constantemente, tornando os CAPTCHAs baseados em texto menos eficazes. Tecnologias avançadas de conversão de fala em texto podem contornar CAPTCHAs de áudio. Da mesma forma, modelos de IA treinados em grandes conjuntos de dados de imagens podem resolver muitos CAPTCHAs baseados em imagem com alta precisão.
Link do artigo: https://arxiv.org/pdf/2307.12108
Do outro lado do campo de batalha, os pesquisadores de CAPTCHA criaram técnicas de CAPTCHA mais complexas.
Por exemplo, o reCAPTCHA pode avaliar o comportamento de interação do usuário e calcular a probabilidade de que sejam humanos.
Ironicamente, os humanos estão ajudando a IA a resolver problemas complexos de CAPTCHA.
Por exemplo, as fazendas de cliques empregam um grande número de trabalhadores mal pagos para clicar em anúncios, incluindo postagens em mídias sociais, seguir contas, escrever avaliações falsas e até resolver problemas de CAPTCHA.
Fazenda de cliques de mídia social no Vietnã
Seu trabalho é ajudar os sistemas de IA a se comportarem como humanos, derrotando assim os CAPTCHAs e outras tecnologias antifraude.
O futuro dos CAPTCHAs
A corrida armamentista permanente entre medidas de segurança e aqueles que buscam contorná-las promove inovação contínua.
À medida que a IA continua a evoluir, os métodos adotados por especialistas em segurança cibernética e aqueles que buscam romper barreiras digitais também evoluirão.
É previsível que o futuro dos CAPTCHAs será influenciado pelos avanços contínuos da IA.
Os métodos tradicionais de CAPTCHA estão perdendo eficácia, portanto, os sistemas de CAPTCHA futuros provavelmente se concentrarão mais na análise do comportamento do usuário, como as pessoas interagem com os sites, tornando mais difícil para os bots imitar esse comportamento.
Os sites podem mudar para o uso de CAPTCHAs biométricos, como reconhecimento facial ou digitalização de impressões digitais, mas isso levantará questões de privacidade.