Principio de funcionamiento del CAPTCHA
Durante mucho tiempo, los sitios web y las aplicaciones móviles han sido objeto de ataques a gran escala por parte de bots.
Estos bots maliciosos están programados para consumir automáticamente grandes cantidades de recursos computacionales, publicar spam, recopilar datos de sitios web e incluso registrarse y realizar verificaciones de usuarios.
En 2022, casi la mitad (47,4%) de todo el tráfico de Internet procedía de bots, un aumento del 5,1% respecto al año anterior. La proporción de tráfico humano (52,6%) cayó a su nivel más bajo en ocho años.
En este contexto, nació el CAPTCHA (acrónimo de "Prueba de Turing pública y automática para diferenciar entre ordenadores y humanos"), que es lo que ahora conocemos como código de verificación.
Como científico informático, Tam Nguyen considera que el CAPTCHA es una barrera eficaz para que los sitios web eviten ataques automáticos, mejoren la seguridad de la red y mejoren la experiencia del usuario, al menos a corto plazo.
Los CAPTCHA están diseñados como preguntas o desafíos que son fáciles para los humanos pero difíciles de responder para los bots informáticos.
Se pueden dividir en cuatro tipos: basados en texto, basados en imágenes, basados en audio y basados en comportamiento.
Basados en texto
Los CAPTCHA basados en texto han sido populares desde los inicios de Internet.
Este tipo de CAPTCHA requiere que los usuarios lean una imagen de texto distorsionada y compleja e introduzcan la respuesta en un campo de texto.
Una variante del CAPTCHA basado en texto es pedir a los usuarios que resuelvan problemas matemáticos simples como "18+5" o "23-7".
Sin embargo, debido a la popularización del aprendizaje profundo de IA, los algoritmos avanzados de reconocimiento óptico de caracteres han resuelto recientemente este problema.
Irónicamente, cuando el texto se ajusta para ser más distorsionado y complejo, los humanos reales no pueden proporcionar la respuesta correcta.
Wired publicó un artículo titulado "Fallé dos pruebas CAPTCHA esta semana, ¿sigo siendo humano?"
Basados en audio
Los CAPTCHA de audio reproducen un breve clip de audio que contiene una serie de números o letras pronunciados por una voz humana o sintética, que los usuarios escuchan y luego introducen en un campo de texto proporcionado.
La entrada se verifica con la respuesta correcta para determinar si el usuario es humano.
Al igual que los CAPTCHA basados en texto, los CAPTCHA de audio pueden ser difíciles de descifrar para los humanos debido a factores como el ruido de fondo, la mala calidad del audio, la distorsión severa y los acentos poco familiares.
Basados en imágenes
Los CAPTCHA basados en imágenes se introdujeron para aumentar el desafío para los bots.
Los usuarios deben identificar objetos específicos en las imágenes, por ejemplo, seleccionar todos los bloques de imágenes que contengan semáforos.
Esta tarea aprovecha la percepción visual humana, que sigue siendo superior a la mayoría de los bots basados en visión por computadora.
Sin embargo, este tipo de CAPTCHA también puede ser confuso en muchas situaciones.
"Los CAPTCHA siempre me hacen dudar sobre esos pequeños bordes"
Basados en comportamiento
Los CAPTCHA basados en comportamiento analizan el comportamiento del usuario, como el movimiento del ratón y los patrones de escritura.
El popular CAPTCHA basado en comportamiento reCAPTCHA requiere que los usuarios marquen la casilla "No soy un robot".
Durante este proceso, reCAPTCHA analiza el movimiento y los clics del ratón para distinguir entre humanos y bots. El comportamiento humano suele ser más variable y menos predecible, mientras que el comportamiento de los bots suele ser preciso y consistente.
IA vs. Humanos
Los CAPTCHA son otro campo de batalla en la aparentemente interminable lucha entre la IA y los humanos.
Originalmente, la idea de los CAPTCHA basados en imágenes era ayudar a entrenar a la IA para realizar mejor el reconocimiento de texto al digitalizar libros.
Esta innovación, inventada por Luis von Ahn (cofundador de Duolingo), presentaba palabras escaneadas poco claras como CAPTCHA a los humanos, y al identificar estas palabras, enseñamos a la IA.
Hoy en día, la IA se ha vuelto cada vez más avanzada, capaz de resolver los desafíos de CAPTCHA utilizando tecnologías modernas como el aprendizaje profundo y la visión por computadora.
Por ejemplo, los algoritmos de reconocimiento óptico de caracteres han mejorado constantemente, haciendo que los CAPTCHA basados en texto sean menos efectivos. Las tecnologías avanzadas de conversión de voz a texto pueden eludir los CAPTCHA de audio. Del mismo modo, los modelos de IA entrenados en grandes conjuntos de datos de imágenes pueden resolver muchos CAPTCHA basados en imágenes con alta precisión.
Enlace al artículo: https://arxiv.org/pdf/2307.12108
En el otro lado del campo de batalla, los investigadores de CAPTCHA están creando técnicas de CAPTCHA más complejas.
Por ejemplo, reCAPTCHA puede evaluar el comportamiento de interacción de los usuarios y calcular la probabilidad de que sean humanos.
Irónicamente, los humanos están ayudando a la IA a resolver problemas complejos de CAPTCHA.
Por ejemplo, las granjas de clics emplean a un gran número de trabajadores mal pagados para hacer clic en anuncios, incluyendo publicaciones en redes sociales, seguir cuentas, escribir reseñas falsas e incluso resolver problemas de CAPTCHA.
Granja de clics de redes sociales en Vietnam
Su trabajo es ayudar a los sistemas de IA a comportarse como humanos, derrotando así a los CAPTCHA y otras tecnologías antifraude.
El futuro de los CAPTCHA
La carrera armamentística permanente entre las medidas de seguridad y quienes buscan eludirlas fomenta la innovación constante.
A medida que la IA continúa evolucionando, también lo harán los métodos empleados por los expertos en ciberseguridad y aquellos que buscan romper las barreras digitales.
Es previsible que el futuro de los CAPTCHA se vea afectado por el continuo avance de la IA.
Los métodos tradicionales de CAPTCHA están perdiendo eficacia, por lo que es probable que los futuros sistemas de CAPTCHA se centren más en analizar el comportamiento del usuario, como la forma en que las personas interactúan con los sitios web, lo que dificulta que los bots imiten este comportamiento.
Los sitios web pueden pasar a utilizar CAPTCHA biométricos, como el reconocimiento facial o el escaneo de huellas dactilares, pero esto plantea problemas de privacidad.