Captcha: Das neue Schlachtfeld zwischen KI und Menschen

Captchas stehen vor KI-Herausforderungen, eine intelligente Aufrüstung ist unausweichlich.

Funktionsweise von CAPTCHAs

Seit langem sind Websites und mobile Anwendungen massiven Angriffen von Bots ausgesetzt.

Diese bösartigen Bots sind so programmiert, dass sie automatisch große Mengen an Rechenressourcen verbrauchen, Spam veröffentlichen, Website-Daten sammeln und sogar Benutzerkonten registrieren und verifizieren.

Im Jahr 2022 stammte fast die Hälfte (47,4%) des gesamten Internetverkehrs von Bots, ein Anstieg um 5,1% gegenüber dem Vorjahr. Der Anteil des menschlichen Verkehrs (52,6%) sank auf den niedrigsten Stand seit acht Jahren.

In diesem Zusammenhang entstand CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart), das wir heute als Verifizierungscode kennen.

Als Informatiker ist Tam Nguyen der Meinung, dass CAPTCHAs zumindest kurzfristig eine effektive Barriere für Websites sind, um automatisierte Angriffe zu verhindern, die Cybersicherheit zu verbessern und das Benutzererlebnis zu verbessern.

CAPTCHAs sind so konzipiert, dass sie Fragen oder Herausforderungen stellen, die für Menschen einfach, für Computerbots jedoch schwierig zu beantworten sind.

Sie können in vier Typen unterteilt werden: textbasiert, bildbasiert, audiobasiert und verhaltensbasiert.

Textbasiert

Textbasierte CAPTCHAs sind seit den Anfängen des Internets sehr beliebt.

Diese Art von CAPTCHA erfordert, dass Benutzer verzerrte und komplexe Textbilder lesen und die Antwort in ein Textfeld eingeben.

Eine Variante textbasierter CAPTCHAs besteht darin, dass Benutzer einfache mathematische Probleme lösen müssen, wie "18+5" oder "23-7".

Aufgrund der Verbreitung von Deep-Learning-KI haben fortschrittliche Algorithmen zur optischen Zeichenerkennung dieses Problem jedoch kürzlich gelöst.

Ironischerweise können echte Menschen oft keine korrekten Antworten geben, wenn der Text zu verzerrt und komplex wird.

Wired veröffentlichte einen Artikel mit dem Titel "Ich habe diese Woche zweimal den CAPTCHA-Test nicht bestanden, bin ich noch ein Mensch?"

Audiobasiert

Audio-CAPTCHAs spielen einen kurzen Audioausschnitt ab, der eine Reihe von Zahlen oder Buchstaben enthält, die von einer menschlichen oder synthetischen Stimme gesprochen werden. Der Benutzer hört zu und gibt diese Zahlen oder Buchstaben in das bereitgestellte Textfeld ein.

Die Eingabe wird mit der korrekten Antwort verglichen, um festzustellen, ob der Benutzer ein Mensch ist.

Wie bei textbasierten CAPTCHAs können auch Audio-CAPTCHAs aufgrund von Hintergrundgeräuschen, schlechter Audioqualität, starker Verzerrung und unvertrauten Akzenten für Menschen schwer zu verstehen sein.

Bildbasiert

Bildbasierte CAPTCHAs wurden eingeführt, um die Herausforderung für Bots zu erhöhen.

Benutzer müssen bestimmte Objekte in Bildern identifizieren, zum Beispiel alle Bildkacheln auswählen, die Ampeln enthalten.

Diese Aufgabe nutzt die visuelle Wahrnehmung des Menschen, die immer noch besser ist als die meisten computerbasierten Bots.

Allerdings kann diese Art von CAPTCHA in vielen Fällen auch für Menschen verwirrend sein.

"CAPTCHAs lassen mich immer an diesen kleinen Ecken zweifeln"

Verhaltensbasiert

Verhaltensbasierte CAPTCHAs analysieren das Verhalten des Benutzers, wie Mausbewegungen und Tippverhalten.

Das beliebte verhaltensbasierte CAPTCHA reCAPTCHA erfordert, dass Benutzer ein Kästchen mit "Ich bin kein Roboter" ankreuzen.

Während dieses Prozesses analysiert reCAPTCHA die Mausbewegungen und -klicks, um zwischen Menschen und Bots zu unterscheiden. Menschliches Verhalten ist in der Regel variabler und weniger vorhersehbar, während das Verhalten von Bots typischerweise präzise und konsistent ist.

KI vs. Menschen

In dem scheinbar endlosen Kampf zwischen KI und Menschen sind CAPTCHAs ein weiteres Schlachtfeld.

Ursprünglich war die Idee bildbasierter CAPTCHAs dazu gedacht, KI bei der Texterkennung für die Digitalisierung von Büchern zu trainieren.

Diese von Luis von Ahn (Mitbegründer von Duolingo) erfundene Innovation präsentierte undeutlich gescannte Wörter als CAPTCHAs für Menschen. Durch die Identifizierung dieser Wörter haben wir die KI trainiert.

Heute ist KI fortschrittlicher geworden und kann moderne Technologien wie Deep Learning und Computer Vision nutzen, um CAPTCHA-Herausforderungen zu lösen.

Zum Beispiel haben sich Algorithmen zur optischen Zeichenerkennung verbessert, wodurch textbasierte CAPTCHAs weniger effektiv geworden sind. Fortschrittliche Sprache-zu-Text-Technologien können Audio-CAPTCHAs umgehen. Ebenso können KI-Modelle, die mit großen Bilddatensätzen trainiert wurden, viele bildbasierte CAPTCHA-Probleme mit hoher Genauigkeit lösen.

Paper-Link: https://arxiv.org/pdf/2307.12108

Auf der anderen Seite des Schlachtfelds haben CAPTCHA-Forscher komplexere CAPTCHA-Techniken entwickelt.

Zum Beispiel kann reCAPTCHA das Interaktionsverhalten des Benutzers bewerten und die Wahrscheinlichkeit berechnen, dass es sich um einen Menschen handelt.

Ironischerweise helfen Menschen der KI, komplexe CAPTCHA-Probleme zu lösen.

Zum Beispiel beschäftigen Click Farms eine große Anzahl von Niedriglohnarbeitern, um auf Anzeigen zu klicken, einschließlich Social-Media-Beiträgen, Konten zu folgen, gefälschte Bewertungen zu schreiben und sogar CAPTCHA-Probleme zu lösen.

Vietnamesische Social-Media-Click-Farm

Ihre Arbeit besteht darin, KI-Systemen zu helfen, sich wie Menschen zu verhalten und so CAPTCHAs und andere Betrugsschutztechnologien zu überwinden.

Die Zukunft von CAPTCHAs

Das ständige Wettrüsten zwischen Sicherheitsmaßnahmen und denjenigen, die versuchen, diese zu umgehen, fördert kontinuierliche Innovation.

Mit der Weiterentwicklung der KI werden sich auch die Methoden der Cybersicherheitsexperten und derjenigen, die versuchen, digitale Barrieren zu durchbrechen, weiterentwickeln.

Es ist absehbar, dass die Zukunft von CAPTCHAs durch die kontinuierlichen Fortschritte in der KI beeinflusst wird.

Da traditionelle CAPTCHA-Methoden an Wirksamkeit verlieren, werden sich zukünftige CAPTCHA-Systeme möglicherweise stärker auf die Analyse des Benutzerverhaltens konzentrieren, wie Menschen mit Websites interagieren, was für Bots schwieriger nachzuahmen ist.

Websites könnten sich der Verwendung biometrischer CAPTCHAs wie Gesichtserkennung oder Fingerabdruckscans zuwenden, was jedoch Datenschutzbedenken aufwerfen würde.