驗證碼:AI與人類的新戰場

驗證碼面臨AI挑戰,智能化升級勢在必行。

驗證碼的工作原理

長期以來,網站和移動應用程序一直受到機器人的大規模攻擊。

這些惡意機器人通過編程自動消耗大量計算資源、發布垃圾信息、收集網站數據,甚至註冊和執行用戶驗證。

2022年,所有互聯網流量的近一半(47.4%)來自機器人,比上一年增加5.1%。人類流量的比例(52.6%)降至八年來的最低水平

在這種情況下,CAPTCHA(全稱為「區分計算機和人類的全自動公共圖靈測試」)應運而生,也就是我們現在所熟知的驗證碼。

作為一名計算機科學家,Tam Nguyen認為驗證碼是網站防止自動攻擊、加強網絡安全和改善用戶體驗的有效屏障,至少在短期內是這樣。

驗證碼被設計為一些對人類來說很容易,但對計算機機器人來說卻很難回答的問題或挑戰。

它可分為四種類型:基於文本、基於圖像、基於音頻和基於行為。

基於文本

自互聯網誕生之初,基於文本的驗證碼就非常流行。

這種驗證碼類型要求用戶閱讀扭曲而複雜的文本圖像,並將答案輸入文本字段。

基於文本的驗證碼的一種變體是要求用戶解決簡單的數學問題,如「18+5」或「23-7」。

不過,由於深度學習人工智能的普及,最近先進的光學字符識別算法已經解決了這個問題。

具有諷刺意味的是,當文字被調整得更加失真、更加複雜時,真正的人類卻無法提供正確的答案。

《連線》曾發表文章,「我本週兩次驗證碼測試都失敗了,我還是人嗎?」

基於音頻

音頻驗證碼會播放一段簡短的音頻片段,其中包含由人工或合成聲音說出的一系列數字或字母,用戶聽完後會在提供的文本字段中輸入這些數字或字母。

輸入內容會與正確答案進行驗證,以確定用戶是否為人類。

與基於文本的驗證碼一樣,音頻驗證碼也會因背景噪音、音頻質量差、失真嚴重和口音不熟悉等因素而難以被人類解讀。

基於圖像

引入基於圖像的驗證碼是為了增加對機器人的挑戰性。

用戶必須從圖像中識別特定對象,例如,選擇包含交通信號燈的所有圖像塊。

這項任務利用了人類的視覺感知,而人類的視覺感知仍然優於大多數基於計算機視覺的機器人。

然而,這種類型的驗證碼在很多情況下也會讓人感到困惑。

「驗證碼總是讓我對那些小邊緣陷入糾結」

基於行為

基於行為的驗證碼會分析用戶的行為,如滑鼠移動和打字模式等。

流行的基於行為的驗證碼reCAPTCHA 要求用戶勾選「I'm not a robot」框。

在此過程中,reCAPTCHA會分析滑鼠的移動和點擊,以區分人類和機器人。人類的行為通常變化較多,可預測性較低,而機器人的行為通常精確一致。

AI vs. 人類

在人工智能與人類之間似乎無休止的爭鬥中,驗證碼是又一個戰場。

最初,基於圖像的驗證碼的想法是為了幫助訓練AI執行書籍數字化任務時能更好地執行文本識別。

這個由Luis von Ahn(多鄰國聯合創始人)發明的創舉,將掃描不清的單詞作為驗證碼展示給人類,通過識別這些單詞,我們教會了人工智能。

如今,人工智能已經變得越來越先進,可以利用深度學習和計算機視覺等現代技術來解決驗證碼難題。

例如,光學字符識別算法不斷改進,使得基於文本的驗證碼變得不那麼有效。先進的語音轉文字技術可以繞過音頻驗證碼。同樣,經過大量圖像數據集訓練的人工智能模型也能以較高的準確率解決許多基於圖像的驗證碼問題。

論文地址:https://arxiv.org/pdf/2307.12108

在戰場的另一端,驗證碼研究人員創造了更複雜的驗證碼技術。

例如,reCAPTCHA可以評估用戶的交互行為,並計算出他們是人類的可能性。

具有諷刺意味的是,人類正在幫助人工智能解決複雜的驗證碼問題。

例如,點擊農場(click farms)僱用大量低薪工人點擊廣告,包括社交媒體帖子、關注賬戶、撰寫虛假評論,甚至解決驗證碼問題。

越南社交媒體點擊農場

他們的工作就是幫助人工智能系統表現得像人類一樣,從而擊敗驗證碼和其他防欺詐技術。

驗證碼的未來

安全措施與尋求規避安全措施之間的永久軍備競賽促進了不斷的創新。

隨著人工智能的不斷發展,網絡安全專家和那些尋求突破數字障礙的人所採用的方法也會不斷發展。

可以預見,驗證碼的未來將受到人工智能不斷進步的影響。

傳統的驗證碼方法正在失去效力,因此未來的驗證碼系統可能會更加注重分析用戶行為,例如人們如何與網站互動,從而使機器人更難模仿這種行為。

網站可能會轉向使用生物識別驗證碼,如面部識別或指紋掃描,但這些都會引發隱私問題。