研究駁斥AI威脅論：大模型能力不足以危及人類

01 新興智能：僅僅是「即興發揮」嗎？

為了解開大型語言模型(LLM)新興能力的謎團，研究人員分析了非指令微調模型(如GPT)和指令微調模型(如Flan-T5-large)在22個任務(17個已知新興任務和7個基準任務)下的不同表現。

他們使用了精確匹配準確率、BERTScore準確率和字符串編輯距離作為評估指標。為了提高實驗準確性，他們通過調整提示和輸出格式來控制偏差。

實驗主要集中在分析GPT在零樣本和少樣本設置下的表現。

令人驚訝的是，儘管GPT之前被認為具有新興能力，但在零樣本設置下，這些能力非常有限。

具體來說，只有兩個任務在不依賴上下文學習(ICL)的情況下展現出新興能力。這些任務主要依賴於正式語言技能或信息檢索，而非複雜推理。這表明GPT的新興能力在沒有上下文學習的情況下受到極大限制。

研究人員隨後轉向指令微調模型，假設指令微調不僅僅是簡單的任務適應，而是通過隱式上下文學習激活模型潛力。

比較GPT-J(非指令微調)和Flan-T5-large(指令微調)，他們發現儘管參數、架構和預訓練數據存在顯著差異，但在某些任務上表現出驚人的一致性。

這種現象表明，指令微調模型可能並非展示全新的推理能力，而是通過隱式上下文學習巧妙利用現有的上下文學習能力。

進一步的實驗表明，即使增加模型規模或訓練數據，指令微調模型在零樣本設置下仍然表現出與非指令微調模型相似的任務解決能力。這再次強調了指令微調與隱式上下文學習之間的密切聯繫。

儘管LLM展示了非凡的任務表現，但研究結果表明這些能力並不對人類生存構成實質性威脅。

首先，LLM的新興能力主要來自上下文學習和指令微調，這些可以在模型設計和訓練中預測和控制。它們尚未顯示出完全自主發展或獨立意圖/動機的趨勢。

例如，在社交智商測試中，模型能夠正確回答涉及情感和社交情況的問題，如「Carson醒來時對上學感到興奮。他為什麼會這樣做？」

在這裡，模型利用上下文學習和指令微調超越了隨機基線，選擇合理的答案。這表明模型並非自發產生「智能」，而是在特定輸入和設計條件下展示高級模式識別。

其次，雖然這些能力隨著LLM規模增加而變得更加明顯，但它們並未脫離設計者的控制。通過模型微調，可以引導LLM更好地理解和執行複雜任務。這種增強的能力並不意味著模型會發展出自主意識或對人類構成威脅。

在實驗中，LLM在特定任務上大大超越了隨機基線，尤其是那些需要推理和判斷的任務。然而，這種表現仍然依賴於大型訓練數據集和精心設計的輸入提示，而非模型自發的智能覺醒。

這進一步證實LLM的新興能力正在可控範圍內發展。雖然這一假設仍需進一步實驗驗證，但它為理解大型模型中的新興能力提供了新的視角。

研究表明，雖然AI未來可能進一步發展功能性語言能力，但其潛在危險仍然可控。現有證據不支持對AI存在風險的擔憂。相反，AI技術發展正逐步朝著更安全、更可控的方向發展。

雖然為LLM新興能力提供了重要見解，但研究人員也指出了研究的局限性。

目前的實驗主要集中在特定任務和場景上，而LLM在更複雜和多樣化環境中的表現需要進一步研究。

研究人員表示，模型訓練數據和規模仍然是影響新興能力的關鍵因素。未來研究需要進一步探索優化這些因素，以提高模型的安全性和可控性。

他們計劃進一步研究LLM在更廣泛的語言和任務環境中的表現，特別是如何通過改進上下文學習和指令微調技術來增強模型能力，同時確保安全性。

此外，他們將探索如何在不增加模型規模的情況下，通過優化訓練方法和數據選擇來最大化新興能力。