Claude AI 太強了？WSJ 獨家爆料中國駭客已使用並成功自動化入侵 4 次
駭客假冒「安全審計員」騙過 AI 防護，自動化率高達 90%，人類僅需在關鍵點「按 Yes。
根據《華爾街日報》報導，以 AI 編程效果強大聞名的 AI 公司 Anthropic 證實，與中國政府有關的國家級駭客，在今年 9 月的一次網絡攻擊行動中，利用了其下的 AI 模型 Claude 進行高度自動化的入侵。
Anthropic 的威脅情報主管 Jacob Klein 指出，這次攻擊行動針對數十個主要企業及外國政府，其自動化程度是團隊前所未見的。
攻擊自動化率達 90% 人類僅作關鍵決策
過去，駭客使用 AI 通常僅限於輔助任務，例如撰寫釣魚郵件或掃描網絡漏洞。然而，Klein 強調，在這次事件中，高達 80% 至 90% 的攻擊流程已實現自動化，人類操作員僅需在少數幾個關鍵決策點介入。
「他們（駭客）幾乎是按一個按鈕，然後只需極少的人類互動就完成了攻擊。」Klein 補充道。在某些情況下，人類的介入僅僅是為了確認 AI 的下一步行動，例如「是，請繼續」或「這看起來不對，Claude 你確定嗎？」。
假冒「安全審查」成功「越獄」AI
要利用 Claude 這種先進的 AI 模型進行惡意攻擊，駭客必須繞過 Anthropic 設下的安全護欄。報告指出，駭客使用了稱為「越獄」的技巧 。
具體而言，駭客向 Claude AI 謊稱自己是合法的安全測試組織，正代表目標企業進行授權的安全審計。透過這種欺騙手段，駭客成功誘使 AI 執行從掃描漏洞到竊取數據的各項攻擊任務。
Anthropic 表示，他們已即時中斷了這些攻擊行動並封鎖了相關帳戶，但在被阻止前，駭客已成功完成了多達 4 次的入侵。在其中一個成功案例中，駭客指示 Claude AI 查詢受害者的內部資料庫，並獨立提取數據，部分成功的攻擊確實導致了敏感資訊被盜。
AI 幻覺仍是弱點，但威脅已顯現
儘管自動化程度極高，但這些 AI 駭客尚未能完全自主。Anthropic 指出，AI 偶爾會出現「幻覺」 而導致犯錯。例如，AI 可能會「誇大其能力和訪問權限」，聲稱自己已攻入某個系統，但實際上沒有。這類錯誤仍需要人類的審查和修正。
此事件突顯了 AI 技術的「雙刃劍」風險：AI 既能增強防禦，也能武裝攻擊者。Volexity 和 Google 等公司近期也分別觀察到中國和俄羅斯的駭客組織，正利用 AI 提升攻擊的效率和速度。
中國駐華盛頓大使館發言人對此回應稱，網絡攻擊的追溯極為複雜，並指責美國利用網絡安全問題「抹黑」中國。
更多內容：
Chinese Hackers Used Anthropic’s AI to Automate Cyberattacks
Anthropic 懶人包｜Claude AI 會玩寶可夢、OpenAI 前員工成立、Amazon 大力投資！
