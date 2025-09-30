Anthropic 發佈 Claude Sonnet 4 .5：寫程式、代理、安全性全面提升

今天凌晨 Anthropic 正式發佈了 Claude Sonnet 4.5，它被定義為目前全球最強的程式編寫模型。在多想基準測試中，它不僅超越了自己的前身 Sonnet 4 和成本更高的 Opus 4.1，而且還將 Google 的 Gemini 2.5 及 OpenAI 的 GPT-5 斬於馬下。在模擬真實世界場景的 OSWorld 開放任務測試中，Sonnet 4.5 創下了 61.4% 的得分新紀錄，相比 Opus 4.1 要高出足足 17 個百分點。

根據 Anthropic 的介紹，Claude Sonnet 4.5 可以連續 30 小時自主編寫超過 10,000 行程式碼，耐力遠超 Opus 4。另外它還具備更強的上下文感知（在對話時追蹤 Token 使用情況）和並行工具調用能力，而且有全新的記憶工具（還處於 beta 狀態）能讓模型在上下文視窗之外儲存和檢索資訊。與此同時，Sonnet 4.5 也經過了大量安全訓練，能顯著減少「奉承、欺騙、權力追求、鼓勵妄想」等問題，並嘉慶了針對提示注入攻擊的防禦。

除此之外，Claude Code 也新增了備受期待的「檢查點」功能，可隨時保存進度並一鍵恢復早先狀態。檔案創建功能現已開放給所有 Pro 使用者，此前在等待名單中的 Max 用家也能使用 Chrome 裡的 Claude 外掛了。Claude Sonnet 4.5 的 API 定價是每 100 萬輸入 token 3 美元，每 100 萬輸出 token 15 美元，價格和 Sonnet 4 保持一致。

