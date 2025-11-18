四大飲食平台網購優惠碼大放送！
xAI 悄然發佈 Grok 4.1：情商更高、寫作更強、幻覺大幅減少
給即將到來的 Gemini 3.0 施加一些壓力。
Elon Musk 的 xAI 今天早些時候悄然上線了全新 Grok 模型，分為標準的 Grok 4.1 和支援推理的 Grok 4.1 Thinking，兩者均向用家免費開放。其中 Thinking 版本以 1483 Elo 分雄踞 LMArena 排行榜首，非推理模式的 Grok 4.1 也直接殺到了榜單第二的位置。第三名的 Google Gemini 2.5 Pro 落後 Grok 4.1 Thinking 足足 31 分，這給即將到來的 Gemini 3.0 施加了不小的壓力。
新版模型還擁有更強的創意寫作能力，在 Creative Writing v3 跑分中，Grok 4.1 Thinking 和 Grok 4.1 僅次於 GPT 5.1，擊敗了 OpenAI o3、Claude Sonnet 4.5、Kimi K2 Instruct 等對手。相比之前的 Grok 4 Fast，Grok 4.1 的資訊錯誤率下降了約 7 成，出現幻覺的可能性也從 12.09% 減少到了 4.22%。
不過 Grok 4.1 最大的升級點，還是在於它具備更強的情商、共情力與人際互動能力。其成績領跑 EQ-Bench，在和用家溝通的過程中可以察覺語氣、情緒的變化並做出更符合人類情感邏輯的反應。而且它在長會話中能維持態度一致，並保證協作連貫性和目標意識。值得一提的是，Grok 4.1 在沿用 Grok 4 大規模強化學習框架的基礎上，還增加了「以高階推理模型充當獎勵模型」的自評迭代方法。也就是說它會用更高層次的模型訓練自己，這將逐漸減少訓練對人工的依賴。
