OpenAI 預覽新世代的前沿模型「o3」,明年初正式推出

跳過 o2 是「出於對歐洲行動網路 O2 的尊重」。

OpenAI
OpenAI

在 OpenAI「12 天的發表」的最後,該公司以下一代前沿模型「o3」的預覽為壓軸,結束了直播系列。OpenAI CEO Sam Altman 在 直播中表示:「出於對 Telefónica(歐洲 O2 行動網路的擁有者)的尊重,以及秉持 OpenAI 真的非常、極度不擅長取名的優良傳統,它被命名為 o3。」

不意外地,o3 提供了比其前代更強的效能,但它究竟比 o1 好多少呢?依 OpenAI 的描述,在給它今年的美國數學邀請賽 (American Invitational Mathematics Examination) 的試卷時,o3 的準確率達到了 96.7%。相比之下,o1 則獲得了 83.3% 的評分。OpenAI 研究部門資深副總裁 Mark Chen 表示:「這表示 o3 通常只會錯一題。」事實上,o3 在 OpenAI 常用的測試套件中表現過於亮眼,以至於該公司不得不尋找更具挑戰性的測試來評估其表現。

不過,想玩到 o3 還要等一段不短的時間。OpenAI 預定先將 o3 提供給有意協助進行安全測試的研究人員,正式推出則大約會在明年初的某個時點,具體時間尚未公佈。

o3 mini cost and performance
o3 mini cost and performance

與此同時,OpenAI 還展示了 o3-mini。這個新模型使用 OpenAI 最近宣布的自適應思考時間 (Adaptive Thinking Time) API 來提供低、中、高三種不同的推理模式。這允許使用者調整軟體在給出答案之前「思考」問題的時間長度 —— 從上圖中可以看出,o3-mini 可以達到與 OpenAI 當前的 o1 推理模型相當的結果,但運算成本卻大幅降低。

o3-mini 預計在明年一月底左右推出,o3 則會「緊隨其後」。

緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!

🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D

🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk