OpenAI 的 Operator 網頁 AI 代理開始測試,但要 ChatGPT Pro 訂閱才能試用

OpenAI 也同時開始與 Instacart 等平台合作。

OpenAI Operator
OpenAI Operator

OpenAI 已經開始預覽自家的 AI 代理工具「Operator」,可以自動操作網路瀏覽器。在稍早發表的一篇部落格文章中,OpenAI 稱背後的技術為「電腦使用代理(Computer-Using Agent)」。依 OpenAI 的描述,該模型「經過訓練後,可以像人類一樣與圖形使用者介面(Graphical User Interface,GUI)互動,也就是人們在螢幕上看到的按鈕、選單和文字欄位等元件。這使其能夠靈活地與網站互動,而無需透過作業系統或網站的特定 API。」

目前發表的 Operator 是以 OpenAI 的 GPT-4o 模型為基礎構建。它結合了該模型的視覺分析功能,以及透過強化學習訓練的「進階推理」能力。Operator 能夠「將任務分解為多個步驟的計畫,並在出現挑戰時自我修正」。根據 OpenAI 的說法,這種能力代表了 AI 開發的下一個階段。

與過去的研究預覽一樣,OpenAI 警告說 Operator「仍處於早期階段,功能有其局限性」,並且「尚未能在所有情況下可靠地執行」。取決於所涉及的任務與介面的複雜性,使用者如果能多花一些時間撰寫更詳細的提示的話,Operator 會比較清楚自己該做什麼。根據 The Verge 的報導,如果 Operator 在執行工作時遇到困難,它會將控制權交還給使用者;如果碰到網站要求提供敏感資訊(包括登入資訊)時,它也會交出控制權。OpenAI 還表示,Operator 會「拒絕有害的請求並禁止不被允許的內容」。

Instacart
Instacart

Operator 初期將先向訂閱費用每月 200 美元的 ChatGPT Pro 用戶提供。此外,他們還與 Instacart 等公司合作,在其平台上提供該代理 AI,但同樣地你也需要 ChatGPT Pro 訂閱才能測試。

Operator 是近期發佈的眾多 AI 代理程式的一員,每間公司的代理程式適用的範圍也都不盡相同,有像 Operator 這樣僅限導航網路瀏覽器的 AI,也有能控制整個作業系統的 AI。Anthropic 在 10 月發表的 Claude 3.5 Sonnet 模型就有提供這樣的功能,而最近 Google 也透過其 Gemini 2.0 模型和 Project Mariner 緊隨其後。

相關文章:

緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!

🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D

🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk