Meta 發布 Llama 4 首批 2 款模型,帶來文字與圖像統一處理能力
除了這次亮相的 Llama 4 Scout 和 Maverick 外,還有兩款模型預計下月公開。
Meta 日前發布了 Llama 4 系列開源模型的頭 2 款產品 Scout 和 Maverick,兩者均基於專家混合架構。其中「主力」Maverick 共有 4,000 億參數(17B 活躍參數)、128 個專家和 100 萬字元上下文窗口,擅長文本和圖像理解,適用於「一般主力和聊天場景」。而較小型的 Scout 則具備 1,090 億參數(17B 活躍參數)、16 個專家和 1,000 萬上下文,適合處理「多文檔摘要、解析用家活動、推理代碼庫」等任務。
根據 Meta 的介紹,Llama 4 Scout 可以在單顆 NVIDIA H100 GPU 上運行,非常適合科研人員和中小企業。而 Maverick 則在編程、推理、多語言、圖像基準等測試中擊敗了 GPT-4o 和 Gemini 2.0,並能在推理和編程上和 DeepSeek v3.1 媲美。目前這兩款新模型已經可以在 Llama 網站和 Hugging Face 下載,同時 Meta 也已經將其部署到了 WhatsApp、Instagram、Messenger 等自家產品當中。此外他們還預告,會在下月帶來 Llama 4 系列另兩款模型 Behemoth 和 Reasoning 的消息,其中 Behemoth 號稱是「世界上最智慧的大語言模型之一」。
緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!
🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk
🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/
🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8
🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D
🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk