ChatGPT 現在可以直接生成影像,不用再去 Dall-E 了

利用 GPT-4o 模型,AI 也能更理解你想要生成的是什麼。

GPT-4o image generation
GPT-4o image generation

OpenAI 剛宣布,所有使用者很快就能直接在 ChatGPT 內生成圖片。這項功能將逐步推送給 ChatGPT Plus、Pro、Team 等訂閱層級的用戶,但最重要的是免費使用者也將能使用。這將成為 GPT-4o 模型中的預設圖片生成工具,因此每當你想快速生成一張圖片時,就無需再開啟 Dall-E。這項功能也會來到 Sora 上。

OpenAI 表示,該平台將「根據你的提示文、對話內容和上傳的檔案,來生成高品質圖片。」針對上傳的圖檔,它鐐將能夠根據提示進行修改。OpenAI 同時也宣稱在文字呈現(AI 圖片長期以來的罩門之一)和情境理解等方面有顯著改進。

這些新工具目標是同時滿足個人和專業用途。OpenAI 舉了數個例子,說明這類圖片生成能力能在哪些情境派上用場。這些包括創作資訊圖表、社群媒體的宣傳圖文,以及如下圖所示、包含大量文字的解說圖片。

GPT-4o example
GPT-4o example

這個圖片生成能力是以 GPT-4o 為基礎建構的。去年發表時,OpenAI 曾解釋說名稱中的「o」代表「omni」(全方位),指的是該模型的多模態能力,因此它其實具有影像生成的能力,似乎也不那麼讓人驚訝。作為一個現代的生成工具,它也能生成擬真的圖片。該公司表示,它提供「強大的照片擬真能力,包含光線、陰影和紋理的準確性」,同時因為它也是個強力的大型語言模型,因此在理解用戶想生成的圖片究竟為何上,也有特別的優勢。舉例來說,它將能理解「生成能在中央公園找到的鳥類的海報」或「視覺化呈現先前對話中討論過的藝術時代」這種需要一點理解力的內容。

相關新聞:

緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!

🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D

🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk