字節跳動偷用 OpenAI 訓練自家 AI,最終帳號被凍結
文章來源:Qooah.com
據外國媒體稱,字節跳動在生成式 AI 競爭中落於下風,最近該公司打算「走捷徑」,並了違反了 OpenAI 的服務條款,一直在偷偷採用 OpenAI 的技術研發自己的大語言模型。現在,OpenAI 已凍結了字節跳動的賬戶。
外國媒體表示,字節跳動的這一做法在 AI 領域中普遍認為是一種「失禮」行為,同時也是對 OpenAI 的服務條款的直接侵犯,這家公司所產出的模型不能被用來「開發任何與我們的產品和服務競爭的 AI 模型」。字節跳動的 OpenAI 使用權限是通過微軟所購買,但微軟也制定了跟 OpenAI 一樣的政策。
外國媒體所得到的字節跳動內部文件可以證明,在字節跳動的代號為「種子計劃」(Project Seed)中,該公司幾乎每個開發階段都應用 OpenAI 的應用程式接口(API),用來開發包括訓練和評估模型的基礎大語言模型。並且參與該計劃的員工對這種做法所帶來的不良影響都心知肚明。據字節跳動員工在內部通訊平台飛書海外版 Lark 的聊天記錄,他們曾就採用數據脫敏」來粉飾證據一事進行探討。外媒表示,字節跳動員工在很大程度使用 OpenAI 的技術,這使得「種子計劃」的員工常常達到了 OpenAI API 的最大使用上限。
據公司的內部文件可以看出,在「種子計劃」的早期階段時,字節跳動在這時採用 OpenAI 的技術會更多些。該公司在數月前就要求團隊在「模型開發的任何階段」停止對 GPT 生成的文本的使用。同期,該公司的 AI 大模型「豆包」獲得了批准發佈,「種子計劃」借此可以上線。但是,字節跳動仍然將使用包括評估豆包背後模型的性能的 API,繼續違反 OpenAI 和微軟服務條款。有位對字節跳動內部情況很瞭解的人士表示,「他們說他們想確保一切都是合法的,但他們實際上只是不想被抓住把柄」。
字節跳動發言人 Jodi Seth 出來回應說,在「種子計劃」的早期開發時,GPT 產生的數據是主要用於註解模型,並於今年中期時,已經從字節跳動的訓練數據中移除。在聲明中 Seth 表示「字節跳動獲得了微軟的許可能夠使用 GPT API。我們使用 GPT 驅動非中國市場的產品和功能,但使用我們自主開發的模型驅動的豆包。豆包只在中國提供。」
OpenAI 發言人 Niko Felix 為此發佈了一份聲明,證實已將暫停字節跳動的賬戶,並稱「所有 API 客戶必須遵守我們的使用政策,以確保我們的技術被用於好的一面。雖然字節跳動很少使用我們的 API,但我們在進一步調查期間已暫停了他們的帳戶。如果我們發現他們的使用不符合公司政策,我們將要求他們做出必要的改變或終止他們的賬戶。」
微軟發言人 Frank Shaw 也發佈了一份聲明稱「Azure OpenAI 服務等微軟 AI 解決方案屬於我們有限訪問框架的一部分,這意味著所有客戶都必須申請並獲得微軟的批准才能訪問。我們還制定了標準並提供資源,幫助我們的客戶負責任地使用這些技術,並遵守我們的服務條款。我們還制定了發現濫用行為的流程,並在企業違反我們的行為準則時停止他們的訪問。」我們對此事將會繼續跟蹤報道。
為您推薦更多相關文章:
更多推薦文章在:Qooah.com
Like/讚好以獲得全面資訊:Qooah Facebook