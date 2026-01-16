韓國 AI 自主夢驚爆抄襲風波，五強入圍三家被揭用中國開源碼

韓國政府去年 6 月大搞「國產 AI 模型大賽」，目標 3 年內打造「純韓技術」大型 AI 模型，力求追到 OpenAI、Google 水準九成五表現。點知計劃中途就爆出一場抄襲風波，五間決賽公司中，竟有三間被指使用中國及美國開源程式碼，瞬間引發「主權 AI」公信力危機。

該場比賽由科學部主辦，勝出者可獲政府數據、人才及 AI 晶片資源，旨在降低對中美科技依賴。不過，理想豐滿現實卻骨感，面對當今全球 AI 兩極化生態，南韓「從零開始」的願景無疑要面對嚴峻考驗。

Upstage 被指中國模型「著韓服」，LayerNorm 96.8% 相似惹議

風波核心就係初創公司 Upstage，競爭對手 Sionic AI CEO 高錫賢於 LinkedIn 公開發文，指 Upstage 參加國家項目的基礎模型 Solar Open 100B 與中國智譜 AI 的 GLM 4.5 Air 模型有 96.8% 相似度，仲有版權標記殘留。高暗示對方只係「微調中國模型再包裝」，用納稅人錢交「偽國產作業」。

Upstage 即開直播驗證會，展示訓練日誌證明核心模型從空白開始訓練，只在推理框架採用全球常見的智譜開源組件。CEO 金聖勳解釋，LayerNorm 數值之所以會高度相似，係因為大型語言模型如果使用相近 Transformer 或 MoE 架構，再以類似數據訓練，最終統計特徵便有很大可能會收斂到近似結果。公開驗證之後一日，高錫賢便公開道歉，承認未充分驗證即炮轟做法欠妥。

Naver、SK Telecom 同中企程式「撞樣」，行業慣例定技術依賴？

Upstage 被點名之後，其他決賽隊伍都被放大鏡檢視。Naver 旗下視覺同音訊編碼器被指同阿里巴巴「通義千問」設計相似，SK Telecom 所用推理程式碼也疑似「撞樣」DeepSeek。兩間公司都承認有用到開源模組，但強調核心訓練引擎全自主開發，外部組件只作標準化處理，屬行業常見做法。首爾大學 AI 研究院院長李在儒亦公開表示，被質疑的幾個模型「的確從零開始訓練」，並無直接復制外國模型權重。

「主權 AI」真正界線喺邊？學界意見分歧

究竟自主 AI 係咪一定要完全自寫每行代碼？學術界意見兩極。哈佛大學教授韋巨賢表示：「要求每行程式碼都自己寫根本唔現實，放棄開源軟體，等於將成堆好處丟咗落海。」​

但反對派就擔心，就算只用外圍代碼，都可能引入後門或者供應鏈依賴風險，「主權 AI」戰略意義會被削弱。而家最尷尬係競賽規則根本冇講清楚外國開源碼是否可用，科學部至今未出新指引。部長裴慶勳僅表示自己樂見技術辯論，稱「見到韓國 AI 的光明未來」。

有評論形容，Upstage 事件係南韓 AI 生態系統第一次「壓力測試」：一方面暴露競賽規則對開源使用嘅灰色地帶，另一方面亦倒逼政府、初創同學界明確獨立模型的真正定義。

