傳DeepSeek繞開英偉達框架 準備適配國產GPU

【on.cc東網專訊】內地初創公司DeepSeek近日推出以低成本開發的人工智能(AI)模型,引發關注。內媒周一(3日)引述消息報道,DeepSeek在研發大模型時繞過了美國晶片巨頭英偉達的「護城河」、軟硬件整合技術統一計算架構(CUDA),準備適配國產GPU,令美企感到很大威脅。

CUDA是一種通用編程框架,允許開發者利用英偉達的GPU計算。北京航空航天大學副教授黃雷受訪指出,如DeepSeek真的繞過了CUDA,可直接根據GPU的驅動函數做一些新開發,從而實現更細粒度的操作。分析指,CUDA會導致訓練模型時損失一些靈活性,DeepSeek的做法相當於繞過硬件對訓練速度的限制,意味其他模型需訓練10天,DeepSeek只需5天。

消息人士透露,DeepSeek擁有一些擅長寫PTX語言的內部開發者,假如之後使用國產GPU,其在硬件適配方面將更得心應手,只要了解這些硬件驅動提供的一些基本函數接口,就可以仿照英偉達GPU硬件的編程接口去寫相關代碼,從而讓自家大模型更容易適配國產硬件。

【更多即時新聞詳情請上東網新聞