提出AI新法轉化語言 港學者獲最佳論文獎

首次有香港學者獲國際性的最佳論文獎。左:程鴻、右:孫相國。
首次有香港學者獲國際性的最佳論文獎。左:程鴻、右:孫相國。

香港中文大學系統工程與工程管理學系副系主任程鴻教授及其研究團隊於2023年知識發現和數據挖掘特別小組(SIGKDD)國際會議上榮獲計算機協會頒發的最佳論文獎(研究型)。獲獎論文涉及人工智能(AI),是從全球超過1,400份投稿中脫穎而出,是SIGKDD史上首次有香港學者獲此殊榮,有關論文有助推進訓練人工智能方法的發展,在海量的數據中理解文字指令並生成人類語言。

目前,市場上開發的多功能AI主要局限於語言模型,即透過預先學習海量的語言數據,訓練出能理解文字指令並生成類似人類語言的回應。如要進一步訓練出可學習圖表或關係網絡等非線性數據,並同樣作出非線性形式回應的新一代AI模型,仍然要面對不少挑戰。論文提出了一種嶄新的AI訓練方法,令AI有效學習海量且非線性數據,包括複雜的地理網絡圖、病毒學中的抗體和抗原的關係圖、社交網絡上交流數據等。與目前的訓練方法相比,新的訓練方法有效將AI模型的準確率提升1%至8%。

論文第一作者孫相國對獲獎深感榮幸,他表示,嶄新的預先訓練方法有望促進通用大型AI的發展,使它能一站式地理解圖表、處理圖表指令,並輸出圖表形式的結果,有望為公共交通政策提供複雜的地理和交通分析、幫助研究人員更好地利用生物訊息數據庫加速疫苗和藥物開發,以及提升社交網絡大數據分析的性能。

奠定建立圖表AI模型基礎

SIGKDD的評委小組肯定獲獎論文的貢獻,並表示,業界目前有迫切的需要開發更高效的方法以預先訓練AI處理圖表的數據。此論文通過統一指令格式去處理圖表、關係網絡和語言數據,設計了有效的指令標記、標記結構和輸入模式來解決上述的重大問題。實驗評估證明論文提出的方案改進了現存的的演算方法。這項工作為未來建立通用型圖表AI模型奠定了基礎,並可能對神經科學等應用產生深遠的影響。