香港文匯報訊(記者高鈺)香港理工大學人工智能高等研究院(PAAI)團隊近日在生成式人工智能(GenAI)領域取得多項關鍵技術突破,包括提出「協作式生成人工智能」創新模式,將AI訓練從傳統集中式轉向分散式,大幅降低訓練成本、保障數據隱私,更打破資源壁壘,讓全球更多研究機構得以參與AI研發,為全球AI創新注入強勁動力。
當前GenAI領域面臨三大難點:基礎模型訓練需耗費巨量計算資源,僅少數機構可以負擔,導致學術界難以直接參與基礎模型的訓練、領域專屬知識與數據無法融入模型;隱私保護與版權歸屬問題使醫療、金融等敏感數據難以用於訓練;基礎模型難以及時吸收新知識,每次重新訓練需「天文數字級」資源,嚴重阻礙技術迭代。
針對這些痛點,PAAI團隊決定從低成本訓練與分散式融合兩大方向展開攻關。理大是首個開源發布「端到端FP8低比特訓練全套方案」的大學團隊,該技術打破全球基礎模型以BF16精度訓練的主流格局,是全球少數掌握該核心技術的研究團隊之一。
與BF16相比,FP8核心優勢是訓練速度提高逾兩成、顯存峰值佔用減少逾一成、成本大幅下降;整合「持續預訓練」、「監督式微調」和「強化學習」下,訓練效果媲美BF16模型且訓練時間和顯存佔用進一步壓縮。團隊已啟動更低成本的FP4精度訓練探索,成果已發表於學術論文。
此外,傳統基礎模型是參數越多、知識越廣、性能越強,但集中式訓練需耗費百萬計GPU小時,但理大的InfiFusion模型融合技術僅需數百GPU小時。團隊以160個GPU小時完成了4個尖端模型融合,且融合後模型在多項測試中性能顯著優於原始模型。理大PAAI執行院長楊紅霞指出,以超低資源實現基礎模型訓練,加上高效模型融合,可助全球學術人員投入GenAI研究,匯聚更多力量創新。
在技術落地方面,團隊訓練出性能領先的醫療基礎大模型,並研發專屬「癌症GenAI」,可快速積累高質量醫療數據、直接對接醫療設備,用於癌症個性化治療規劃,目前正聯合復旦大學附屬華山醫院、香港伊利沙伯醫院等推動合作與臨床落地。在智能體AI領域方面,該技術可作為研究生學術助手,協助論文撰寫與審閱,同時作為多模態專利檢索引擎。