2025年9月,由中國信息通信研究院牽頭研制的《大規(guī)模預訓練模型技術和應用評估方法》5項行業(yè)標準獲批發(fā)布。
該系列標準覆蓋大模型的開發(fā)、管理、運營等多個階段,主要包括模型開發(fā)、能力評估、應用成效、運營管理和可信要求5部分,為大模型技術和產(chǎn)品的研發(fā)測試及應用推廣提供了重要參考。該系列標準的發(fā)布與實施,將進一步健全大模型標準體系,加速大模型技術創(chuàng)新與應用落地,為“人工智能﹢”行動的深入推進提供堅實支撐。
《大規(guī)模預訓練模型技術和應用評估方法 第1部分:模型開發(fā)》規(guī)定了大模型在開發(fā)過程中的能力要求,旨在評估數(shù)據(jù)管理、模型訓練、模型管理和模型部署四大維度的規(guī)范性與成熟度,涵蓋數(shù)據(jù)獲取與處理、訓練方式與框架、版本回溯、模型微調(diào)與轉換等關鍵能力。
《大規(guī)模預訓練模型技術和應用評估方法 第2部分:模型能力》規(guī)定了大模型的技術和服務能力要求,旨《大規(guī)模預訓練模型技術和應用評估方法 第5部分:模型運營》規(guī)定了大模型工程化落地和運營階段的能力要求,旨在評估數(shù)據(jù)工程、模型調(diào)優(yōu)、模型交付、服務運營以及平臺資源管理調(diào)度等方面的能力。
據(jù)介紹,近年來,中國信息通信研究院積極踐行標準引領人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展的目標,深入開展大模型關鍵技術及產(chǎn)業(yè)應用研究工作,旨在通過建立一套科學、系統(tǒng)、全面的大模型評估體系,有效引導大模型產(chǎn)業(yè)的健康有序發(fā)展,推動技術與應用的深度融合。

關注“廣東技術性貿(mào)易措施”,獲取更多服務。