截至6月底中國日均Token消耗量突破30萬億

2025年08月14日 15:14　來源：中國新聞網

大字體

小字體

分享到：

　　中新社北京8月14日電 (記者劉亮)在人工智能時代，Token(即“詞元”)作為處理文本的最小數(shù)據單元，如同互聯(lián)網時代的“流量”。中國國家數(shù)據局局長劉烈宏14日在北京舉行的新聞發(fā)布會上介紹，截至今年6月底，中國日均Token消耗量已突破30萬億。

8月14日，中國國務院新聞辦公室在北京舉行“高質量完成‘十四五’規(guī)劃”系列主題新聞發(fā)布會，國家發(fā)展改革委黨組成員、國家數(shù)據局局長劉烈宏，國家數(shù)據局副局長沈竹林，國家數(shù)據局副局長陳榮輝，國家數(shù)據局副局長夏冰介紹“十四五”時期數(shù)字中國建設發(fā)展成就，并答記者問。中新社記者楊可佳攝

　　國務院新聞辦公室當天舉行新聞發(fā)布會，介紹“十四五”時期數(shù)字中國建設發(fā)展成就。劉烈宏在會上表示，2024年初，中國日均Token的消耗量為1000億，截至今年6月底，日均Token消耗量已突破30萬億，1年半時間增長了300多倍，這反映了中國人工智能應用規(guī)模快速增長。

　　他指出，人工智能快速發(fā)展，與中國高度重視數(shù)據工作密不可分。中國是第一個把數(shù)據作為生產要素的國家，多措并舉促進數(shù)據資源的開發(fā)利用。中國強調“人工智能+”行動到哪里，高質量數(shù)據集的建設和推廣就要到哪里。

　　近年來，中國大力推動高質量數(shù)據供給，出臺高質量數(shù)據集建設相關文件，多部門聯(lián)合推動相關工作。同時，持續(xù)推進高質量數(shù)據集建設工作。截至今年6月底，中國已建設高質量數(shù)據集超過3.5萬個，總體量超400PB。據悉，1PB可存儲約5億張2MB大小的高清照片，400PB相當于中國國家圖書館數(shù)字資源總量的140倍左右。

　　人工智能模型的訓練也推動數(shù)據交易需求攀升。劉烈宏介紹，截至今年6月底，中國各地高質量數(shù)據集累計交易額近40億元人民幣，數(shù)據交易機構掛牌的高質量數(shù)據集總規(guī)模達246PB。以北京數(shù)交所為例，高質量數(shù)據集占交易總量的比例從去年的10%躍升到目前的近80%。

　　中文數(shù)據在國內大模型的訓練性能提升方面發(fā)揮著重要作用。劉烈宏說，中國多數(shù)模型訓練使用的中文數(shù)據占比已超過60%，有的模型已達80%。中文高質量數(shù)據的開發(fā)和供給能力持續(xù)增強，推動中國人工智能模型性能快速提升。(完)

【編輯:李駿】

更多精彩內容請進入財經頻道