您的位置:首頁 >科技 >

        國內多數AI模型訓練使用的中文數據占比已超60%

        2025-08-23 12:37:27    來源:新華網
        中文數據在國內AI大模型的訓練性能提升方面發揮著重要作用。國家數據局近日發布的數據顯示,目前國內多數AI模型訓練使用的中文數據占比已經超過60%,有的模型達到80%。中文高質量數據的開發和供給能力持續增強,推動我國人工智能模型性能快速提升。

        國家數據局局長劉烈宏表示,我國人工智能的快速發展,與我國高度重視數據工作是密不可分的。作為人工智能發展的核心要素之一,數據在推動“人工智能+”過程中發揮著關鍵作用,高質量數據集的建設至關重要。

        “在人工智能時代,Token,也就是大家通常所說的詞元,是處理文本的最小數據單元,如同互聯網時代大家所說的‘流量’。”劉烈宏介紹,2024年初,我國日均Token的消耗量為1000億,到今年6月底,日均Token消耗量已經突破30萬億,一年半時間增長了300多倍,反映了我國人工智能應用規模的快速增長。

        據介紹,截至今年6月底,我國已經建設高質量數據集超過3.5萬個,總體量超過了400PB(1PB可存儲約5億張2MB大小的高清照片),400PB的總量相當于中國國家圖書館數字資源總量的140倍左右。

        人工智能模型的訓練也推動了數據交易需求的攀升。截至今年6月底,各地高質量數據集累計交易額近40億元,數據交易機構掛牌的高質量數據集總規模達到了246PB。

        下一步,國家數據局將通過體系化布局持續推進高質量數據集建設,加快打造具身智能、低空經濟、生物制造等重點領域數據高地,推動全社會強化數據要素價值認同,加快推進數據要素價值共創,培育“為優質數據買單”的市場共識。

        關鍵詞:

        相關閱讀

        亚洲国产成人久久综合碰| 精品亚洲成在人线AV无码| 亚洲永久在线观看| 亚洲色图.com| 亚洲蜜芽在线精品一区| 4444亚洲国产成人精品| 亚洲欧洲日产国产综合网| 亚洲国产精品无码专区影院 | 久久久久亚洲AV无码专区网站| 亚洲精品色播一区二区| 亚洲欧洲免费无码| 亚洲色成人四虎在线观看| 亚洲国产成人精品无码区花野真一| 色噜噜亚洲男人的天堂| 亚洲天堂免费在线| 亚洲最大天堂无码精品区| 亚洲中文字幕无码爆乳| 亚洲日韩一区精品射精| 亚洲精品理论电影在线观看| 亚洲专区一路线二| 亚洲日韩国产精品乱-久| 亚洲色最新高清av网站| 亚洲精品第一国产综合亚AV| 亚洲av日韩av永久无码电影| 国产成人亚洲毛片| 国产亚洲精品国看不卡| 国产成A人亚洲精V品无码性色| 亚洲s色大片在线观看| 亚洲欧洲国产精品你懂的| 91亚洲自偷手机在线观看| 亚洲国产精品线观看不卡 | 亚洲国产一区二区三区| 在线观看亚洲精品福利片| 精品久久久久久亚洲| 亚洲人成电影在在线观看网色| 亚洲精品午夜在线观看| 最新国产精品亚洲| 亚洲AⅤ无码一区二区三区在线| 亚洲一级特黄大片在线观看 | 四虎必出精品亚洲高清| 国产精品久久久久久亚洲影视 |