2024年,全國數據生產(chǎn)總量41.06澤字節(ZB),相當于拍攝1300多萬(wàn)部《哪吒2》這樣的高復雜度3D動(dòng)畫(huà)電影——近日,《全國數據資源調查報告(2024年)》(以下簡(jiǎn)稱(chēng)《報告》)對外發(fā)布,亮出全國數據資源“家底”。
此次調查展現了當前中國數據資源怎樣的發(fā)展現狀?數據生產(chǎn)主要集中在哪些地區和行業(yè)?數據資源開(kāi)發(fā)利用前景如何?
數據生產(chǎn)總量首次突破40ZB
對全國數據資源進(jìn)行“大摸底”,這是第二次。
據介紹,2024年,國家數據局聯(lián)合相關(guān)部門(mén)首次開(kāi)展全國數據資源調查,對數據資源進(jìn)行摸底。2025年2月,本年度全國數據資源統計調查工作啟動(dòng),歷時(shí)近1個(gè)月完成,并于4月29日對外發(fā)布《報告》。
相較于第一次,今年的調查有哪些不同?有什么新發(fā)現?
全國數據資源統計調查工作組有關(guān)負責人介紹,本年度調查在上年度數據規模、開(kāi)發(fā)利用和應用情況等指標基礎上,新增人工智能、大模型、低空經(jīng)濟等熱點(diǎn)領(lǐng)域調查指標,并對數據資源地區、行業(yè)分布情況做了分析測算。
看數據總量,2024年全國數據生產(chǎn)總量首次突破40ZB,達到41.06ZB,同比增長(cháng)25%,增速較去年提高2.56個(gè)百分點(diǎn)。人均數據生產(chǎn)量約為31.31太字節(TB),相當于1萬(wàn)多部高清電影,同比增長(cháng)25.17%,數據生產(chǎn)總量和人均產(chǎn)量實(shí)現同步躍升。
看算力布局,2024年,全國算力總規模達到280EFLOPS(每秒百億億次浮點(diǎn)運算),智能算力規模達90EFLOPS,占比提升至32%,為海量數據計算提供智能底座。其中,中央企業(yè)算力規模增長(cháng)近3倍,智能算力占比為40.22%;數據技術(shù)企業(yè)算力規模同比增長(cháng)近1倍,智能算力占比為43.63%。
看新增指標,隨著(zhù)人工智能快速發(fā)展,用于開(kāi)發(fā)、訓練和推理的數據量同比增長(cháng)40.95%。智能家居、智能網(wǎng)聯(lián)汽車(chē)等智能設備數據增速位居前列,分別為51.43%、29.28%。無(wú)人機應用范圍快速拓展,機器人產(chǎn)業(yè)化進(jìn)程不斷加快,帶動(dòng)低空經(jīng)濟和機器人數據生產(chǎn)量增速超過(guò)30%。
國家工業(yè)信息安全發(fā)展研究中心主任蔣艷表示,我國數據要素化進(jìn)入新階段,數據領(lǐng)域新技術(shù)、新模式、新業(yè)態(tài)不斷涌現。從今年的調查看,一方面智能網(wǎng)聯(lián)汽車(chē)、大模型等智能化應用,推動(dòng)了全社會(huì )數據增長(cháng),這類(lèi)數據量占比超四成;另一方面低空經(jīng)濟、機器人等新領(lǐng)域的數據生產(chǎn)量雖然不高,但增速超過(guò)30%,成為新的增長(cháng)點(diǎn)。
區域和行業(yè)分布集中度高
全國數據資源規模優(yōu)勢持續擴大,各地之間存在一定差異。
根據《報告》,經(jīng)濟大省數據資源集聚效應明顯,廣東、江蘇、山東、浙江、河南和四川6個(gè)省份數據生產(chǎn)量占全國比重達57.45%。東部地區數據資源開(kāi)發(fā)利用活躍,北京、上海企業(yè)人工智能投入平均水平位居全國前二,浙江應用大模型的企業(yè)比例位居第一。
“山東是經(jīng)濟大省、工業(yè)大省,有著(zhù)海量的數據資源和豐富的應用場(chǎng)景?!鄙綎|省大數據局局長(cháng)王健說(shuō),近年來(lái),山東強化工作統籌、深化數據共享、創(chuàng )新場(chǎng)景應用,全省一體化政務(wù)服務(wù)能力位列全國第一方陣,“開(kāi)放數林指數”位居全國第一。
根據山東省發(fā)布的數據,山東獲批全國工業(yè)品主數據標準建設試點(diǎn),2024年遴選29個(gè)試點(diǎn)縣(市、區)的特色細分行業(yè),全面開(kāi)展試點(diǎn)工作,試點(diǎn)行業(yè)數量居全國第一;形成245個(gè)產(chǎn)品主數據標準,約占全國總量30%;全省重點(diǎn)監測范圍內大數據企業(yè)超900家,2024年營(yíng)收突破2600億元;建成全國首個(gè)海洋大數據交易服務(wù)平臺,交易額超1500萬(wàn)元。王健說(shuō),山東還將著(zhù)力加強數據源頭供給,開(kāi)展公共數據匯聚行動(dòng),將各級各部門(mén)數據匯聚至省一體化大數據平臺,挖好數據要素這座“富礦”。
蔣艷表示,從全國看,數據資源向東部地區聚集,江蘇、廣東的企業(yè)數字化投入是全國平均水平的1.71倍,也為區域數據開(kāi)發(fā)利用提供有力支撐。
區域發(fā)展有差異,行業(yè)分布也存在集中度較高的情況。
國際數據公司(IDC)今年5月發(fā)布中國金融云市場(chǎng)跟蹤報告顯示,2024年下半年,中國金融云市場(chǎng)規模達到52.3億美元,同比增長(cháng)11.0%。業(yè)內人士分析,金融業(yè)數據資源和應用場(chǎng)景極為豐富,數據生產(chǎn)量長(cháng)期以來(lái)穩居各行業(yè)前列,相關(guān)市場(chǎng)規模近年也在不斷增加,數據交易規模占總體比重超過(guò)30%,成為最大的細分行業(yè)數據交易市場(chǎng)。
全國數據資源統計調查工作組有關(guān)負責人表示,隨著(zhù)我國數字化、網(wǎng)絡(luò )化、智能化進(jìn)程加速,制造、金融、交通物流行業(yè)數據生產(chǎn)總量領(lǐng)先其他行業(yè),金融、采礦、交通物流行業(yè)企業(yè)平均數據生產(chǎn)量位居前三。交通物流、電力行業(yè)數據資源開(kāi)發(fā)利用活躍度遠高于全國平均水平,分別為78.24%、75.83%。
喚醒更多“沉睡數據”
有了豐富的數據資源,如何充分開(kāi)發(fā)利用是關(guān)鍵。在第一次全國數據資源調查中,調查組發(fā)現我國海量數據和豐富場(chǎng)景優(yōu)勢潛力亟需釋放。
蔣艷表示,2023年,全國新增數據存儲量為0.95 ZB,生產(chǎn)總量中僅有2.9%的數據被保存,由于海量數據復用價(jià)值較低,大部分過(guò)程類(lèi)數據產(chǎn)生后即被丟棄或覆蓋。數據存而未用現象較為突出,企業(yè)一年未使用的數據占比約四成,數據加工能力不足導致大量數據價(jià)值被低估、難以挖掘復用。
如今,數據資源開(kāi)發(fā)利用有沒(méi)有新變化?
“在本年度調查中,我們看到數據資源開(kāi)發(fā)利用活躍度穩步提升?!比珖鴶祿Y源統計調查工作組有關(guān)負責人說(shuō),公共數據資源供給和企業(yè)用數需求雙向拉動(dòng),企業(yè)加快應用大模型,高質(zhì)量數據集建設進(jìn)入加速期。
一方面,公共數據資源開(kāi)發(fā)利用步伐加快。根據《報告》,2024年,全國地市級以上公共數據開(kāi)放平臺數量增長(cháng)7.5%,開(kāi)放的數據量增長(cháng)7.1%;超六成?。ㄗ灾螀^、直轄市)、計劃單列市啟動(dòng)公共數據授權運營(yíng)工作。
另一方面,企業(yè)用數活力逐步提升。2024年,存儲數據中活躍數據總量同比提升22.73%,活躍數據總量占存儲數據總量62.04%;約66%的行業(yè)龍頭企業(yè)和30%的數據技術(shù)企業(yè)購買(mǎi)過(guò)數據;利用大模型的數據技術(shù)企業(yè)和數據應用企業(yè)數量分別增長(cháng)57.21%、37.14%;數據技術(shù)企業(yè)積極推動(dòng)數據集建設,高質(zhì)量數據集數量增速達27.4%。
此次《報告》預測,全國數據生產(chǎn)總量將保持增長(cháng)態(tài)勢,2025年有望突破50ZB,無(wú)人駕駛、具身智能、低空經(jīng)濟等戰略性新興產(chǎn)業(yè)和未來(lái)產(chǎn)業(yè)的數據資源規模將保持高速增長(cháng)。數據資源流通利用將進(jìn)入加速期,數據治理、數據標注、數據智能等相關(guān)企業(yè)迎來(lái)發(fā)展機遇期,信息技術(shù)服務(wù)商加速向數據運營(yíng)服務(wù)商轉型,數據產(chǎn)品和服務(wù)供給能力將大幅提升,催生一批數智應用新產(chǎn)品新服務(wù)新業(yè)態(tài)。企業(yè)數據價(jià)值挖掘重心從服務(wù)自身數字化轉型向數據要素化、市場(chǎng)化拓展,數據跨主體流通、跨行業(yè)應用、跨場(chǎng)景賦能的乘數效應加速釋放。
隨著(zhù)數據資源規模優(yōu)勢持續擴大,數據要素市場(chǎng)化、價(jià)值化進(jìn)程進(jìn)一步提速,更多“沉睡數據”有望被喚醒。專(zhuān)家分析,作為全球首個(gè)將數據納入生產(chǎn)要素的國家,中國已初步構建起門(mén)類(lèi)齊全的數據產(chǎn)業(yè)鏈。截至目前,全國數據領(lǐng)域相關(guān)企業(yè)超19萬(wàn)家,數據產(chǎn)業(yè)規模超2萬(wàn)億元。按照20%以上的年均增長(cháng)率測算,2030年中國數據產(chǎn)業(yè)規模將達7.5萬(wàn)億元。