在政策支持與產(chǎn)業(yè)需求的雙重帶動(dòng)下,我國數據標注產(chǎn)業(yè)正處于爆發(fā)式增長(cháng)的風(fēng)口。面對日趨激烈的全球科技競爭和廣闊的市場(chǎng)需求,我國需加快在數據要素及標注數據確權、流通安全以及“主權AI”建設等方面的布局,推動(dòng)數據標注產(chǎn)業(yè)在高質(zhì)量發(fā)展的道路上行穩致遠。
數據標注是對數據進(jìn)行添加標記、說(shuō)明、解釋、分類(lèi)和編碼的過(guò)程,是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節。數據標注質(zhì)量直接關(guān)系到模型輸出的準確性和可靠性。
隨著(zhù)各行業(yè)數字化、智能化進(jìn)程的加速推進(jìn),數據標注自動(dòng)化水平顯著(zhù)提升,專(zhuān)業(yè)化趨勢日益明顯,應用領(lǐng)域也在不斷拓展和深化,從傳統的語(yǔ)音轉寫(xiě)、圖片文字識別等領(lǐng)域,向更高端、更復雜的場(chǎng)景延伸,應用價(jià)值持續提升。
國家數據局近日發(fā)布的數據顯示,我國七個(gè)數據標注基地數據標注規模再創(chuàng )新高,總規模達到17282TB,相當于中國國家圖書(shū)館數字資源總量的6倍左右;目前已形成醫療、工業(yè)、教育等行業(yè)的高質(zhì)量數據集335個(gè);賦能121個(gè)國產(chǎn)人工智能大模型研發(fā);引進(jìn)和培育標注企業(yè)223家;標注從業(yè)人員達5.8萬(wàn)人;帶動(dòng)數據標注行業(yè)相關(guān)產(chǎn)值超過(guò)83億元。
我國作為人工智能大國,必須加快在數據要素及標注數據確權、數據流通安全以及“主權AI”建設等方面的布局,以確保在人工智能領(lǐng)域的國際競爭力和話(huà)語(yǔ)權。
一是要完善數據要素確權機制,筑牢數據市場(chǎng)的基石。數據要素確權是數據標注產(chǎn)業(yè)健康發(fā)展的前提和基礎。在數字經(jīng)濟時(shí)代,數據已成為至關(guān)重要的生產(chǎn)要素,其權屬問(wèn)題直接關(guān)系到數據的流通、利用和價(jià)值實(shí)現。數據的無(wú)形性、易復制性及權屬界定模糊等特性,使得數據要素的確權工作成為亟待解決的棘手問(wèn)題。
我國出臺的《中華人民共和國網(wǎng)絡(luò )安全法》《中華人民共和國數據安全法》《中華人民共和國個(gè)人信息保護法》等法規制度,為數據要素確權提供了法律基礎。但在實(shí)際操作中,仍面臨如何界定數據權屬、如何平衡數據主體與數據使用者之間的利益關(guān)系等問(wèn)題,需進(jìn)一步深入探索和完善相關(guān)機制。
二是要明確標注數據的權屬歸屬和利益分配機制。作為在原始數據基礎上通過(guò)人工或機器標注而產(chǎn)生的新數據,標注數據的權屬問(wèn)題需綜合考慮原始數據提供方、標注服務(wù)提供方及標注數據使用方等多方權益。同時(shí),應加強法律法規的宣傳和培訓力度,提高產(chǎn)業(yè)界的法律意識和合規意識,確保數據要素確權工作順利進(jìn)行。
三是構建完善數據流通安全治理制度體系,保障數字經(jīng)濟穩健發(fā)展的生命線(xiàn)。數據標注過(guò)程可能涉及敏感信息的處理和傳輸,如個(gè)人隱私數據、商業(yè)機密等。一旦這些數據泄露或被惡意利用,可能會(huì )給個(gè)人和社會(huì )帶來(lái)重大損失。
我國已經(jīng)出臺一系列數據流通安全相關(guān)的法律法規和政策文件,如《關(guān)于完善數據流通安全治理 更好促進(jìn)數據要素市場(chǎng)化價(jià)值化的實(shí)施方案》等,但在實(shí)際操作中,仍需深入探索如何保障數據在流通過(guò)程中的安全性、完整性和可追溯性等,包括建立嚴格的數據流通安全管理制度,明確數據提供方、數據接收方和數據流通平臺等各方的責任和義務(wù);加強數據流通安全技術(shù)的應用和創(chuàng )新,如采用數字水印、數據指紋、區塊鏈等技術(shù)手段,確保數據流通過(guò)程中的安全性和可追溯性;加強與國際社會(huì )合作與交流,共同推動(dòng)全球數據流通安全治理體系的建設。
四是加強“主權AI”建設,提升國家核心競爭力。在全球科技競爭日益激烈的今天,“主權AI”建設已成為各國關(guān)注的焦點(diǎn)。我國作為人工智能大國,必須加快“主權AI”建設的步伐,確保在人工智能領(lǐng)域的國際話(huà)語(yǔ)權和競爭力。
具體到數據標注產(chǎn)業(yè),我們應建立自主安全可控的AI基礎設施,確保關(guān)鍵核心技術(shù)基本實(shí)現自主控制;加強AI底層技術(shù)領(lǐng)域領(lǐng)軍人才培養,加強科研創(chuàng )新;持續優(yōu)化產(chǎn)業(yè)布局,推動(dòng)產(chǎn)業(yè)集群發(fā)展;積極參與國際AI標準制定,提高我國AI技術(shù)的國際認可度和影響力。此外,在“主權AI”建設過(guò)程中,還需注重保護個(gè)人隱私等敏感信息的安全,確保AI技術(shù)的合規應用和發(fā)展。
完善數據要素確權機制、構建數據流通安全治理體系、加強“主權AI”建設,不僅是保障數據標注產(chǎn)業(yè)健康發(fā)展的必由之路,更是推動(dòng)我國數字經(jīng)濟邁上新臺階的關(guān)鍵舉措。
通過(guò)政策引導、技術(shù)創(chuàng )新與國際合作的多重驅動(dòng),我國數據標注產(chǎn)業(yè)將不斷提升自身競爭力,為人工智能技術(shù)的深入應用與數字經(jīng)濟的蓬勃發(fā)展提供堅實(shí)支撐。
?。ㄗ髡撸焊督埾到K經(jīng)貿職業(yè)技術(shù)學(xué)院副院長(cháng)、中國法治現代化研究院特邀研究員;杜帥系對外經(jīng)貿大學(xué)社會(huì )保障與企業(yè)金融研究中心主任)