3問(wèn)大數據
從移動(dòng)支付到共享經(jīng)濟,大數據正在加速重塑著(zhù)大眾生活的諸多方面;從萬(wàn)物互聯(lián)到智慧城市,大數據正在深刻影響著(zhù)經(jīng)濟發(fā)展、社會(huì )治理、國家管理的各個(gè)領(lǐng)域。了解大數據、掌握大數據、運用大數據,這是當下的現實(shí)課題,更意味對未來(lái)的判斷和引領(lǐng)。
大數據正在得到空前重視。2017年底,習近平總書(shū)記在中共中央政治局第二次集體學(xué)習時(shí)強調,推動(dòng)實(shí)施國家大數據戰略,加快完善數字基礎設施,推進(jìn)數據資源整合和開(kāi)放共享,保障數據安全,加快建設數字中國。最近一年來(lái),貴州、海南、四川等地陸續發(fā)布促進(jìn)大數據發(fā)展工作方案或相關(guān)地方法規,以促進(jìn)和保障大數據發(fā)展有序推進(jìn),各類(lèi)便民應用層出,產(chǎn)業(yè)集聚明顯加快。
我國大數據發(fā)展現狀如何—數據應用是否發(fā)揮應有效果?數據公開(kāi)共享是否合理充分?個(gè)人數據隱私保護是否全面?近日,本報記者就這些問(wèn)題深入調研,采寫(xiě)“解碼大數據”上下篇報道。今天推出上篇《3問(wèn)大數據》。
——編 者
大數據好用嗎
-應用領(lǐng)域不廣泛
-區域水平不均衡
-行業(yè)融合不深入
本報記者 吳 姍 錢(qián)一彬
年度賬單、聽(tīng)歌歷程、出行軌跡……年初,多個(gè)互聯(lián)網(wǎng)應用平臺推出對用戶(hù)使用情況的“個(gè)人總結”,買(mǎi)了什么東西、下了幾次館子、聽(tīng)了什么歌、去了什么地方……大數據似乎比用戶(hù)更了解自己。雖質(zhì)疑不斷,但有趣的“用戶(hù)畫(huà)像”背后,是大數據應用越來(lái)越深入尋常百姓家。
工信部發(fā)布的《大數據產(chǎn)業(yè)發(fā)展規劃(2016—2020)》指出,目前大數據仍存在應用領(lǐng)域不廣泛、應用程度不深、認識不到位等問(wèn)題。為解決更多需求痛點(diǎn),大數據亟待打通行業(yè)發(fā)展水平參差不齊、應用領(lǐng)域不平衡、業(yè)務(wù)融合不深入等堵點(diǎn)。
賽迪顧問(wèn)股份有限公司大數據產(chǎn)業(yè)研究中心的統計數據顯示,互聯(lián)網(wǎng)、金融和電信三大領(lǐng)域的大數據應用在各行業(yè)總規模中所占比重超過(guò)70%;健康醫療領(lǐng)域和交通領(lǐng)域近年不斷“上架”新應用,但行業(yè)規模占比相對較;而其他眾多民生領(lǐng)域,大數據應用仍處于淺層次信息化層面,行業(yè)發(fā)展水平參差不齊。
上海普陀區全面推廣“社區治理云平臺”系統,基層大數據讓社區服務(wù)“掌上”可得;全國首個(gè)旅游大數據公共服務(wù)平臺“杭州旅游數據在線(xiàn)”上線(xiàn),游客通過(guò)手機便可了解景點(diǎn)實(shí)時(shí)擁堵度、酒店好評率等信息……總體上,東部地區的大數據應用“刷新”更快。賽迪顧問(wèn)統計顯示,北京、江蘇、浙江、山東、上海五大省市的大數據產(chǎn)業(yè)發(fā)展領(lǐng)跑全國,而云南、吉林、河北、內蒙古、廣西等省區則相對滯后,大數據應用區域發(fā)展不平衡的問(wèn)題不容忽視。
大數據的價(jià)值在于應用!巴孓D大數據”的關(guān)鍵,在于大數據技術(shù)與業(yè)務(wù)實(shí)現深度融合!澳壳,大數據在多個(gè)行業(yè)尚未與業(yè)務(wù)實(shí)現深度融合,應用場(chǎng)景創(chuàng )新不足,大數據技術(shù)人員需要提升行業(yè)業(yè)務(wù)知識和經(jīng)驗!睌祿夹g(shù)與應用服務(wù)商百分點(diǎn)首席數據科學(xué)家杜曉夢(mèng)表示,國內很多行業(yè)仍?xún)H在局部業(yè)務(wù)上使用大數據技術(shù),僅掌握數據挖掘和分析技術(shù),如不能將技術(shù)與業(yè)務(wù)全面、深度地融合,則無(wú)法完全發(fā)掘出數據應用的真正價(jià)值。
《大數據產(chǎn)業(yè)發(fā)展規劃(2016—2020)》提出,到2020年,大數據相關(guān)產(chǎn)品和服務(wù)業(yè)務(wù)收入突破1萬(wàn)億元,年均復合增長(cháng)率保持30%左右,大數據在創(chuàng )新創(chuàng )業(yè)、政府管理和民生服務(wù)等方面廣泛深入應用。未來(lái)如何在搜集、儲存大數據的基礎上更好地整合、分析和應用,將成為優(yōu)化“數據大腦”的重點(diǎn)課題。
大數據的生命力,在于發(fā)現問(wèn)題、感知風(fēng)險、建立連接、解決問(wèn)題以及預測未來(lái)。目前國內的大數據應用側重于數據收集,在基礎統計分析、風(fēng)險感知和預測方面還有較大提升空間。同時(shí),也不能在尚未明晰具體業(yè)務(wù)應用場(chǎng)景的情況下盲目追求大數據,而要以應用場(chǎng)景為牽引,只匯集不分析或者片面追求大而全,都不利于大數據發(fā)揮其對生產(chǎn)力提升的促進(jìn)作用。此外,在大數據廣泛運用于創(chuàng )新創(chuàng )業(yè)、政府管理和民生服務(wù)等方面的同時(shí),也應認識到:大數據對社會(huì )的沖擊有多大,社會(huì )對于大數據發(fā)展的回應、規范和約束就應有多大。
——清華大學(xué)新聞與傳播學(xué)院教授沈陽(yáng)
大數據暢通嗎
-收集標準不統一
-信息壁壘待打通
-供給需求不匹配
本報記者 董絲雨 王玉琳
我國信息數據資源80%以上掌握在各級政府部門(mén)手中。近年來(lái),在《關(guān)于推進(jìn)公共信息資源開(kāi)放的若干意見(jiàn)》《政務(wù)信息系統整合共享實(shí)施方案》等文件的推動(dòng)下,政府數據加快共享開(kāi)放的步伐,惠民成績(jì)單亮點(diǎn)不斷。然而,由于我國大數據發(fā)展還處在起步階段,不少基礎性、關(guān)鍵性數據仍被政府部門(mén)束之高閣,共享開(kāi)放程度低,成為現代化治理進(jìn)程中的“路障”。
有效的數據收集是實(shí)現共享與開(kāi)放的基礎。據貴州省大數據發(fā)展管理局相關(guān)負責人介紹,部分政府部門(mén)在數據收集的過(guò)程中,由于缺乏統一的標準,收集到的數據雖然量大,但質(zhì)量不高,可利用價(jià)值低。
由于目前數據共享開(kāi)放的法律、政策環(huán)境尚不成熟,一些地方政府職能部門(mén)評估信息是否要開(kāi)放等問(wèn)題時(shí),往往有所推脫。如果數據毫無(wú)關(guān)聯(lián)地沉淀在各部門(mén)的信息系統中,缺乏共享開(kāi)放的意識,甚至把數據資源視為“私產(chǎn)”,就會(huì )造成條塊分割、重復建設,形成壁壘森嚴的“信息孤島”。據此前媒體報道,長(cháng)江上游地區一些省份的交通管理部門(mén)、運輸公司不愿與其他省市共享物流信息,造成聯(lián)運銜接的信息壁壘,甚至出現了同樣1噸貨,百公里公路運費比經(jīng)濟發(fā)達地區高60元的現象。
供給與需求脫節也讓數據共享和開(kāi)放效果打上折扣。截至去年底,廣東省全省87個(gè)省直部門(mén)有6988類(lèi)數據資源、62332項信息項,居全國各省(區、市)首位。但各部門(mén)提出共享需求僅3649類(lèi),省級編目共享僅477類(lèi),數據難以真正發(fā)揮利民惠民、支撐政府決策的作用。
此外,盡管部分數據已接入共享開(kāi)放平臺,但由于不能被機器讀取,成為無(wú)法釋放應有活力的“休眠數據”!2017中國地方政府數據開(kāi)放平臺報告》顯示,截至去年4月,全國19個(gè)地方政府數據開(kāi)放平臺的8398個(gè)開(kāi)放數據中仍有約25%的機器可讀性較差。
去年12月6日召開(kāi)的國務(wù)院常務(wù)會(huì )議提出,提供公共數據是政府公共服務(wù)的重要內容,要求對分散、獨立的政務(wù)信息系統加快清理整合,統一接入國家數據共享交換平臺,并依法依規向社會(huì )開(kāi)放。如何繼續加快數據共享開(kāi)放的進(jìn)程,讓群眾真正享受到數據共享開(kāi)放帶來(lái)的紅利,是未來(lái)大數據工作的重點(diǎn)和難點(diǎn)。
當前我國政府數據治理發(fā)展不充分、不平衡有多方面原因。
首先是認識問(wèn)題,沒(méi)有認識到數據治理對提高執政透明度和促進(jìn)經(jīng)濟發(fā)展都有積極意義,反而認為沒(méi)有直接的政績(jì)產(chǎn)出;其次是責任問(wèn)題,安全風(fēng)險和問(wèn)題追責等都影響政府部門(mén)開(kāi)放數據的積極性;第三是利益問(wèn)題,一些人認為共享開(kāi)放數據,將導致原有權力或既得利益受影響;第四是能力問(wèn)題,有沒(méi)有物力財力可以投入,這是經(jīng)濟能力;有沒(méi)有專(zhuān)人專(zhuān)崗協(xié)調,這是行政能力;有沒(méi)有成熟技術(shù)可以快速應用,這是技術(shù)能力。
——北京大學(xué)政府管理學(xué)院副教授黃璜
大數據安全嗎
-越權收集花樣多
-數據黑市有隱患
-安全防護存漏洞
本報記者 許 晴 宋靜思
2018年初,對大數據時(shí)代個(gè)人隱私安全的擔憂(yōu)再度升級:微信官方表示,不會(huì )將用戶(hù)任何聊天內容用于大數據分析;支付寶因用戶(hù)查看年度賬單時(shí)“被同意”收集個(gè)人信息,被國家網(wǎng)信辦約談;百度則回應江蘇消協(xié)稱(chēng),旗下手機應用沒(méi)有能力、也從來(lái)不會(huì )申請監聽(tīng)用戶(hù)電話(huà)。
數據作為大數據產(chǎn)業(yè)中的核心資源,已成為各家企業(yè)、平臺的爭奪對象。為采集數據,眾多網(wǎng)站平臺、聯(lián)網(wǎng)設備、應用軟件“各出奇招”。有網(wǎng)友質(zhì)疑,連手電筒應用都要求讀取手機通訊錄、使用麥克風(fēng)和攝像頭,實(shí)在不合理。
“究其原因,是因為數據變得值錢(qián)了”。九次方大數據創(chuàng )始人、貴陽(yáng)大數據交易所執行總裁王叁壽說(shuō),大數據是海量數據的聚合,沒(méi)有數據,大數據如同無(wú)源之水。合法企業(yè)通過(guò)用戶(hù)數據提供精準、便捷的個(gè)性化服務(wù),從而實(shí)現商業(yè)變現,讓大數據產(chǎn)業(yè)有利可圖。
除了政府開(kāi)放的數據和企業(yè)自身收集的數據,數據交易也是數據的重要來(lái)源,但也在某種程度上催生了黑色產(chǎn)業(yè)鏈。據業(yè)內人士介紹,正規數據交易市場(chǎng)的交易額約為100億元,而數據黑市的交易額度則龐大得多,盈利狀況也很好。
王叁壽介紹,正規交易的數據需要經(jīng)過(guò)采集、清洗、脫敏、脫密、融合等流程,保障了數據的合法性、真實(shí)性和安全性,成本也相應提高。但黑市交易的大部分數據多由內鬼或黑客竊取得來(lái),幾乎是無(wú)本萬(wàn)利。比如,正規渠道的人臉識別數據價(jià)格為每條0.1元,而黑市上只需花1分錢(qián)就能獲取同樣的數據。
去年3月,某知名電商內部員工被捕,因其涉嫌盜取涉及交通、物流、醫療、社交、銀行等個(gè)人信息50億條并在網(wǎng)絡(luò )黑市販賣(mài);去年11月,深圳警方在華強北某投資咨詢(xún)公司查獲上千份公民征信報告,循線(xiàn)追查出售賣(mài)者為某商業(yè)銀行深圳分行信貸部職員。2016年發(fā)布的一項調查研究結果顯示,近七成企業(yè)曾在過(guò)去一年內遭遇公司內部人員竊取或試圖竊取數據。
大數據技術(shù)不斷創(chuàng )新演進(jìn),傳統網(wǎng)絡(luò )安全技術(shù)也面臨嚴峻挑戰!吨袊髷祿l(fā)展調查報告(2017年)》顯示,企業(yè)在選購大數據軟件產(chǎn)品時(shí),產(chǎn)品安全性和穩定性成為最重要的考慮因素。業(yè)內人士指出,大數據背景下的攻擊者通過(guò)人工智能、機器學(xué)習等新技術(shù)對攻擊工具進(jìn)行升級,提高網(wǎng)絡(luò )攻擊的精確度和隱蔽性。安全保護技術(shù)手段亟待強化更新,構建更可靠、更有效的大數據安全保障技術(shù)體系。
網(wǎng)站和手機應用越界收集用戶(hù)數據,根本原因是為了追逐商業(yè)利益。企業(yè)收集用戶(hù)數據時(shí),要尊重用戶(hù)的知情權、退出權和自由選擇權。要明確大數據和個(gè)人信息之間的關(guān)系:個(gè)人信息屬于隱私權范疇,而大數據一部分來(lái)源于個(gè)人信息,但本質(zhì)是知識產(chǎn)權。
現階段,數據黑市問(wèn)題嚴重,反映出《網(wǎng)絡(luò )安全法》落實(shí)尚未到位,在制度上、人員上、技術(shù)防控上還有很大差距。立法不代表問(wèn)題完全解決,還要加大力度、嚴格執行,技術(shù)上也要配合跟進(jìn),一步一個(gè)腳印,切實(shí)提高網(wǎng)絡(luò )安全水平。
——中國政法大學(xué)傳播法研究中心副主任朱巍