通過(guò)詞頻統計快速抓取《紅樓夢(mèng)》中的730多個(gè)人名;利用三維建模和3D打印技術(shù)“重塑”云岡石窟第十二窟;抓取分析人氣值、集資榜數據,研究《創(chuàng )造營(yíng)2020》等熱門(mén)綜藝節目的粉絲行為……如今,大數據、云計算、人工智能等數字技術(shù)與人文研究的結合正催生出“數字人文”的全新研究范式,在驅動(dòng)學(xué)術(shù)生產(chǎn)方式變革的同時(shí),其創(chuàng )新研究成果也逐步惠及大眾。
數字人文是研究者采用數字技術(shù)來(lái)解決人文領(lǐng)域研究問(wèn)題的跨學(xué)科實(shí)踐。其歷史最早可以追溯到1949年的“阿奎那項目”,即用計算機對中世紀經(jīng)院哲學(xué)家托馬斯·阿奎那的全部著(zhù)作及相關(guān)文獻制作語(yǔ)詞索引。數字人文最核心的特征是用數字技術(shù)解決傳統人文學(xué)研究中遇到的、傳統手段無(wú)法解決的問(wèn)題。這樣說(shuō)來(lái),恐怕還略顯抽象,我們不妨舉幾個(gè)數字人文在不同學(xué)科的應用案例。
文學(xué)研究方面,令研究者發(fā)愁的一個(gè)問(wèn)題就是海量文學(xué)作品并沒(méi)有進(jìn)入研究視野,進(jìn)而對文學(xué)創(chuàng )作的總體情況缺乏高屋建瓴式的準確把握。2019年,中國新版當代小說(shuō)就有5542種之多,更別提汗牛充棟的網(wǎng)絡(luò )文學(xué)了。當年網(wǎng)絡(luò )文學(xué)注冊作者已達1755萬(wàn)人,其作品量可想而知。因此,想要把握當下創(chuàng )作的潮流和趨勢,數字人文給出的辦法是“遠讀”(distant reading),與貼近作品、以準確把握某一文本為目標的“細讀”(close reading)相對,遠讀將鏡頭拉得更遠、視角更廣,考察作品的范圍更大,通過(guò)忽略無(wú)關(guān)的細節信息,利用數字技術(shù)從宏觀(guān)上更加客觀(guān)準確地描摹出文學(xué)創(chuàng )作的概貌。
2018年,谷臻故事工場(chǎng)CEO走走通過(guò)抓取1979年至2018年40年間,680位作者發(fā)表在《收獲》雜志上的1618篇長(cháng)中短篇小說(shuō),從每十年的地理位置變化、明快—沉郁作品比例、影視改編類(lèi)型曲線(xiàn)、主題變遷等6個(gè)維度著(zhù)手,解讀《收獲》40年作品風(fēng)格的變化趨勢,是遠讀研究方法的一次嘗試。通過(guò)對小說(shuō)文本的詞頻數據分析,他們發(fā)現《收獲》第一個(gè)十年(1979年—1989年)刊載作品的高頻詞是“我要”,反映了作家主體意識的覺(jué)醒和自我表達欲望的提升;第二個(gè)十年(1990年-1999年)的表達主體從“我”擴展到“我們”,“家庭”倫理關(guān)系成為最受關(guān)注的話(huà)題;第三、第四個(gè)十年中,文學(xué)創(chuàng )作也呈現出各自不同的特點(diǎn)。如果通過(guò)人工閱讀得出相似結論,恐怕要大費一番周折。
此外,數字人文還可為人文學(xué)研究中的疑難問(wèn)題提供全新的解決思路,實(shí)現了科技和人文的跨界破壁。明初重要詩(shī)人楊基的出生年月一直存在爭議。有研究者根據他《梁園飲酒歌》一詩(shī)中“我生之辰木入斗,烏啼東井命壁守。壁為文府斗為歲,許我文章播人口!睂罨錾靥K州天平山的GPS坐標、時(shí)區導入軟件,加載黃道坐標后計算出他的生日在1331年12月4日至次年1月25日之間,為文學(xué)史研究提供了更為可靠的證據支撐。河北大學(xué)研究人員借助聲門(mén)儀、呼吸帶、眼動(dòng)儀等設備記錄保存傳統戲曲保定老調,可以精確記錄表演者的聲帶振動(dòng)頻率、幅度、節奏和呼吸信號以及眼神表達和視線(xiàn)焦點(diǎn)。通過(guò)對這些數據的分析,有可能找到戲曲表演“韻味”形成的密碼。
在文化遺產(chǎn)保護利用方面,數字人文更是發(fā)揮著(zhù)不可替代的作用。通過(guò)平面和立體掃描、智能文本識別,可以完成古籍文獻、藝術(shù)品甚至建筑的數字化數據采集,形成穩定安全可靠、可重復利用、獲取便利的數字資源,這不僅是獲取學(xué)術(shù)研究資料的必要環(huán)節,其成果通過(guò)轉化利用,更可面向大眾發(fā)揮文化普及的教育功能。經(jīng)過(guò)30多年數字化技術(shù)的發(fā)展,目前敦煌研究院已完成230多個(gè)洞窟的數據采集、145個(gè)洞窟的圖像拼接、160多個(gè)洞窟的虛擬漫游和三維空間結構以及42身的彩塑三維重建。利用相關(guān)數字化成果,敦煌研究院面向大眾推出了“云游敦煌”微信小程序等一系列線(xiàn)上“云展覽”,讓數字人文的成果為全社會(huì )共享。
以上只是數字人文應用前景的冰山一角,更多的跨學(xué)科交叉研究正在展開(kāi)。有研究顯示,數字人文研究論文分布在102個(gè)學(xué)科領(lǐng)域中,計算語(yǔ)言學(xué)、計量史學(xué)等新興學(xué)科不斷涌現。未來(lái)的人文學(xué)研究將搭上數字化時(shí)代的快車(chē),相關(guān)成果也將更好地為社會(huì )大眾服務(wù)。
更多精彩內容,請點(diǎn)擊進(jìn)入文化產(chǎn)業(yè)頻道>>>>>
(責任編輯:
魏金金
)