
近日,美國人工智能研究公司OpenAI推出的聊天機器人ChatGPT火爆全網(wǎng)。它能通過(guò)學(xué)習和理解人類(lèi)語(yǔ)言進(jìn)行自然語(yǔ)言對話(huà),跟人類(lèi)聊天時(shí)遇到敏感問(wèn)題會(huì )“打太極”,還能替打工人生成頗具幽默感的辭職信……
可以說(shuō),ChatGPT打開(kāi)了自然語(yǔ)言處理技術(shù)商業(yè)化落地且成為消費端爆款的大門(mén),具有劃時(shí)代的意義。中國目前還沒(méi)有可媲美的類(lèi)似應用,會(huì )在本輪AI競爭中因慢一步而落于人后嗎?不必過(guò)慮!
AI發(fā)展的三大要素是數據、算法、算力,中國在這三方面都有良好基礎。
AI的進(jìn)步迭代需大量數據進(jìn)行學(xué)習訓練,ChatGPT也不例外。ChatGPT的訓練使用了約45TB數據,其中包含多達近1萬(wàn)億個(gè)單詞的文本內容。從大數據資源看,中國擁有全世界最大規模的網(wǎng)民數量,有豐富的應用場(chǎng)景,在數據積累方面優(yōu)勢明顯。
在算法方面,ChatGPT的技術(shù)底座是大型語(yǔ)言模型。GPT屬于自然語(yǔ)言處理NLP的范疇,本質(zhì)上仍是以深度學(xué)習為代表的人工智能技術(shù)長(cháng)期發(fā)展和積累的結果,并未出現算法的革命性突破,發(fā)布于2020年的GPT-3是有1750億個(gè)參數的大模型,ChatGPT正是基于它的改進(jìn)版本創(chuàng )建的。國內也有NLP領(lǐng)域的大模型,并有智能客服、作詩(shī)機等實(shí)際應用。雖然目前全球還沒(méi)有能跟ChatGPT驚艷表現相抗衡的大模型,但是業(yè)界共識是差距在兩年左右。兩年的差距并非鴻溝,有趕超可能。
AI的訓練和使用需要強大的算力,算力的基礎是芯片,有人擔心中國在這方面會(huì )吃虧。實(shí)際上,芯片水平并不等同于算力水平,算力還需要廣闊的應用場(chǎng)景支撐,需要具備對千萬(wàn)個(gè)芯片進(jìn)行規;{度運行的能力!2021—2022全球計算力指數評估報告》顯示,美國計算力指數得分為77分,中國為70分,分列世界前兩位,中國算力水平與美國處于同一等級,差距并不大。
對于中國企業(yè)來(lái)說(shuō),ChatGPT的優(yōu)點(diǎn)值得學(xué)習,它的不足也正是我們參與競爭的機遇。
學(xué)習它提高AI智商的新路徑。ChatGPT的聰明表現,源自讓AI從人類(lèi)反饋中進(jìn)行強化學(xué)習。在訓練過(guò)程中,人類(lèi)訓練者扮演著(zhù)用戶(hù)和助手的角色,這比過(guò)去AI大模型的“深度學(xué)習+人工標注”模式省時(shí)省力、效果更好。
在它表現欠佳的中文領(lǐng)域錯位競爭。ChatGPT的英文水平明顯高于中文水平,這是它在訓練階段被“喂”了更多英文素材的必然結果,也可以成為中國版ChatGPT應用的競爭切入點(diǎn)。
從它被詬病的倫理挑戰中尋得商機。ChatGPT會(huì )一本正經(jīng)地胡說(shuō)八道,生成錯誤信息的能力遠超人類(lèi)。它還會(huì )被人類(lèi)不當使用,比如學(xué)生拿它寫(xiě)作業(yè),黑客拿它寫(xiě)代碼用于網(wǎng)絡(luò )攻擊,詐騙犯拿它開(kāi)設“殺豬盤(pán)”。防范治理這些風(fēng)險,一方面需要完善相關(guān)倫理法規,另一方面也應考慮到人類(lèi)處理信息的速度遠遜于A(yíng)I的事實(shí),開(kāi)發(fā)自動(dòng)判別并警示AI生成有害信息的技術(shù)。屆時(shí),反ChatGPT技術(shù)也將成為新商機。
中國版ChatGPT并不遙遠,已有百度等多家公司宣布將進(jìn)入此賽道。面對ChatGPT這個(gè)新晉AI網(wǎng)紅,我們應清醒分析其優(yōu)勢和不足,學(xué)優(yōu)補劣。 (本文來(lái)源:經(jīng)濟日報 作者:佘惠敏)
(責任編輯:王炬鵬)