“中國創(chuàng )業(yè)者在移動(dòng)互聯(lián)網(wǎng)時(shí)代是最會(huì )做應用的?!?/p>
文|《中國企業(yè)家》記者 趙東山
“國內好的大模型應用目前還是太少了,2023年大家都使勁做大模型,反倒在應用方面沒(méi)有大的突破?!边@是網(wǎng)易有道CEO周楓投身大模型一年后最大的感受。
在他看來(lái),2024年大模型應用即將迎來(lái)爆發(fā),“咱們中國創(chuàng )業(yè)者在移動(dòng)互聯(lián)網(wǎng)時(shí)代可是最會(huì )做應用的”。2023年,周楓去美國轉了一圈,他發(fā)現那邊的創(chuàng )業(yè)活力非常強,大家都在各個(gè)層級上創(chuàng )新,他意識到國內需要再次加速,尤其在應用層。
過(guò)去一年,不同于百川智能創(chuàng )始人王小川、智譜CEO張鵬等清華大學(xué)校友研發(fā)超大規模大模型,周楓帶領(lǐng)團隊研發(fā)出“子曰”教育大模型之后,就快速投入到大模型原生應用的開(kāi)發(fā)中,業(yè)務(wù)被逼著(zhù)進(jìn)入一種快速迭代的狀態(tài),周楓參與業(yè)務(wù)會(huì )議的頻率從月會(huì )變成了周會(huì ),他形容當時(shí)的團隊狀態(tài)是“應用團隊和模型團隊互相逼”。
截至目前,基于“子曰”教育大模型,有道已推出10多款學(xué)習類(lèi)AI原生應用和功能,成為國內開(kāi)發(fā)AI原生應用最多的大模型企業(yè)之一。而基于大模型對原有業(yè)務(wù)的重構,有道的業(yè)績(jì)變化也真實(shí)地體現在公司的經(jīng)營(yíng)數據中。
根據有道2023年第三季度的財報,網(wǎng)易有道該季凈收入15.4億元,毛利率上升至55.9%,達到近兩年新高;季度經(jīng)營(yíng)虧損同比收窄73.7%,總運營(yíng)費用也同比下降,經(jīng)營(yíng)效率進(jìn)一步提升。
在具體產(chǎn)品和業(yè)務(wù)上,受益于大模型的助力,AI Box的升級以及AI寫(xiě)作功能的推出,帶動(dòng)有道詞典及有道翻譯第三季度會(huì )員費同比增長(cháng)160%以上,在線(xiàn)營(yíng)銷(xiāo)服務(wù)凈收入較2022年同期增長(cháng)113.5%。
“搭載了子曰大模型的產(chǎn)品,比同期發(fā)布的未搭載大模型應用的產(chǎn)品,在用戶(hù)使用頻率上要高出50%以上?!敝軛鞲嬖V《中國企業(yè)家》。
從2006年網(wǎng)易有道成立,周楓相繼做了有道搜索、有道詞典、有道云筆記、有道精品課、有道詞典筆等業(yè)務(wù),業(yè)務(wù)范圍覆蓋K12教育、成人教育、素質(zhì)教育、智能硬件等領(lǐng)域,這讓大模型的應用落地有了眾多的場(chǎng)景。
雖然有道并非大模型企業(yè)中規模最大的一家,但周楓采取的“小快靈”AI應用開(kāi)發(fā)路線(xiàn),很顯然已率先在商業(yè)模式上奏效。當外界在追問(wèn)大模型到底給企業(yè)帶來(lái)哪些增量時(shí),有道已經(jīng)在各業(yè)務(wù)的用戶(hù)反饋中得到了答案。
“做企業(yè)最重要的是挑什么仗去打?!敝軛髡f(shuō)道,“如果你告訴團隊去打根本不可能贏(yíng)的仗,那不是害大家嗎?”
把重心轉移到應用上
時(shí)間回到2022年11月底,ChatGPT發(fā)布之后,周楓試用后感到非常震撼。他跟算法團隊來(lái)來(lái)回回地用,測試它的能力底線(xiàn),在公司內部評測模型不同能力的細節。為了了解更多技術(shù)細節,周楓把從GPT-2開(kāi)始的所有語(yǔ)言模型相關(guān)的論文全部讀了一遍。
2023年1月,有道內部召開(kāi)年度戰略會(huì ),這是公司每年的傳統,周楓把總監以上的團隊集中在一起連續開(kāi)三天會(huì )。不同于往年,2023年周楓讓有道首席科學(xué)家段亦濤講了一個(gè)多小時(shí)GPT相關(guān)的技術(shù),讓大家做了充分的討論。
最終的結論是,大模型是一個(gè)革命性的技術(shù),如果有道不迅速入局,革新和顛覆自己,就連起家的詞典和翻譯業(yè)務(wù)就也別干了。當時(shí),周楓和團隊一直在思考,ChatGPT、大模型跟有道到底有沒(méi)有關(guān)系?有道到底要做什么?有沒(méi)有合作方可以調用?
“我們從第一天開(kāi)始就決定要做一批應用,而不是說(shuō)我要訓個(gè)模型出來(lái),然后看怎么辦?我不是這個(gè)想法,只是當時(shí)找了一圈都沒(méi)有可調用的大模型,只能自己訓練。我覺(jué)得你把大模型弄出來(lái),卻搞不明白用來(lái)干什么的話(huà),自己做大模型的意義就不大了?!敝軛鞲嬖V《中國企業(yè)家》。
其實(shí),當時(shí)美國可汗學(xué)院等教育公司已經(jīng)開(kāi)始嘗試接入GPT-3.5,做一些教育服務(wù)嘗試,但國內還沒(méi)有能力綜合又非常成熟的可以接入的模型,周楓必須得自己做。
很快,周楓就和團隊達成兩個(gè)共識:第一,有道團隊一定要自己做大模型,如果自己不做是很難完全摸清楚門(mén)道的,公司的動(dòng)作就會(huì )變得很慢,做什么都落在別人后面,成為一個(gè)跟隨者;第二,做開(kāi)源大模型肯定打不過(guò)專(zhuān)門(mén)做超大規模大模型的公司,必須把重心轉移到應用上。
作為資深技術(shù)從業(yè)者,周楓過(guò)去20年見(jiàn)證了好幾輪技術(shù)變革浪潮,歷史經(jīng)驗告訴他,每一次大的浪潮里,機會(huì )不僅僅在于基礎技術(shù)。就像互聯(lián)網(wǎng)發(fā)展之初,做服務(wù)器和路由器的公司最賺錢(qián),但大家很快就發(fā)現互聯(lián)網(wǎng)的精髓不在路由器,而是在互聯(lián)網(wǎng)應用上。
他認為,如果中國的創(chuàng )業(yè)者眼睛全盯著(zhù)要去做大模型,就會(huì )像移動(dòng)互聯(lián)網(wǎng)時(shí)代那樣,整天盯著(zhù)怎么做手機而忽視了微信、淘寶、抖音等應用的機會(huì )。
不做1000億參數以上大模型
截至目前,有道大模型團隊超過(guò)100人,且大多數都是從原來(lái)的團隊轉過(guò)來(lái),他們中很多都有人工智能領(lǐng)域的相關(guān)研發(fā)經(jīng)驗。
除了人才外,有道在A(yíng)I方面也有深厚的積累。早在2008年,有道成為國內第一家提供統計機器翻譯模型的公司;2017年,有道從機器翻譯引擎升級成神經(jīng)網(wǎng)絡(luò )翻譯引擎,隨后又升級到現在主流的Transformer技術(shù)。因此,在做大模型的時(shí)候,有道團隊過(guò)往很多積累都可以用上。
但即便有技術(shù)積累和人才優(yōu)勢,周楓給團隊設定的邊界是:堅決不會(huì )做1000億參數以上的模型。
在周楓看來(lái),大模型目前可分為三個(gè)層級——1000億參數以上的超大模型、100億參數~1000億參數的中間模型和100億參數以下的小模型。每個(gè)層級都定位不同的實(shí)用場(chǎng)景,其中超大模型提供最佳質(zhì)量,具備較強數理推理能力;中間的模型具備知識的能力,且因為成本較低,但效果不錯,可以廣泛應用;而小模型則是放到設備里,具備語(yǔ)言能力和情緒能力。
“我們基本上相對早期的時(shí)候就琢磨明白這件事兒了,超大規模的模型應該留給專(zhuān)門(mén)以大模型為全部工作的公司去做,一方面太貴了,另一方面市場(chǎng)也不需要重復建設?!敝軛鞲嬖V《中國企業(yè)家》。
在他看來(lái),有道作為教育科技企業(yè),核心的差異應該來(lái)自于中間和底下兩個(gè)模型。而這其中,要求開(kāi)發(fā)者對不同層級的模型能力有深刻的理解,且能將產(chǎn)品需求和能力模型匹配。
在結合過(guò)往業(yè)務(wù)尋找落地場(chǎng)景應用的過(guò)程中,周楓確立了兩個(gè)原則:第一,解決用戶(hù)在教育場(chǎng)景的需要;第二,能快速變現,有足夠的商業(yè)空間。而虛擬人口語(yǔ)教練Hi Echo、AI家庭教師小P老師等應用和功能,都是他認為既能滿(mǎn)足用戶(hù)學(xué)習需求,又能實(shí)現商業(yè)化變現。
教育缺的是辦法
2019年10月,有道在美股上市時(shí),周楓就曾拿用AI技術(shù)批改作文這一場(chǎng)景舉例?!暗敃r(shí)的確效果一般?!敝軛鞲嬖V《中國企業(yè)家》。
2023年,借助AI大模型,有道再次推出AI作文指導,目前已經(jīng)批改了幾十萬(wàn)篇作文。周楓發(fā)現用戶(hù)需求沒(méi)變,但當需求能被很好地解決的時(shí)候,產(chǎn)品使用量或者活躍度就會(huì )快速上升,滿(mǎn)意度也明顯提升。
2023年一年,周楓深刻地意識到,其實(shí)教育從來(lái)都不缺用戶(hù)需求,缺的都是辦法。除了AI作文批改被使用頻次變高之外,他發(fā)現有道硬件詞典筆中,以前用戶(hù)都是掃一個(gè)詞,而現在則是掃一行句子,而有道的業(yè)務(wù)正是在這些細微的變化中被重構。
在周楓看來(lái),教育科技是個(gè)巨大的市場(chǎng),很多剛性需求下的細分場(chǎng)景都是巨大的業(yè)務(wù)盤(pán)。而大模型提供一個(gè)很大的機會(huì ),讓用戶(hù)以相對廉價(jià)的方式能買(mǎi)到不錯的教育服務(wù)。
2022年全國教育經(jīng)費執行情況統計公告顯示:2022年全國教育經(jīng)費總投入為61329.14億元,首次超過(guò)6萬(wàn)億元,比上年增長(cháng)5.97%。
除了直接面向C端用戶(hù)外,2023年有道與杭州拱墅區智慧教育達成了合作,有道團隊直接把應用內置到智慧教育系統中,這里的學(xué)生每天在學(xué)校就可以練15分鐘口語(yǔ)。
研發(fā)和推廣大模型應用這一年,周楓也總結了一些經(jīng)驗:
第一,即便大模型已經(jīng)在媒體上變成一個(gè)熱詞,但其實(shí)大部分中國人還沒(méi)有用過(guò)大模型產(chǎn)品,所以當開(kāi)發(fā)者產(chǎn)品做得非常精致,完成度非常高時(shí),用戶(hù)的接受度也非常高。
第二,英語(yǔ)口語(yǔ)類(lèi)產(chǎn)品,虛擬人非常有用。在此之前,有道曾開(kāi)發(fā)出一版無(wú)虛擬人的口語(yǔ)教練產(chǎn)品,但發(fā)現效果一般,最終有道決定聯(lián)合網(wǎng)易游戲團隊在產(chǎn)品中加入虛擬人形象。
第三,交互式的追問(wèn),以及基于語(yǔ)音和聊天的學(xué)習產(chǎn)品形態(tài),用戶(hù)非常需要,他們天然就喜歡這樣的產(chǎn)品形式。
大模型是個(gè)10年的事兒
除了是一名教育科技創(chuàng )業(yè)者外,周楓還是兩個(gè)孩子的父親。在ChatGPT和大模型火了之后,他現在逢家長(cháng)就問(wèn),你孩子學(xué)編程沒(méi)有,學(xué)計算機沒(méi)有?
在周楓看來(lái),如果小學(xué)二三四年級的學(xué)生,逐漸開(kāi)始能接受計算機時(shí),真的應該去體驗一下編程?!斑^(guò)去50年,社會(huì )所有行業(yè)中間給人類(lèi)社會(huì )發(fā)展帶來(lái)最大震撼的,基本就是信息產(chǎn)業(yè),它不斷帶來(lái)驚喜,每10年都有一個(gè)巨大變化?!敝軛鞅硎?。
與此同時(shí),他也開(kāi)始培養孩子的創(chuàng )造力和提問(wèn)的軟能力,他認為在未來(lái)這對每個(gè)孩子來(lái)說(shuō)都是越來(lái)越重要的。他也正逐漸將這樣的育兒觀(guān)念帶入到有道的產(chǎn)品中,比如堅決杜絕孩子們用AI工具作為抄作業(yè)的手段,保護孩子自主學(xué)習的精神。
在周楓看來(lái),大模型是個(gè)長(cháng)達10年的事兒,就像移動(dòng)互聯(lián)網(wǎng)是10年的事兒一樣?!半m然2007年就已經(jīng)出現iPhone,但直到2016年才出現抖音?!敝軛鲝娬{。
他認為,2024年大模型相關(guān)領(lǐng)域將會(huì )有三大機會(huì )點(diǎn):第一,超大模型肯定會(huì )成為一個(gè)國內大模型廠(chǎng)商爭奪的焦點(diǎn);第二,國內將會(huì )涌現一大批大模型原生應用;第三,端側將會(huì )得到廣泛應用。