
最近,“端到端”在車(chē)圈火了!特斯拉基于“端到端”的FSDV12(完全自動(dòng)駕駛)方案形成的標桿示范效應,疊加入華傳聞,帶動(dòng)“蔚小理”等車(chē)企和華為、地平線(xiàn)等服務(wù)商紛紛轉向,加碼端到端自動(dòng)駕駛技術(shù)。
所謂“端到端”,其實(shí)是來(lái)自深度學(xué)習中的概念,英文為“End—to—End(E2E)”,指通過(guò)一個(gè)AI模型,只要輸入原始數據就可以輸出最終結果。應用到自動(dòng)駕駛領(lǐng)域,意味著(zhù)只需要一個(gè)模型,就能把攝像頭、毫米波雷達、激光雷達等傳感器收集到的感知信息,轉換成車(chē)輛方向盤(pán)的轉動(dòng)角度、加速踏板的踩踏深度以及制動(dòng)的力度等具體操作指令,讓汽車(chē)實(shí)現自動(dòng)駕駛。用小鵬汽車(chē)創(chuàng )始人何小鵬的說(shuō)法,表現得“很絲滑”,更像“人類(lèi)司機駕駛”。
此前,市面上絕大部分自動(dòng)駕駛系統為傳統模塊化方式,即一個(gè)人工和智能兩分天下的混搭系統:感知依靠神經(jīng)網(wǎng)絡(luò ),規劃控制則使用人類(lèi)手動(dòng)設計的算法。這一系統的好處在于分工明確,發(fā)現缺陷便于分模塊檢查、解決。但問(wèn)題是,這種模塊化的自動(dòng)駕駛系統在相對簡(jiǎn)單的駕駛任務(wù)上表現不錯,而在復雜的駕駛任務(wù)面前,其天花板顯而易見(jiàn)。就算是號稱(chēng)遙遙領(lǐng)先的城市高階智駕功能,依然會(huì )有機械感,也會(huì )在匯入快速路、通過(guò)大型路口時(shí)宕機。
考慮到自動(dòng)駕駛的核心挑戰是解決無(wú)窮無(wú)盡的邊緣場(chǎng)景,以有限人力解決無(wú)限長(cháng)尾問(wèn)題的成本和時(shí)間難以估量,數據化、模型化成為必然趨勢。不過(guò),端到端,同樣是一個(gè)需要老師傅精心打磨的高難度技術(shù)活。
一方面,端到端需要海量高質(zhì)量數據“投喂”訓練。與大語(yǔ)言模型可以在互聯(lián)網(wǎng)上爬取海量文字數據用于訓練不同,端到端智駕需要的視頻數據獲取成本和難度極高。以特斯拉為例,目前其FSD累計學(xué)習的人類(lèi)駕駛視頻片段超過(guò)2000萬(wàn)個(gè),而這一規模的數據僅采集成本就需要50億元至80億元。
另一方面,端到端需要強大算力的支持。自動(dòng)駕駛涉及激光雷達、圖像感知以及V2X車(chē)路協(xié)同等技術(shù)與解決方案。強大的算力不僅有利于實(shí)時(shí)處理海量數據,降低數據傳輸延遲,還可更好地支持面向智慧城市、智慧交通、高級別自動(dòng)駕駛等全場(chǎng)景。然而,華為車(chē)BU、百度極越、蔚來(lái)、理想、吉利、長(cháng)城、小鵬等國內企業(yè)算力增長(cháng)目前均面臨較大瓶頸。
問(wèn)題還在于,算力與數據的制約又會(huì )顯著(zhù)影響算法的發(fā)展。雖然國內學(xué)術(shù)界提出的端到端自動(dòng)駕駛模型UniAD斬獲2023年CPVR最佳論文獎,為國內企業(yè)提供了可以參考的方向,但是在開(kāi)環(huán)驗證體系、小體量樣本數據下開(kāi)發(fā)的UniAD,上車(chē)還需要一定時(shí)間的工程化改造和大規模數據訓練。
此外,端到端會(huì )同時(shí)放大自動(dòng)駕駛系統的上限與下限。因為端到端構建的是一個(gè)神經(jīng)網(wǎng)絡(luò )黑箱,在獲取更高上限的過(guò)程中讓渡了一部分傳統模塊方案具備的可解釋性。如何在自動(dòng)駕駛系統中保留可解釋性,將那些不應被逾越的規則,比如別闖紅燈,表征到神經(jīng)網(wǎng)絡(luò )中去,保證端到端能安全地落地應用、進(jìn)化,也將是規控工程師們的重要課題。
攀登珠峰有兩條路線(xiàn):一條是中國西藏的北坡,另一條是尼泊爾的南坡。不管選擇從南坡還是從北坡攀登,最終都將到達同一個(gè)頂峰。這與當前自動(dòng)駕駛的發(fā)展路徑有相似之處。雖然現在還很難判定端到端就是自動(dòng)駕駛的最優(yōu)解或最終解,但這并不妨礙企業(yè)創(chuàng )新探索。畢竟端到端能夠比傳統模塊化方式更好地處理極端案例,并且代表了一種減少人工編碼依賴(lài)的更高效的思路?;谶@個(gè)路徑,或許自動(dòng)駕駛能夠通往更高階段。(本文來(lái)源:經(jīng)濟日報 作者:楊忠陽(yáng))