據(jù)外媒報道,中國北京大學(xué)(Peking University)與清華大學(xué)(Tsinghua University)的研究人員發(fā)表了一篇論文,介紹“用于駕駛的生成式預(yù)訓(xùn)練版本1(Generative Pre-training for Driving version 1,GPD-1)”的創(chuàng)新框架,旨在提升自動駕駛系統(tǒng)的能力。該方法對各種駕駛場景進(jìn)行建模,以簡化場景生成、運動規(guī)劃和交通仿真等任務(wù),從而提升自動駕駛車輛預(yù)測和模擬各種駕駛條件的能力。利用分層位置編碼和矢量量化自動編碼器等先進(jìn)創(chuàng)新技術(shù),GPD-1實現(xiàn)了此次技術(shù)集成。

GPD-1(圖片來源:azoai.com)
自動駕駛技術(shù)領(lǐng)域的進(jìn)展
近年來,自動駕駛領(lǐng)域取得了顯著進(jìn)展,主要歸功于人工智能(AI)和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步。傳統(tǒng)方法通常孤立地處理駕駛場景的特定方面,例如地圖生成或運動預(yù)測。然而,由于駕駛環(huán)境中各種實體間互動的復(fù)雜性,將此類組件整合至一個統(tǒng)一的框架中仍面臨著挑戰(zhàn)。不過,通過利用大型數(shù)據(jù)集高效模擬和預(yù)測駕駛場景,研發(fā)生成式模型,特別是自回歸變壓器架構(gòu),提供了有發(fā)展前景的解決方案。
GPD-1:研發(fā)一個統(tǒng)一的生成式模型
在該篇論文中,研究人員介紹了GPD-1,一款旨在整合自動駕駛場景演變各個方面的模型。該框架采用標(biāo)記來代表駕駛場景,其中包含自主車輛(ego vehicle)、代理和地圖元素。利用一個自回歸變壓器,該框架能夠按序處理此類標(biāo)記,捕捉時間依賴性與空間關(guān)系,為駕駛場景提供強(qiáng)大的表示。此外,利用場景級注意力機(jī)制,可進(jìn)一步促進(jìn)幀內(nèi)各標(biāo)記之間的細(xì)微互動。
為了編碼空間和時間信息,研究人員為自主車輛和代理標(biāo)記研發(fā)了一款分層位置編碼器,融合了二維(2D)位置和朝向信息。對于地圖標(biāo)記,采用矢量量化自動編碼器(VQ-VAE)將自主車輛為中心的語義地圖壓縮成離散標(biāo)記,有效降低復(fù)雜度,同時保持空間精確度。此種創(chuàng)新設(shè)計讓GPD-1能夠在交通仿真、場景生成、閉環(huán)仿真、地圖預(yù)測和運動規(guī)劃等任務(wù)中進(jìn)行歸納,無需額外微調(diào)。
該模型在龐大的nuPlan數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練,其中涵蓋從多個城市環(huán)境中收集的超1300小時的駕駛數(shù)據(jù),包括交叉路口和環(huán)島等復(fù)雜場景。該數(shù)據(jù)集為評估該模型在實際環(huán)境中的表現(xiàn)提供了堅實基礎(chǔ)。
關(guān)鍵發(fā)現(xiàn)與見解
本研究驗證了GPD-1模型在無需額外微調(diào)的情況下,歸納各種自動駕駛?cè)蝿?wù)的有效性。在場景生成方面,該模型可通過生成代理、地圖和自主車輛信息,無縫初始化場景。在交通仿真方面,基于初始代理狀態(tài)和實際地圖,該模型準(zhǔn)確預(yù)測了交通動態(tài)演變情況,體現(xiàn)了其在動態(tài)環(huán)境中的適應(yīng)能力。
此外,該模型在運動規(guī)劃方面表現(xiàn)出色,利用有關(guān)周圍代理和地圖的信息,為自主車輛生成了高精度的軌跡。值得注意的是,GPD-1在定量評估指標(biāo)上取得了成功,即平均位移誤差(Average Displacement Error,ADE)、最終位移誤差(Final Displacement Error,F(xiàn)DE)及碰撞率,充分展現(xiàn)了其安全性與精準(zhǔn)度。此類成果表明,GPD-1在多個下游任務(wù)中達(dá)到了領(lǐng)先的性能,特別是在運動規(guī)劃方面,能夠超越現(xiàn)有的方法。
該實驗進(jìn)一步表明,GPD-1在仿真中維持了較低的碰撞率,確保在動態(tài)駕駛場景中的安全性。其在遵循交通規(guī)則和法規(guī)的同時,穩(wěn)健地管理了多個代理間的交互。通過精準(zhǔn)預(yù)測未來場景演變及代理的移動,GPD-1代表了自動駕駛技術(shù)的一項重大發(fā)展。
GPD-1的實際應(yīng)用
GPD-1對推動自動駕駛系統(tǒng)發(fā)展具有重大意義,其能夠基于最少的初始輸入信息生成真實的駕駛場景,是訓(xùn)練和評估自動駕駛技術(shù)的寶貴工具。
在交通仿真中,GPD-1有效評估了復(fù)雜環(huán)境中的車輛互動,對研究人員和開發(fā)人員測試各種駕駛條件提供了極大的價值。其運動規(guī)劃能力為傳統(tǒng)方法提供了一種數(shù)據(jù)驅(qū)動型替代方案,實現(xiàn)了精確的軌跡預(yù)測。閉環(huán)仿真得益于GPD-1能夠基于實時自主車輛數(shù)據(jù),動態(tài)調(diào)整代理的軌跡,從而提升了仿真的真實性和安全性。此種適應(yīng)性也有望提升自動駕駛系統(tǒng)的安全性和可靠性,特別是在城市環(huán)境。
結(jié)論與未來發(fā)展方向
綜上所述,GPD-1模型標(biāo)志著向完全集成且可解釋的自動駕駛框架邁進(jìn)了重要一步。通過將駕駛仿真的各個方面整合成一個連貫的系統(tǒng),其克服了傳統(tǒng)方法的局限性,為真實且具有適應(yīng)性的駕駛仿真提供了一個靈活且強(qiáng)大的解決方案。
未來,研究人員的重點應(yīng)該關(guān)注提升該模型在處理新代理進(jìn)入視野時的預(yù)測準(zhǔn)確性,由于缺乏輸入數(shù)據(jù),此項任務(wù)已成為一項挑戰(zhàn)。為此,在特定數(shù)據(jù)集上進(jìn)一步進(jìn)行微調(diào)或集成自適應(yīng)性學(xué)習(xí)機(jī)制,有望提升該模型在動態(tài)、復(fù)雜環(huán)境中的性能表現(xiàn)。此外,集成實時數(shù)據(jù)處理和自適應(yīng)學(xué)習(xí)機(jī)制還可以進(jìn)一步提升其在復(fù)雜駕駛環(huán)境中的可適應(yīng)性。總體而言,GPD-1為推動自動駕駛技術(shù)發(fā)展奠定了基礎(chǔ),為該領(lǐng)域的持續(xù)創(chuàng)新與重大發(fā)展鋪平了道路。