要點:
1、首次用語言模型作為輔助駕駛,用描述的方式來控制行動軌跡
2、Co-Pilot人機交互框架能完美把控乘客意圖
3、大語言模型在自動駕駛領(lǐng)域進一步深入應(yīng)用的可能性
站長之家(ChinaZ.com) 11月8日 消息:近日,清華大學(xué)、中國科學(xué)院、MIT的科研人員聯(lián)合研究人員對于大語言模型在人機交互領(lǐng)域中的應(yīng)用進行了研究,設(shè)計了一種名為Co-Pilot的人機交互框架。該研究首次嘗試用語言模型作為輔助駕駛,以描述的方式來控制行動軌跡,同時能夠符合用戶的軌跡意圖。此舉揭示了大語言模型在自動駕駛領(lǐng)域進一步深入應(yīng)用的可能性,也為后續(xù)相關(guān)研究指明了方向。
論文地址:https://www.researchgate.net/figure/Co-Pilot-for-path-tracking-control-The-system-consists-of-three-modules-the-Reference_fig2_374800815
人車交互作為智能汽車發(fā)展的重要功能之一,對降低司機駕駛負擔(dān)、提升乘客出行體驗有很大幫助,相關(guān)功能也成為了消費者在選擇時的重要標(biāo)準(zhǔn)。在此前提下,Co-Pilot人機交互框架的應(yīng)用能夠完美把控乘客意圖。大語言模型具有理解說話者真正意圖的能力,并得益于大量訓(xùn)練數(shù)據(jù)中的知識,具有一定的常識,通過調(diào)整提示詞,對不同任務(wù)具有很好的適應(yīng)性,極大提升了應(yīng)用與落地的效率。因此,大語言模型為解決人機共駕問題提供了一種新的思路。
為了驗證Co-Pilot架構(gòu)的可行性,研究人員設(shè)計了兩個不同種類的任務(wù)進行測試,實驗效果達到了預(yù)期。另外,Co-Pilot架構(gòu)的記憶機制能夠提升信息利用效率。通過更新記憶中的內(nèi)容來增強提示詞,使得大語言模型進行少樣本學(xué)習(xí)。因此,Co-Pilot架構(gòu)在自動駕駛?cè)藱C交互領(lǐng)域的應(yīng)用具有可行性和有效性。
研究人員通過在仿真平臺中開展實驗,得出了驗證結(jié)果。實驗結(jié)果表明,情景記憶在相似任務(wù)中對Co-Pilot的推理最有幫助,使其可結(jié)合人類意圖給出合理的反應(yīng)。調(diào)優(yōu)后的提示模式在更復(fù)雜的實驗中也取得了良好效果。提示中不同記憶的組合,對于大語言模型的表現(xiàn)有著顯著的影響。這表明了Co-Pilot架構(gòu)在自動駕駛?cè)藱C交互領(lǐng)域具有良好的應(yīng)用前景。
(舉報)