ChatGPT更被人熟知的身份是“會(huì)聊天的AI”,底層技術(shù)傳統(tǒng)上講屬于NLP領(lǐng)域。
但NLP大模型跨界應(yīng)用到視覺領(lǐng)域,早已有之。比如毫末智行一直提倡的Transformer大模型,最早就誕生于NLP領(lǐng)域。
ChatGPT大火,甚至被比爾蓋茨比喻成和互聯(lián)網(wǎng)誕生一樣重要。而一向追逐前沿AI應(yīng)用的毫末智行,如何把ChatGPT用在自動(dòng)駕駛上?
從ChatGPT到DriveGPT
毫末智行的自動(dòng)駕駛認(rèn)知大模型(人駕自監(jiān)督認(rèn)知大模型),正式升級(jí)為DriveGPT。
稍微解釋一下,毫末的自動(dòng)駕駛認(rèn)知大模型采用的是RLHF(人類反饋強(qiáng)化技術(shù))算法,通過不斷輸入真實(shí)人駕接管數(shù)據(jù),持續(xù)優(yōu)化自動(dòng)駕駛決策模型。
也就是說,毫末的這個(gè)模型在不斷學(xué)習(xí)千千萬萬個(gè)老司機(jī)的駕駛經(jīng)驗(yàn),進(jìn)而幫助模型自己能獨(dú)立做出最優(yōu)決策。
而ChatGPT之所以能成為“很會(huì)聊天的AI”,也是因?yàn)橛?xùn)練的時(shí)候使用了RLHF算法,利用人類知識(shí),讓模型能判斷自己的答案質(zhì)量,訓(xùn)練自己逐步給出更高質(zhì)量的回答。
目前,毫末智行已經(jīng)完成DriveGPT的模型搭建和第一階段數(shù)據(jù)跑通,現(xiàn)在的參數(shù)規(guī)??梢詫?duì)標(biāo)GPT-2的水平,大約7.74億。
ChatGPT的爆火也不過是這幾個(gè)月的事情,而毫末現(xiàn)在已經(jīng)有了能落地的進(jìn)展。
這樣的速度背后,其實(shí)是AI技術(shù)向超大規(guī)模數(shù)據(jù)、超大規(guī)模模型演變的大趨勢(shì)。
毫末智行的自動(dòng)駕駛模型中,其實(shí)早就應(yīng)用了和ChatGPT相同的模塊。
毫末智行的認(rèn)知決策算法
先看看毫末怎么迭代認(rèn)知決策算法的。
毫末這套認(rèn)知決策算法進(jìn)化分為三個(gè)階段:
第一個(gè)階段,引入個(gè)別場(chǎng)景的端到端的模仿學(xué)習(xí),直接擬合人駕行為;
第二個(gè)階段,通過認(rèn)知大模型,引入海量正常人駕數(shù)據(jù),通過Prompt的方式實(shí)現(xiàn)認(rèn)知決策的可控、可解釋;
第三個(gè)階段,也就是毫末認(rèn)知決策算法現(xiàn)在處于的階段,引入真實(shí)接管數(shù)據(jù),并在大模型中開始使用RLHF算法,讓模型學(xué)習(xí)人駕接管數(shù)據(jù)。
這其中第三個(gè)階段,就是和ChatGPT訓(xùn)練邏輯類似的階段,也是能引入這套模式的階段。
也就是說,當(dāng)毫末認(rèn)知決策算法通過擬合、學(xué)習(xí)人駕數(shù)據(jù),具有一定的駕駛決策能力后,毫末構(gòu)建了一套獎(jiǎng)勵(lì)規(guī)則(即獎(jiǎng)勵(lì)模型,reward model)。
在同一個(gè)駕駛環(huán)境下,如果人類駕駛行為和算法決策一致,不選擇接管,計(jì)為一個(gè)good case;如果人類司機(jī)接管了,就計(jì)為一個(gè)bad case。
通過把good case和bad case這種“好壞”的價(jià)值判斷模型引入算法訓(xùn)練,能夠進(jìn)一步讓算法做出更好的駕駛決策。
目前,毫末智行DriveGPT已經(jīng)進(jìn)入算法進(jìn)化的第二個(gè)階段,接下來就是第三階段:輸入大規(guī)模真實(shí)接管數(shù)據(jù),讓模型強(qiáng)化學(xué)習(xí)人駕數(shù)據(jù)反饋。
并且,毫末還會(huì)把DriveGPT作為云端測(cè)評(píng)模型,評(píng)估車端小模型的駕駛效果。
關(guān)于DriveGPT更多重要進(jìn)展,4月HAOMO AI Day上毫末會(huì)進(jìn)一步公布。
而毫末智行能實(shí)現(xiàn)這些目標(biāo),離不開背后強(qiáng)大的算力支持。
為什么是毫末智行
毫末在國(guó)內(nèi)應(yīng)該第一個(gè)明確提出自動(dòng)駕駛重感知輕地圖的技術(shù)路線。
去年行業(yè)的發(fā)展驗(yàn)證了毫末的先見之明。
ADAS系統(tǒng)盡量減少高精地圖信息的依賴,自然就要求車端的感知識(shí)別能力更強(qiáng)大。
在研發(fā)端來說,迭代這樣的大模型,需要更大的算力來支撐。
今年1月,在毫末舉辦的AI Day上,這個(gè)自動(dòng)駕駛量產(chǎn)公司宣布自建智算中心MANA OASIS。
通過和字節(jié)跳動(dòng)旗下火山引擎的合作,MANA OASIS算力可達(dá)0.67 EFLOPS(每秒6.7x1017次浮點(diǎn)運(yùn)算)。
智算中心不僅算力幾乎全部為自動(dòng)駕駛服務(wù),架構(gòu)也根據(jù)自動(dòng)駕駛的業(yè)務(wù)特性做出調(diào)整,計(jì)算、存儲(chǔ)和通信都具有很強(qiáng)的基礎(chǔ)能力。
并且,毫末MANA OASIS還支持千億參數(shù)的AI大模型的完整訓(xùn)練,收斂周期效率得到大大提升。
在AI Day上毫末還宣布了五大模型,除了上文提到的自動(dòng)駕駛認(rèn)知大模型(現(xiàn)在叫DriveGPT),還有視頻自監(jiān)督大模型、3D重建大模型、多模態(tài)互監(jiān)督大模型、動(dòng)態(tài)環(huán)境大模型,從數(shù)據(jù)、目標(biāo)識(shí)別準(zhǔn)確率、路徑預(yù)測(cè)規(guī)劃、整體乘坐體驗(yàn)等多個(gè)角度共同提升毫末自動(dòng)駕駛能力。
毫末自建超算,從技術(shù)層面解釋了為何它能成為第一個(gè)真正把ChatGPT相關(guān)技術(shù)真正在自動(dòng)駕駛領(lǐng)域應(yīng)用的玩家。
而從公司整體策略上,支撐毫末在研發(fā)端進(jìn)展迅速的條件,是它以自動(dòng)駕駛量產(chǎn)上車為核心目標(biāo)的整體戰(zhàn)略,以及背后長(zhǎng)城汽車每年百萬銷量的落地規(guī)模支持。
畢竟無論是NLP還是自動(dòng)駕駛,不斷獲取大規(guī)模低成本的數(shù)據(jù)獲取渠道,才是一切的基礎(chǔ)。
說了這么多,毫末智行的技術(shù),體現(xiàn)在乘用車上了嗎?
毫末NOH,已經(jīng)量產(chǎn)上車。
今年毫末智行的目標(biāo)是實(shí)現(xiàn)城市NOH大規(guī)模量產(chǎn)上車,即在城市內(nèi)實(shí)現(xiàn)能自動(dòng)識(shí)別紅綠燈、人車混行場(chǎng)景,大部分時(shí)間不用人類駕駛的高階智能駕駛功能。
在明年,毫末城市NOH預(yù)計(jì)會(huì)在國(guó)內(nèi)100個(gè)城市落地。
免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: