理想汽車(chē)近期在自動(dòng)駕駛技術(shù)領(lǐng)域取得了重大突破,正式推出了其新一代技術(shù)——MindVLA大模型。這一創(chuàng)新成果在NVIDIA GTC 2025大會(huì)上首次亮相,隨即引起了廣泛關(guān)注。
據(jù)理想汽車(chē)介紹,MindVLA大模型集成了視覺(jué)、語(yǔ)言和行為三大智能,為機(jī)器人大模型樹(shù)立了新的標(biāo)桿。簡(jiǎn)而言之,MindVLA不僅能夠“看到”和“聽(tīng)到”,更重要的是它能夠“做到”,實(shí)現(xiàn)了感知與行動(dòng)的完美結(jié)合。
這一技術(shù)的推出,對(duì)于用戶(hù)和整個(gè)汽車(chē)行業(yè)都具有深遠(yuǎn)的意義。對(duì)于用戶(hù)而言,未來(lái)的汽車(chē)將不再僅僅是交通工具,而是能夠聽(tīng)懂指令、理解需求、提供幫助的“智能伙伴”。而對(duì)于汽車(chē)行業(yè),MindVLA的出現(xiàn)或?qū)⒁l(fā)一場(chǎng)出行方式的革命,正如當(dāng)年的iPhone 4重新定義了智能手機(jī)一樣。
理想汽車(chē)還透露,MindVLA大模型預(yù)計(jì)將于今年7月與理想i8車(chē)型同時(shí)首發(fā)。屆時(shí),配備AD Max系統(tǒng)的車(chē)輛將能夠享受到這一先進(jìn)技術(shù)帶來(lái)的便捷與智能。
針對(duì)網(wǎng)友關(guān)心的其他問(wèn)題,理想汽車(chē)也一一進(jìn)行了解答。對(duì)于現(xiàn)款車(chē)型是否支持MindVLA大模型的問(wèn)題,理想汽車(chē)表示,目前能夠運(yùn)行端到端+VLM大模型的車(chē)輛,后續(xù)也將支持更加強(qiáng)大的MindVLA大模型。
那么,MindVLA大模型與現(xiàn)有的端到端+VLM大模型有何不同呢?從技術(shù)層面來(lái)看,MindVLA將空間智能、語(yǔ)言智能和行為智能統(tǒng)一在一個(gè)模型內(nèi),使自動(dòng)駕駛系統(tǒng)能夠感知環(huán)境、思考并作出適應(yīng)。而在能力表現(xiàn)上,MindVLA加持下的汽車(chē)更像是一個(gè)智能助手,能夠與用戶(hù)溝通、理解用戶(hù)意圖,并執(zhí)行各種任務(wù)。
例如,在陌生車(chē)庫(kù)中,MindVLA能夠自主尋找車(chē)位并完成泊車(chē);它還能根據(jù)駕駛員的語(yǔ)音指令調(diào)整行駛速度或轉(zhuǎn)向;甚至在你發(fā)送給它地標(biāo)照片后,它也能按圖索驥找到目的地。可以說(shuō),有了MindVLA的汽車(chē),就像有了一個(gè)能聽(tīng)懂語(yǔ)音指令、看得見(jiàn)陌生地標(biāo)、并能在陌生環(huán)境中自主導(dǎo)航的專(zhuān)職司機(jī)。
針對(duì)網(wǎng)友關(guān)心的端到端和VLM更新速度問(wèn)題,理想汽車(chē)表示,這兩個(gè)模型將保持高速迭代,并持續(xù)推進(jìn)端到端+VLM的持續(xù)提升。
MindVLA大模型與理想汽車(chē)之前推出的MindGPT也存在一定的聯(lián)系。MindVLA作為下一代自動(dòng)駕駛核心架構(gòu),使用了MindGPT作為語(yǔ)言基座。這一設(shè)計(jì)繼承了MindGPT在語(yǔ)言理解與交互領(lǐng)域的優(yōu)勢(shì)能力,并針對(duì)自動(dòng)駕駛場(chǎng)景進(jìn)行了專(zhuān)項(xiàng)優(yōu)化。這也體現(xiàn)了智艙與智駕在功能層的協(xié)同創(chuàng)新。
對(duì)于MindVLA千人團(tuán)/萬(wàn)人團(tuán)何時(shí)內(nèi)測(cè)的問(wèn)題,理想汽車(chē)表示,具體內(nèi)測(cè)時(shí)間將以官方公布為準(zhǔn)。可以預(yù)見(jiàn)的是,隨著MindVLA大模型的逐步推廣和應(yīng)用,未來(lái)的智能出行將更加便捷、安全和舒適。