在理想汽車的最新活動中,AItalk系列迎來了第二集,李想在這一集中深入探討了VLA(視覺語言行動模型)的概念。
李想提到,VLA在機器人領域同樣備受關注,但對于理想汽車而言,它有著獨特的定義。理想汽車將VLA視為一個“司機大模型”,一個能夠像人類司機一樣執行任務的智能系統。
李想強調,VLA的實現并非一蹴而就,而是一個逐步進化的過程。他分享了VLA發展的第一個階段,即從2021年開始,理想汽車利用機器學習技術進行感知,并結合后續的規則算法,包括規劃、控制、執行等模塊,這些模塊分段式地協同工作。
為了更形象地說明這一點,李想打了一個比方,將這一階段的智能比作昆蟲動物的智能。他指出,這種智能依賴于既定的規則和高精地圖,就像螞蟻通過特定的路徑和任務分配來完成工作一樣。
李想進一步解釋,雖然這一階段的智能還相對基礎,但它為VLA的未來發展奠定了堅實的基礎。隨著技術的不斷進步和算法的持續優化,理想汽車期待VLA能夠逐漸進化到更高層次的智能,最終實現像人類司機一樣靈活、高效地執行任務。