☰

理想汽車李想：電動化是入場券，L4纔是決勝關鍵

鳳凰網科技訊 12月26日，今天是理想汽車李想AI Talk直播的第二天，理想汽車董事長李想、智能駕駛研發副總裁郎鹹朋圍繞着2024年理想智能駕駛發生的變化與主持人進行了深度交流。

此前李想不滿智駕推進速度，警告郎鹹朋若看不到變化、拿不到頭部位置將面臨崗位調整，促使團隊迴歸用戶體驗與產品價值，加速端到端預研。郎鹹朋回憶首次試駕端到端車輛，從中關村到北京交通大學，十幾天訓練成果驚豔，縱向操控超以往，系統靠數據訓練，無需複雜規則編寫。

去年未推端到端技術，因數據、算力不成熟。今年初，AD Max 車型數據量達 10 億公里左右，算力達 5EFLOPS，加上預研成果具備條件。理想選純數據驅動端到端模式提升性能上限，結合 VLM 應對未知場景，有別於特斯拉。

硬件上，李想指出中國路況複雜，夜間有尾燈壞的貨車，攝像頭無光可視距離僅100 米出頭，激光雷達可達200米，能實現130公里/小時AEB自動緊急制動，保障安全，後續車型繼續配備。

市場反饋，今年智能駕駛助力理想汽車銷量，2月AD Max交付量佔比20%左右，下半年超50%。郎鹹朋稱早期自動駕駛像普通功能，如今端到端+VLM 緩解駕駛疲勞，綜合MPI提升，用戶願買單。理想提出有監督智能駕駛，區別於傳統分級，是L4先導，用系統1+系統 2方案讓自動駕駛學習成長，實現規模效應。目前交付全場景一體化端到端產品，近期還將推送高速城市全場景升級及AI推理可視化交互。郎鹹朋預計2025年有望實現L3自動駕駛。

面對競爭，李想認爲電動化是入場券，L4纔是決勝關鍵。當下內卷，理想爲拿L4“門票”，需500萬輛上路車、掌握VLA基礎模型能力、有資金招募人才與配備算力。他堅信滿足條件能打造如蘋果般公司。

以下爲直播對話實錄：

理想智駕一號位的職業危機

張小珺：聽說李想對智駕發了很大的火，你怎麼還能留在這？

郎鹹朋：當時想哥說了一句很狠的話，他說郎博下半年如果我還看不到變化，咱們還是拿不到頭部位置的話，那你這個負責人就可以不用幹了。

張小珺：那次發火完之後達成了什麼結果？

郎鹹朋：我覺得大家就回歸的是體驗和用戶價值，重新把大家的思路聚攏了。我們是給用戶做一個有更好體驗、更安全、更便捷的產品，而不是說做一大堆什麼從指標上看起來挺好的產品。那次所有人心裡邊又重新回到從產品出發去做智能駕駛，這是我覺得印象最深的一點。

張小珺：你們是那次之後開始轉的端到端嗎？

郎鹹朋：其實在想哥發火之前，我們內部的這個端到端的預研，已經在開展了。那麼從那一刻開始，我們端到端的速度就加快了。

張小珺：第一次試駕端到端是什麼樣的體驗？

郎鹹朋：我第一次試到這個車，從中關村開到了北京交通大學。開了幾公里我就問旁邊的賈鵬，這是規則還是怎麼做的？怎麼我覺得開得這麼好呢？他說一句規則都沒寫，全都是系統按照咱們給它的數據自己訓練出來的。

咱們開車都知道，如果前面有個車剎停的話，它是要緩慢減速，甚至還再擡起一點剎車，有這樣非常舒適的剎車過程。這個過程我們團隊在規則階段寫了很長時間的代碼，都沒有達到一個完全擬人、解決所有場景的表現。

但我第一次試駕端到端，它的縱向就已經比之前試過所有的都要好的狀態，這才用了短短不到15天。所以我覺得那時候建立了一個信心，就是端到端一定能做出來。而且一旦它做出來，就一定會比現在所有的智能駕駛軟件都要好。

張小珺：既然端到端是靈丹妙藥，爲什麼去年不上？特斯拉去年就上了，你去年在幹嘛？

郎鹹朋：我們在等，等足夠的數據和算力，等到了我們就能上了。

端到端 VLM大模型其實最終的本質是用人工智能來做自動駕駛。人工智能的三個要素：算法、數據和算力。這三個要素必須全都齊備。我們是今年是準備好了，所以我們能做這個事情。

理想AD Max 車型的銷量，去年起來了之後到今年初（高質量訓練）數據量達到10億（公里）左右規模，這是一個基礎。第二是算力基礎，今年初我們算力也到了5EFLOPS。再加上第三步，就是端到端的一些預研也有一定成果，所以到今年初是天時地利人和，可以做這個事情了，去年我們還在補課的一個過程。

張小珺：爲什麼很多企業的端到端是兩個模型，而不是One Model？

郎鹹朋：這個是算法和理念的問題。我們要做端到端時就給自己定了一個目標，一定要用純數據驅動的方式來做這件事情，而不是結合了之前的規則來做，所以說它的性能上限會非常高。

張小珺：爲什麼理想是端到端+VLM，不像特斯拉只用端到端？你們對自己的端到端不夠自信嗎？

郎鹹朋：不能這麼講，我們在做技術方案時充分參考了世界上所有的先進方案，但始終無法解決一個問題是，當一套自動駕駛或智能駕駛系統，它工作時如果遇到之前沒有見過的場景，應該怎麼處理？我們認爲就是端到端+VLM，就是系統1+系統2的方式，很好地模仿人類大腦的工作方式。

張小珺：如果智駕一號位想要推動智能駕駛的投入，老闆會成爲阻力嗎？

郎鹹朋：沒有，反而李想一直在催促我：郎博，咱們自動駕駛怎麼還是慢了？趕緊加快速度！

李想：要麼就做端到端，要麼就不再做自動駕駛。

張小珺：特斯拉沒有用激光雷達，你們爲什麼要用？

李想：很多人不太理解說：爲什麼要保留激光雷達，還是爲了安全。是不是因爲你技術不好？不是，中國和美國是不一樣的，如果你經常在中國晚上夜路開車，你會看到有尾燈壞了的大貨車、甚至可能尾燈壞的大貨車會直接停在主路上，至少我們今天的攝像頭，能夠在深夜裡沒有光線下看到的距離，其實只有100米出頭。

但是激光雷達，在沒有任何光線的情況下是可以看到200米的。這就可以幫助我們實現130公里/小時的AEB自動緊急制動。那我覺得這個是非常重要的，因爲我們是個面向家庭的車，每個人生命安全都非常的重要，所以這是我們繼續保留激光雷達根本所在。而且後邊的車型仍然會保留。我相信如果馬斯克在中國，在深夜裡不同的高速開過車，他也會選擇把前面的一顆激光雷達保留下來。因爲特斯拉對於安全同樣地重視，只是他要在這個環境裡來看到。

張小珺：理想激進的用只有一個模型的端到端，其他車企還在用兩個模型，爲什麼？

李想：很多時候可能跟我們有一些比較好的外腦有關，像王興、陸奇博士，他們會給我們帶來很多啓發。有一次陸奇博士跟我們講，你們應該思考一下人是怎麼工作的？我覺得這個當時對我們幫助很大。

今年初我還逼着智駕團隊去美國，他們在不同的城市開FSD V12。另一方面我們研究工作也在進行，那時已經在發端到端+VLM的各種研究論文了。回來以後我覺得要麼你做這個，要麼我們就不要再做自動駕駛了。今天你靠這些規則上來做的，跟請個供應商做出來的東西有啥區別？沒有啥區別。

我說服郎博他們很重要的一點，我說你們經常解決了一個Corner Case（極端情況），又出現三個其他的Corner Case。你們一輩子都在解決Corner Case，解決不完。

張小珺：所以其他人不轉，是因爲他們Corner Case解決得比你們好？

李想：有些企業Corner Case確實解決得比我們好，因爲他會招很多的人，5倍、10倍的人，然後一個路口一個路口去解決。不但解決規則算法的Corner Case，甚至還自己有地圖，去修地圖的Corner Case。

張小珺：過去兩年在人工智能上，你有什麼哇塞Moment嗎？

李想：ChatGPT 肯定是了，其次我們內部還是有很多“哇塞”的。一個印象最深的是，我們決定啓動端到端並匹配好資源，準備好200人團隊，他們訓練了幾十版模型，第一版放到車上，當時郎博讓我們來試，我跟張穎（經緯中國合夥人）在北京研發總部正好就一起試了。張穎坐主駕我坐副駕，當時我就很驚訝：這一個月的訓練，比過去三年做的東西，進步速度要快！

張穎之前試過無圖NOA，當他試到端到端時發現這跟人很相似，甚至在一個路口，旁邊有輛車爲了躲行人往我們這邊躲時，這個車也適時地避讓了。他問爲什麼能躲那麼快？我說端到端響應速度快了好幾倍，因爲他是個One Model，而不是經過4個步驟。

我們下一個大版本更新時，用戶可以在車上直接很清楚地看到端到端的工作方式是什麼樣的，視覺語言模型工作方式是什麼樣的，以及人工智能到底是怎麼工作的。

有監督智能駕駛不是L2的延續，而是L4的先導。

張小珺：大家都說理想做智駕是投入最晚最慢的，你怎麼看？

郎鹹朋：2018年1月我加入理想時，跟李想討論過這個問題。什麼纔是決定最終智能駕駛或自動駕駛實現的最關鍵因素？我們當時聊的就是數據。人才可以流動、算法可以提升、算力也非常重要，但是隻要有健康的資金、合理的資金使用也是能買得到的。

那麼最重要就是數據，數據它是買不到的，必須自己有這樣一個非常高質量、規模非常大的數據，纔可以做好自動駕駛。所以我們要按照節奏來做自動駕駛，剛開始我們要先把車造好、把車賣好，然後積累更多的資金、人才和數據，到了一定時間點再大量投入，去達到更好的自動駕駛的效果。其實從現在結果上也是能看出這一點的：我們自動駕駛的節奏是非常好的。

張小珺：什麼時候理想意識到，智駕對於賣車是有幫助的？

郎鹹朋：從實際表現來看是從今年開始的，今年智能駕駛確實對於銷量有非常好的促進作用。我們2月AD Max的交付量佔比只到20%左右，然後到今年下半年超過50%了，這是實打實的業績。早期大家認爲自動駕駛是一個功能，它跟座椅加熱沒有大的區別，並沒有解決用戶日常出行的舒適性。直到現在我們用AI來做自動駕駛，端到端+VLM真正解放用戶長時間的駕駛疲勞。當我們能達到綜合MPI（城市+高速綜合接管里程）100公里、幾百公里時，大家就真正願意爲自動駕駛買單了。

張小珺：理想提出有監督智能駕駛，跟自動駕駛L1到L5傳統分級有什麼區別？

郎鹹朋：這裡面其實體現我們對自動駕駛研發的思路差別。之前很多人認爲L3自動駕駛是L2輔助駕駛的延續，只要把L2輔助駕駛的場景越做越多，總有一天能無限趨近於L3，甚至可能就能夠做到L3。

但在我們看來，L3或者有監督智能駕駛，它並不是L2的延續，而是L4或者自動駕駛的先導程序。實際上我們是錨着未來的自動駕駛能力去研發、去成長和迭代的，而不是沿着過去一套用L2的思路，去做現在的自動駕駛。

張小珺：你說自動駕駛是能力、輔助駕駛是功能，兩者本質區別是什麼？

郎鹹朋：功能是預設條件，能力是應對所有條件。你不可能窮盡所有的預設。

功能的話，還是用上一代的這種軟件1.0方案來做自動駕駛。最大的問題是在研發之初，就要清晰地設定所有條件、所有邊界，以及最終確定性的結果。這在自動駕駛裡是非常困難的。

能力的話，是用人工智能的方式來做自動駕駛。當我們把自動駕駛當成能力來開發，從最本質思考人是怎麼學會開車的。最開始人去駕校學習，掌握基本駕駛技能再考試。考完掌握基本能力之後，作爲實習司機一邊實踐一邊提升能力，慢慢地成長爲老司機。我們系統1+系統2的方案，讓自動駕駛系統擁有這種能力去迭代和成長，隨着數據量的增長，它會慢慢地讓性能隨之提升，這個就是大家經常說的規模效應。

張小珺：你們驗證了自動駕駛的規模效應嗎？

郎鹹朋：我們已經驗證出來了。這不是我們發明的，所有的大模型應用都符合這種規律，也就是說數據規模和數據質量的增長，會帶動性能的增長。而且性能增長是接近於線性的，這就是我們用大模型最本質的好處。

張小珺：有監督智能駕駛階段，理想交付給用戶的產品長什麼樣？

郎鹹朋：全場景的、一體化端到端產品。要想實現有監督智能駕駛，一個前提是實現車位到車位，也就是解決最前面一百米和最後面一百米。以前智駕是從幹道開始，現在可以從小區車位開始，然後包括園區道路、泊車、城市道路，還有高速和收費站ETC都會全部打通。

高速城市全場景升級端到端+VLM，以及創新的AI推理可視化的交互，將在近期隨OTA全量推送給所有的AD Max用戶。

張小珺：L3什麼時候實現？

郎鹹朋：按照現在的端到端+VLM這套體系，能力繼續迭代的話，我們是有希望在2025年去實現L3的。

張小珺：面對李想年初對於智駕的發火，你的職業危機是什麼時候解除的？

郎鹹朋：我覺得到現在還沒解除，因爲還沒有做到極致。我們的目標是今年綜合MPI（城市+高速綜合接管里程）做到100公里接管一次的能力。這個接管不是安全接管，不是說你要撞車了才接管，是用戶覺得車開得不符合體驗、不舒服的接管。到明年、後年，我們會逐漸提升至500公里、甚至1000公里以上。慢慢讓大家對智駕越來越自信、越來越依賴。

張小珺：要實現這樣的目標，需要儲備多少算力和數據？

郎鹹朋：要達到500公里的綜合MPI（城市+高速綜合接管里程），預計需要2000萬Clips（視頻片段）的水平。如果2000萬Clips從不到5%的老司機去篩選，這裡隱含的數據量，要達到50億公里甚至上百億公里的水平。

電動車這場仗什麼時候能分出勝負手？

張小珺：你現在開車智能駕駛佔比是多少？

李想：大概80%左右。

張小珺：剩下的20%是因爲你們技術不夠行嗎？

李想：最主要是我趕時間。

張小珺：端到端是自動駕駛的制勝法寶嗎？

李想：我覺得端到端只能解決L3，解決不了L4。

張小珺：什麼時候可以100%用自動駕駛？

李想：給我三年的時間，它需要技術到位，也需要產品到位，也需要一些環境和政策到位，也需要消費者對於人工智能的信任到位。

張小珺：電動車這場仗什麼時候能分出勝負手？

李想：現在中國的汽車仍然非常內卷。電動化和智能化是兩場仗，電動化其實是相當於是一張門票，我認爲L4會分出來真正的勝負。但是我們今天在做的所有事情，是爲了L4拿門票，因爲L4所需要花的錢，所需要擁有的能力，所需要的數據量，是今天所不具備的，所以今天大家要靠這個東西去拿L4的門票。

張小珺：拿L4的門票需要什麼條件？

李想：足夠多的車跑在路上。

張小珺：多少車？

李想：得500萬輛以上。第二你要真的自己掌握VLA（視覺語言行動模型）這個基礎模型的能力。第三，你要有足夠多的錢去招募最頂級的人才，以及足夠的算力，有這三個條件。

張小珺：當滿足這些條件且做到足夠優秀時，能做出一家像蘋果這樣的公司嗎？

李想：一定會的，一定會的。

理想汽車李想：電動化是入場券，L4纔是決勝關鍵

相關資訊