封閉走不好汽車智能化
本報記者 尹麗梅 張碩 北京報道
“繼電動化之後,汽車行業已經進入全面智能化的時代。這個‘全面’指的是智能化的發展速度可能會遠遠快於電動化的發展速度,未來的1~2年很可能不會存在不智能的汽車。”
近日,在“大軍山·智能汽車科技大會(2024)”上中國電動汽車百人會副理事長兼秘書長張永偉對包括《中國經營報》在內的記者表示,汽車智能化在短短兩到三年內迅速發展,已經進入到了比較理性的發展階段。
工業和信息化部披露的數據顯示,今年上半年,中國乘用車L2級輔助駕駛及以上新車滲透率達到 55.7%,其中具備領航輔助駕駛(NOA)功能的新車滲透率達到11%,預計全年智能網聯汽車銷量將超過1700萬輛,滲透率超過60%,各家車企在智能化技術上加大投入,加快推動高階智駕和大模型技術普及應用。
自動駕駛對於數據的需求非常旺盛,車企需要有更多的數據去持續迭代自動駕駛模型。然而,就我國而言,在自動駕駛領域車企對於數據的採集和處理卻存在數據採集難以形成規模、長尾場景難覆蓋、採集成本高、效率低等痛點。業內認爲,推動數據共享是“破題之鑰”。
數據共享可以降低採集成本
智能駕駛是汽車下半場的競爭焦點。近兩年,人工智能、大模型的爆發,讓智能網聯汽車的開發,由原來基於規則的驅動變成了由數據驅動。在這一轉變之下,高質量數據成爲訓練模型至關重要的要素。
然而,需要面對的現實是,智能駕駛數據特別是高質量的數據獲取並不容易。
北京愷望數據科技有限公司(以下簡稱“愷望數據”)CTO李斌在大會上表示,特斯拉在全球擁有超過200萬輛私家車進行“全場景、全時段”進行數據的採集,使其能以更低成本獲取海量、多樣化的駕駛數據。然而,國內車企能夠進行數據採集的車輛規模相對不足,而且國內只能在特定區域和路況下進行採集,並且進行數據採集需要具備相關資質,這使得我國自動駕駛數據要上到一定的規模非常難。
與此同時,隨着業務的發展,自動駕駛對於數據的需求量呈現指數級增長,數據採集的預算也將隨之增長,要採集高質量的自動駕駛數據將面臨成本增長的阻力。
“比如說,40萬幀的數據需求量,採集時間大概需要40周,數據加工時間大概也要80周,總花費成本將達到500多萬元左右。”李斌認爲,如果讓數據流通起來,在共享模式下,一部分數據由企業獨立採集,另一部分採用其他車廠或供應商採集的類似數據,就可以達到數據採集以及加工時間減半的效果,同時成本也會降下來。
如若數據能夠流通和共享的話,不僅可以實現更低的採集成本,李斌認爲,還將能提高自動駕駛的訓練迭代頻次,而更快的訓練頻次將使車企的模型能夠得到更好的訓練。
目前,行業內各車企、自動駕駛公司將數據視爲核心資產,往往不願共享,這一心理使得行業內“數據孤島”現象嚴重。
然而,自動駕駛系統需要大量場景多樣性的數據來訓練和優化模型。數據共享不僅可以降低重複採集和處理的成本,還可以擴大樣本空間,幫助解決“長尾問題”,提升模型在極端場景下的泛化能力和可靠性。
業內有觀點認爲,只有通過數據共享構建開放的合作生態,才能推動智能駕駛技術走向成熟,並實現全球範圍內的規模化應用。
探索已在路上
實際上,打破數據流通壁壘、突破自動駕駛算力發展瓶頸,已經成爲行業共性話題。
在上海零數科技副總裁兼汽車交通事業部總經理劉波看來,數據是各個不同主體在不同時期、不同系統內產生的,只有實現共享才能打造出第二增長曲線。
“以前,數據只實現了內循環,即在一個公司內部不同部門之間進行流轉,在內循環中我們已經嚐到了甜頭,切實地感受到數據共享能降本增效。但這還遠遠不夠,我們應開始去打造數據的外循環,外循環是跨主體、跨行業、跨領域的,只有這樣才能打造出第二增長曲線。”劉波認爲,搭建一個汽車大數據交互平臺,在數據基礎設施上精準發力,才能夠去解決數據容易修改、權屬不清、流通不受控、泄漏隱私、計算不透明以及權責難追溯這六大痛點。
四維圖新東區總經理霍敬宇在會上提到,隨着智能駕駛感知能力不斷升維,智能網聯汽車數據量呈爆發式增長,據估算每輛汽車每隔數秒即可產生超150個參數,每小時數據量達500G至5T,每日收集量多達近百TB。然而,自動駕駛數據涉及敏感信息,車企存在不敢用、不敢採的心理,而且自動駕駛數據採集、處理的鏈條非常長,“髒活累活特別多”,並且難以變現和商業化。與此同時,在數據的採集確權、數據的合規性方面,監管部門管理起來也面臨着複雜挑戰。
在這一背景下,打造AI新基建成爲新的解決之道。他指出,從車端、路端、雲端,哪些數據能採、採完後如何處理和存儲,存儲之後如何進行數據脫敏,脫敏後如何給車廠做定製化圖層,這一系列問題四維圖新都已形成了一套完整的閉環處理系統。
“這個系統能夠爲車企提煉出真正對自動駕駛訓練有用的數據。我們能把提煉出的特殊場景的數據提供給主機廠,幫助它們進行模型的訓練。四維圖新願意把我們自己的算法開放給主機廠,主機廠也可以用我們的算法去融合和提升自身的算法能力,我們願意與主機廠進行合作,建立一套新的生態。”霍敬宇說道。
愷望數據的定位是做打通數據流通的連接器,爲自動駕駛提供數算一體、共享協同的數據基礎設施。據悉,目前愷望數據已與北京亦莊智能城市研究院旗下全資子公司北京國際算力服務有限公司,聯合打造了全國首個“車路雲數據協同平臺”,並已正式上線運營。
該平臺聚焦自動駕駛車端感知數據和車路雲智能交通場景,爲企業提供高效、安全的智能數據應用服務,不僅提供精準適配和精加工的數據,還提供模型訓練所需的GPU算力集羣服務。
汽車數據資產的流通能夠打破自動駕駛數據孤島的現狀。
張永偉強調,要以開放、合作、專注的思路走好智能化發展之路。對企業來講,要發展智能汽車,單一企業不可能包打天下,因此開放、合作是汽車企業走好智能化的必由之路,誰能夠打造一個更加開放的生態、誰能夠實現領導創新鏈的能力,誰的迭代速度可能就更快。封閉走不好智能化,開放可以實現“1+1”大於2的聚合效應,只有這樣智能化纔會跑出發展“加速度”。
(編輯:張碩 審覈:童海華 校對:翟軍)