天娛數科首席數據官吳邦毅:驅動具身智能變革離不開3D數據集|財專訪
財聯社1月11日訊(記者 崔銘)作爲未來產業的前沿陣地、全球科技與產業競爭的全新賽道,人形機器人、具身智能在近日舉行的CES 2025上成爲全場焦點。據GGII預測,2030年全球人形機器人市場規模將突破200億美元,中國市場規模將達到50億美元左右。
CES 2025期間,天娛數科(002354.SZ)首席數據官吳邦毅在接受財聯社記者專訪時表示,人形機器人蓬勃發展的浪潮之下,3D數據已然躍升爲最爲關鍵的基礎性資源,但目前仍要突破3D數據採集與處理成本高、耗時長、難度大,以及3D數據標準化建設滯後等難題。
以下是訪談實錄(有刪改):
財聯社:與往屆相比,此次CES 2025有哪些顯著變化?
吳邦毅:CES上AI的影響力逐年增強,今年更甚。我在展會上發現了一個特別顯著的焦點——具身智能。以往這一領域大部分是國外巨頭,展示的也大多是“實驗室”階段的技術創新,比如:特斯拉的Optimus、OpenAI對1X進行戰略投資、大量初創公司的崛起,以及學術界MobileALOHA等項目的持續創新。而今年的CES,不止國內企業的身影更多了,具體落地的產品、應用也非常豐富。
財聯社:雖然人形機器人的發展非常迅速,但仍處於初期階段,現在面臨的最大瓶頸是什麼?
吳邦毅:人形機器人蓬勃發展的浪潮之下,3D數據已然躍升爲最爲關鍵的基礎性資源,能夠全方位、立體化地呈現真實人物與各類場景,爲機器人帶來豐富多元的交互體驗。憑藉3D數據,AI得以突破二維視覺的狹隘邊界,深度洞悉物理世界裡人和物的形態構造、空間位置以及動態變化,實現三維空間場景中對視覺信息的高階推理。
然而,放眼全球,3D數據雖處於核心地位,但仍面臨兩大困境:一方面,3D數據的採集與後期處理,是一件非常“燒錢、耗時、費力”的事;另一方面,3D數據的標準化建設嚴重滯後,各類數據格式五花八門,缺乏統一規範,直接導致數據之間的兼容性極差,難以實現順暢的共享與高效的複用。
財聯社:天娛數科在這次CES 2025上展示的重點是什麼?對於您提到的3D數據痛點問題有什麼解決辦法?
吳邦毅:這次展會現場,我們通過Behavision空間智能MaaS平臺重點展示了公司在人工智能、3D具身智能數據集以及大模型等前沿關鍵領域的成果。Behavision空間智能MaaS平臺融合了天娛數科自研的智者千問大模型、先進可視算法,以及自行採集並通過認證的3D具身智能數據集。平臺構築了一套全方位數據綜合應用體系,將“數據採集、數據建設、數據管理”三大環節緊密相連,形成一個有機整體。
財聯社:現在全球範圍內有哪些重要的3D數據集,主要應用領域是什麼?
吳邦毅:主要有Objaverse、Open X-Embodiment、PandaSet、3D Match、Rel3D幾個數據集,這些數據集主要用於機器人和多場景空間智能領域。
現階段,我們的Behavision空間智能MaaS平臺已然積累了超百萬組3D數據,以及35萬組多模態數據。2024年10月,“人形機器人空間動捕長程數據”“大場景空間感知模型重建數據”等5個具有開創性意義的3D具身智能數據集,在北京國際大數據交易所完成了數據資產登記,成爲全國首個3D具身智能數據集。
爲了夯實在空間智能領域的競爭優勢,我們戰略投資了芯明。其自研空間計算芯片是目前全球唯一單芯片集成芯片化實時3D立體視覺感知、AI、SLAM(實時定位建圖)的空間智能系統級芯片,具備3.5TOPS的端側算力,可支持單芯片接入6路傳感器。其產品解決方案已在全球範圍內應用在機器人、機器狗、XR、消費電子、物流無人機、3D掃描等多個前沿應用領域的龍頭企業產品中。
財聯社:多模態數據在人形機器人與3D數據的應用中有哪些作用?
吳邦毅:在感知與環境理解層面,人形機器人融合視覺、力感知等多種模態,如藉助3D視覺掌握物體形狀、位置,配合力感知抓取物品,還能結合文本與3D數據理解場景語義,精準定位自身所處環境,識別物體功能,爲後續行動提供基礎。
在運動控制與操作任務方面,多模態可助力精準操作,像手術機器人依靠3D視覺與力反饋,實現精細手術步驟;同時優化運動規劃,利用3D視覺察覺障礙物,結合自身運動學參數,在複雜3D空間規劃安全高效路徑,確保機器人順暢完成任務。
在人機交互方面,多模態數據大幅可提升交互體驗,既實現自然交互,綜合語音、3D視覺識別表情姿態及文本理解指令,讓機器人精準領會人意,又支持個性化服務,憑藉3D視覺觀察用戶關注焦點,聯合語音評價等,爲用戶定製專屬推薦,滿足多元需求。
財聯社:天娛數科在人工智能技術和應用推廣方面還有哪些探索、創新?
吳邦毅:天娛數科的發展緊緊圍繞着數字化、智能化、全球化三大戰略展開。智能化戰略主要圍繞着“數據要素×”與“人工智能+”相結合的思路推進,我們依託海量數據要素資源優勢和人工智能算法技術優勢,研發了多個企業級大模型,構築了AI營銷SaaS、移動應用分發PaaS、Behavision空間智能MaaS平臺三個業務平臺,持續推動零售、工業、金融、文娛等多個行業的數字化轉型。
與此同時,我們不斷深化在3D數據採集設備、3D數據平臺、3D模型訓練、3D數據集拓展等方面的努力,提升Behavision空間智能MaaS平臺的性能和服務能力,推動具身智能、人形機器人從基於程序控制的1.0演示階段,到基於大模型的2.0模仿階段,向基於海量3D數據的3.0智能階段發展,爲各行業提供更加智能化的解決方案。
此外,我們的全球化戰略也在穩步推進,並取得了新的突破。近日,我們在印尼設立了區域總部,這標誌着公司全球化發展從以往的以遊戲、工具應用爲代表的“App出海”時代正式邁入了立足中國、紮根海外本土、服務全球的新階段。