自研算法賦能智慧工廠OPPO在國際人工智能會議CVPR 2021展示了AI創新實力
6月24日,一年一度的全球計算機視覺會議CVPR落下帷幕,OPPO在六大賽道共十二項賽項中取得一項第一,七項第二,四項第三的成績,再次展示了AI創新實力。
本次參加CVPR 2021競賽的團隊來自OPPO研究院智能感知與交互研究部和OPPO美國研究所,先後在多目標行爲分析、足球行爲分析、長視頻理解、時空行爲檢測、跨模態分析及人機交互識別六大賽道上取得優異成績。他們通過對算法的優化、訓練,不斷強化OPPO 的AI能力,讓AI更好地爲人類服務。
據OPPO相關人士介紹,在多目標行爲分析(Multi-Agent Behavior)賽道中,OPPO所應用的AI算法能基於特徵點信息準確判別、預測動物及人在複雜交互內容下的行爲。OPPO憑藉着領先的AI算法能力,從全球240多個頂尖參賽團隊中脫穎而出,獲得子賽項少樣本行爲分類任務(Learning New Behavior)第一,及傳統分類(Classical Classification)與標註風格遷移任務(Annotation Style Transfer)賽項的第二與第三名。目前,這項技術正在OPPO智慧工廠發揮着保護作用,工人們在這套算法的輔助下,可以避免關鍵生產環節的錯漏錯放,令自身和產線更安全。
在基於多張2D圖片的3D人臉重建挑戰賽中,OPPO自研的AI算法所還原的三維人臉模型與真實人臉誤差僅爲1mm左右,在主要指標成績排名中取得第二名。該算法克服了在實際生活中,特別是動態視頻拍攝時,因爲動作導致的人臉五官點不明晰、表情誇張、甚至圖片數據失真等問題。事實上,OPPO自研的人臉檢測算法已能夠識別635個人臉特徵關鍵點,並實現30次/秒的高速運行。在不久前發佈的OPPO Reno6上,依託於該算法架構的AI煥採美妝視頻技術爲用戶輕鬆打造了動態的自然美妝效果。
目前,OPPO的AI能力已發展到可以識別人在時空環境中的行爲狀態。在足球行爲分析(SoccerNet)賽道中,OPPO取得動作定位(Action Spotting)和回放定位(Replay Grounding)兩個賽項第二名。這項挑戰需要在一段足球比賽視頻中辨別出十幾種關鍵動作,包括越位、紅牌這類基礎規則複雜,動作幅度小,人類都很難識別的行爲。同時AI算法還需要排除攝影機位不同等干擾因素,準確定位回放片段在原始比賽視頻中發生的時間點。
在跨模態行爲分析(MMact)賽道上,OPPO分別在行爲識別(Cross-Modal Action Recognition)與行爲定位(Cross-Model Action Temporal Localization)兩個子賽項中取得第二名。OPPO的AI算法僅通過視覺信息便可準確識別一段視頻中人物在特定空間內發生的交談、屈膝、走動等十餘種動作。該技術未來有望廣泛應用在家居場景,爲家中老人、小孩、寵物帶來更貼心的照料。
此外,OPPO還在時空行爲定位(AVA-Kinetics)賽道獲得第三名。AVA數據集作爲一個時空行爲檢測的數據集,使用該數據集的定位賽項歷來是人工智能的熱門賽道之一,每年不乏國際頂尖科技公司與院校的知名團隊參與其中。時空行爲定位算法不僅可以準確識別視頻中人們的行爲,還可以同步定位其所處的時間段和空間範圍。
本次CVPR上,OPPO在學術界前沿領域長視頻理解(LOVEU, Long-form Video Understanding)挑戰中,獲得兩大賽項第三名。該賽道需要AI在預先沒有特定分類標準的情況下,自行理解視頻的意義並分割出其邊界的時間段落。因此,對算法的泛化性提出了極大挑戰,AI需要像人一樣思考,理解視頻中人類動作、顏色、物品、乃至光源的變化,並對變化點進行判斷。
OPPO研究院美國研究所參與了稠密深度估計挑戰賽道,展示了能夠基於2D圖像輸出稠密3D深度信息的技術,獲得自監督學習賽項第二名的成績,並獲得“最佳創意獎”。該技術通過利用深度學習模型直接從普通圖像輸出深度信息,未來有可能替代ToF這樣的深度傳感器,帶來體驗更好的室內外導航。