傅盛想捅破AI行業窗戶紙 要做大模型數據加工廠

11月27日消息,獵戶星空聯合聚雲科技舉辦了題爲《Data Ready for Al,MoE大模型發佈暨商業閉環分享》媒體活動。獵戶星空正式發佈了自主研發的Orion-MoE8×7B大模型,並攜手聚雲科技推出了基於該大模型的數據服務產品——AI數據寶AirDS(AI-Ready Data Service)。

獵戶星空首席科學家韓堃介紹,Orion-MoE8×7B大模型是獵戶星空自主研發的開源混合架構專家大模型,擁有8×70億參數,採用了生成式混合專家的設計,涵蓋了中文、英語、日語、韓語等多種語言。

據介紹,之所以發佈該模型,是因爲獵戶星空在探索AI應用場景過程中,一方面以客戶視角爲出發點,模型既要效果好又要速度快;另一方面從大模型技術發展來看,相比稠密模型的“通才”、一羣“專家”的MoE能更高效專業地完成企業複雜任務,而且在不顯著增加計算成本的前提下大幅增加模型容量。所以,這款極具性價比的Orion-MoE 8x7B大模型是“爲匹配企業客戶需求而生”。

據瞭解,在主流的公開基準評測中,Orion-MoE8×7B與同規模參數級別的基座大模型對比,各項評測指標均表現優異,特別是在多語言能力方面展現出強大實力。此外,在推理速度方面也表現搶眼,顯著高於同等參數規模的稠密模型。

與此同時,獵戶星空基於研發MoE大模型對數據訓練的認知理解和能力積累,攜手獵豹移動旗下聚雲科技共同推出大模型數據服務產品——AI數據寶AirDS(AI-Ready Data Service)。

獵戶星空首席科學家韓堃介紹道,近年來,由於計算能力的提升、大規模數據集的可用性以及算法的改進,AI大模型進入爆發增長期,算力、算法、數據,是大模型發展的關鍵三要素。然而,相比於算法和算力,在大模型商業閉環中,數據明顯成爲最直接影響其在垂直行業落地效果的關鍵。

“捅破AI行業窗戶紙,百模大戰靠數據”,AI數據寶AirDS提供全方位的大模型數據服務,涵蓋數據收集、清洗、標註、提示詞工程以及評估等環節。在實際應用中,已服務包括移動通信終端、互聯網娛樂、新能源汽車等多個領域的中國領先出海品牌,幫助客戶顯著提升AI應用的效果與效率,助力全球市場競爭。

獵豹移動副總裁童寧在會上詳細介紹了AI數據寶AirDS的成功案例。例如,在移動通信終端領域,AI數據寶AirDS通過收集多場景、多語⾔數據,完成開發測試平臺,優化prompt⼯程,提升⼤模型針對用戶需求的數據返回準確率等等。(定西)