趣丸科技開源語音大模型MaskGCT
10月24日,趣丸科技宣佈與香港中文大學(深圳)聯合研發的語音大模型“MaskGCT”正式在Amphion系統中開源,面向全球用戶開放使用。區別於傳統TTS模型,該模型採用掩碼生成模型與語音表徵解耦編碼的技術範式,在聲音克隆、跨語種合成、語音控制等任務中性能表現突出。據介紹,MaskGCT在三個TTS基準數據集上都達到了SOTA效果。
相關資訊
- ▣ 文化灣企說丨廣州趣丸科技:聯合港中大(深圳)開源首個語音大模型,效果全球領先躋身第一梯隊
- ▣ 國產AI音樂生成效果幾何?實測趣丸科技天譜樂大模型
- ▣ 廣州海珠打造最盈利大模型產業集聚高地,趣丸科技等大模型企業入駐
- ▣ AI早知道|商湯科技發佈東風泰語大模型;Meta計劃開源 AI 模型Llama3 405B
- ▣ 全球科技早參丨OpenAI發佈語音模型Voice Engine
- ▣ 騰訊混元大語言模型和3D模型正式開源
- ▣ AI早知道|國內首個端到端語音大模型Lingo;摩爾線程開源音頻理解大模型MooER摩耳
- ▣ 騰訊混元宣佈大語言模型和3D模型正式開源
- ▣ 盈趣科技:暫無自主研發AI大模型,開發相關AI應用
- ▣ 天津大學“伏羲傳語”多語言大模型正式發佈並開源,應對大模型多語言能力不足
- ▣ xAI宣佈開源大語言模型Grok-1並開放下載
- ▣ AI早知道|B 站開源輕量級 AI 語言模型;阿里通義Qwen2成最強開源大模型
- 科大訊飛大模型競速2年多,答卷不只是語音
- ▣ 科大訊飛星火語音大模型“星火極速超擬人交互”8月底開放
- ▣ AI早知道|騰訊推全球首個語音指揮FPS AI ;摩爾線程開源音頻理解大模型
- ▣ 聯發科 推繁中大型語言模型
- ▣ OpenAI開發者大會派禮包:大幅降低模型成本,AI語音加持App,小模型“蹭”大模型性能
- ▣ 全球科技早參丨全球首個芯片設計開源大模型誕生
- ▣ 商湯科技發佈新版日日新·商量大語言模型
- ▣ 摩爾線程正式開源音頻理解大模型MooER
- ▣ 通義千問開源視覺語言模型Qwen2-VL
- ▣ 騰訊開源最大MoE大語言模型!3D大模型同時支持文/圖生成,曬混元模型及應用全家桶
- ▣ 奇富科技智能語音模型升級,川渝方言識別準確率提升超35%
- ▣ 新鮮早科技丨特斯拉股價大漲近15%;騰訊混元大模型正式開源
- ▣ 白龍馬雲行科技申請基於大模型自我校驗用於RAG系統緩解大語言模型幻覺的方法專利,緩解大語言模型幻覺
- ▣ OpenAI推出語音克隆AI模型
- 直播預告 | 開源Talk:大語言模型與視覺語言模型越獄行爲及防禦機制的回顧與展望
- ▣ 數智早參|OpenAI官宣推出新的大語言模型GPT-4o;騰訊混元文生圖大模型開源
- OpenAI推模擬真人語音技術