第三媒體軟件中心軟件網絡資訊互聯網資訊 → Soul App自研端到端語音通話大模型上線,拓展人機交互新體驗 TTL

Soul App自研端到端語音通話大模型上線,拓展人機交互新體驗

上傳:shapone     來源:信息存儲服務     日期:2024-09-03

[摘要]  
   近日,社交平臺Soul App(以下簡稱“Soul”)語音大模型再次升級,上線自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風格語言
 
[正文]    
   近日,社交平臺Soul App(以下簡稱“Soul”)語音大模型再次升級,上線自研端到端全雙工語音通話大模型,具備超低交互延遲、快速自動打斷、超真實聲音表達和情緒感知理解能力等特點,能夠直接理解豐富的聲音世界,支持超擬人化的多風格語言,實現更接近生活日常的交互對話和“類真人”的情感陪伴體驗。目前,Soul自研的端到端語音通話大模型能力已上線旗下“異世界回響”實時通話場景(內測中),并將在后續拓展至AI茍蛋等多個AI陪伴、AI互動場景。

   自2016年上線,Soul一直致力于以創新的技術方案和產品設計,實現社交體驗的拓展。2020年,Soul啟動對AIGC的技術研發工作,系統推進在智能對話、語音技術、虛擬人等AIGC關鍵技術能力研發工作,并推動AI能力在社交場景的深度落地。

   以AI升級社交的過程中,Soul的技術重點之一是致力于實現擬人化、自然化情感陪伴體驗。其中,聲音是重要環節之一。作為傳遞信息和情感的重要媒介,聲音最能在溝通中賦予“情緒溫度”和“陪伴感”。特別是在社交場景中,情感化、低延遲、多風格、類真實的聲音能力,可以打破“次元壁”,讓線上社交尤其是人機互動中,也能實現真實生活場景聊天的自然流暢感和沉浸現場感,真正完成類現實生活化互動場景中的交互體驗。

   因此,為給用戶帶來更好的情緒反饋和陪伴感,情緒理解、延遲問題一直是Soul技術團隊關注的焦點。

   此前,Soul團隊推出了自研的語音生成大模型、語音識別大模型、語音對話大模型、音樂生成大模型等語音大模型能力,支持真實音色生成、語音DIY、多語言切換、多情感擬真人實時對話等,目前已應用于Soul “AI茍蛋”、站內狼人游戲“狼人魅影”AI語音實時互動、獨立新產品“異世界回響”等場景。

   與國際最前沿的技術發展保持同頻,Soul持續完善自身語音技術能力積累,創新AI社交應用體驗。今年7月,在人工智能領域頂級的國際學術會議——國際人工智能聯合會議(International Joint Conference on Artificial Intelligence,IJCAI)舉辦的第二屆多模態情感識別挑戰賽(MER24)上,Soul 語音技術團隊于SEMI(半監督學習)賽道獲得第一名,在國際賽事舞臺上展現了Soul的前沿洞察和技術能力。

   如今,自研端到端語音通話大模型的率先上線,再次證明了Soul在行業中扎實的技術能力積累。

   區別于傳統的級聯方案,語音到語音的端到端建模,意味著語音交互體系的顛覆式升級,即不再需要從“語音識別、自然語言理解、語音生成”等多個環節流轉,直接語音輸入—語音輸出的端到端模型能夠最大程度實現信息無損傳遞,降低響應延遲時間。

   此次Soul自研的端到端語音通話大模型便具備超低交互延遲、快速自動打斷、超真實聲音表達和豐富情緒感知理解能力的特點,支持更自然的人機交互體驗。

   在延遲方面,于實際應用過程中,用戶體驗與“異世界回響”中虛擬人實時語音通話效果時,延遲時間少于行業平均水平,真正實現即時的AI交流和陪伴。

   值得一提的是,端到端的語音語義理解和響應以及更自然的語音指令控制,讓Soul語音通話大模型不僅能夠給予情感關懷、理解人聲情緒情感并給出有溫度的回應,還能夠理解物理世界的聲音場景,模擬物理世界動物聲音、理解多人聊天內容,實現多風格語言切換、文藝內容創作和即興演唱,接近現實交流互動場景需要。

   接下來,Soul將持續推進多模態端到端大模型能力建設和應用落地,以AI輔助社交、提升關系建立的質量和效率的同時,構建人機交互新場景,讓用戶可以與AI進行更加有溫度、沉浸、趣味的互動交流,不斷創新社交體驗。

   (新聞稿 2024-09-03)

頻道首頁 】【 評論 】 【 打印 】 【 字體:
   上一篇:下一本書,閱讀星辰和大海|在Soul,看見更大的世界
   下一篇:速來圍觀!阿丘科技2024新品發布即將開幕
導航:報價 | 大全 | 排行榜 | 產品大全 | 參量 | 訂閱 
 Advertisement
 十大最受關注的新聞
1  奧運首次!運動員在領獎臺用三星Galaxy Z Flip6奧運版定格“勝利自拍”分享喜悅
2  首屆人工智能先進技術成果供需對接大會硬核又新潮!
3  C口A口U盤如何選 金士頓帶你一圖讀懂
4  2024 ChinaJoy驍龍主題館盛大開啟,高通帶你玩轉科技潮流娛樂盛宴
5  華碩B650/X670E主板加AMD 9000板U套裝預約開啟
6  輕薄AI筆記本標桿,HUAWEI MateBook X Pro 2024用料分析
7  三星向2024巴黎奧運會選手贈予Galaxy Z Flip6奧運版打造非凡奧運之旅
8  首屆人工智能先進技術成果供需對接大會,緣何“落地”綿陽?
9  電腦存儲硬核伴侶 金士頓移動固態硬盤 金士頓移動固
10  出海新篇章:月狐數據深度剖析2024中國企業出海品牌策略
 十大熱門驅動/軟件下載
1  [手機驅動]手機usb萬能
2  [熱門常用軟件]QQ2008正式版下載【騰訊QQ2008官方版Beta1】
3  [熱門常用軟件]E話通下載【E話通4.5 正式版】
4  [手機驅動]Samsung三星 手機USB驅動1.0版For Win98SE/ME/...
5  [手機驅動]Microsoft微軟 ActiveSync同步軟件4.5中文版Fo...
6  [攝像頭驅動]萬能攝像頭 FOR Windows
7  [熱門常用軟件]皮皮播放器下載【PPFilm皮皮播放器 2.1.0....
8  [手機驅動]諾基亞 PC套件下載
9  [熱門常用軟件]面對面游戲下載【面對面視頻游戲大廳】
10  [手機驅動]Microsoft微軟 Windows Mobile Device Center ...
 十大最受關注的品牌
1  三星手機(SAMSUNG)
2  諾基亞手機(NOKIA)
3  華碩筆記本(ASUS)
4  摩托羅拉手機(MOTOROLA)
5  英特爾CPU(Intel)
6  華碩主板(ASUS)
7  LG手機(LG)
8  索愛手機(Sony Ericsson)
9  聯想筆記本(lenovo)
10  宏碁筆記本(acer)
 十大熱門常用軟件下載
1  QQ2008正式版下載【騰訊QQ2008官方版Beta1】
2  E話通下載【E話通4.5 正式版】
3  皮皮播放器下載【PPFilm皮皮播放器 2.1.0.2版】
4  面對面游戲下載【面對面視頻游戲大廳】
5  DVD解碼器下載【NVIDIA DVD Decoder 1.02】
6  迅雷5下載【迅雷5.8.1.507官方版】
7  QQ2007 II正式版下載【騰訊QQ2007官方版本】
8  QQ2006正式版下載【騰訊QQ2006官方版本】
9  聯眾世界游戲大廳下載【聯眾世界2.7.0.8官方版】
10  MTV下載器【MTV下載精靈 8.31版】
11  pplive最新版下載【PPLive網絡電視V1.9.35版】
12  迅雷(Thunder)下載【迅雷v5.7.12.493官方版】
13  騰訊QQ2008下載【騰訊QQ官方版2008極速賀歲版KB1】
14  Total Video Converter下載【Total Video Converter v3.1...
15  QQ拼音輸入法下載【騰訊QQQQ拼音輸入法V1.4.1版】
16  皮皮高清影視播放器下載【PIPIPlayer 2.7.0.3版】
17  eMule下載【電驢eMule官方v0.49a正式版】
18  極點五筆輸入法下載【極點五筆6.1標準版】
19  QQ2009正式版下載【騰訊QQ2009 SP4官方版】
20  Vagaa哇嘎畫時代版下載【哇嘎 2.6.5.10】
   >> 查看評論   
 
   >> 查看更多評論   [共有0條評論]
發表評論
        
        
   點評:
   姓名:  
            字數: 0
     
新聞精選
·民生山姆聯名信用卡正式上線
·黃倩:數字化教育浪潮中的領航者
·七夕講法普法,法行寶在行動
·《2024快應用智慧服務生態白皮書》發布,探索
·雷軍、董宇輝同時上身的探路者品牌,究竟有什
·科技巨頭紛紛布局邊緣AI,云天勵飛半年業績飆
  ·十四載再出發 堅守初心用戶至上 品牌升級開啟
·滿幫連續十年參加數博會 數智物流助力交通運
·趙峰:提升銷售領導力,實現業績跨越式發展
·下一本書,閱讀星辰和大海|在Soul,看見更大
·讓拍攝無限輕松,猛瑪為創作者再出發|品牌煥
·小度全線產品接入大模型能力,添添閨蜜機Pro