在生成式人工智能领域,大模型多模态交互能力的升级正掀起一股新的 AI 浪潮,在 RTC 能力的加持下,人与 AI 的交互不再局限于文字,也可以通过语音通话进行生动、流畅的低延时交互,这也成为当下国内外大模型厂商新的发力点。
今年5月,GPT-4o 的发布开创了AI 实时语音交互的先河。在此之前,一些传统的大模型已经具备语音交互的能力,但一般采用 WebSocket 方案,这一方案虽然应用广泛,但其传输架构是基于 TCP 协议来构建,延迟较高,在 STT-LLM-TTS 的三步骤中,一个来回的延迟就要2-3秒,在弱网等非理想网络环境下,整体语音交互的延时更达到4秒+。在 GPT-4o 采用 RTC 方案后,展现出了自然、流畅的低延时语音交互体验,也让更多企业与开发者看到了在 AI 语音交互中 RTC 方案的更优性,并积极与 RTC 厂商合作,升级 AI 语音交互的体验。
图:声网实时多模态对话式AI解决方案架构图
图:电影《Her》里的AI助理被视为AI情感陪伴的启蒙
同时,在游戏社交、AI分身、实时语音翻译等场景,实时AI语音也大有可为。例如,在狼人杀、谁是卧底等场景,AI NPC 角色虽然已经在应用,但是 AI 的痕迹还是较为明显。在大模型具备实时语音交互能力后,谁是卧底中的 AI 角色可以做到快速的推理并发言,再搭配语音仿真技术,有望做到 AI 角色的以假乱真。
51CallCenter网友
2026-03-09 01:13:46
㊙️ ㊙️ ㊙️ 幼 女 资 源 在 线 观 看【93nn.top 】㊙️㊙️㊙️小 萝 莉 来 一 波【 8uup.xyz 】 ㊙️ ㊙️ ㊙️
51CallCenter网友
2026-03-04 11:22:27
㊙️ ㊙️ ㊙️ 幼 女 资 源 在 线 观 看【pm92.xyz 】㊙️㊙️㊙️小 萝 莉 来 一 波【 mpp9.top 】 ㊙️ ㊙️ ㊙️
51CallCenter网友
2026-03-03 18:23:29
㊙️ ㊙️ ㊙️ 幼 女 资 源 在 线 观 看【pm92.xyz 】㊙️㊙️㊙️小 萝 莉 来 一 波【 mpp9.top 】 ㊙️ ㊙️ ㊙️
51CallCenter网友
2026-03-03 17:57:05
㊙️ ㊙️ ㊙️ 幼 女 资 源 在 线 观 看【pm92.xyz 】㊙️㊙️㊙️小 萝 莉 来 一 波【 mpp9.top 】 ㊙️ ㊙️ ㊙️
51CallCenter网友
2026-03-03 17:28:35
㊙️ ㊙️ ㊙️ 幼 女 资 源 在 线 观 看【pm92.xyz 】㊙️㊙️㊙️小 萝 莉 来 一 波【 mpp9.top 】 ㊙️ ㊙️ ㊙️
51CallCenter网友
2026-03-03 17:00:29
㊙️ ㊙️ ㊙️ 幼 女 资 源 在 线 观 看【pm92.xyz 】㊙️㊙️㊙️小 萝 莉 来 一 波【 mpp9.top 】 ㊙️ ㊙️ ㊙️
51CallCenter网友
2026-03-03 14:11:18
㊙️ ㊙️ ㊙️ 幼 女 资 源 在 线 观 看【pm92.xyz 】㊙️㊙️㊙️小 萝 莉 来 一 波【 mpp9.top 】 ㊙️ ㊙️ ㊙️