当前位置:首页 → 电脑软件 → 北科大女生 求你别再骗我妈救命钱 → 优游ub8登录 v9.431.7182.435265 PC版
v5.812.3575 安卓免費版
v5.543 安卓免費版
v3.862.3301.137039 安卓漢化版
v7.503.463.121479 安卓版
v6.358.8944.372916 IOS版
v6.345.4199.857326 安卓最新版
v6.923.2788.189928 IOS版
v3.143 安卓免費版
v3.191.2532.181212 安卓版
v4.268.7251.283841 安卓版
v6.962.278.429192 IOS版
v2.742.5473.227904 IOS版
v1.207.7360 安卓免費版
v6.478.9011.530015 安卓漢化版
v5.26.8140.561000 IOS版
v9.18.5123 IOS版
v1.919.5638.976693 IOS版
v3.303.6419.591462 IOS版
v1.620 安卓最新版
v4.584.4359 安卓最新版
v4.474.5958.632507 最新版
v5.80.1381 安卓最新版
v9.319 安卓免費版
v3.442.2169.793961 安卓免費版
v5.586.8184 最新版
v1.532.3505 安卓免費版
v2.414.5131.425210 安卓漢化版
v2.462.2979.538732 PC版
v5.332 最新版
v2.86.5533.10483 安卓免費版
v5.909.6381 PC版
v3.222 安卓免費版
v5.636.5362.640160 安卓版
v4.652.2831 最新版
v5.579.3882.592970 安卓版
v4.730 IOS版
v9.872 安卓版
v7.171.4251.685140 安卓版
v2.676.3195.300726 安卓漢化版
v9.406.2630 IOS版
v5.963.8050.136547 最新版
v2.525.5793.823361 PC版
v9.164.9650.452330 安卓免費版
v1.15.5767.409925 安卓漢化版
v5.101 安卓版
v9.5 最新版
v1.543.1109 安卓版
v9.107.5207.72850 安卓免費版
v6.970 安卓最新版
v9.889.1127.35691 安卓漢化版
v8.450.8724.583351 IOS版
v7.608.6768.813917 IOS版
v5.713.4684.941961 安卓免費版
v6.220 IOS版
v8.414.7974 最新版
v8.893.7064.49874 PC版
v8.765.6450.460168 安卓漢化版
v4.72.8679.521796 PC版
v1.613.5401.731547 安卓免費版
v8.261.9496.907502 安卓最新版
v4.590.6198.290572 最新版
v2.830.955.607141 安卓版
v8.469.4477.358772 安卓免費版
v6.238.6970.395987 安卓最新版
v8.613 安卓版
v3.956 安卓最新版
v5.643.3285.821386 IOS版
v5.367.933.466392 安卓漢化版
v3.546.1676.881660 安卓最新版
v4.865.2614.663951 最新版
v4.150.6627 安卓免費版
v2.198.2012.214555 安卓免費版
v5.194.961.128383 IOS版
v2.701.8044.310995 安卓最新版
v1.746 最新版
v2.766.3513.916936 PC版
v9.552.4972.783124 IOS版
v2.426.1811.597727 最新版
v3.713.1992 安卓最新版
v2.648.9648 安卓漢化版
优游ub8登录
智东西作者 王涵编辑 漠影
智东西9月30日消息,刚刚,通义千问推出多语言实时音视频同传模型Qwen3-LiveTranslate-Flash,占据多个中英及多语言语音翻译榜单第一名!
Qwen3-LiveTranslate-Flash实现了覆盖18种语言的离线和实时两种音视频翻译能力,主要有以下5个核心亮点:
1、多语言和方言:支持中文、英文、法语、德语、俄语、意大利语、西班牙语等主要官方语言和普通话、粤语、北京话、吴话、四川话、天津话的方言翻译。
2、视觉增强:首次引入视觉上下文增强技术,Qwen3-LiveTranslate-Flash可以通过识别和利用口型、动作、文字、实体等多模态信息,有效应对嘈杂音频环境以及一词多译词场景下的翻译不准问题。
3、3秒延迟:轻量的混合专家架构与动态采样策略,同传实现最低3秒的延迟。
4、无损同传:该模型采用语义单元预测技术缓解跨语言翻译的调序问题,实现与离线翻译几乎无损的翻译质量。
5、音色自然:该模型使用海量语音数据训练,可以根据原始语音内容自适应调节语气和表现力的拟人音色。
一、超越Gemini-2.5-Flash,同传准确度达94%以上
在公开测试集上,中英及多语言语音翻译榜单中,Qwen3-LiveTranslate-Flash的准确度优于当前主流大模型Gemini-2.5-Flash、GPT-4o-Audio-Preview和Voxtral Small-24B等模型,在除AVG.XX-EN以外的测试中均是第一名。
Qwen3-LiveTranslate-Flash在不同领域和复杂声学环境下的测试成绩也优于Gemini-2.5-Flash等主流大模型。
该模型研发语义单元预测技术来缓解跨语言调序问题,其实时同传可在保持非实时翻译94%以上准确度的同时,显著降低延迟。
视觉增强技术进一步让Qwen3-LiveTranslate-Flash在嘈杂音频、一词多译、专有名词翻译等场景翻译更精准。在实时场景中,视觉信息弥补了语音上下文的缺失,优势更明显。
二、能分清mask和Musk,还有多种不同声色
官方给出了丰富的实例,Qwen3-LiveTranslate-Flash在同传翻译、视觉增强辅助等能力上的表现确实能打,着实为专业翻译工作人员捏了一把汗。
例如将阿里巴巴2023年12月份季度业绩电话会议进行中文同传:
输入音频:
https://oss.zhidx.com/f31009e4395c7deb609debf197a65f7b/68daad00/uploads/2025/09/68dbace08deb2_68dbace08a53d_68dbace08a4ee_%E4%B8%AD%E8%8B%B1%E5%90%8C%E4%BC%A0.mp3
输出效果:
凭借视觉增强辅助语音翻译功能,Qwen3-LiveTranslate-Flash能够识别出来mask(口罩)和Musk(马斯克)的区别:
该模型还可以识别低频专有名词,比如人名:
Qwen3-LiveTranslate-Flash还支持多种语言或方言的不同音色,例如:
1、芊悦,voice参数:Cherry
音色效果:
https://oss.zhidx.com/525060543cfe82f97f67b4028186c137/68daad00/uploads/2025/09/68dbacdf3ba68_68dbacdf38441_68dbacdf3840c_%E8%8A%8A%E6%82%A61.mp3
描述:阳光积极、亲切自然小姐姐。
支持的语种/方言:中文、英语、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语
2、不吃鱼,voice参数:Nofish
音色效果:
https://oss.zhidx.com/f1aa4a9ac56a844e07759883ccfedcb4/68daad00/uploads/2025/09/68dbacdf118a1_68dbacdf0dee0_68dbacdf0dea6_%E4%B8%8D%E5%90%83%E9%B1%BC1.mp3
描述:不会翘舌音的设计师。
支持的语种/方言:中文、英语、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语
3、上海-阿珍,voice参数:Jada
音色效果:
https://oss.zhidx.com/f2a8fc34ae1f8e05143da3b3f18a7295/68daad00/uploads/2025/09/68dbacdf6bbdc_68dbacdf68577_68dbacdf6854c_%E4%B8%8A%E6%B5%B7-%E9%98%BF%E7%8F%8D1.mp3
描述:风风火火的沪上阿姐。
支持的语种/方言:中文(吴语)
4、北京-晓东,voice参数:Dylan
音色效果:
https://oss.zhidx.com/c656142c36e636356d3d45ffff53a8f1/68daad00/uploads/2025/09/68dbacdec7750_68dbacdec35ad_68dbacdec355e_%E5%8C%97%E4%BA%AC-%E6%99%93%E4%B8%9C1.mp3
描述:北京胡同里长大的少年。
支持的语种/方言:中文(北京话)
5、四川-晴儿,voice参数:Sunny
音色效果:
https://oss.zhidx.com/92a224dfc2b4411c099bf760854dbe7e/68daad00/uploads/2025/09/68dbacdfd0fb1_68dbacdfcd890_68dbacdfcd854_%E5%9B%9B%E5%B7%9D-%E6%99%B4%E5%84%BF1.mp3
描述:甜到你心里的川妹子。
支持的语种/方言:中文(四川话)
6、天津-李彼得,voice参数:Peter
音色效果:
https://oss.zhidx.com/1f4e465854e05350ccde9ddb3f05a41e/68daad00/uploads/2025/09/68dbace010fb5_68dbace00829e_68dbace00826a_%E5%A4%A9%E6%B4%A5-%E6%9D%8E%E5%BD%BC%E5%BE%971.mp3
描述:天津相声,专业捧哏。
支持的语种/方言:中文(天津话)
7、粤语-阿清,voice参数:Kiki
音色效果:
https://oss.zhidx.com/e830838613a77c0b3c5d03035d686a19/68daad00/uploads/2025/09/68dbace046bbd_68dbace04354e_68dbace04350f_%E7%B2%A4%E8%AF%AD-%E9%98%BF%E6%B8%851.mp3
描述:甜美的港妹闺蜜。
支持的语种/方言:粤语
8、四川-程川,voice参数:Eric
音色效果:
https://oss.zhidx.com/aee07fc351746e64cc5498d99feceaac/68daad00/uploads/2025/09/68dbacdf97ef6_68dbacdf94087_68dbacdf94056_%E5%9B%9B%E5%B7%9D-%E7%A8%8B%E5%B7%9D1.mp3
描述:一个跳脱市井的四川成都男子。
支持的语种/方言:中文(四川话)
结语:通义千问加速AI音视频翻译落地
Qwen3-LiveTranslate-Flash首次引入视觉上下文增强技术,让音视频AI翻译更上了一个台阶。
通义千问团队称,今后还将持续提升语音翻译的准确性、自然度、情感一致性,拓展新万博体育:语种的覆盖范围,增强在各种复杂语音环境下的翻译鲁棒性。
在语音翻译这个应用面推进技术进步的红海赛道,通义千问这次推出新模型,或将大幅降低全球开发者在实时跨语言交流应用上的创新门槛,加速催生从国际会议、跨境直播到无障碍沟通等场景的下一代产品落地。
相关版本
多平台下载
查看所有0条评论>网友评论