字节跳动正式发布端到端同声传译模型:准确率接近真人,3秒延迟

  7 月 24 日,字节跳动宣布正式发布端到端同声传译模型 Seed LiveInterpret 2.0。据介绍,这是首个延迟&准确率接近人类水平的产品级中英语音同传系统,在中英同传翻译质量达到业界 SOTA 的同时,实现了极低语音延迟水平。

  字节跳动表示,该模型基于全双工端到端语音生成理解框架,支持中英互译。可实时处理多人语音输入,像人类同传译员一样以极低的延迟“边听边说”,一边接收源语言语音输入,一边直接输出目标语言的翻译语音。同时,Seed LiveInterpret 2.0 还支持 0 样本声音复刻,沟通更流畅自然。不过,目前模型主要支持中英互译。

  据悉,相比传统机器同传系统,Seed LiveInterpret 2.0 具有四大优势:接近真人同传的翻译准确率;极低延迟的“边听边说”能力;零样本声音复刻;智能平衡翻译质量、延迟和语音输出节奏。(快科技)