微软开源长时自然语音合成模型VibeVoice-1.5B 科技媒体marktechpost 8月25日报道,微软发布全新开源文本转语音模型VibeVoice-1.5B,支持一次生成最长90分钟、最多4位说话者的自然语音,并具备跨语言与歌声合成功能。该模型基于 7*24快讯 2025年08月27日 0 点赞 0 评论 6 浏览