OPFUN Talk萌课堂,专注青少在线语言启蒙!

上海 18761612306

首页 > 资讯列表 > 资讯详情

合肥法语培训:虚拟主持人研发团队负责人郜静文:通过个性化多语言合成技术合成

来源:小编 编辑:小编 日期:2022-09-15 16:30:42

【同期】AI小青,虚拟主播

大家好,我是科大讯飞。AI虚拟主播小青,我可以用多种语言和方言广播。现在我用广东话为你广播;现在用英语为你广播;现在用俄语为你广播;现在用日语为你广播;现在用韩语为你广播;现在用法语为你广播。祝你身心健康,工作顺利。

【说明】据了解,原有AI虚拟锚是一个单维语音提示。如果你想实现流畅的语言,丰富和愉快的语言,自然和生动的身体动作和表达,你需要通过个性化的多语言合成技术合成你想要广播的内容。

【同期】虚拟主持人R&D团队负责人高静文

目前,我们的虚拟主播已经支持播放30多种语言。它是通过几种技术实现的。首先,它需要收集一些人类材料。我们需要大约半小时的信息来建模这个虚拟人。在未来,我们只需要输入文本,它就可以开始视频输出。

解释说起来很简单,但训练过程非常困难。定制锚定部分音频和视频同步视频数据后,将数据的语音和视频分开,用语音数据培训个性化语言生成模型,提取面部识别、表情捕获等视频参数;在多模态生成模型培训中,涉及深度学习、机器翻译、多语言生成等关键技术。

【同期】虚拟主持人R&D团队负责人高静文

然后,通过虚拟人和语音合成的一些组合,它已经成为一个多模式的虚拟人结构。在这里,我们不仅要表现声音的实现,还要表现一些情绪,包括情绪中的声音表现,包括虚拟人的嘴唇和面部情绪,以及身体动作的灵活表现。在这个过程中,我们需要克服人工智能对文本的分析,情感分析与多维度的结合。

【说明】目前,研发部门已经开发出来AI虚拟主播、AI虚拟客服、AI虚拟教师等,已广泛应用于媒体、金融、客户服务等领域。

【同期】虚拟主持人R&D团队负责人高静文

刘鸿和张军报道安徽合肥

亿鸽在线客服系统
  1. 联系我们

  2. 在线客服:(9:00-23:00)
  3. 服务热线:18761612306
  4. (9:00-23:00)
苏ICP备2022034778号-2