本次报告将介绍 Xiaomingbot,一款多语言多模态的新闻机器人。她能实现从结构化数据到 多语言新闻文本的生成,并生成摘要。利用跨语言声音克隆技术,她也具备将多语言文本用同一种播 报者的语音语调播出。利用脸部表情动作同步技术,她能合成生动的虚拟主播,脸部动作保持与语音 播报文字的同步。自问世以来,已经在社交媒体生产文稿 60 万余篇。我们也将展望自动文本写作技术 的挑战和未来发展前景。
自然语言生成:现状与挑战
李磊