Xiaomingbot – 多语言多模态新闻生成与播报

本次报告将介绍 Xiaomingbot，一款多语言多模态的新闻机器人。她能实现从结构化数据到多语言新闻文本的生成，并生成摘要。利用跨语言声音克隆技术，她也具备将多语言文本用同一种播报者的语音语调播出。利用脸部表情动作同步技术，她能合成生动的虚拟主播，脸部动作保持与语音播报文字的同步。自问世以来，已经在社交媒体生产文稿 60 万余篇。我们也将展望自动文本写作技术的挑战和未来发展前景。

视频内容概览