文本数据的语义理解的正确性是保障知识抽取准确性的关键,也是后续知识有效利用的重要基础。深度学习是目前最有效的面向知识抽取的文本数据语义理解方法,然而大规模、高质量标注训练数据缺失的问题限制了深度学习模型的效果,进而成为了信息抽取系统的瓶颈。本次报告将分享报告人在有限的标注训练数据的场景下,从特征增强和特征迁移的角度进行的数据混合增强、语法信息融合和跨领域迁移等一系列文本语义建模方法的尝试,初步降低了语义理解模型对领域标注的依赖,并提升了语义理解和信息抽取的效果。
张日崇