在新事物不断涌现,且事物之间联系不断丰富的时代背景下,作为一项新生技术,知识图谱旨在对现实世界中概念或实体及其之间的联系进行建模.由于直接来自于现实世界,知识图谱中的实体和关系往往以符号化形式表示.要实现进一步的价值挖掘,进行知识图谱计算,就需要将符号化表示转换为数值形式.知识图谱表示学习技术应运而生.目前,知识图谱表示学习已得到很大发展.依据应用领域不同,可以将知识图谱划分为通用领域和特定领域两种.已有表示学习模型多面向通用领域构建,且在通用领域的样本数据上进行验证.如果将这些模型运用到特定领域,就会面临新的数据分布挑战.为解决特定领域的知识图谱表示学习问题,本文以栖息地知识图谱和用户消费行为知识图谱为例进行了数据特征分析,发现特定领域知识图谱的数据特征不仅与通用领域不同,且不同领域之间的分布也各有特点.所以,我们从比数据分布更抽象的角度,即基于知识图谱构建语义联系的本质特征,以三元组为建模粒度,对头实体、关系和尾实体之间的交互作用进行了充分拟合,提出InterTris模型.同时,基于家谱领域的公共知识图谱Kinship、微生物领域的酶知识图谱样本ES、微生物领域的栖息地知识图谱样本LiveIn和电子商务领域的用户消费行为知识图谱样本UserAct共计四个数据集,以部分较优的转换模型和组合模型为基线,通过链接预测和三元组分类两组实验,本文发现InterTris在四个数据集上都取得了整体最优的效果,充分证明了在三元组粒度进行交互建模的必要性和合理性.
[知识图谱, 表示学习, 特定领域, 三元交互, 链接预测, 三元组分类]
[张祎, 孟小峰]