

语义解析神经网络(Semantic Parsing Neural Network)

目前基于 Semantic Parsing 的 KBQA 主要有 4 种方法:

语义解析(Semantic Parser)过程转化为查询图生成问题的各类方法; 在领域数据集适用的 Encoder-Decoder 模型化解析方法; 基于 Transition-Based 的状态迁移学习的解析方法; 利用 KV-MemNN 进行解释性更强的深度 KBQA 模型;


传统的 Semantic Parser 方法主要依赖于预先定义的规则模板,或者利用监督模型对用户 Query 和语义形式化表示(如 CCG [11]、λ-DCS [12])的关系进行学习,然后对自然语言进行解析。

这种方法需要大量的手工标注数据,可以在某些限定领域和小规模知识库(如 ATIS [13]、GeoQuery)中达到较好的效果,但是当面临 Freebase 或 DBpedia 这类大规模知识图谱的时候,往往效果欠佳。

查询图方法(Query Graph)


Transition-Based 方法

Memory Network 方法


信息检索(Information Retrieval)

基于搜索排序(IR)的知识图谱问答的工作流: 首先会确定用户 Query 中实体提及词(Entity Mention); 然后链接到 KG 中的主题实体(Topic Entity),并将 Topic Entity 相关的子图(Subgraph)提取出来作为候选答案集合; 然后分别从 Query 和候选答案中抽取特征; 最后利用排序模型对 Query 和候选答案进行建模并预测




《Information Extraction over Structured Data: Question Answering with Freebase 》是该类方法的基础模型,处理流程:

先对问句进行句法分析,并对其依存句法分析结果提取问题词(qword)、问题焦点词(qfocus)、主题词(qtopic)和中心动词(qverb)特征,将其转化为问句特征图(Question Graph) 然后利用 qtopic 在 KG 内提取 Subgraph,并基于此生成候选答案特征图 最后将问句中的特征与候选特征图中的特征进行组合,将关联度高的特征赋予较高的权重,该权重的学习直接通过分类器学习

但这种方法有两点不足: 需要自行定义并抽取特征,而且问句特征和候选答案特征组合需要进行笛卡尔乘积,特征纬度过大; 此方法难以处理复杂问题;





从 KG/QA 中学习模版,然后将问句拆解成 Logical Forms 或理解其意图


Message Parsing NN + Stepwise Reasoning Network

Neural Symbolic Machine(NSM)






