论文题目
DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning
作者:
Wenhan Xiong ;
Thien Hoang ;
William Yang Wang;
推荐理由:
这篇文章首次将强化学习的思想引入到知识图谱的推理过程中,企图找到多跳(h,r,?)问题推理的最佳路径。文章首先将所有的节点进行embedding,然后训练一个简单的policy network,输入(当前节点的embedding,到目标节点的embedding之间的差),输出所有要采取的relation的分布(即policy)。

训练方法比较粗糙,使用基本的policy gradient,每次的路径找到目标给一个奖励,找不到-1。但是可以给基于认知的推理很多启发。

摘要:
We study the problem of learning to reason in large scale knowledge graphs (KGs). More specifically, we describe a novel reinforcement learning framework for learning multi-hop relational paths: we use a policy-based agent with continuous states based on knowledge graph embeddings, which reasons in a KG vector space by sampling the most promising relation to extend its path. In contrast to prior work, our approach includes a reward function that takes the accuracy, diversity, and ef- ficiency into consideration. Experimentally, we show that our proposed method outperforms a path-ranking based algorithm and knowledge graph embedding methods on Freebase and Never-Ending Language Learning datasets.1
学术头条已建立微信交流群,想进群的同学请加学术君微信:AMiner308,记得备注:名字+单位/学校噢!

[关于转载]:本文为“学术头条”原创文章。转载仅限全文转载并保留文章标题及内容,不得删改、添加内容绕开原创保护,且文章开头必须注明:转自“SciTouTiao”微信公众号。谢谢您的合作。

分享干货
AMiner迄今为止已发布17期AI系列研究报告,您可在后台回复对应数字获取报告。
2019年报告
15 → 《人工智能之数据挖掘》
16 → 《人工智能之知识图谱》
17 → 《人工智能之图计算》
2018年报告
1 → 《自动驾驶研究报告》
2 → 《机器人研究报告》
3 → 《区块链研究报告》
4 → 《行为经济学研究报告》
5 → 《机器翻译研究报告》
6 → 《通信与人工智能研究报告》
7 → 《自动驾驶研究报告》前沿版
8 → 《自然语言处理研究报告》
9 → 《计算机图形学研究报告》
10 → 《超级计算机研究报告》
11 → 《3D打印研究报告》
12 → 《智能机器人研究报告》前沿版
13 → 《人脸识别研究报告》
14 → 《人工智能芯片研究报告》
推荐阅读:
博士带你学LSTM|怎么开发一个LSTM模型来生成形状?(附代码)
微信公众号菜单栏为大家设置了“论文推荐”和“优质分享”专栏,“北京讲座”移至“优质分享”专栏内,欢迎大家关注。

学术头条
发掘科技创新的原动力
您的转发就是我们最大的动力
点击阅读原文下载此篇论文(加载过程请耐心等待)

