CCKS(全国知识图谱与语义计算大会,China Conference on Knowledge Graph and Semantic Computing)已于本月24日在杭州召开。前几天我们对录用的部分论文进行了简单的剖析,今天我们就来继续解析部分录用的论文。
CCKS华人库已在GCT官网上线,想要了解论文作者详细信息可以通过下面链接进入人才库。
传送门:https://gct.aminer.cn/eb/gallery/detail/eb/5d5e4f9186d144b6fc835735(人才持续更新中)
基于连通图的篇章级事件抽取与相关度计算


剖析:本文的方法采用无监督的方式,不需要大规模的标注数据对模型进行训练,减少模型应用过程中的人力成本与时间成本。从整体上看,模型流程可以分为四个部分:关键子句筛选、关键事件词识别、标题关键词抽取、篇章相似度计算。前两部分对篇章核心事件词进行提取,第三部分与前两部分组成的pipline通过最后一步结合在一起,完成对篇章事件相关度 的计算。本文的创新点主要有以下两个方面:1.在传统Text Rank算法中引入了EM思想,使得模型可以同时对句子和词语的重要性进行识别;2.提出了以事件多边形为基本元素、事件关键词为节点的连通图构建方法,并在此基础上对关键事件词进行挖掘。本文设计了丰富的对比实验,验证了提出的模型的有效性。
基于多源知识图谱融合的智能导诊算法




剖析:本文的方法使用医疗网站的症状-疾病信息和区域平台EHR数据构建症状-疾病-科室知识图谱,然后对患者主诉进行症状和疾病的实体识别,通过基于WBDPMS算法和权重融合的方法进行科室推荐,本文的方法在真实患者主述的数据上准确率达到了0.83,能达到患者预诊科室要求。在未来,可以将贝叶斯概率融合在权重计算上,使联合症状对疾病的权重更为精准,进而获得更好的结果。此外,将会对疾病进行并发症的识别,优化知识图谱中不准确的疾病及其相关科室关系,并且可以获取更多信息检测患者异常用药,用来筛选由多开药导致的结果误差。为了能够更好的辅助患者进行诊疗,可与患者进行对话,使用当前预测疾病的其他症状,让患者进行确认,进一步对患者所患进行预测。
面向问题意图识别的深度主动学习方法




剖析:本文基于深度主动学习技术设计问题意图识别语料标注方法,以减少问题意图识别任务中的人工标注成本。针对深度学习在主动学习中计算量巨大等挑战,设计了一个轻量级深度学习意图识别模型,并实验证明了该模型在问题意图识别任务中表现出高性能的同时,训练速度更快。针对主动学习方法中常用的不确定性选择策略存在的孤立点和冗余问题,提出了一种结合样例的信息性、代表性与多样性三项准则的选择策略,并在实验证明了该选择策略能更有效地度量样例价值,减少更多的问题意图标注成本。
MSDL-IEW:面向文本分类的密集度感知不确定性主动学习算法



剖析:本文针对样本标注代价高的问题,提出了一种面向文本分类的不确定性主动学习方法,首先设计MSDL算法选取初始训练集,即通过LDA算法对样本密集度进行计算,从样本集的群体中选择密集度高的部分样本作为初始训练集,建立初始分类器,可保证初始分类器具有一定的代表性;接下来为了加快模型训练速度,本文引入了基于信息熵的样本加权策略,实验表明,IEW策略相较于传统最大熵样本选择策略更优;最后,实验结果表明,本文所提出的算法在准确率、召回率和F值三个指标上均有提升,融合了代表性和不确定性,从而提高了分类器的性能,使用70%的标注样本可接近全部标注样本的训练结果,可有效减少标注样本的成本。
融合依存关系和篇章修辞关系的事件时序关系识别




学术头条已建立微信交流群,想进群的同学请加学术君微信:AMiner308,记得备注:名字+单位/学校噢!
✦ 性别预测还能这么玩?告诉我你的姓名就够了!
✦ SIGCOMM 2019北京开幕,近五年SIGCOMM高引论文TOP10有哪些?
✦ IJCAI 50年获奖学者盘点,那些人工智能领域的闪耀明星!
✦ AI Time 4 | 论道数据共享开放与隐私保护
✦ AI Time 5 | 论道无人驾驶:近在咫尺还是遥遥无期
微信公众号菜单栏为大家设置了“论文推荐”和“优质分享”专栏,欢迎大家关注。


您的转发就是我们最大的动力
点击阅读原文查看更多内容!

