大数跨境
0
0

人工智能助力新学术搜索引擎崛起,谷歌学术面临挑战

人工智能助力新学术搜索引擎崛起,谷歌学术面临挑战 学术头条
2016-11-16
2
导读:Semantic Scholar语义学术搜索将搜索范围扩大三倍,微软学术搜索也在人工智能帮助下重生了。

Semantic Scholar语义学术搜索将搜索范围扩大三倍,微软学术搜索也在人工智能帮助下重生了。

最近,一个基于人工智能的免费学术搜索引擎的创始人宣布,将搜索涵盖范围扩大,涵盖约1000万篇计算机和神经科学研究论文,这一系统的目标是超过谷歌学术搜索。从去年11月该引擎发布以来,已有数家基于人工智能的学术搜索引擎加入竞争,最引人瞩目的是计算机巨头微软重新踏入了这一领域。

在圣迭戈召开的美国神经科学学会年会上,由华盛顿州西雅图的非营利组织艾伦人工智能研究所(AI2)开发的语义学术搜索网站(SemanticScholar)发布了新的版本。这给一些曾提前预览过该网站的科学家留下了深刻印象。斯坦福大学的神经生物学家安德鲁·胡伯曼(Andrew Huberman)说:“这个网站可以改变游戏规则,它可以带你成功穿过浓密的信息丛林。”


基于人工智能的语义学术搜索负责人,艾伦人工智能研究所主任奥伦·艾齐奥尼(Oren Etzioni)

该搜索引擎最初发布于2015年11月,能够凭借对论文内容和语境的更复杂的理解,实现对学术论文的分类和排序。广受欢迎的谷歌学术搜索可以访问约2亿份文档,并能扫描需要付费浏览的文章,但其搜索方式仅有关键字搜索。相比之下,语义学术搜索的功能更为强大,比如可以搜索对某篇论文最有意义的引用,而且能按被引用次数增加的速度对论文排序,这是衡量论文热门程度的指标。

Semantic Scholar最初发布时,范围仅限计算机科学领域的300万篇论文。由于和AI2的姊妹单位──艾伦脑科学研究所的合作,该网站现在已陆续添加了数百万篇神经学和医学的论文和搜索过滤器。这些过滤器可以让用户的搜索更有针对性,比如目标论文是研究脑的哪一部分或哪种细胞、哪种模型生物、使用的是哪些方法等等。网站负责人奥伦·艾齐奥尼(Oren Etzioni)表示,明年,AI2打算将PubMed的全部论文加入索引,并将搜索范围扩展至全部医学学科。

何塞·曼努埃尔·戈麦斯-佩雷斯(Jose Manuel Gómez-Pérez)是马德里一家软件公司ExpertSystem 从事语义搜索的工作人员,他说:“我现在用得最多的还是谷歌学术搜索,但这个网站的潜力很大。”

微软的重生

 

不过,SemanticScholar并非唯一一个基于人工智能的搜索引擎。计算巨头微软今年5月也低调发布了自己的AI学术搜索工具“微软学术”(MicrosoftAcademic),以取代其前身微软学术搜索,微软已于2012年起停止对后者的更新。

微软的学术搜索算法和数据可以通过API和公开学术协会(OpenAcademic Society)供研究人员使用。后者是微软研究院、AI2和其他组织的合作伙伴。“做这项工作的人越多越好。”微软该项目负责人Wang Kuansan说。他表示Semantic Scholar将探索更深度的自然语言处理,即理解论文和查询中整个句子的意义。而微软的工具由自家网页搜索引擎“必应”提供语义搜索技术支持,涵盖范围更广,论文数量达1.6亿篇。

和SemanticScholar一样,微软学术也提供一些有用(如果说范围还较小)的过滤器,比如作者、期刊名和研究领域。而且在每个二级领域下都编写了一个“最有影响力的科学家”排行榜,列出了由递归算法得到的在相应领域发表了最重要的论文的人物,算法会根据论文被其他重要论文引用的次数判定其重要性高低。根据微软学术给出的结果,过去6个月最顶尖的神经科学家是梅奥诊所(Mayo Clinic)的克利福德·杰克(Clifford Jack)。

其他学者表示,他们对微软的努力印象深刻。搜索引擎逐渐把Google Scholar与订阅文献计量数据库(如Scopus和Web of Science)的优势结合起来,前者有庞大的覆盖范围,后者的搜索结果则更为结构化,Anne-Wil Harzing在英国密德萨斯大学研究科学指标,她对这个新产品进行了分析。 “不可否认的是,重生的微软学术正在快速成长。”她说。微软研究院表示,目前正在打造一个个性化的版本,预计于明年年初推出。用户可以登录,微软就可以推送他们感兴趣的新论文,还可以在用户自己的论文被人引用时提醒他们。

其他公司和学术机构也在开发人工智能驱动的软件,以深入挖掘在线的内容。例如,位于德国萨尔布吕肯的马普信息学研究所(Max Planck Institute for Informatics)正在开发一种名为DeepLife的搜索引擎,专门用于健康和生命科学研究。“这些是研究原型,而不是可持续维护的长期项目,”艾齐奥尼说。

从长远来看,AI2旨在创建一个系统,能够回答科学问题、提出新的实验设计或抛出有用的假设。“在20年之后,人工智能不但能够阅读科学文本,更重要的是,还能够理解科学文本。”艾齐奥尼说。


原文链接:http://www.nature.com/news/ai-science-search-engines-expand-their-reach-1.20964

【声明】内容源于网络
0
0
学术头条
致力于学术传播和科学普及,重点关注大模型、AI4Science 等前沿科学进展。
内容 1019
粉丝 0
学术头条 致力于学术传播和科学普及,重点关注大模型、AI4Science 等前沿科学进展。
总阅读605
粉丝0
内容1.0k