

1. Clinical Text Summarization: Adapting Large Language Models Can Outperform Human Experts
这篇论文研究了临床文本摘要的问题,探讨了大型语言模型 (LLMs) 在临床摘要任务中的表现。作者使用了八个 LLMs,涵盖了六个数据集和四个不同的摘要任务:放射学报告、患者问题、病程记录和医生 - 患者对话。通过彻底的定量评估,他们发现了模型和适应方法之间的权衡,以及最近在 LLMs 方面的发展可能不会导致更好结果的情况。在临床读者研究中,作者发现最佳适应 LLM 的摘要在完整性和正确性方面优于人类摘要。进一步的定性分析揭示了 LLMs 和人类专家面临的相互挑战。最后,他们将传统定量 NLP 指标与读者研究评分相关联,以增强对这些指标与医生偏好的理解。他们的研究首次表明,在多个任务中,LLMs 在临床文本摘要方面可以超过人类专家。这暗示了将 LLMs 整合到临床工作流程中可以减轻文档负担,使临床医生能够更多地关注个性化患者护理和其他不可替代的医学人类方面。
论文链接:https://www.aminer.cn/pub/6503bec83fda6d7f067c757a
2. Agents: An Open-source Framework for Autonomous Language Agents
这篇论文介绍了一款名为"Agents"的开源框架,用于构建自主语言代理。近期在大语言模型(LLM)方面的进展使得研究人员和开发者能够构建自主语言代理,这些代理可以自动解决各种任务,并使用自然语言接口与环境、人类和其他代理进行交互。作者认为,语言代理是通向人工通用智能的有前途的方向,并发布了 Agents,这是一个开源库,旨在将这些进展开放给更广泛的非专业受众。Agents 精心设计,支持包括规划、记忆、工具使用、多代理通信和细粒度符号控制等重要功能。用户友好是 Agents 的一个特点,因为它使得非专业人员能够在不进行大量编码的情况下构建、自定义、测试、调整和部署最先进的自主语言代理。该库还具有研究友好型设计,其模块化设计使其易于扩展,方便研究人员使用。
论文链接:https://www.aminer.cn/pub/6503bec83fda6d7f067c7765
3. Ambiguity-Aware In-Context Learning with Large Language Models
这篇论文研究了在大语言模型中进行模糊性感知上下文学习(Ambiguity-Aware In-Context Learning)。上下文学习(In-context learning,ICL)指的是仅向大型语言模型展示几个任务特定示例,无需进行任务特定微调,即可获得下游增益。然而,大型语言模型对提示的选择非常敏感,因此一个关键的研究问题是 如何选择好的示例进行上下文学习。一种有效的策略是利用 ICL 示例和测试输入之间的语义相似性,使用文本检索器来选择示例,但这并不考虑 LLM 关于该任务的现有知识。从以前的工作(Min 等,2022)中,我们已经知道标签与示例配对会偏颇模型预测。这让我们猜测,是否考虑 LLM 关于任务的现有知识,特别是关于输出标签空间的知识,可以帮助我们选择更好的示例选择策略。通过在三个文本分类任务上进行大量实验,我们发现不仅选择语义相似的 ICL 示例是有益的,而且选择那些有助于解决测试示例周围固有标签模糊性的示例也是有益的。有趣的是,我们发现包括 LLM 之前错误分类的示例,并且落在测试示例决策边界上的示例,可以带来最大的性能提升。
论文链接:https://www.aminer.cn/pub/6503bec83fda6d7f067c7787
4. Generative Image Dynamics
这篇论文提出了一种名为"生成图像动力学"的方法,用于建模场景动态的图像空间先验。该先验从包含自然振荡运动的视频序列中提取的运动轨迹集合中学习得到,例如树木、花朵、蜡烛和风中摇曳的衣物。给定一张图像,经过训练的模型使用一种频率协调的扩散抽样过程,在傅里叶域预测每个像素的长期运动表示,我们称之为神经随机运动纹理。这种表示可以转换为密集的运动轨迹,覆盖整个视频。结合基于图像的渲染模块,这些轨迹可以用于许多下游应用,例如将静止图像无缝转换为动态视频,或使用户能够真实地与现实图片中的物体互动。
论文链接:https://www.aminer.cn/pub/6503bec83fda6d7f067c778d
5. AudioSR: Versatile Audio Super-resolution at Scale
这篇论文介绍了一种名为 AudioSR 的通用音频超分辨率模型,可以对各种音频类型(如音效、音乐和语音)进行鲁棒的音频超分辨率处理,突破了以前方法在音频类型和处理带宽方面的限制。具体来说,AudioSR 可以将输入音频信号在 2kHz 至 16kHz 的带宽范围内上采样为带宽为 24kHz、采样率为 48kHz 的高分辨率音频信号。在各种音频超分辨率基准测试中的客观评估显示,所提出的模型取得了优秀成果。此外,主观评估表明,AudioSR 可以作为即插即用的模块,提高包括 AudioLDM、Fastspeech2 和 MusicGen 在内的各种音频生成模型的生成质量。
论文链接:https://www.aminer.cn/pub/6503beb93fda6d7f067c57fa
6. Are Large Language Model-based Evaluators the Solution to Scaling Up Multilingual Evaluation?
这篇论文探讨了大型语言模型(LLM)为基础的评价器是否有助于扩大多语言评估。LLM 在自然语言处理(NLP)任务中表现出色,如问答、总结和分类。由于当前评估技术的局限性,包括缺乏适当的基准、指标、成本和人类注释者,使用 LLM 作为评估者越来越受欢迎,他们可以对其他模型的输出(通常是 LLM)进行排名或打分。尽管 LLM 可以处理大约 100 种语言,但除前 20 名之外的大多数语言在各种任务、指标和基准方面都缺乏系统性的评估。这迫切需要扩大多语言评估,以确保精确了解 LLM 在各种语言中的性能。基于 LLM 的评价器似乎是解决这个问题的完美方案,因为他们不需要人类注释者、人类参考或基准,并且理论上可以用于评估 LLM 覆盖的任何语言。在本文中,我们研究了 LLM-based 评价器是否有助于扩大多语言评估。具体来说,我们将基于 LLM 的评价与 8 种语言中 3 个文本生成任务的 5 个指标的 20k 人类判断进行校准。我们的研究结果表明,基于 LLM 的评价者可能存在偏向于更高分数的偏见,应谨慎使用,并且应始终使用母语人士判断的数据集进行校准,特别是在低资源和非拉丁文字语言中。
论文链接:https://www.aminer.cn/pub/6503bec83fda6d7f067c75a4
7. The Rise and Potential of Large Language Model Based Agents: A Survey
这篇论文名为《基于大型语言模型的人工智能代理的崛起与潜力:综述》,探讨了大型语言模型(LLMs)在人工智能(AI)领域中的应用及其作为 AI 代理基础的潜力。论文首先追溯了代理概念从哲学起源到 AI 领域的发展,并解释了为什么 LLMs 适合作为 AI 代理的基础。在此基础上,论文提出了一个概念框架,包括三个主要组件:大脑、感知和动作,该框架可根据不同应用进行调整。随后,论文探讨了 LLM-based 代理在三个方面的广泛应用:单代理场景、多代理场景和人类 - 代理协作。接着,论文深入研究了代理社会,探讨了 LLM-based 代理的行为和个性、当他们形成社会时出现的社会现象,以及他们为人类社会提供的见解。最后,论文讨论了该领域的一系列关键主题和开放性问题。
论文链接:https://www.aminer.cn/pub/6503bec83fda6d7f067c775f
8. Towards Artificial General Intelligence (AGI) in the Internet of Things (IoT): Opportunities and Challenges
这篇论文探讨了在物联网(IoT)中实现人工智能(AGI)的机会和挑战。物联网是一个由无数设备、传感器和系统相互连接的世界,共同收集和分享数据以实现智能决策和自动化。论文首先概述了物联网的基本原理以及人工智能在物联网系统中的关键作用。随后,深入研究了 AGI 的基本原理,最终形成了一个 AGI 与物联网无缝集成的概念框架。AGI 与物联网的融合应用范围广泛,包括智能电网、住宅环境、制造业和交通,以及环境监测、农业、医疗和教育等领域。然而,将 AGI 适应于资源受限的物联网环境需要专门的研究努力。此外,论文还讨论了由于计算资源有限、大规模物联网通信的复杂性,以及与安全和隐私相关的重要问题所带来的限制。
如何使用AMiner AI?
使用AMiner AI的方法很简单,打开AMiner首页,从页面顶部导航栏或者右下角便可进入AMiner AI页面。

在AMiner AI页面中,可以选择基于单篇文献进行对话和基于全库(个人文献库)对话,可选择上传本地PDF或者直接在AMiner上检索文献。

