专家称,人工智能能够应对减少人类痛苦的挑战。我们呢?
21 世纪初,亚当·罗德曼 (Adam Rodman) 还是一名医学院二年级学生,他到图书馆看望一位让医生束手无策的病人。罗德曼查阅了目录,复制了研究论文,并与团队分享。
“这对患者的治疗产生了很大的影响,”罗德曼说。“每个人都说,‘这太棒了。这是循证医学。’但这花了两个小时。而我今天可以在 15 秒内完成。”
罗德曼现在是哈佛医学院的助理教授,也是贝斯以色列女执事医疗中心的医生。如今,他的口袋里装着一个医学图书馆——这是 2022 年大型语言模型 ChatGPT 发布后开发的一款智能手机应用。OpenEvidence——部分由医学院教职员工开发——允许他查询特定疾病和症状。它搜索医学文献,起草研究结果摘要,并列出最重要的进一步阅读来源,在罗德曼与患者面对面时提供答案。
“我们会说,‘哇,这项技术真的很强大。’但我们该如何利用它才能真正改变现状呢?”亚当·罗德曼
几十年来,各种形式的人工智能一直应用于医学领域——但不是这样的。专家预测,大型语言模型的采用将重塑医学。一些人将其潜在影响与人类基因组解码,甚至互联网的兴起相提并论。预计其影响将体现在医患互动、医生的文书工作量、医院和医生执业管理、医学研究和医学教育方面。
这些影响大多可能是积极的,提高效率,减少错误,缓解全国范围内初级保健的压力,使数据更充分地影响决策,减轻行政负担,并为更长时间、更深入的人际互动创造空间。
亚当·罗德曼(Adam Rodman) ,哈佛医学院助理教授、贝斯以色列女执事医疗中心医师
“我内心的乐观主义者希望人工智能可以让我们医生成为更好的自己,从而更好地照顾我们的患者。”
但也存在一些严重的隐患。
当前的数据集往往反映出社会偏见,这些偏见加剧了弱势群体在医疗服务可及性和质量方面的差距。如果不加以纠正,这些数据可能会将现有的偏见固化在日益强大的人工智能中,而人工智能将日益影响医疗保健的运作方式。
专家表示,另一个重要问题是,人工智能仍然容易产生“幻觉”,编造“事实”并将其呈现为真实的。
然后还有一种危险,那就是医学界不够大胆。最新的人工智能有可能彻底改变医疗保健,但前提是有机会。错误的优先顺序——过于尊重既得利益,关注金钱而不是健康——很容易将人工智能“革命”沦为一场平淡无奇的修修补补。
“我认为我们处在一个奇怪的领域,”罗德曼说。“我们会说,‘哇,这项技术真的很强大。’但我们该如何利用它才能真正改变现状呢?作为一名临床医生和研究人员,我担心的是,如果我们不大胆思考,如果我们不尝试重新思考我们组织医学的方式,那么情况可能不会发生太大变化。”
加固“摇摇欲坠的大厦”
五年前,当被问及人工智能在医疗保健领域的作用时,艾萨克·科哈内 (Isaac Kohane) 的回答令人沮丧。那些沉迷于社交媒体应用的青少年比许多医生更有能力。他说,今天的情况截然不同。
科哈内是医学院生物医学信息学系主任,也是《新英格兰医学杂志》新AI 计划的主编,他将最新模型的能力描述为“令人难以置信”。为了说明这一点,他回忆起早期对 OpenAI 的 GPT-4 的了解。他用一个复杂的案例(一个天生生殖器模糊的儿童)对它进行了测试,这甚至可能让经验丰富的内分泌学家都感到困惑。科哈内向 GPT-4 询问了遗传原因、生化途径、检查的下一步,甚至询问了该告诉孩子的父母什么。它在测试中获得了高分。
“这个大型语言模型并没有被训练成医生;它只是被训练来预测下一个单词,”Kohane 说。“它可以连贯地谈论葡萄酒与素食菜单的搭配,就像诊断一个复杂的病人一样。这确实是一个巨大的飞跃,任何诚实的计算机科学人士都无法预测未来 10 年会发生什么。”
哈佛医学院生物医学信息学系主任、《新英格兰医学杂志》新 AI 期刊主编Isaac Kohane
“与临床医生进行任何互动后立即获得第二意见将会更好地改变医患关系的性质。”
时机已到。长期以来,美国医疗保健系统一直受到批评,称其成本高、效率低、过于注重治疗而非预防,目前已出现问题。科哈内回忆起一位新进系的教员找不到初级保健医生,他已经厌倦了近距离观察这种情况。
“我早就说过,医疗系统存在问题,波士顿的医疗系统问题非常明显,”他说。“人们担心人工智能的公平问题。我想说的是,我们今天面临着巨大的公平问题。除非你人脉广泛,愿意为礼宾服务多付数千美元,否则你将很难找到及时的初级保健服务。”
Kohane 表示,人们最初担心人工智能会取代医生,但后来意识到该系统既需要人工智能,也需要人力。将执业护士和医生助理与人工智能合作是几种有希望的方案之一。
“现在的讨论不再是‘人工智能是否会取代医生’,而是‘人工智能能否通过一组可能与我们习惯的临床医生来巩固摇摇欲坠的有组织医学大厦?’”
构建最佳助手
科哈恩说,法学硕士课程的推广方式——同时面向所有人——加速了其普及。医生们立即尝试了一些令人眼花缭乱但必不可少的任务,比如向保险公司写事先授权申请,解释某些特定治疗(通常很昂贵)的必要性。
“人们就这么做了,”科哈内说。“医生们在推特上来回发文,说他们节省了这么多时间。”
患者也这样做,寻求虚拟的第二意见,就像那个反复疼痛的孩子一样,三年来被 17 位医生误诊。在这个广为人知的案例中,男孩的母亲将他的医疗笔记输入 ChatGPT,这表明了一种没有医生提到过的疾病:脊髓栓系综合征,脊髓在脊柱内被束缚。当患者移动时,脊髓会拉伸,而不是平稳滑动,从而引起疼痛。神经外科医生确认了诊断,然后纠正了解剖异常。
当然,在诊所使用人工智能的其中一个好处是让医生在第一时间就表现得更好。更快、更全面地获取病史、建议诊断和其他数据有望提高医生的表现。但最近的一项研究表明,还有很多工作要做。
10 月份发表在《JAMA Network Open》上的一项研究比较了单个医生、使用 LLM 诊断工具的医生和仅使用 LLM 的医生的诊断。结果令人惊讶,显示使用 LLM 的医生的准确率提高不大——76%,而单个医生的准确率提高 74%。更令人惊讶的是,仅使用 LLM 的医生表现最好,得分比仅使用医生高出 16 个百分点。
罗德曼是该论文的资深作者之一,他表示,人们很容易得出法学硕士学位对医生没有太大帮助的结论,但他坚持认为,深入研究这一发现很重要。他说,在这项研究(于 2023 年进行)之前,只有 10% 的医生是经验丰富的法学硕士学位使用者,其余的医生只接受过基础培训。因此,当罗德曼后来查看成绩单时,发现大多数人使用法学硕士学位进行基本事实检索。
“现在医生使用它的最佳方式是征求第二意见,当他们遇到棘手的病例时可以重新审视自己,”他说。“我怎么会错?我遗漏了什么?我还应该问什么问题?从心理学文献中我们知道,这些都是补充人类思维方式的方法。”
麻省总医院人工智能和生物信息学习系统中心联席主任戴维·贝茨 (David Bates) 表示,人工智能的其他潜在好处之一是可以让药物更安全。贝茨和同事最近的一项研究表明,马萨诸塞州医院四分之一的就诊会导致患者受到某种伤害。其中许多事件都与药物不良反应有关。
贝茨表示:“人工智能应该能够寻找与药物相关的问题,并比我们现在能够做到的更准确地识别它们。”他也是哈佛大学医学院的医学教授,也是哈佛大学陈曾熙公共卫生学院的卫生政策与管理教授。
麻省总医院人工智能和生物信息学学习系统中心联席主任David Bates
“人工智能有产生幻觉的倾向,这令人担忧,因为我们不希望人们的记录中出现实际上并不存在的东西。”
医学院医学教育院长 Bernard Chang 表示,另一个机遇源于人工智能在一个平凡领域日益增强的能力:笔记记录和总结。
“环境记录”系统很快就能监听病人的就诊情况,记录病人所说的和所做的一切,并实时生成有组织的临床记录。当讨论症状时,人工智能可以提出诊断和治疗方案。之后,医生可以检查总结的准确性。
张说,笔记和摘要的自动化将给医护人员带来多方面的好处。它将减轻医生的文书工作负担,而文书工作通常被认为是导致倦怠的原因,它将重塑医患关系。患者对门诊就诊的最大抱怨之一是医生坐在电脑前,提问并记录答案。摆脱了记笔记的过程,医生可以与患者面对面,开辟一条通往更紧密联系的道路。
“这不是人工智能最神奇的用途,”Chang 说。“我们都看到过人工智能做一些事情,然后说,‘哇,这太神奇了。’这不是其中之一。但这个项目正在全国不同的门诊诊所试行,早期结果非常令人鼓舞。感到负担过重和精疲力竭的医生开始说,‘你知道吗,这个工具会帮助我。’”
哈佛医学院医学教育院长Bernard Chang
“我认为人工智能对医学和医学教育的影响堪比互联网,是一种变革工具。”

偏见威胁
尽管法学硕士 (LLM) 实力强大,但他们并不甘于被孤立。
“技术还不够好,无法达到不需要知识渊博的人的安全水平,”罗德曼说。“我能理解它可能会在哪里搁浅。我可以进一步诊断。我能做到这一点,因为我吃过苦头。在住院医生实习期间,你会犯很多错误,但你会从这些错误中吸取教训。我们目前的系统非常不理想,但它确实能训练你的大脑。当医学院的学生与可以自动化这些过程的东西互动时——即使它们平均比人类更好——他们将如何学习?”
医生和科学家也担心错误信息。贝斯以色列女执事医疗中心肺科、重症监护和睡眠医学科副教授兼医师 Leo Celi 表示,普遍的数据偏见源于生物医学在富裕西方国家的根源,这些国家的科学是由研究白人的白人男性塑造的。
Leo Celi,贝斯以色列女执事医疗中心肺部、重症监护和睡眠医学科医学副教授兼医师
“我们需要设计人类人工智能系统,而不是构建算法。我们必须能够预测人类会如何犯错。”
“在构建人工智能之前,你需要了解数据,”Celi 说。“这让我们对传统医疗保健系统和医学教育系统的设计缺陷有了新的认识。很明显,现状非常糟糕——我们知道它很糟糕,我们已经接受了这是一个有缺陷的系统——除非我们重新编码世界本身,否则人工智能的所有承诺都将破灭。”
Celi 引用了一项关于因糖尿病住院的讲英语和不讲英语的患者在护理方面的差异的研究。不讲英语的患者醒来检查血糖的次数较少,因此更有可能错过血糖变化。然而,这种影响是隐藏的,因为数据并没有明显的偏差,只是不完整,尽管它仍然造成了护理方面的差异。
“他们只进行一两次血糖检查,而如果你英语说得好,则需要进行十次,”他说。“如果取平均值,计算机就不会发现这是一种数据不平衡。缺失的背景信息太多,专家可能不知道我们所说的‘数据伪影’。这是数据生成过程的社会模式造成的。”
贝茨举了更多例子,包括一种皮肤癌仪器在检测色素沉着严重的皮肤上的癌症方面效果不佳,以及一种排班算法错误地预测黑人患者的失约率会更高,从而导致预约过多和等待时间更长。
“大多数临床医生并不知道,我们拥有的每种医疗设备在一定程度上都存在偏见,”Celi 说。“它们并不适用于所有群体,因为我们对它们进行了原型设计,并针对大学年龄的白人男性学生进行了优化。它们并没有针对 80 岁且患有所有这些合并症的 ICU 患者进行优化,那么为什么人们会期望它们所代表的数字是客观事实呢?”
Celi 表示,暴露遗留系统中的深层偏见为纠正错误提供了机会。因此,越来越多的研究人员正在努力确保临床试验招募来自不同地理位置的不同人群。
一个例子是贝斯以色列医院的 MIMIC 数据库,它反映了医院多样化的患者群体。该工具由 Celi 监督,以开源格式为研究人员提供匿名电子医疗记录(笔记、图像、测试结果)。他说,世界各地的研究人员已经在 10,000 项研究中使用了该数据库,并将扩展到另外 14 家医院。
敏捷时代
与临床一样,实验室中使用的人工智能模型并不完美,但它们开辟了有望大大加速科学进步的道路。
“它们在原子尺度上为一些目前仍无法通过实验获得或需要花费大量时间和精力才能生成的分子提供了即时见解,”医学院生物医学信息学副教授 Marinka Zitnik 说道。“这些模型提供了准确的计算机预测,科学家可以在他们的科学工作中加以利用。对我来说,这只是暗示了我们正处于这个不可思议的时刻。”
“越来越重要的是开发可靠、忠实的基准或技术,让我们能够评估人工智能模型的输出在现实世界中的表现。” 玛琳卡·兹特尼克
Zitnik 的实验室最近推出了 Procyon,这是一种旨在弥补蛋白质结构及其生物学作用方面的知识空白的人工智能模型。
直到最近,科学家们才开始理解蛋白质的形状——长分子如何在三维空间中折叠和扭曲。这一点很重要,因为扭曲和扭曲会暴露分子的某些部分并隐藏其他部分,使这些位置更容易或更难与其他分子相互作用,从而影响分子的化学性质。
Marinka Zitnik,生物医学信息学助理教授
“研究实验室的见解并不总能转化为有效的治疗方法,如果人工智能不能弥合这一差距,它可能会扩大这一差距。”
兹尼克说,如今,根据已知的氨基酸序列预测蛋白质的形状(几乎精确到每个原子)是可行的。最大的挑战是将这些结构与各种生物环境和疾病中的功能和表型联系起来。大约 20% 的人类蛋白质功能不明确,而绝大多数研究(95%)都集中在 5,000 种经过深入研究的蛋白质上。
Zitnik 说:“我们通过将分子序列和结构与功能注释相连接来预测蛋白质表型,从而解决这一差距,帮助该领域更接近能够通过计算机预测每种蛋白质的功能。”
实验室人工智能的长期目标是培养“人工智能科学家”,作为研究助理,能够访问全部科学文献,将这些知识与实验结果相结合,并能提出下一步建议。Zitnik 表示,这些系统可以发展成为真正的合作者,并指出一些模型已经产生了简单的假设。例如,她的实验室使用 Procyon 来识别麦芽糖酶葡糖淀粉酶蛋白中与米格列醇结合的结构域,米格列醇是一种用于治疗 2 型糖尿病的药物。在另一个项目中,该团队表明 Procyon 可以对与帕金森病有关的未充分表征的蛋白质进行功能注释。Zitnik 表示,该工具之所以具有广泛的功能,是因为它是在大量实验数据集和整个科学文献上进行训练的,这些资源远远超出了人类可以阅读和分析的范围。
课堂先于实验室,人工智能的灵活性、创新性和持续学习的动态也正在应用于教育。医学院开设了一门有关医疗保健领域人工智能的课程;增加了医学领域人工智能的博士课程;计划推出一款“导师机器人”,在讲座之外提供补充材料;并正在开发一款虚拟病人,学生可以在第一次与真实病人的紧张接触之前练习。与此同时,罗德曼正在领导一个指导小组,研究生成式人工智能在医学教育中的应用。
他说,这些举措是一个良好的开端。然而,人工智能技术的快速发展使得学生很难为长达 30 年的职业生涯做好准备。
“哈佛的观点,也是我的观点,是我们可以给人们提供基本知识,但我们必须鼓励人们灵活应对,为快速变化的未来做好准备,”罗德曼说。“我们能做的最好的事情可能是让人们做好迎接意外的准备。”
免责声明:
关注我们,一起探索AWM!
近期热点
2025-03-10
2025-03-07
2025-02-28




