大数跨境

刚刚,GPT-5.5被中国纯血AI反超了!

刚刚,GPT-5.5被中国纯血AI反超了! 新智元
2026-06-13
42

新智元报道

【新智元导读】国产纯血大模型在医疗领域实现全面突破,综合能力超越 GPT-5.5,斩获双料第一。数据显示,其生成病历的医生采纳率高达 91%,标志着医疗 AI 正式跨越“可用”门槛。

过去两年,医疗大模型虽是 AI 落地最热门的赛道,却也是公认最难攻克的堡垒。尽管各大厂商发布会上指标亮眼,但一旦进入真实诊室,往往因无法适应复杂场景而被医生弃用。“能演示”与“能干活”之间存在巨大鸿沟。

然而,这一局面近日迎来转折。飞利浦《2026 未来健康指数》显示,27% 的临床医生承认 AI 在过去九十天中至少三次帮助其规避了医疗差错。紧接着,一家中国公司交出了更为硬核的答卷。

星火医疗大模型 V3.5
医生采纳率 91%

打破医疗 AI 落地的三大魔咒

6 月 9 日,讯飞医疗正式发布星火医疗大模型 V3.5。该模型实现病历生成医生采纳率 91%、书写时间缩短 52%、累计辅助诊断超 12 亿次。要理解这一成绩的分量,需先审视医疗 AI 面临的三大核心挑战:

  • 容错率近乎为零:与其他领域不同,医疗场景下的错误建议关乎生命健康。模型必须具备可验证、可溯源、可问责的特性,而非仅仅是“大概率正确”。
  • 真实场景极度复杂:真实诊室充满嘈杂人声、方言及断续的病情陈述,远超实验室安静的录音环境。许多模型在演示中表现完美,却在实战中“失聪”。
  • 工作流不容打断:医生时间稀缺,若 AI 工具需要反复修改或二次校对,实则是增加负担。只有无缝嵌入现有工作流,才能真正落地。

星火医疗大模型 V3.5 的价值,正是在于其在临床刚需场景中,同时跨过了这三道门槛。

医生愿不愿意用,才是唯一的标尺

衡量医疗 AI 实用性的核心标准朴素而直接:医生在真实临床场景中,是否愿意直接采纳 AI 生成的结果。在此标准下,V3.5 在三大核心场景交出硬数据。

病历生成:时间砍半,采纳率 91%

病历书写是医生最耗时的工作之一。星火医疗大模型 V3.5 通过突破多源医患远场识别、多角色定向语音增强等核心技术,实现了端到端自动生成结构化病历。

在多家头部三甲医院的实际应用中,生成病历的合理率达 80%,医生采纳率高达 91%,书写时间缩短 52%。对于日均接诊百人的医生而言,这意味着每天可节省近 3 小时的文书时间,让 AI 真正从“负担”变为“助手”。

AI 读片:采用率 75%,达到专家会诊水准

影像辅诊是医疗 AI 的高难度方向。V3.5 利用多序列联合空间建模和影像 - 文本跨模态推理,不仅识别病灶,更能输出“意味着什么、下一步怎么办”的完整报告

数据显示,其 X 线、MR 报告生成的医生采纳率达 75%,影像质控达到专家会诊水准。考虑到影像报告的专业复杂度,这是全球医疗大模型首次在真实临床场景中跨过此防线。

循证诊疗助理:随身的“医学图书馆”

针对医生对 AI“太自信地错”的担忧,V3.5 循证诊疗助理智能体采用“证据对齐—反思校验—专家强化”路径。每个建议均可追溯至权威文献,支持多步推理。

该系统覆盖病历质控、用药审核及跨专科辅助诊断,兼容中国诊疗规范及中西医体系。对标估值 120 亿美元的美国 OpenEvidence,讯飞的差异化优势在于更懂中国医疗体系。

打开引擎盖:全栈国产化与数据飞轮

星火医疗大模型 V3.5 的突破源于底层算力与算法的硬功夫。

首先,实现全国产算力底座上的长文本高效训练。针对医疗长上下文场景,模型在国产平台上跑通了 DSA(动态稀疏注意力)与 MTP(多Token 预测)技术,使长文本推理吞吐量提升 4.5 倍,确保医院本地化部署“跑得动、迭代得起”。

其次,16 亿人次数据飞轮正式转动。依托 16 亿人次脱敏医疗语音和 12 亿次真实诊疗数据,模型实现了语音、影像、语义的真正融合。这种多模态对齐能力,使其能将医生的话、看的片子、写的字串联成完整的临床逻辑链。

官方测试显示,在多项关键任务上,V3.5 综合能力显著超越 GPT-5.5、DeepSeek-V4-Pro 等主流大模型,证明了垂直医疗大模型在专业场景下的不可替代性。

双料第一:权威评测与规模落地

针对“自卖自夸”的质疑,第三方权威评测提供了有力佐证。

IDC 报告显示:在《中国医疗大模型技术评估 2026》中,讯飞星火医疗大模型综合实力位列行业第一,15 项核心指标中拿下 12 项第一,尤其在产品落地性、安全性及规模化应用能力上表现最优。

上海人工智能实验室 MedBench 评测:在发布前夕,该模型以综合得分 98.9 登顶中文医疗大模型榜单,在循证推理、安全校验等关键维度领先。

评测第一叠加 91% 的真实临床采纳率,标志着国内医疗大模型首次实现“实验室”与“市场”的双重领跑。

织就覆盖 806 个区县的医疗网

规模化落地是检验产品的试金石。目前,讯飞医疗已覆盖全国 806 个区县、7.7 万余家基层医疗机构,携手 600 余家等级医院(含 50 余家百强医院)。

在 C 端,讯飞晓医 APP 下载量突破 3000 万。通过 B+C 双向协同,院内成熟的临床能力赋能居民健康管理,构建了集居民、医生、管理端于一体的区域健康管理平台。

随着国家“人工智能+"行动的深入,政策红利与自主可控需求将为国产医疗大模型铺平道路。从技术创新到规模化营收的路径已然清晰。

结语:医疗 AI 的“可用元年”

91% 的采纳率表明,医疗大模型已从“未来的演示”转变为“诊室里可靠的工具”。星火医疗大模型 V3.5 的成功证明,在全国产算力底座上,中国完全有能力打造出世界一流且真正落地的专业医疗大模型。

当 AI 切实减轻医生负担、补齐基层缺口、守护大众健康时,技术的价值才真正落到实处。这或许是医疗大模型发展最正确的方向。

【声明】内容源于网络
0
0
新智元
智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
内容 16234
粉丝 0
新智元 智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响,领航中国新智能时代。
总阅读234.9k
粉丝0
内容16.2k