刚刚，GPT-5.5被中国纯血AI反超了！- 大数跨境

首页

刚刚，GPT-5.5被中国纯血AI反超了！

新智元

2026-06-13

新智元报道

【新智元导读】国产纯血大模型在医疗领域实现全面突破，综合能力超越 GPT-5.5，斩获双料第一。数据显示，其生成病历的医生采纳率高达 91%，标志着医疗 AI 正式跨越“可用”门槛。

过去两年，医疗大模型虽是 AI 落地最热门的赛道，却也是公认最难攻克的堡垒。尽管各大厂商发布会上指标亮眼，但一旦进入真实诊室，往往因无法适应复杂场景而被医生弃用。“能演示”与“能干活”之间存在巨大鸿沟。

然而，这一局面近日迎来转折。飞利浦《2026 未来健康指数》显示，27% 的临床医生承认 AI 在过去九十天中至少三次帮助其规避了医疗差错。紧接着，一家中国公司交出了更为硬核的答卷。

星火医疗大模型 V3.5
医生采纳率 91%

打破医疗 AI 落地的三大魔咒

6 月 9 日，讯飞医疗正式发布星火医疗大模型 V3.5。该模型实现病历生成医生采纳率 91%、书写时间缩短 52%、累计辅助诊断超 12 亿次。要理解这一成绩的分量，需先审视医疗 AI 面临的三大核心挑战：

容错率近乎为零：与其他领域不同，医疗场景下的错误建议关乎生命健康。模型必须具备可验证、可溯源、可问责的特性，而非仅仅是“大概率正确”。
真实场景极度复杂：真实诊室充满嘈杂人声、方言及断续的病情陈述，远超实验室安静的录音环境。许多模型在演示中表现完美，却在实战中“失聪”。
工作流不容打断：医生时间稀缺，若 AI 工具需要反复修改或二次校对，实则是增加负担。只有无缝嵌入现有工作流，才能真正落地。

星火医疗大模型 V3.5 的价值，正是在于其在临床刚需场景中，同时跨过了这三道门槛。

医生愿不愿意用，才是唯一的标尺

衡量医疗 AI 实用性的核心标准朴素而直接：医生在真实临床场景中，是否愿意直接采纳 AI 生成的结果。在此标准下，V3.5 在三大核心场景交出硬数据。

病历生成：时间砍半，采纳率 91%

病历书写是医生最耗时的工作之一。星火医疗大模型 V3.5 通过突破多源医患远场识别、多角色定向语音增强等核心技术，实现了端到端自动生成结构化病历。

在多家头部三甲医院的实际应用中，生成病历的合理率达 80%，医生采纳率高达 91%，书写时间缩短 52%。对于日均接诊百人的医生而言，这意味着每天可节省近 3 小时的文书时间，让 AI 真正从“负担”变为“助手”。

AI 读片：采用率 75%，达到专家会诊水准

影像辅诊是医疗 AI 的高难度方向。V3.5 利用多序列联合空间建模和影像 - 文本跨模态推理，不仅识别病灶，更能输出“意味着什么、下一步怎么办”的完整报告。

数据显示，其 X 线、MR 报告生成的医生采纳率达 75%，影像质控达到专家会诊水准。考虑到影像报告的专业复杂度，这是全球医疗大模型首次在真实临床场景中跨过此防线。

循证诊疗助理：随身的“医学图书馆”

针对医生对 AI“太自信地错”的担忧，V3.5 循证诊疗助理智能体采用“证据对齐—反思校验—专家强化”路径。每个建议均可追溯至权威文献，支持多步推理。

该系统覆盖病历质控、用药审核及跨专科辅助诊断，兼容中国诊疗规范及中西医体系。对标估值 120 亿美元的美国 OpenEvidence，讯飞的差异化优势在于更懂中国医疗体系。

打开引擎盖：全栈国产化与数据飞轮

星火医疗大模型 V3.5 的突破源于底层算力与算法的硬功夫。

首先，实现全国产算力底座上的长文本高效训练。针对医疗长上下文场景，模型在国产平台上跑通了 DSA（动态稀疏注意力）与 MTP（多Token 预测）技术，使长文本推理吞吐量提升 4.5 倍，确保医院本地化部署“跑得动、迭代得起”。

其次，16 亿人次数据飞轮正式转动。依托 16 亿人次脱敏医疗语音和 12 亿次真实诊疗数据，模型实现了语音、影像、语义的真正融合。这种多模态对齐能力，使其能将医生的话、看的片子、写的字串联成完整的临床逻辑链。

官方测试显示，在多项关键任务上，V3.5 综合能力显著超越 GPT-5.5、DeepSeek-V4-Pro 等主流大模型，证明了垂直医疗大模型在专业场景下的不可替代性。

双料第一：权威评测与规模落地

针对“自卖自夸”的质疑，第三方权威评测提供了有力佐证。

IDC 报告显示：在《中国医疗大模型技术评估 2026》中，讯飞星火医疗大模型综合实力位列行业第一，15 项核心指标中拿下 12 项第一，尤其在产品落地性、安全性及规模化应用能力上表现最优。

上海人工智能实验室 MedBench 评测：在发布前夕，该模型以综合得分 98.9 登顶中文医疗大模型榜单，在循证推理、安全校验等关键维度领先。

评测第一叠加 91% 的真实临床采纳率，标志着国内医疗大模型首次实现“实验室”与“市场”的双重领跑。

织就覆盖 806 个区县的医疗网

规模化落地是检验产品的试金石。目前，讯飞医疗已覆盖全国 806 个区县、7.7 万余家基层医疗机构，携手 600 余家等级医院（含 50 余家百强医院）。

在 C 端，讯飞晓医 APP 下载量突破 3000 万。通过 B+C 双向协同，院内成熟的临床能力赋能居民健康管理，构建了集居民、医生、管理端于一体的区域健康管理平台。

随着国家“人工智能+"行动的深入，政策红利与自主可控需求将为国产医疗大模型铺平道路。从技术创新到规模化营收的路径已然清晰。

结语：医疗 AI 的“可用元年”

91% 的采纳率表明，医疗大模型已从“未来的演示”转变为“诊室里可靠的工具”。星火医疗大模型 V3.5 的成功证明，在全国产算力底座上，中国完全有能力打造出世界一流且真正落地的专业医疗大模型。

当 AI 切实减轻医生负担、补齐基层缺口、守护大众健康时，技术的价值才真正落到实处。这或许是医疗大模型发展最正确的方向。

【声明】内容源于网络

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

内容 16234

粉丝 0

新智元智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

总阅读234.9k

粉丝0

内容16.2k