资讯
直通车
SOFT STAO
“清华AI医院”,首批42位AI医生亮相,覆盖300余种疾病
清华智能产业研究院(AIR)旗下又一孵化项目紫荆智康曝光,其专注 AI 医疗,构建了 Agent Hospital(清华 AI 医院),今年 5 月相关论文引发关注,9 月公司成立以推动应用落地。近期“紫荆 AI 医生”系统上线,42 位来自 21 个科室的 AI 医生亮相内测,预计 2025 年上半年向社会大众开放。Agent Hospital 旨在通过建立“闭环式”医疗虚拟世界实现 AI 医生加速进化,具有独特技术特色。紫荆智康构建的系统已扩展科室覆盖范围,设置多种模式并将进行更多能力测试。同时,以医疗智能体为代表的智慧医疗应用新方向开启,Agent Hospital 规划打造医疗版《西部世界》,未来人类医生角色将发生变化。从科技互联网变革医疗的历程来看,Agent Hospital 可能是破局时刻,其启动对医疗数据要求不高,还可助力医生培养。清华 AIR 除该项目外,在智慧交通、智慧物联、智慧医疗三大方向均有阶段性进展与成果,如智慧交通的产业化合作,智慧物联的绿色计算推进,智慧医疗在单细胞理解注释、药物筛选、蛋白质生成、制药等多方面的成果等。
三星:推出第二代生成式AI模型Samsung Gauss2
三星公司在韩国举办的开发者大会,宣布推出第二代生成式AI模型Samsung Gauss2。该多模态语言模型可处理多种数据类型,性能和效率显著提升。Gauss2有“精简版”“均衡版”“至尊版”三种规格,能满足不同计算环境与应用场景需求,分别具备在资源受限设备高效运行、平衡性能速度效率、保证高性能并降低计算成本等特点。它支持多种语言及编程语言,采用自主研发技术确保效率和准确性。与开源模型相比,Gauss2在多语言文本生成和代码编写等方面表现佳且处理速度大幅提升。目前Gauss2已在三星内部广泛应用,如“code.i”编码助手升级后为相关人员提供高效代码辅助服务,月度使用量增长四倍。
通义千问 API 调用价格一年下降 97%
世界互联网大会乌镇峰会开幕,阿里巴巴集团CEO吴泳铭在全体会议演讲时指出,AI推动千行百业生产力变革,其创造价值将远超互联网链接。面向AI时代,阿里巴巴专注完善AI基础设施与坚持开源开放将AI能力转化为生产力。过去一年阿里在AI基础设施高投入,因规模效应与技术进步使算力成本降低,“通义千问”API调用价格一年内降幅达97%,百万token调用成本最低至0.5元。他认为便宜算力会带我们进入智能化时代。还提到过去30年互联网主价值是链接,未来30年AI将全面提升生产力创造更大价值。且阿里坚持把自研大模型向全行业开源,目前全球开发者基于“通义千问”二次开发衍生模型超7.8万个,超800万用户通过“魔搭”下载应用模型。
歌曲生成平台Suno推出v4版本
AI歌曲生成平台Suno宣布推出v4版本,此次更新在音质、歌词精准度和歌曲结构方面有显著提升,官方称其音频更清晰、歌词更锐利、作品更具动感。v4带来“Remaster”新功能可提升旧版创作曲目质量,还引入AI驱动的歌词助手“ReMi”能提供更具创意的歌词。包括Remaster音轨升级可提升旧版音轨音质,ReMi歌词助理可助力轻松且创意性地创作歌词,还有个性化封面设计以及对Covers和Personas功能的全新升级,如Covers[v4]可生成全新演绎版本,Personas[v4]可塑造一致音乐形象。
Friend 预热人工智能吊坠硬件,对话平台可先行与 AI 聊天
初创公司Friend正在预热一款可挂在用户脖子上、通过内置麦克风和扬声器与用户对话的Friend AI吊坠硬件,不过尚未公布其具体规格。同时,Friend还上线了聊天对话平台,称用户可提前与吊坠硬件中内置的虚拟数字人对话,外媒测试发现相关数字人预设较“戏剧性”。外媒综合判断认为Friend AI及其吊坠硬件还有很长的路要走,且此前AI Pin和Rabbit R1的失败例子也让这款吊坠硬件面临重大挑战。
闲鱼:首次将AI技术应用于闲置交易
在第29届联合国气候大会中国角边会上,闲鱼CTO陈举锋宣布平台注册用户数破6亿并展示“闲鱼AI智能体”这一业内首用于闲置交易的AI模型。该智能体基于AI技术与闲鱼数据能力创建行业大模型以优化闲置交易体验。目前AI已应用于闲置交易多个环节,闲鱼因闲置交易特点及用户情况易产生问题,希望借大模型AI解决。2023年闲鱼从搭建“鱼力值”信用分体系切入探索AI,今年又陆续上线多款AI产品加速应用。陈举锋还表示未来希望每位闲鱼用户都有专属AI顾问,可通过对话让其完成闲置交易全流程工作。
Mistral AI发布全新多模态AI模型Pixtral Large
Mistral AI公司发布全新多模态AI模型Pixtral Large,其参数达1240亿,基于Mistral Large 2,可处理文本和图片,已在研究、商业等许可证下提供,适用于多种用途。该模型在MathVista、DocVQA、VQAv2等标准多模态基准测试中表现出色,尤其在MathVista准确率达69.4%超所有对手,在ChartQA和DocVQA测试中也超越GPT-4o和Gemini-1.5 Pro。它配备123B多模态解码器和1B视觉编码器,支持128K上下文窗口,能处理至少30张高分辨率图像,在视觉数据、复杂推理及图表理解方面能力强大。

