10月14日丨每日AI简讯丨阿里Qwen3-VL上线！视觉认知能力全面超越同类大模型- 大数跨境

首页

10月14日丨每日AI简讯丨阿里Qwen3-VL上线！视觉认知能力全面超越同类大模型

久新数智

2025-10-14

导读：摘要信息

9agent.ai

点击蓝字关注我们

每日AI简讯

2025-10-14

大模型

LLM

DeepGEM | 阅片即可知基因密码！AI大模型将重塑肿瘤基因检测流程
金域医学、腾讯与广州医科大学附属第一医院联合开发AI大模型DeepGEM，通过常规组织病理图像预测肿瘤患者基因突变情况，突破传统基因检测技术复杂、耗时久、成本高的困境。该模型可缩短等待时间，降低检测成本，为病情紧急及基层患者提供经济可及的基因诊断路径，目前已在金域落地部署，推动多癌种临床辅助诊断。
Qwen3-VL | 硅基流动平台上线阿里 Qwen3-VL 模型，全面提升视觉认知能力
近日，硅基流动平台上线阿里最新发布的Qwen3-VL系列开源模型，该模型在视觉理解、时序分析及多模态推理方面有显著进步，支持32种语言OCR，能处理弱光、模糊文本；原生支持256K上下文（可扩展至1M），可处理数小时视频并精准定位关键事件；还能与界面交互完成任务，生成图表、代码等。其创新技术提升了长视频推理和图像捕捉能力，多项评测表现超闭源模型。

产品&应用

Product Application

CherryIN | Cherry Studio 推出 CherryIN，全面整合主流 AI 模型
Cherry Studio 近日发布 v1.6.4 版本并集成全新 CherryIN 系统，该系统整合了 Claude、Gemini、GPT-5、GLM、Grok 及全系列通义模型等主流 AI 模型，用户可在单一平台灵活使用多种模型。测试期间，各模型享优惠折扣（开源模型达40%），新注册用户还可获500,000个token用于模型体验，提升了用户使用便捷性和体验。
结构化图像生成编辑系统 | 告别 “乱画图表”，港中文团队推出首个结构化图像生成系统!
香港中文大学MMLab团队联合北航、上交等高校，推出首个结构化图像生成编辑系统，解决现有模型在图表等结构化图像生成中准确性不足的问题。该系统在数据（构建130万条代码对齐样本库）、模型（轻量级视觉语言模型整合）、评估（推出StructBench基准和StructScore指标）三方面创新，提升结构化图像生成能力，未来将应用于教育、科研和办公领域。
Reasoning Memory框架 | Google重磅突破!AI Agent 实现“自我进化”，从错误中学习变身超级智能体
Google提出革命性框架“Reasoning Memory”，旨在让AI Agents从自我经验和错误中积累知识，实现“自我进化”。该框架通过积累经验、概括抽象、重用优化，解决了当前AI代理无法从经验中成长的问题，实验显示其在复杂任务中性能提升显著，有望推动AI向更智能、自主方向演进，影响自动化客服等应用生态。
DeepGEM病理大模型 | 腾讯 AI 助力肺癌基因突变预测:准确率高达99%
腾讯生命科学实验室联合广州医科大学第一附属医院等研发的DeepGEM病理大模型，在肺癌基因突变预测中取得进展。该模型通过分析常规病理切片图像，1分钟内完成突变预测，准确率达78%-99%，无需昂贵基因测序，可降低成本、缩短时间，还能输出突变空间分布图。后续将合作建立"病理-基因多模态大模型平台"，推动AI在更多癌种应用。
Sora by OpenAI | Sora by OpenAI 即将登陆安卓平台，预注册已在北美开启
OpenAI的AI视频生成应用Sora即将登陆安卓平台，目前谷歌Play商店已现身该应用但不可用，仅北美（美国、加拿大）用户可预注册。此前Sora在iOS平台上线后表现亮眼，短时间内下载量突破100万，被称为“AI版抖音”。预注册开启意味着安卓版正式发布临近，该应用为用户创意表达提供了新工具。
通义千问、豆包 | 国内AI助手通义千问和豆包开启记忆功能，力争超越ChatGPT
阿里巴巴旗下通义千问与字节跳动旗下豆包两大AI助手，近日相继启动记忆功能内测，对标OpenAI的ChatGPT，从即时问答工具向长期私人助理转型。通义千问采用显式记忆设计，用户可主动触发并确认存储；豆包更新隐私政策及记忆功能FAQ，明确使用范围与用户控制权。此举显示国内AI助手正加速适应市场需求，提升智能化与人性化服务。
Claude Code插件 | Claude Code 插件功能上线，助力开发者提升编程效率
Anthropic公司推出AI编程助手Claude Code的全新“插件”功能并进入公开测试，旨在增强开发者自定义能力。该插件系统包含斜杠命令、子代理等四大核心组件，支持通过/插件命令灵活管理插件，还推出插件市场及官方套件（涵盖代码审查等场景），所有用户可参与测试，以提升开发效率并推动AI编程助手应用。
Perplexity | Perplexity CEO 宣布告别 PPT，借助 AI 实现投资者路演新模式
Perplexity联合创始人兼CEO阿拉文德・斯里尼瓦斯放弃传统PPT融资路演，转而使用AI工具Perplexity协助。他通过撰写备忘录、邀请投资者提问，利用Perplexity实时解答问题；面对投资者邮件疑问，复制内容至Perplexity生成“像阿拉文德一样”的答案链接回复。此模式获认可，双方次日完成资金转账，展示了AI在商业融资中的应用潜力。

硬件&底层技术

Hardware Technology

OpenAI | OpenAI联手阿根廷，投资250亿美元打造超级数据中心
近日，OpenAI与阿根廷能源公司Sur Energy签署意向书，计划投资250亿美元在阿根廷建设名为"Stargate 阿根廷"的超级数据中心，具备500兆瓦计算能力，专门支持先进人工智能计算。该项目为阿根廷最大信息技术与能源基建项目之一，将享受税收减免优惠，助力阿根廷成为南美洲人工智能科技中心，同时为全球AI发展提供算力支持。
蚂蚁集团 | 首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
10月13日，蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer。该框架解决了扩散语言模型推理中计算成本高、KV缓存失效等难题，在基准测试中，其推理速度较英伟达Fast-dLLM提升10.7倍，单批次推理速度首次超越自回归模型，标志着扩散语言模型向高效实践迈出关键一步。
Radical Numerics | 扩散模型新突破:Radical Numerics开源30B参数RND1，AI自我进化迈出关键一步
AI研究机构Radical Numerics于10月9日发布30B参数的RND1-Base扩散语言模型，为当前最大规模开源扩散语言模型。该模型基于Qwen3-30BA3B自回归模型转型，采用稀疏专家混合架构，支持并行生成与双向注意力，推理延迟更低，在MMLU、GSM8K等基准测试中表现优于同类模型，并开源完整权重及代码，推动扩散模型从理论向工程实践转化。

上市公司动态

Listed Company Updates

雅创电子(股票代码:301099) | 雅创电子：2025上半年AI收入超1.5亿，机器人业务有新进展
雅创电子10月13日在互动平台表示，公司AI战略布局成效初显，2025年上半年AI领域累计收入超1.5亿元。机器人业务方面，团队已获小批量订单，有望成为新利润增长点。此外，公司将加大IC业务研发投入，丰富车规级模拟芯片产品线，夯实自研IC业务扩张基础。

行业动态&政策

Industry Trends Policies

“2025全球十大工程成就”发布 DeepSeek、人形机器人等入选
10月13日，2025年世界工程组织联合会全体大会暨全球工程大会在上海开幕，会上由中国工程院院刊《Engineering》评选的“2025全球十大工程成就”正式发布，DeepSeek开源大语言模型、人形机器人、南水北调中线工程等项目入选。
日本政府对 OpenAI Sora 2 发布版权警告，要求遵守法律规定
日本政府近日对OpenAI的Sora2视频生成模型发布版权警告，内阁府特命担当大臣城内实表示，因Sora2可能生成近似日本动画的内容，政府要求其禁止侵犯版权。日本动画、漫画作为重要文化产业，政府强调将维护其版权。此外，美国电影协会也对Sora2可能侵权行为提出警告。
海尔阿里签署全面AI合作协议，共建数字产业新生态
近日，海尔集团与阿里巴巴集团签署全面战略合作协议，达成AI合作，聚焦AI+云、电商、全球化三大领域，共建数字产业新生态。双方将在AI+云领域开展全栈合作，基于通义千问打造行业垂域模型；在先进制造整合平台与算力能力，推动AI应用创新；在电商构建跨地域数字化生态，并在全球化布局共建算力平台与云服务，支持海外市场发展。
2025 全球十大工程成就揭晓:DeepSeek入选
2025年“全球十大工程成就”评选结果公布，包括毅力号火星探测器、DeepSeek开源大语言模型、Blackwell GPU架构等十项成果。其中，Blackwell GPU架构提升了AI计算效率，为大模型训练提供支撑；DeepSeek开源大语言模型推动技术普及与行业智能化转型，体现工程科技的创新与对可持续发展的支持。
OpenAI 与微软达成重磅交易:股权结构再变，投资者面临稀释风险
OpenAI与微软达成重磅交易，公司估值达5000亿美元，主要得益于与英伟达、AMD的数十亿美元合同。微软将成最大单一股东（持股约30%），员工和非营利母公司各占近30%。但持续资金需求致现有投资者（如微软、软银等）面临股权稀释风险。OpenAI正转型营利性企业以推进上市，非营利母公司将调整股东权利，马斯克因早期捐赠未获股权提起诉讼，最终安排仍待谈判。

其他

Other

马斯克挖角 NVIDIA 核心团队，xAI 加速 “世界模型” 研发
埃隆・马斯克的xAI公司为推进“世界模型”研发，从NVIDIA挖来核心研究员Zeeshan Patel和Ethan He，二者分别在多模态模型、物理AI及视频自监督学习领域有专长。xAI计划2026年底推出首款动态生成3D AI游戏，长期将技术扩展至机器人、自动驾驶等领域，与特斯拉等旗下公司协同，争夺下一代AI系统市场。
Meta 挖角Thinking Machines Lab联合创始人
Meta近期成功挖角思维机器实验室（Thinking Machines Lab）联合创始人安德鲁・图洛克。图洛克曾与前OpenAI高管米拉・穆拉提共同创办该实验室，其离职或对实验室发展造成影响。Meta创始人扎克伯格此前多次尝试收购AI公司未果，此次引入顶尖人才被视为增强AI竞争力的重要策略，图洛克的经验将为Meta AI项目注入活力。

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 0

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读0

粉丝0

内容0