大数跨境

10月14日丨每日AI简讯丨阿里Qwen3-VL上线!视觉认知能力全面超越同类大模型

10月14日丨每日AI简讯丨阿里Qwen3-VL上线!视觉认知能力全面超越同类大模型 久新数智
2025-10-14
2
导读:摘要信息



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025-10-14


01

大模型

LLM

图片
  • DeepGEM | 阅片即可知基因密码!AI大模型将重塑肿瘤基因检测流程

    金域医学、腾讯与广州医科大学附属第一医院联合开发AI大模型DeepGEM,通过常规组织病理图像预测肿瘤患者基因突变情况,突破传统基因检测技术复杂、耗时久、成本高的困境。该模型可缩短等待时间,降低检测成本,为病情紧急及基层患者提供经济可及的基因诊断路径,目前已在金域落地部署,推动多癌种临床辅助诊断。

  • Qwen3-VL | 硅基流动平台上线阿里 Qwen3-VL 模型,全面提升视觉认知能力

    近日,硅基流动平台上线阿里最新发布的Qwen3-VL系列开源模型,该模型在视觉理解、时序分析及多模态推理方面有显著进步,支持32种语言OCR,能处理弱光、模糊文本;原生支持256K上下文(可扩展至1M),可处理数小时视频并精准定位关键事件;还能与界面交互完成任务,生成图表、代码等。其创新技术提升了长视频推理和图像捕捉能力,多项评测表现超闭源模型。


02

产品&应用

Product Application

图片
  • CherryIN | Cherry Studio 推出 CherryIN,全面整合主流 AI 模型

    Cherry Studio 近日发布 v1.6.4 版本并集成全新 CherryIN 系统,该系统整合了 Claude、Gemini、GPT-5、GLM、Grok 及全系列通义模型等主流 AI 模型,用户可在单一平台灵活使用多种模型。测试期间,各模型享优惠折扣(开源模型达40%),新注册用户还可获500,000个token用于模型体验,提升了用户使用便捷性和体验。

  • 结构化图像生成编辑系统 | 告别 “乱画图表”,港中文团队推出首个结构化图像生成系统!

    香港中文大学MMLab团队联合北航、上交等高校,推出首个结构化图像生成编辑系统,解决现有模型在图表等结构化图像生成中准确性不足的问题。该系统在数据(构建130万条代码对齐样本库)、模型(轻量级视觉语言模型整合)、评估(推出StructBench基准和StructScore指标)三方面创新,提升结构化图像生成能力,未来将应用于教育、科研和办公领域。

  • Reasoning Memory框架 | Google重磅突破!AI Agent 实现“自我进化”,从错误中学习变身超级智能体

    Google提出革命性框架“Reasoning Memory”,旨在让AI Agents从自我经验和错误中积累知识,实现“自我进化”。该框架通过积累经验、概括抽象、重用优化,解决了当前AI代理无法从经验中成长的问题,实验显示其在复杂任务中性能提升显著,有望推动AI向更智能、自主方向演进,影响自动化客服等应用生态。

  • DeepGEM病理大模型 | 腾讯 AI 助力肺癌基因突变预测:准确率高达99%

    腾讯生命科学实验室联合广州医科大学第一附属医院等研发的DeepGEM病理大模型,在肺癌基因突变预测中取得进展。该模型通过分析常规病理切片图像,1分钟内完成突变预测,准确率达78%-99%,无需昂贵基因测序,可降低成本、缩短时间,还能输出突变空间分布图。后续将合作建立"病理-基因多模态大模型平台",推动AI在更多癌种应用。

  • Sora by OpenAI | Sora by OpenAI 即将登陆安卓平台,预注册已在北美开启

    OpenAI的AI视频生成应用Sora即将登陆安卓平台,目前谷歌Play商店已现身该应用但不可用,仅北美(美国、加拿大)用户可预注册。此前Sora在iOS平台上线后表现亮眼,短时间内下载量突破100万,被称为“AI版抖音”。预注册开启意味着安卓版正式发布临近,该应用为用户创意表达提供了新工具。

  • 通义千问、豆包 | 国内AI助手通义千问和豆包开启记忆功能,力争超越ChatGPT

    阿里巴巴旗下通义千问与字节跳动旗下豆包两大AI助手,近日相继启动记忆功能内测,对标OpenAI的ChatGPT,从即时问答工具向长期私人助理转型。通义千问采用显式记忆设计,用户可主动触发并确认存储;豆包更新隐私政策及记忆功能FAQ,明确使用范围与用户控制权。此举显示国内AI助手正加速适应市场需求,提升智能化与人性化服务。

  • Claude Code插件 | Claude Code 插件功能上线,助力开发者提升编程效率

    Anthropic公司推出AI编程助手Claude Code的全新“插件”功能并进入公开测试,旨在增强开发者自定义能力。该插件系统包含斜杠命令、子代理等四大核心组件,支持通过/插件命令灵活管理插件,还推出插件市场及官方套件(涵盖代码审查等场景),所有用户可参与测试,以提升开发效率并推动AI编程助手应用。

  • Perplexity | Perplexity CEO 宣布告别 PPT,借助 AI 实现投资者路演新模式

    Perplexity联合创始人兼CEO阿拉文德・斯里尼瓦斯放弃传统PPT融资路演,转而使用AI工具Perplexity协助。他通过撰写备忘录、邀请投资者提问,利用Perplexity实时解答问题;面对投资者邮件疑问,复制内容至Perplexity生成“像阿拉文德一样”的答案链接回复。此模式获认可,双方次日完成资金转账,展示了AI在商业融资中的应用潜力。


03

硬件&底层技术

Hardware Technology

图片
  • OpenAI | OpenAI联手阿根廷,投资250亿美元打造超级数据中心

    近日,OpenAI与阿根廷能源公司Sur Energy签署意向书,计划投资250亿美元在阿根廷建设名为"Stargate 阿根廷"的超级数据中心,具备500兆瓦计算能力,专门支持先进人工智能计算。该项目为阿根廷最大信息技术与能源基建项目之一,将享受税收减免优惠,助力阿根廷成为南美洲人工智能科技中心,同时为全球AI发展提供算力支持。

  • 蚂蚁集团 | 首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

    10月13日,蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer。该框架解决了扩散语言模型推理中计算成本高、KV缓存失效等难题,在基准测试中,其推理速度较英伟达Fast-dLLM提升10.7倍,单批次推理速度首次超越自回归模型,标志着扩散语言模型向高效实践迈出关键一步。

  • Radical Numerics | 扩散模型新突破:Radical Numerics开源30B参数RND1,AI自我进化迈出关键一步

    AI研究机构Radical Numerics于10月9日发布30B参数的RND1-Base扩散语言模型,为当前最大规模开源扩散语言模型。该模型基于Qwen3-30BA3B自回归模型转型,采用稀疏专家混合架构,支持并行生成与双向注意力,推理延迟更低,在MMLU、GSM8K等基准测试中表现优于同类模型,并开源完整权重及代码,推动扩散模型从理论向工程实践转化。


04

上市公司动态

Listed Company Updates

图片
  • 雅创电子(股票代码:301099) | 雅创电子:2025上半年AI收入超1.5亿,机器人业务有新进展

    雅创电子10月13日在互动平台表示,公司AI战略布局成效初显,2025年上半年AI领域累计收入超1.5亿元。机器人业务方面,团队已获小批量订单,有望成为新利润增长点。此外,公司将加大IC业务研发投入,丰富车规级模拟芯片产品线,夯实自研IC业务扩张基础。


05

行业动态&政策

Industry Trends Policies

图片
  • “2025全球十大工程成就”发布 DeepSeek、人形机器人等入选

    10月13日,2025年世界工程组织联合会全体大会暨全球工程大会在上海开幕,会上由中国工程院院刊《Engineering》评选的“2025全球十大工程成就”正式发布,DeepSeek开源大语言模型、人形机器人、南水北调中线工程等项目入选。

  • 日本政府对 OpenAI Sora 2 发布版权警告,要求遵守法律规定

    日本政府近日对OpenAI的Sora2视频生成模型发布版权警告,内阁府特命担当大臣城内实表示,因Sora2可能生成近似日本动画的内容,政府要求其禁止侵犯版权。日本动画、漫画作为重要文化产业,政府强调将维护其版权。此外,美国电影协会也对Sora2可能侵权行为提出警告。

  • 海尔阿里签署全面AI合作协议,共建数字产业新生态

    近日,海尔集团与阿里巴巴集团签署全面战略合作协议,达成AI合作,聚焦AI+云、电商、全球化三大领域,共建数字产业新生态。双方将在AI+云领域开展全栈合作,基于通义千问打造行业垂域模型;在先进制造整合平台与算力能力,推动AI应用创新;在电商构建跨地域数字化生态,并在全球化布局共建算力平台与云服务,支持海外市场发展。

  • 2025 全球十大工程成就揭晓:DeepSeek入选

    2025年“全球十大工程成就”评选结果公布,包括毅力号火星探测器、DeepSeek开源大语言模型、Blackwell GPU架构等十项成果。其中,Blackwell GPU架构提升了AI计算效率,为大模型训练提供支撑;DeepSeek开源大语言模型推动技术普及与行业智能化转型,体现工程科技的创新与对可持续发展的支持。

  • OpenAI 与微软达成重磅交易:股权结构再变,投资者面临稀释风险

    OpenAI与微软达成重磅交易,公司估值达5000亿美元,主要得益于与英伟达、AMD的数十亿美元合同。微软将成最大单一股东(持股约30%),员工和非营利母公司各占近30%。但持续资金需求致现有投资者(如微软、软银等)面临股权稀释风险。OpenAI正转型营利性企业以推进上市,非营利母公司将调整股东权利,马斯克因早期捐赠未获股权提起诉讼,最终安排仍待谈判。


06

其他

Other

图片
  • 马斯克挖角 NVIDIA 核心团队,xAI 加速 “世界模型” 研发

    埃隆・马斯克的xAI公司为推进“世界模型”研发,从NVIDIA挖来核心研究员Zeeshan Patel和Ethan He,二者分别在多模态模型、物理AI及视频自监督学习领域有专长。xAI计划2026年底推出首款动态生成3D AI游戏,长期将技术扩展至机器人、自动驾驶等领域,与特斯拉等旗下公司协同,争夺下一代AI系统市场。

  • Meta 挖角Thinking Machines Lab联合创始人

    Meta近期成功挖角思维机器实验室(Thinking Machines Lab)联合创始人安德鲁・图洛克。图洛克曾与前OpenAI高管米拉・穆拉提共同创办该实验室,其离职或对实验室发展造成影响。Meta创始人扎克伯格此前多次尝试收购AI公司未果,此次引入顶尖人才被视为增强AI竞争力的重要策略,图洛克的经验将为Meta AI项目注入活力。



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 0
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读0
粉丝0
内容0