11月11日丨每日AI简讯丨月之暗面Kimi K2训练仅460万，性能碾压GPT-5登顶人类终极考试！- 大数跨境

首页

11月11日丨每日AI简讯丨月之暗面Kimi K2训练仅460万，性能碾压GPT-5登顶人类终极考试！

久新数智

2025-11-12

导读：摘要信息

9agent.ai

点击蓝字关注我们

每日AI简讯

2025-11-11

大模型

LLM

Qwen3-Max-Thinking | 阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹，挑战 OpenAI 的领先地位
阿里巴巴升级版AI推理模型Qwen3-Max-Thinking在AIME和HMMT两项全球顶级数学竞赛中取得满分，成为首个达100%准确率的中国AI模型。该模型属Qwen3-Max系列，参数超1万亿，还在加密货币交易实验中以22.3%回报优于其他模型，包括OpenAI的GPT-5（损失62.7%），目前已通过网页和阿里云API开放。
Grok | 埃隆・马斯克用 Grok 探讨爱情，社交媒体引发热议
埃隆・马斯克在特斯拉股东批准新薪酬方案后，于社交媒体X发布xAI工具Grok Imagine生成的两段视频，一段为动画角色雨中表达"永远爱你"，另一段为合成悉尼・斯威尼声音调侃。部分用户称前者"最令人伤心"，87岁作家乔伊斯・卡罗尔・奥茨批评其内容缺乏人性，马斯克回应称其为"骗子"，事件引发对AI生成内容及马斯克社交行为的广泛讨论。
Kimi K2 Thinking | 月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元，性能登顶人类终极考试
月之暗面（Moonshot AI）正式开源最强思考型大模型Kimi K2 Thinking，其在权威基准“人类终极考试”（HLE）中以44.9%得分超越GPT-5、Claude4.5等国际巨头，训练成本仅460万美元（约3277万元人民币）。该模型全面开源模型权重、训练脚本等，支持商用，降低AI落地门槛，标志国产模型从“答得快”迈向“想得深”新阶段。
GPT-5-Codex-Mini | OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型
OpenAI近日推出专为开发者打造的轻量编程模型GPT-5-Codex-Mini，作为GPT-5-Codex的“轻量版”，其在SWE-bench Verified基准测试中得分71.3%，保持高准确率的同时降低使用门槛，开发者可获4倍调用额度。该模型支持CLI和IDE扩展，API接口将开放，系统还会在调用量达90%时自动推荐切换，同时优化底层架构解决性能波动问题，为开发者提供更灵活选择。
Mercury | Inception重启!获5000万美元融资推出新一代扩散语言模型Mercury
人工智能初创公司Inception宣布重启，完成5000万美元融资（由Menlo Ventures领投，微软M12基金等参投），推出新一代扩散语言模型Mercury。该模型采用扩散架构，通过迭代优化生成文本与代码，每秒生成超1000个代币，远超GPT-5等主流LLM。目前Mercury已通过OpenRouter、Poe开放使用，定价为每百万输入令牌0.25美元、输出令牌1美元，兼具速度与成本优势。
DeepSeek-V3/DeepSeek-R1 | 腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线
腾讯云官网11月10日发布公告，宣布旗下DeepSeek-V3和DeepSeek-R1大模型将于11月24日00:00正式下线，不再提供接入服务。官方推荐用户迁移至DeepSeek-V3-0324、DeepSeek-R1-0528新版本，未手动迁移用户将自动升级至对应新版本，以保障服务连续性。
ChatGPT | ChatGPT新闻推荐的“双重标准”——API与网页界面差异显著
汉堡大学等机构研究发现，ChatGPT的网页界面（Web UI）与API在新闻推荐上存在显著差异。网页界面偏向主流媒体及OpenAI合作伙伴Axel Springer旗下品牌（如welt.de占比13%），公共广播机构曝光率34.6%；API则更依赖维基百科等百科资源及小众技术网站，Springer旗下媒体仅占2%，公共广播机构占比12.2%。用户要求“更广泛来源”时，系统可能引入带政治偏见或虚假信息的网站，且OpenAI未解释差异原因，系统更新无通知导致结果不可预测。

产品&应用

Product Application

Step-Audio-EditX | StepFun AI 推出开源音频编辑模型 Step-Audio-EditX，实现音频编辑新体验
StepFun AI 近日推出开源音频编辑模型 Step-Audio-EditX，该3B参数模型通过双代码本标记器将音频编辑转为令牌操作，简化语音编辑。其采用大边距学习及6万说话者数据训练，提升情感、风格编辑准确性，还结合人类偏好数据强化学习。测试显示，模型在情感和风格准确性上显著提升，并能优化其他TTS系统音频质量，为音频编辑研究提供新可能。
Kindle Translate | 亚马逊推Kindle Translate!免费AI翻译助独立作者出海，文学“灵魂”能否留存引热议
亚马逊推出专为KDP作者打造的AI翻译服务Kindle Translate，当前处于Beta阶段且免费，初始支持英西互译、德译英，未来将扩展语种。该服务旨在降低翻译门槛，帮助独立作者打破语言壁垒，让作品触达全球读者，但AI翻译在文学意境、文化隐喻等方面的精度仍受争议，亚马逊允许作者预览译文并明确标识AI译作。
Presentation-AI | 一句话生成专业PPT!开源神器Presentation-AI免费上线，本地运行、碾压Gamma.app
近日，开源AI演示文稿生成工具Presentation-AI免费上线，用户输入一句话提示即可生成结构完整、视觉精美的PPT。该工具支持流式生成与深度可控编辑，兼容Ollama等开源大模型可本地运行，内置9种专业主题模板，集成Stable Diffusion自动配图，覆盖职场、教育等多场景，降低专业表达门槛。
小度AI眼镜Pro | 百度推出小度 AI 眼镜 Pro，2299 元、支持多种智能功能
百度推出小度AI眼镜Pro，售价2299元，有波士顿和猫眼两种款式可选，支持配近视镜片。该眼镜重39克，搭载索尼1200万像素镜头，支持4K拍照和1440p视频录制，内置EIS防抖。其配备五麦克风阵列和防漏音扬声器，融合多模态AI大模型，支持AI翻译、识物等功能，续航配合充电盒可达68小时。
Grok Imagine | Grok支持纯文本生成视频了一句话即可生成带音效视频
xAI旗下AI助手Grok推出Grok Imagine功能，全面支持纯文本生成短视频。用户输入描述（如“赛博朋克城市中飞驰的摩托车”），17秒内可获带背景音效、动态镜头的6-15秒视频，支持多宽高比适配多场景。该功能强调人机共创，支持图转视频、多风格切换等，依托自研Aurora引擎，现全平台上线，免费用户限量生成，订阅用户享更多权益。
CatPaw | 美团首款 AI IDE 产品 CatPaw 开放公测:研发渗透率超95%，代码生成率破50%
美团旗下首款AI集成开发环境（AI IDE）产品CatPaw于2025年11月10日开放公测。该产品以Agent与人协作为核心，具备智能驱动编程、代码补全等功能，此前以插件形式在内部使用，现全面升级面向公众。内部数据显示，其研发渗透率超95%，增量代码AI生成率破50%，技术上搭载美团自研编程大模型LongCat，支持多模型混合调用。用户可通过官网下载安装，领取邀请码体验，初始提供500次对话额度。
人工智能应用 | 印度财富管理新秀计划招募新毕业生，人工智能助力行业转型
印度数字财富管理公司Dezerv为应对行业经验丰富私人银行家短缺问题，计划招募应届毕业生，培训其运用人工智能技术提供个性化财富管理服务。此举旨在打破传统模式，满足市场对专业服务的需求，同时缓解行业人才争夺压力，为年轻人提供职业空间，推动财富管理行业转型。

硬件&底层技术

Hardware Technology

谷歌 | 谷歌发布Nested Learning新范式，解决AI“灾难性遗忘”难题
谷歌研究团队在NeurIPS2025会议上发布Nested Learning（嵌套学习）新范式，受人类神经可塑性启发，通过分层记忆架构解决AI“灾难性遗忘”问题。该范式使AI模型持续学习新任务时几乎保留旧知识，遗忘率逼近零，应用前景涵盖大模型、医疗AI等领域，推动AI向“终身学习者”发展。

行业动态&政策

Industry Trends Policies

Anthropic雄心勃勃的“登月计划”:剑指2028年700亿美元营收
据《The Information》披露，AI企业Anthropic计划将年收入从2025年的约47亿美元增至2028年的700亿美元，需2026、2027年连续翻番，2028年增长约80%。其目标还包括将毛利率从负94%提升至77%，主要依赖API接入（占2028年超80%收入）及Claude Code工具（预计年收入达10亿美元）。此举将加剧与OpenAI的竞争，后者2025年预计收入200亿美元，目标2028年超1000亿美元、2030年2000亿美元。
广电总局重拳整治AI动画乱象!2026年3月起，恶搞短剧、AI生成内容全面纳入审核
国家广播电视总局宣布，2026年3月起将在全国开展专项治理行动，首次将AIGC类作品纳入分类分层审核体系。未通过审核或未补审的AI生成动画短视频将被下架，重点整治低俗恶搞、儿童角色滥用等危害未成年人身心健康的行为，推动行业从“流量驱动”转向“质量驱动”。
研究显示:英国四分之一大企业将因 AI 削减员工
最新研究显示，未来一年内约25%的英国大型企业计划因AI技术发展削减员工，初级职位受影响尤为明显。企业希望通过AI自动化替代重复性低技能工作，优化人力资源分配至战略性岗位。调查指出，这一趋势将长期影响招聘策略和员工培训，同时企业需平衡效率提升与员工士气维护，避免裁员带来的负面影响。
乌镇峰会重磅发布!360首发《大模型安全白皮书》，首提“全链路AI安全防线”应对智能时代新威胁
2025年世界互联网大会乌镇峰会上，360数字安全集团发布国内首份《大模型安全白皮书》，揭示大模型全生命周期五大核心风险（基础设施层、内容层等），提出“外挂式安全+平台原生安全”双轨治理框架，并构建覆盖数据脱敏等七大能力的全链路解决方案，推动安全标准制定与生态共建，为智能时代AI安全提供路线图。
AI绘本引发版权与道德争议:企业家用AI完成近千幅插图的字母书
企业家尼尔斯·霍文出版儿童字母书，书中近千幅插图均由AI生成。他表示人工绘制成本高（约5万美元）、耗时长（每幅2小时），AI使书能以30美元精装版或免费PDF面世。此举引发版权与道德争议，批评认为损害人类艺术家利益，但英国法院判决支持使用现有作品训练AI不侵权。霍文称项目旨在帮助儿童学习并推广公司学习应用。
纯手工制作!《绝命毒师》主创新剧拒绝AI参与称其是全球最贵的抄袭机器
《绝命毒师》《风骚律师》创作者文斯·吉利根的新剧《Pluribus》在苹果TV+上线，该剧明确标注“由人类制作”，拒绝AI介入剧本、设计及后期制作。吉利根在采访中直言“讨厌AI”，称其为“全球最昂贵、最耗能的抄袭机器”，强调在AI席卷影视行业的当下，要捍卫人类创作的独特性与情感价值。
恶意软件利用 AI 技术实现自我重写，检测难度加剧
Google威胁情报小组发现实验性恶意软件家族PROMPTFLUX，其通过远程调用Gemini AI实时重写自身代码、动态生成恶意脚本并混淆，导致传统安全软件因特征变化检测效率下降。虽处实验阶段未造成实际危害，但黑客利用AI动态编写恶意模块的灵活性，使未来检测更困难，凸显生成式AI带来的网络安全挑战，需行业重视。
OpenAI 呼吁政府扩大芯片法案税收优惠以支持数据中心建设
近日，OpenAI向美国政府致函，提议将《先进制造投资税收抵免》（AMIC）扩大至电网组件、AI服务器及数据中心项目，以降低资本成本、吸引私人资本，缓解AI基础设施瓶颈。同时，OpenAI还呼吁加快项目审批、建立原材料储备。其高管提及公司预计2025年底年化收入超200亿美元，未来八年计划投资1.4万亿美元。

其他

Other

微软揭示 “Whisper Leak” 隐私漏洞，AI 聊天内容或被窃听
微软安全研究团队揭露针对AI聊天服务的“Whisper Leak”隐私漏洞，攻击者通过分析加密网络流量的元数据（如数据包大小、时序等），可推断用户与AI对话主题，实验中识别敏感话题准确率超98%。多家AI供应商已采取随机填充、批处理等缓解措施，但需权衡用户体验与隐私保护，用户处理敏感信息时应避免不信任网络。
无界动力完成 3 亿元天使融资:打造“通用具身智能”操作大脑
通用具身智能机器人公司无界动力宣布完成首轮3亿元天使融资，由红杉中国、线性资本领投，多家机构跟投，天使+轮融资接近完成，累计超5亿元。公司专注构建机器人“通用大脑”与“操作智能”，创始人张玉峰曾任地平线高管，本轮融资将加速基础模型研发与专家模型落地。

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 0

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读0

粉丝0

内容0