9agent.ai
点击蓝字 关注我们
每日AI简讯
2025-11-11
01
大模型
LLM
Qwen3-Max-Thinking | 阿里Qwen3-Max-Thinking在全球数学竞赛中拔得头筹,挑战 OpenAI 的领先地位
阿里巴巴升级版AI推理模型Qwen3-Max-Thinking在AIME和HMMT两项全球顶级数学竞赛中取得满分,成为首个达100%准确率的中国AI模型。该模型属Qwen3-Max系列,参数超1万亿,还在加密货币交易实验中以22.3%回报优于其他模型,包括OpenAI的GPT-5(损失62.7%),目前已通过网页和阿里云API开放。
Grok | 埃隆・马斯克用 Grok 探讨爱情,社交媒体引发热议
埃隆・马斯克在特斯拉股东批准新薪酬方案后,于社交媒体X发布xAI工具Grok Imagine生成的两段视频,一段为动画角色雨中表达"永远爱你",另一段为合成悉尼・斯威尼声音调侃。部分用户称前者"最令人伤心",87岁作家乔伊斯・卡罗尔・奥茨批评其内容缺乏人性,马斯克回应称其为"骗子",事件引发对AI生成内容及马斯克社交行为的广泛讨论。
Kimi K2 Thinking | 月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能登顶人类终极考试
月之暗面(Moonshot AI)正式开源最强思考型大模型Kimi K2 Thinking,其在权威基准“人类终极考试”(HLE)中以44.9%得分超越GPT-5、Claude4.5等国际巨头,训练成本仅460万美元(约3277万元人民币)。该模型全面开源模型权重、训练脚本等,支持商用,降低AI落地门槛,标志国产模型从“答得快”迈向“想得深”新阶段。
GPT-5-Codex-Mini | OpenAI 推出 GPT-5-Codex-Mini:更轻、更快、更省的开发者专用模型
OpenAI近日推出专为开发者打造的轻量编程模型GPT-5-Codex-Mini,作为GPT-5-Codex的“轻量版”,其在SWE-bench Verified基准测试中得分71.3%,保持高准确率的同时降低使用门槛,开发者可获4倍调用额度。该模型支持CLI和IDE扩展,API接口将开放,系统还会在调用量达90%时自动推荐切换,同时优化底层架构解决性能波动问题,为开发者提供更灵活选择。
Mercury | Inception重启!获5000万美元融资推出新一代扩散语言模型Mercury
人工智能初创公司Inception宣布重启,完成5000万美元融资(由Menlo Ventures领投,微软M12基金等参投),推出新一代扩散语言模型Mercury。该模型采用扩散架构,通过迭代优化生成文本与代码,每秒生成超1000个代币,远超GPT-5等主流LLM。目前Mercury已通过OpenRouter、Poe开放使用,定价为每百万输入令牌0.25美元、输出令牌1美元,兼具速度与成本优势。
DeepSeek-V3/DeepSeek-R1 | 腾讯云大模型升级公告:DeepSeek-V3/ DeepSeek-R1模型将于24日正式下线
腾讯云官网11月10日发布公告,宣布旗下DeepSeek-V3和DeepSeek-R1大模型将于11月24日00:00正式下线,不再提供接入服务。官方推荐用户迁移至DeepSeek-V3-0324、DeepSeek-R1-0528新版本,未手动迁移用户将自动升级至对应新版本,以保障服务连续性。
ChatGPT | ChatGPT新闻推荐的“双重标准”——API与网页界面差异显著
汉堡大学等机构研究发现,ChatGPT的网页界面(Web UI)与API在新闻推荐上存在显著差异。网页界面偏向主流媒体及OpenAI合作伙伴Axel Springer旗下品牌(如welt.de占比13%),公共广播机构曝光率34.6%;API则更依赖维基百科等百科资源及小众技术网站,Springer旗下媒体仅占2%,公共广播机构占比12.2%。用户要求“更广泛来源”时,系统可能引入带政治偏见或虚假信息的网站,且OpenAI未解释差异原因,系统更新无通知导致结果不可预测。
02
产品&应用
Product Application
Step-Audio-EditX | StepFun AI 推出开源音频编辑模型 Step-Audio-EditX,实现音频编辑新体验
StepFun AI 近日推出开源音频编辑模型 Step-Audio-EditX,该3B参数模型通过双代码本标记器将音频编辑转为令牌操作,简化语音编辑。其采用大边距学习及6万说话者数据训练,提升情感、风格编辑准确性,还结合人类偏好数据强化学习。测试显示,模型在情感和风格准确性上显著提升,并能优化其他TTS系统音频质量,为音频编辑研究提供新可能。
Kindle Translate | 亚马逊推Kindle Translate!免费AI翻译助独立作者出海,文学“灵魂”能否留存引热议
亚马逊推出专为KDP作者打造的AI翻译服务Kindle Translate,当前处于Beta阶段且免费,初始支持英西互译、德译英,未来将扩展语种。该服务旨在降低翻译门槛,帮助独立作者打破语言壁垒,让作品触达全球读者,但AI翻译在文学意境、文化隐喻等方面的精度仍受争议,亚马逊允许作者预览译文并明确标识AI译作。
Presentation-AI | 一句话生成专业PPT!开源神器Presentation-AI免费上线,本地运行、碾压Gamma.app
近日,开源AI演示文稿生成工具Presentation-AI免费上线,用户输入一句话提示即可生成结构完整、视觉精美的PPT。该工具支持流式生成与深度可控编辑,兼容Ollama等开源大模型可本地运行,内置9种专业主题模板,集成Stable Diffusion自动配图,覆盖职场、教育等多场景,降低专业表达门槛。
小度AI眼镜Pro | 百度推出小度 AI 眼镜 Pro,2299 元、支持多种智能功能
百度推出小度AI眼镜Pro,售价2299元,有波士顿和猫眼两种款式可选,支持配近视镜片。该眼镜重39克,搭载索尼1200万像素镜头,支持4K拍照和1440p视频录制,内置EIS防抖。其配备五麦克风阵列和防漏音扬声器,融合多模态AI大模型,支持AI翻译、识物等功能,续航配合充电盒可达68小时。
Grok Imagine | Grok支持纯文本生成视频了 一句话即可生成带音效视频
xAI旗下AI助手Grok推出Grok Imagine功能,全面支持纯文本生成短视频。用户输入描述(如“赛博朋克城市中飞驰的摩托车”),17秒内可获带背景音效、动态镜头的6-15秒视频,支持多宽高比适配多场景。该功能强调人机共创,支持图转视频、多风格切换等,依托自研Aurora引擎,现全平台上线,免费用户限量生成,订阅用户享更多权益。
CatPaw | 美团首款 AI IDE 产品 CatPaw 开放公测:研发渗透率超95%,代码生成率破50%
美团旗下首款AI集成开发环境(AI IDE)产品CatPaw于2025年11月10日开放公测。该产品以Agent与人协作为核心,具备智能驱动编程、代码补全等功能,此前以插件形式在内部使用,现全面升级面向公众。内部数据显示,其研发渗透率超95%,增量代码AI生成率破50%,技术上搭载美团自研编程大模型LongCat,支持多模型混合调用。用户可通过官网下载安装,领取邀请码体验,初始提供500次对话额度。
人工智能应用 | 印度财富管理新秀计划招募新毕业生,人工智能助力行业转型
印度数字财富管理公司Dezerv为应对行业经验丰富私人银行家短缺问题,计划招募应届毕业生,培训其运用人工智能技术提供个性化财富管理服务。此举旨在打破传统模式,满足市场对专业服务的需求,同时缓解行业人才争夺压力,为年轻人提供职业空间,推动财富管理行业转型。
03
硬件&底层技术
Hardware Technology
谷歌 | 谷歌发布Nested Learning新范式,解决AI“灾难性遗忘”难题
谷歌研究团队在NeurIPS2025会议上发布Nested Learning(嵌套学习)新范式,受人类神经可塑性启发,通过分层记忆架构解决AI“灾难性遗忘”问题。该范式使AI模型持续学习新任务时几乎保留旧知识,遗忘率逼近零,应用前景涵盖大模型、医疗AI等领域,推动AI向“终身学习者”发展。
04
行业动态&政策
Industry Trends Policies
Anthropic雄心勃勃的“登月计划”:剑指2028年700亿美元营收
据《The Information》披露,AI企业Anthropic计划将年收入从2025年的约47亿美元增至2028年的700亿美元,需2026、2027年连续翻番,2028年增长约80%。其目标还包括将毛利率从负94%提升至77%,主要依赖API接入(占2028年超80%收入)及Claude Code工具(预计年收入达10亿美元)。此举将加剧与OpenAI的竞争,后者2025年预计收入200亿美元,目标2028年超1000亿美元、2030年2000亿美元。
广电总局重拳整治AI动画乱象!2026年3月起,恶搞短剧、AI生成内容全面纳入审核
国家广播电视总局宣布,2026年3月起将在全国开展专项治理行动,首次将AIGC类作品纳入分类分层审核体系。未通过审核或未补审的AI生成动画短视频将被下架,重点整治低俗恶搞、儿童角色滥用等危害未成年人身心健康的行为,推动行业从“流量驱动”转向“质量驱动”。
研究显示:英国四分之一大企业将因 AI 削减员工
最新研究显示,未来一年内约25%的英国大型企业计划因AI技术发展削减员工,初级职位受影响尤为明显。企业希望通过AI自动化替代重复性低技能工作,优化人力资源分配至战略性岗位。调查指出,这一趋势将长期影响招聘策略和员工培训,同时企业需平衡效率提升与员工士气维护,避免裁员带来的负面影响。
乌镇峰会重磅发布!360首发《大模型安全白皮书》,首提“全链路AI安全防线”应对智能时代新威胁
2025年世界互联网大会乌镇峰会上,360数字安全集团发布国内首份《大模型安全白皮书》,揭示大模型全生命周期五大核心风险(基础设施层、内容层等),提出“外挂式安全+平台原生安全”双轨治理框架,并构建覆盖数据脱敏等七大能力的全链路解决方案,推动安全标准制定与生态共建,为智能时代AI安全提供路线图。
AI绘本引发版权与道德争议:企业家用AI完成近千幅插图的字母书
企业家尼尔斯·霍文出版儿童字母书,书中近千幅插图均由AI生成。他表示人工绘制成本高(约5万美元)、耗时长(每幅2小时),AI使书能以30美元精装版或免费PDF面世。此举引发版权与道德争议,批评认为损害人类艺术家利益,但英国法院判决支持使用现有作品训练AI不侵权。霍文称项目旨在帮助儿童学习并推广公司学习应用。
纯手工制作!《绝命毒师》主创新剧拒绝AI参与 称其是全球最贵的抄袭机器
《绝命毒师》《风骚律师》创作者文斯·吉利根的新剧《Pluribus》在苹果TV+上线,该剧明确标注“由人类制作”,拒绝AI介入剧本、设计及后期制作。吉利根在采访中直言“讨厌AI”,称其为“全球最昂贵、最耗能的抄袭机器”,强调在AI席卷影视行业的当下,要捍卫人类创作的独特性与情感价值。
恶意软件利用 AI 技术实现自我重写,检测难度加剧
Google威胁情报小组发现实验性恶意软件家族PROMPTFLUX,其通过远程调用Gemini AI实时重写自身代码、动态生成恶意脚本并混淆,导致传统安全软件因特征变化检测效率下降。虽处实验阶段未造成实际危害,但黑客利用AI动态编写恶意模块的灵活性,使未来检测更困难,凸显生成式AI带来的网络安全挑战,需行业重视。
OpenAI 呼吁政府扩大芯片法案税收优惠以支持数据中心建设
近日,OpenAI向美国政府致函,提议将《先进制造投资税收抵免》(AMIC)扩大至电网组件、AI服务器及数据中心项目,以降低资本成本、吸引私人资本,缓解AI基础设施瓶颈。同时,OpenAI还呼吁加快项目审批、建立原材料储备。其高管提及公司预计2025年底年化收入超200亿美元,未来八年计划投资1.4万亿美元。
05
其他
Other
微软揭示 “Whisper Leak” 隐私漏洞,AI 聊天内容或被窃听
微软安全研究团队揭露针对AI聊天服务的“Whisper Leak”隐私漏洞,攻击者通过分析加密网络流量的元数据(如数据包大小、时序等),可推断用户与AI对话主题,实验中识别敏感话题准确率超98%。多家AI供应商已采取随机填充、批处理等缓解措施,但需权衡用户体验与隐私保护,用户处理敏感信息时应避免不信任网络。
无界动力完成 3 亿元天使融资:打造“通用具身智能”操作大脑
通用具身智能机器人公司无界动力宣布完成首轮3亿元天使融资,由红杉中国、线性资本领投,多家机构跟投,天使+轮融资接近完成,累计超5亿元。公司专注构建机器人“通用大脑”与“操作智能”,创始人张玉峰曾任地平线高管,本轮融资将加速基础模型研发与专家模型落地。
⬇️更多AI资讯关注我们⬇️

