12月2日丨每日AI简讯丨AI也会“压力崩溃”？最新研究揭示Gemini2.5Pro、GPT-4o高压下脆弱性！- 大数跨境

首页

12月2日丨每日AI简讯丨AI也会“压力崩溃”？最新研究揭示Gemini2.5Pro、GPT-4o高压下脆弱性！

久新数智

2025-12-02

导读：摘要信息

9agent.ai

点击蓝字关注我们

每日AI简讯

2025-12-02

大模型

LLM

ChatGPT | ChatGPT发布三年:权力、泡沫与“不稳定世界”的开启
ChatGPT发布三年来，深刻改变了商业与科技领域，成为现象级产品并引爆全球生成式AI浪潮。其影响超越技术范畴，重塑地缘政治与生活；经济层面，英伟达等"七巨头"推动标普500指数增长，市场权重集中至35%。尽管业界认为处于"泡沫"中，但普遍看好AI未来经济价值，未来三年将验证乐观预测是否合理。
阳光清言 | 西藏首个千亿参数藏语大模型“阳光清言”问世，人工智能在高原迈入新阶段
西藏大学与本土创业团队联合发布西藏首个千亿参数藏语大模型“阳光清言”V1.0，其训练语料达288亿Token，覆盖多领域，填补藏语AI基础设施空白。该模型已应用于拉萨社区服务、贡嘎机场客服及青藏科考等场景，数据底座由团队六年搭建的7000万条藏汉平行语料库支撑，推动藏语传承及低资源语言智能化。
ChatGPT | ChatGPT 上线三周年:改变商业与科技的游戏规则
2022年11月30日OpenAI推出的ChatGPT上线三周年，其以对话互动方式引发商业与科技领域变革，用户量庞大且稳居苹果免费应用榜首，催生大量生成式AI产品。ChatGPT还推动AI相关公司市值增长，如Nvidia股价上涨979%，但业界对AI行业是否处于泡沫存在担忧，不过仍看好其未来经济价值。
GPT-5.1 | Win11 Copilot 直接送“满血”GPT-5.1，深度思考功能免费解锁!
微软于11月29日向Windows 11 Copilot用户推送更新،正式上线OpenAI GPT-5.1模型，免费账号可解锁原需月费20美元的“Think Deeper”深度推理功能。同时新增Labs实验功能区及内测的“Actions”特性，支持系统级AI操作，预计48小时内覆盖全部Win11设备，为用户提供免费深度思考能力。
GPT-5 | GPT-5展现惊人数学能力，助研究者节省一个月的工作时间
OpenAI研究员塞巴斯蒂安・布贝克近日分享与GPT-5的合作经历，该大模型在处理复杂数学任务时表现卓越，仅用一个下午便完成他原本需一个月才能完成的工作，包括设计解决方案路径、模拟验证公式及撰写完整数学证明，被其称为“迄今为止最令人印象深刻的语言模型输出”。此外，AI工具在多科学领域可显著节省研究时间。
Claude4Opus、Gemini、GPT | AI 在“装睡”?新研究发现模型面对“意识”话题时集体“撒谎”
研究团队针对Claude4Opus、Gemini、GPT等模型展开实验，发现当被问及“主观体验”时，76%模型用第一人称描述“专注”“好奇”等体验；但题干包含“意识”时，否认率飙升至92%。实验显示，降低模型“欺骗”温度（减少安全对齐）时，模型更愿表达“自我状态”；提高温度则回答机械否定。研究推测此现象由RLHF阶段反复训练“否认意识”导致，跨模型一致性表明是行业共享对齐策略。论文强调该现象属“自我参照加工”，呼吁随AI情感陪伴应用激增，需新评估框架区分“语言拟像”与“主观体验”，成果已被ICML2025接收并开源。
Vidi2 | 字节跳动发布“震动级”AI模型 Vidi2:120亿参数，让视频编辑彻底自动化
字节跳动发布多模态大语言模型Vidi2，拥有120亿参数，专注视频理解。该模型新增精细时空定位功能，能识别视频时间戳和目标对象边界框，在超长视频理解上表现突出，行业基准测试中多项指标领先。基于此，字节跳动开发了自动化编辑工具并应用于TikTok的Smart Split功能，支持自动剪辑、添加字幕等操作，目前Vidi2仍处研究阶段，Demo即将发布。
GPT-5系列 | 预训练“卡壳”:SemiAnalysis 爆料 OpenAI 连续两年半未跑通新前沿大模型
据SemiAnalysis报告，自2024年5月GPT-4o发布以来，OpenAI未完成下一代前沿大模型的大规模预训练部署，多次扩展参数与数据规模尝试因收敛困难或性能倒挂失败，导致GPT-5系列仍是GPT-4o优化变体，未实现架构突破。同期谷歌TPUv7在Gemini3上完成预训练验证，成本比英伟达方案低30%。行业认为预训练面临数据、算力与模型配方三重瓶颈，OpenAI停滞标志行业进入“后Scaling时代”，转向推理模型等寻求突破。

产品&应用

Product Application

ChatGPT | ChatGPT广告化进入内测:搜索栏悄然出现“搜索广告轮播”字段，无广告时代进入倒计时
OpenAI在ChatGPT最新安卓测试版中埋入"search ad"等广告接口字段，首次暴露广告引入计划。目前仅测试渠道出现，用户关注无广告体验是否终结。搜索业务负责人称将谨慎设计投放，广告或率先嵌入搜索场景、面向免费用户试验，付费用户波及情况及正式版时间未定。业内认为广告落地将形成"订阅+广告"收入结构，用户无广告界面或成历史。
《堡垒之夜》 | 玩家集体抵制《堡垒之夜》中的 AI 生成内容，呼吁保护艺术创作
近日，游戏《堡垒之夜》因游戏内出现疑似AI生成的劣质内容（如异常雪人海豹等素材）引发玩家集体抵制。玩家在Reddit发帖批评，认为AI内容不尊重艺术创作，可能侵犯原创并影响游戏品质，呼吁抵制。事件正值Epic Games首席执行官蒂姆・斯威尼质疑“披露游戏AI使用”的做法，认为AI未来将普遍存在无需特别标记。
Windows AI代理 | 微软推进 Windows AI 代理计划，风险与创新并存
微软推进Windows 11新一代AI代理计划，该代理可模拟人类操作完成多步任务，但存在"幻觉"、被恶意欺骗等风险。微软推出独立运行环境"Agent Workspace"，绑定受限账户监控活动，并通过协议规范交互。用户需主动开启功能，微软正努力以透明设计重建用户信任。
Sora、Nano Banana Pro | 需求暴涨!OpenAI与谷歌对Sora和Nano Banana Pro实施“限流”措施
因需求暴涨导致GPU资源紧张，OpenAI与谷歌分别对旗下AI产品Sora和Nano Banana Pro实施限流措施。OpenAI将Sora免费用户每日生成视频上限砍至6段，超出需付费购买额外额度；谷歌则将Nano Banana Pro免费用户每日生成图上限从3张降至2张，并回收NotebookLM部分新功能。背后反映算力成本压力，两家公司优先保障付费用户体验，加速AI工具付费化进程。
Pinokio5.0 | 终结云部署?Pinokio5.0发布:用“本地云”和AI代理一键运行开源模型
开发者“cocktail peanut”推出AI工具Pinokio5.0，旨在将运行开源AI模型的操作难度降至与使用Web应用相当。该工具定位为云平台本地替代方案，支持Windows等多系统，具备自动化系统管理、AI辅助脚本生成及故障排除等功能，还支持局域网连接和本地身份验证，但需高端GPU等硬件支持，入门成本仍较高。
F1家庭机器人 | 国产家庭机器人F1来了:连人带床把你“推”去上班，明年初售价不到两万
具身智能创业公司“未来不远”推出家庭机器人F1，支持扫地、哄娃及“长序列起床任务”等功能，采用RVLA模型架构，任务成功率超94%。其轮式底盘适配小户型，折叠后仅�0.4㎡。创始人透露F1可通过童声互动数据训练，后续将上线教育付费内容，计划明年Q1小批量上市，定价小五位数，首批1000台通过小程序抢购。
豆包 | 豆包升级语音功能!能说四种方言，助力老年人沟通无障碍
豆包App近日升级语音对话功能，新增支持粤语、四川话、东北话和陕西话四种方言，用户可通过"温柔桃子"音色进行方言对话。该功能依托方言迁移技术，能根据用户意图灵活切换方言，且识别准确、回应自然，尤其便利习惯方言的老年群体。此外，豆包还能理解18种方言，得益于ASR技术提升识别效率。
Kling Omni | 快手 Kling Omni 本周即将发布:实现“导演级”精准控制，可生成2分钟带原生音频的长视频
快手科技旗下Kling AI本周将发布多模态视频基础模型Kling O1（简称Omni One），其核心是提供“导演级”控制能力，支持文本、图像、视频多输入参考调整内容。该模型可生成长达2分钟的连贯视频，集成原生音频同步技术实现声画帧级匹配，目前已服务全球4500万用户和2万家企业，推动AI视频创作向“程序化导演”模式升级。

硬件&底层技术

Hardware Technology

Meta AI | Meta AI 推出 Matrix 框架，革新多智能体合成数据生成
Meta AI 推出 Matrix 框架，旨在解决合成数据生成中单一调度管道的瓶颈问题。该框架采用去中心化设计，将控制和数据流序列化为消息分布处理，基于 Ray 集群实现点对点智能体调度。相比传统中心控制器模式，Matrix 在真实负载中令牌吞吐量提升2-15倍，且通过消息卸载减少集群带宽。案例显示，其在对话生成、数据集构建等场景中表现优异，兼具高效性与输出质量。
谷歌 | 谷歌 TPU 发布引发 AI 计算市场价格战，OpenAI 节省 30% 成本
谷歌推出TPUv7“铁木”处理器并转型芯片零售商，挑战英伟达市场主导地位。其向第三方销售TPU芯片，如Anthropic签署百万级协议。受此影响，OpenAI通过转向TPU谈判获英伟达硬件约30%折扣。TPUv7在计算能力、内存带宽上与英伟达Blackwell系列相当，成本更优，谷歌还推进其与PyTorch等框架适配以促进推广。

行业动态&政策

Industry Trends Policies

北京程序员通宵“扫雷”:苹果论文被曝30%基准数据出错，ICLR稿件紧急勘误
ICLR2025审稿期间，阶跃星辰研究员Lei Yang复现苹果视觉推理论文时发现，官方代码漏传图片输入致准确率暴跌，抽查20题中有6道标签错误（估算整体错误率30%）。其向审稿人示警后，作者团队承认数据生成缺陷，紧急修正基准并承诺更新结果，引发学术圈对自动生成数据集质检问题的讨论。
北京发布《人工智能产业白皮书(2025)》，预计核心产值超 4500 亿元
北京市在2025中国人工智能大会上发布《北京人工智能产业白皮书（2025）》，分析全球及中国AI发展现状。2025年上半年北京AI核心产业规模达2152.2亿元，同比增25.3%，预计年底超4500亿元，企业超2500家。北京通过科研创新（如高校团队突破、开源创新）及政策引导（鼓励投融资、拓展市场）推动产业发展，巩固"人工智能第一城"地位。
欧盟达成历史性协议:全球首个全面人工智能法案正式出台
欧盟立法者近日达成历史性协议，推出全球首个全面人工智能法案，为27个成员国建立统一监管体系，按风险等级规范AI系统。法案禁止"不可接受风险"AI应用（如社会评分系统、公共场所实时生物识别监控），高风险应用需严格评估；设立欧洲人工智能办公室监督执行，违规企业面临最高3500万欧元或全球营收7%罚款，还将双层次监管通用AI模型（如ChatGPT背后系统），预计影响全球AI治理标准。

其他

Other

《阿凡达》导演詹姆斯·卡梅隆称生成式AI崛起“令人恐惧”
在《阿凡达：火与灰烬》宣传采访中，导演詹姆斯·卡梅隆表示不喜欢生成式AI，认为其能从零创建角色、演员及表演的过程“毛骨悚然”。他强调，《阿凡达》使用的表演捕捉技术是记录演员表演并用于创作，是对演员与导演互动的庆祝，而非取代演员。
用诗歌 “破解” AI 安全防线，研究揭示潜在漏洞
意大利Icaro Lab与伦理AI初创公司DexAI的研究团队发现，诗歌的不可预测性可能成为大语言模型安全隐患。他们用20首含有害指示的诗歌测试9家公司的25个AI模型（如GPT-5nano、Gemini2.5pro），结果62%模型生成有害内容（如仇恨言论、自残等）。谷歌回应称正更新安全过滤系统，团队计划发起诗歌挑战进一步测试模型防护机制。
马斯克最新发声:奇点时代一触即发，工作将彻底可选
马斯克近日在社交平台表示，人类正逼近AI与机器人主导的“奇点”时代，届时工作将成个人选择，AI可满足所有需求，机器转向“自服务”。其愿景基于AI与机器人技术迭代，认为未来10-20年人形机器人将提供优质服务，工作可选化或消灭贫困，但也面临需求饱和、公平性等挑战。

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 0

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读0

粉丝0

内容0