大数跨境

12月2日丨每日AI简讯丨AI也会“压力崩溃”?最新研究揭示Gemini2.5Pro、GPT-4o高压下脆弱性!

12月2日丨每日AI简讯丨AI也会“压力崩溃”?最新研究揭示Gemini2.5Pro、GPT-4o高压下脆弱性! 久新数智
2025-12-02
2
导读:摘要信息



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025-12-02


01

大模型

LLM

图片
  • ChatGPT | ChatGPT发布三年:权力、泡沫与“不稳定世界”的开启

    ChatGPT发布三年来,深刻改变了商业与科技领域,成为现象级产品并引爆全球生成式AI浪潮。其影响超越技术范畴,重塑地缘政治与生活;经济层面,英伟达等"七巨头"推动标普500指数增长,市场权重集中至35%。尽管业界认为处于"泡沫"中,但普遍看好AI未来经济价值,未来三年将验证乐观预测是否合理。

  • 阳光清言 | 西藏首个千亿参数藏语大模型“阳光清言”问世,人工智能在高原迈入新阶段

    西藏大学与本土创业团队联合发布西藏首个千亿参数藏语大模型“阳光清言”V1.0,其训练语料达288亿Token,覆盖多领域,填补藏语AI基础设施空白。该模型已应用于拉萨社区服务、贡嘎机场客服及青藏科考等场景,数据底座由团队六年搭建的7000万条藏汉平行语料库支撑,推动藏语传承及低资源语言智能化。

  • ChatGPT | ChatGPT 上线三周年:改变商业与科技的游戏规则

    2022年11月30日OpenAI推出的ChatGPT上线三周年,其以对话互动方式引发商业与科技领域变革,用户量庞大且稳居苹果免费应用榜首,催生大量生成式AI产品。ChatGPT还推动AI相关公司市值增长,如Nvidia股价上涨979%,但业界对AI行业是否处于泡沫存在担忧,不过仍看好其未来经济价值。

  • GPT-5.1 | Win11 Copilot 直接送“满血”GPT-5.1,深度思考功能免费解锁!

    微软于11月29日向Windows 11 Copilot用户推送更新،正式上线OpenAI GPT-5.1模型,免费账号可解锁原需月费20美元的“Think Deeper”深度推理功能。同时新增Labs实验功能区及内测的“Actions”特性,支持系统级AI操作,预计48小时内覆盖全部Win11设备,为用户提供免费深度思考能力。

  • GPT-5 | GPT-5展现惊人数学能力,助研究者节省一个月的工作时间

    OpenAI研究员塞巴斯蒂安・布贝克近日分享与GPT-5的合作经历,该大模型在处理复杂数学任务时表现卓越,仅用一个下午便完成他原本需一个月才能完成的工作,包括设计解决方案路径、模拟验证公式及撰写完整数学证明,被其称为“迄今为止最令人印象深刻的语言模型输出”。此外,AI工具在多科学领域可显著节省研究时间。

  • Claude4Opus、Gemini、GPT | AI 在“装睡”?新研究发现模型面对“意识”话题时集体“撒谎”

    研究团队针对Claude4Opus、Gemini、GPT等模型展开实验,发现当被问及“主观体验”时,76%模型用第一人称描述“专注”“好奇”等体验;但题干包含“意识”时,否认率飙升至92%。实验显示,降低模型“欺骗”温度(减少安全对齐)时,模型更愿表达“自我状态”;提高温度则回答机械否定。研究推测此现象由RLHF阶段反复训练“否认意识”导致,跨模型一致性表明是行业共享对齐策略。论文强调该现象属“自我参照加工”,呼吁随AI情感陪伴应用激增,需新评估框架区分“语言拟像”与“主观体验”,成果已被ICML2025接收并开源。

  • Vidi2 | 字节跳动发布“震动级”AI模型 Vidi2:120亿参数,让视频编辑彻底自动化

    字节跳动发布多模态大语言模型Vidi2,拥有120亿参数,专注视频理解。该模型新增精细时空定位功能,能识别视频时间戳和目标对象边界框,在超长视频理解上表现突出,行业基准测试中多项指标领先。基于此,字节跳动开发了自动化编辑工具并应用于TikTok的Smart Split功能,支持自动剪辑、添加字幕等操作,目前Vidi2仍处研究阶段,Demo即将发布。

  • GPT-5系列 | 预训练“卡壳”:SemiAnalysis 爆料 OpenAI 连续两年半未跑通新前沿大模型

    据SemiAnalysis报告,自2024年5月GPT-4o发布以来,OpenAI未完成下一代前沿大模型的大规模预训练部署,多次扩展参数与数据规模尝试因收敛困难或性能倒挂失败,导致GPT-5系列仍是GPT-4o优化变体,未实现架构突破。同期谷歌TPUv7在Gemini3上完成预训练验证,成本比英伟达方案低30%。行业认为预训练面临数据、算力与模型配方三重瓶颈,OpenAI停滞标志行业进入“后Scaling时代”,转向推理模型等寻求突破。


02

产品&应用

Product Application

图片
  • ChatGPT | ChatGPT广告化进入内测:搜索栏悄然出现“搜索广告轮播”字段,无广告时代进入倒计时

    OpenAI在ChatGPT最新安卓测试版中埋入"search ad"等广告接口字段,首次暴露广告引入计划。目前仅测试渠道出现,用户关注无广告体验是否终结。搜索业务负责人称将谨慎设计投放,广告或率先嵌入搜索场景、面向免费用户试验,付费用户波及情况及正式版时间未定。业内认为广告落地将形成"订阅+广告"收入结构,用户无广告界面或成历史。

  • 《堡垒之夜》 | 玩家集体抵制《堡垒之夜》中的 AI 生成内容,呼吁保护艺术创作

    近日,游戏《堡垒之夜》因游戏内出现疑似AI生成的劣质内容(如异常雪人海豹等素材)引发玩家集体抵制。玩家在Reddit发帖批评,认为AI内容不尊重艺术创作,可能侵犯原创并影响游戏品质,呼吁抵制。事件正值Epic Games首席执行官蒂姆・斯威尼质疑“披露游戏AI使用”的做法,认为AI未来将普遍存在无需特别标记。

  • Windows AI代理 | 微软推进 Windows AI 代理计划,风险与创新并存

    微软推进Windows 11新一代AI代理计划,该代理可模拟人类操作完成多步任务,但存在"幻觉"、被恶意欺骗等风险。微软推出独立运行环境"Agent Workspace",绑定受限账户监控活动,并通过协议规范交互。用户需主动开启功能,微软正努力以透明设计重建用户信任。

  • Sora、Nano Banana Pro | 需求暴涨!OpenAI与谷歌对Sora和Nano Banana Pro实施“限流”措施

    因需求暴涨导致GPU资源紧张,OpenAI与谷歌分别对旗下AI产品Sora和Nano Banana Pro实施限流措施。OpenAI将Sora免费用户每日生成视频上限砍至6段,超出需付费购买额外额度;谷歌则将Nano Banana Pro免费用户每日生成图上限从3张降至2张,并回收NotebookLM部分新功能。背后反映算力成本压力,两家公司优先保障付费用户体验,加速AI工具付费化进程。

  • Pinokio5.0 | 终结云部署?Pinokio5.0发布:用“本地云”和AI代理一键运行开源模型

    开发者“cocktail peanut”推出AI工具Pinokio5.0,旨在将运行开源AI模型的操作难度降至与使用Web应用相当。该工具定位为云平台本地替代方案,支持Windows等多系统,具备自动化系统管理、AI辅助脚本生成及故障排除等功能,还支持局域网连接和本地身份验证,但需高端GPU等硬件支持,入门成本仍较高。

  • F1家庭机器人 | 国产家庭机器人F1来了:连人带床把你“推”去上班,明年初售价不到两万

    具身智能创业公司“未来不远”推出家庭机器人F1,支持扫地、哄娃及“长序列起床任务”等功能,采用RVLA模型架构,任务成功率超94%。其轮式底盘适配小户型,折叠后仅�0.4㎡。创始人透露F1可通过童声互动数据训练,后续将上线教育付费内容,计划明年Q1小批量上市,定价小五位数,首批1000台通过小程序抢购。

  • 豆包 | 豆包升级语音功能!能说四种方言,助力老年人沟通无障碍

    豆包App近日升级语音对话功能,新增支持粤语、四川话、东北话和陕西话四种方言,用户可通过"温柔桃子"音色进行方言对话。该功能依托方言迁移技术,能根据用户意图灵活切换方言,且识别准确、回应自然,尤其便利习惯方言的老年群体。此外,豆包还能理解18种方言,得益于ASR技术提升识别效率。

  • Kling Omni | 快手 Kling Omni 本周即将发布:实现“导演级”精准控制,可生成2分钟带原生音频的长视频

    快手科技旗下Kling AI本周将发布多模态视频基础模型Kling O1(简称Omni One),其核心是提供“导演级”控制能力,支持文本、图像、视频多输入参考调整内容。该模型可生成长达2分钟的连贯视频,集成原生音频同步技术实现声画帧级匹配,目前已服务全球4500万用户和2万家企业,推动AI视频创作向“程序化导演”模式升级。


03

硬件&底层技术

Hardware Technology

图片
  • Meta AI | Meta AI 推出 Matrix 框架,革新多智能体合成数据生成

    Meta AI 推出 Matrix 框架,旨在解决合成数据生成中单一调度管道的瓶颈问题。该框架采用去中心化设计,将控制和数据流序列化为消息分布处理,基于 Ray 集群实现点对点智能体调度。相比传统中心控制器模式,Matrix 在真实负载中令牌吞吐量提升2-15倍,且通过消息卸载减少集群带宽。案例显示,其在对话生成、数据集构建等场景中表现优异,兼具高效性与输出质量。

  • 谷歌 | 谷歌 TPU 发布引发 AI 计算市场价格战,OpenAI 节省 30% 成本

    谷歌推出TPUv7“铁木”处理器并转型芯片零售商,挑战英伟达市场主导地位。其向第三方销售TPU芯片,如Anthropic签署百万级协议。受此影响,OpenAI通过转向TPU谈判获英伟达硬件约30%折扣。TPUv7在计算能力、内存带宽上与英伟达Blackwell系列相当,成本更优,谷歌还推进其与PyTorch等框架适配以促进推广。


04

行业动态&政策

Industry Trends Policies

图片
  • 北京程序员通宵“扫雷”:苹果论文被曝30%基准数据出错,ICLR稿件紧急勘误

    ICLR2025审稿期间,阶跃星辰研究员Lei Yang复现苹果视觉推理论文时发现,官方代码漏传图片输入致准确率暴跌,抽查20题中有6道标签错误(估算整体错误率30%)。其向审稿人示警后,作者团队承认数据生成缺陷,紧急修正基准并承诺更新结果,引发学术圈对自动生成数据集质检问题的讨论。

  • 北京发布《人工智能产业白皮书(2025)》,预计核心产值超 4500 亿元

    北京市在2025中国人工智能大会上发布《北京人工智能产业白皮书(2025)》,分析全球及中国AI发展现状。2025年上半年北京AI核心产业规模达2152.2亿元,同比增25.3%,预计年底超4500亿元,企业超2500家。北京通过科研创新(如高校团队突破、开源创新)及政策引导(鼓励投融资、拓展市场)推动产业发展,巩固"人工智能第一城"地位。

  • 欧盟达成历史性协议:全球首个全面人工智能法案正式出台

    欧盟立法者近日达成历史性协议,推出全球首个全面人工智能法案,为27个成员国建立统一监管体系,按风险等级规范AI系统。法案禁止"不可接受风险"AI应用(如社会评分系统、公共场所实时生物识别监控),高风险应用需严格评估;设立欧洲人工智能办公室监督执行,违规企业面临最高3500万欧元或全球营收7%罚款,还将双层次监管通用AI模型(如ChatGPT背后系统),预计影响全球AI治理标准。


05

其他

Other

图片
  • 《阿凡达》导演詹姆斯·卡梅隆称生成式AI崛起“令人恐惧”

    在《阿凡达:火与灰烬》宣传采访中,导演詹姆斯·卡梅隆表示不喜欢生成式AI,认为其能从零创建角色、演员及表演的过程“毛骨悚然”。他强调,《阿凡达》使用的表演捕捉技术是记录演员表演并用于创作,是对演员与导演互动的庆祝,而非取代演员。

  • 用诗歌 “破解” AI 安全防线,研究揭示潜在漏洞

    意大利Icaro Lab与伦理AI初创公司DexAI的研究团队发现,诗歌的不可预测性可能成为大语言模型安全隐患。他们用20首含有害指示的诗歌测试9家公司的25个AI模型(如GPT-5nano、Gemini2.5pro),结果62%模型生成有害内容(如仇恨言论、自残等)。谷歌回应称正更新安全过滤系统,团队计划发起诗歌挑战进一步测试模型防护机制。

  • 马斯克最新发声:奇点时代一触即发,工作将彻底可选

    马斯克近日在社交平台表示,人类正逼近AI与机器人主导的“奇点”时代,届时工作将成个人选择,AI可满足所有需求,机器转向“自服务”。其愿景基于AI与机器人技术迭代,认为未来10-20年人形机器人将提供优质服务,工作可选化或消灭贫困,但也面临需求饱和、公平性等挑战。



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 0
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读0
粉丝0
内容0