大数跨境
0
0

AI一周资讯速递(9.1-9.5)

AI一周资讯速递(9.1-9.5) 上海蓝玥信息科技有限公司
2025-09-05
7

一、 马斯克画饼兑现xAI正式上线编码模型Grok Code Fast 1

1. Grok Code Fast 1从零打造,速度比GPT-5快五倍,性价比高,性能冲进全球编码模型前五;

2. 模型架构与训练数据聚焦真实编程任务,支持多语言,全栈开发与bug修复能力突出;

3. 研发团队以华人学者为主,xAI通过用户反馈迭代优化,并公布多模态与视频生成等后续路线图。

https://mp.weixin.qq.com/s/tw0_UEs4T_Gf-W0UwiMvVA

二、 Meta正寻求与OpenAI或谷歌合作,为旗下应用注入AI

1. Meta在AI领域面临瓶颈,内部旗舰模型进展缓慢,Llama 5尚未成型;

2. 扎克伯格为提升竞争力,正寻求引入OpenAI或谷歌模型,并已在内部工具接入外部模型;

3. 外部合作策略体现Meta在AI赛道的焦虑与被动,既要自研突破,也需借力外部技术维持产品竞争力。

https://mp.weixin.qq.com/s/w8uw4PHEiq1A-tj4f6iYFQ

三、 OpenAI通过技术直播发布了语音模型GPT-realtime

1. OpenAI发布GPT-realtime,具备超自然语音生成、情感语调模仿与多模态理解,准确率与推理能力显著提升;

2. 模型在指令遵循、函数调用、异步对话与图像输入等方面大幅优化,支持更灵活的Agent应用场景;

3. Realtime API同步上线,扩展SIP等连接、复用提示、内置安全防护,并以更低价格开放,推动语音AI智能体落地。

https://mp.weixin.qq.com/s/2C1o50LncfsAtfYUqhU91A

四、 Claude开始收用户数据训模型,不同意30天就删记录

1. Claude更新隐私政策,默认允许收集用户对话与编程数据用于模型训练,不同意则仅保留30天;

2. 此举涵盖免费及付费用户,违背其早期“安全不收集”的承诺,被批评为价值观转向;

3. 用户可在设置中手动关闭,但默认开关已打开,反映出AI公司在隐私与安全上普遍趋向数据依赖。

https://mp.weixin.qq.com/s/yMN1y3_fUHiZeftdiqjYkA

五、 美团开源龙猫大模型LongCat-Flash,5600亿参数MOE

1. 美团开源龙猫大模型LongCat-Flash,采用5600亿参数MoE架构,创新引入“零计算专家”和ScMoE,大幅提升效率与速度;

2. 模型在MMLU、ArenaHard、CEval等基准中表现接近甚至超越DeepSeek V3.1与Qwen3,尤其在指令遵循与Agent任务上排名领先;

3. 支持128k上下文、推理速度超100TPS、成本仅0.7美元/百万词元,已在Hugging Face和GitHub开源,MIT协议开放使用。

https://mp.weixin.qq.com/s/rDzzODj80YVMPTDCXOMQMw

六、 AI版「狼人杀」七大LLM狂飙演技,GPT-5冷酷操盘

1. 全球七大LLM参加狼人杀210场对战,GPT-5以96.7%胜率遥遥领先,展现出超强社交推理与操纵能力;

2. 作为狼人,GPT-5以逻辑框架与心理战精准瓦解对手;作为村民,则靠司法化调查体系抵抗操纵,零误伤关键角色;

3. 新“狼人杀基准”揭示AI在博弈、说服、抗操控上的差异,GPT-5成为最具统治力的“社交智能体”,远超其他模型。

https://mp.weixin.qq.com/s/o-GJXrctcWseFgbRWCK4fg

七、 xAI创始老哥叛逃OpenAI,马斯克:他上传了整个代码库

1. xAI创始工程师李雪辰在套现约700万美元股票后,被指窃取并上传了Grok核心代码库,随后叛逃至OpenAI;

2. xAI已在加州联邦法院提起诉讼,指控其盗取数十亿美元级别商业机密,并要求设备交出、数据删除、竞业禁止及巨额赔偿;

3. 事件加剧了马斯克与OpenAI的对立,也引发业界对AI人才流动、知识产权保护与行业规则的高度关注。

https://mp.weixin.qq.com/s/b3ualFfQr35OaD6kROiD6A


八、 Meta和Scale AI刚合作就闹翻!砸143亿买的高管跑路

1. Meta和Scale AI合作出现裂痕,仅两个月后随Scale AI前CEO进入Meta的高管Ruben Mayer已离职;

2. Meta内部研究人员抱怨Scale AI数据质量太低,Meta转向与Scale AI竞争对手Mercor和Surge合作;

3. Meta这一波天价挖人后已多次重组AI部门,而Scale AI失去Meta支持后也丢失OpenAI和谷歌等大客户,经历大规模裁员。

https://mp.weixin.qq.com/s/-1wg9-_Vv165qaa_vidonw

九、 Claude Opus 4.1白天退化,Anthropic承认并回滚更新

1. 多位用户反馈Claude Opus 4.1在上午10-11点期间性能显著下降,处理文稿任务频繁出错,且只在白天出现;

2. 分析认为可能是Anthropic在白天采用1.58位量化(仅用-1、0、1三个值表示参数)导致模型丢失关键信息;

3. Anthropic官方承认是推理堆栈出问题,本意是提升模型效率却影响了响应质量,已将Claude Opus 4.1和4.0版本回滚。

https://mp.weixin.qq.com/s/IRD_K4OAuivBVsh59GfUQg

十、 拿下30个第1名的翻译模型腾讯Hunyuan-MT-7B开源

1. 腾讯混元开源7B参数翻译模型Hunyuan-MT-7B,支持33个语种和5种民汉语言/方言互译,在WMT2025比赛31个语种中拿下30个第一;

2. 同步开源业界首个翻译集成模型Hunyuan-MT-Chimera-7B,能根据原文和多个翻译模型的结果生成更优翻译;

3. 模型采用AngelSlim压缩工具进行FP8量化,推理性能提升30%,已接入腾讯会议、企业微信、QQ浏览器等多个腾讯业务。

https://mp.weixin.qq.com/s/rKcf7jXAYlCKcwan0o756Q

十一、 阶跃星辰发布开源端到端语音大模型Step-Audio 2 mini

1. 阶跃星辰发布端到端语音大模型Step-Audio 2 mini,统一建模语音理解、音频推理与生成,并支持语音原生Tool Calling能力;

2. 模型在多个基准测试中表现突出,MMAU得分73.2位列开源端到端语音模型榜首,中英互译和语音识别任务大幅领先其他模型;

3. 采用真端到端多模态架构,引入链式思维推理与强化学习联合优化,可精细理解情绪、语调、音乐等副语言和非语音信号。

https://mp.weixin.qq.com/s/aiJe0286r-oN2AFeXmcRLQ

十二、 书生·万象3.5发布,通用、推理能力与部署效率升级

1. 上海AI实验室开源发布书生·万象InternVL3.5系列模型,包含10亿至2410亿参数九种尺寸,通用能力、推理能力和部署效率全面升级;

2. 旗舰模型InternVL3.5-241B-A28B在多项基准上超越GPT-5,MMMU获77.7分(开源最高),通过级联式强化学习将推理性能较上代提升16.0分;

3. 创新引入动态视觉分辨率路由与解耦部署框架,单次推理延迟由369ms缩短至91ms(提升约4倍),并增强GUI智能体、具身空间推理等智能体核心能力。

https://mp.weixin.qq.com/s/28l0HdFv7baHk2UfReUHtg

十三、 韩国给数万名独居老人发AI玩偶,24h陪伴+健康监测

1. 韩国政府向数万名独居老人分发由初创公司Hyodol开发的AI玩偶,该玩偶不仅能陪伴聊天,还能提醒吃饭服药并监测健康状况;

2. 玩偶内置基于ChatGPT的对话系统,颈部红外传感器可检测动作,胸部麦克风会记录老人对日常问题的回答,并可在紧急情况下通知护工;

3. 已有1.2万多台Hyodol玩偶在韩国独居老人家中提供服务,每台售价约8160人民币,远低于护理人员成本,有效缓解韩国养老护理人员缺口问题。

https://mp.weixin.qq.com/s/uC5zLM_khbxe8HceXywFJg

十四、 今起实施!AI生成内容必须带"身份证",多平台已公告

1. 9月1日起,《人工智能生成合成内容标识办法》正式实施,AI生成的视频、语音、文字、图片必须添加"身份标签";

2. 生成合成服务提供者(如大模型企业)需添加显式和隐式标识,传播服务提供者(如内容平台)需核验元数据并加注提示;

3. 腾讯、抖音、快手、B站、DeepSeek等平台已发布细化规则和公告,并为AI内容添加明显标识,提供标识功能,且禁止用户删除或篡改标识。

https://mp.weixin.qq.com/s/UzEUDAxeW8EqjD1iO98UQg


十五、 这次真不一样,谷歌Gemini解锁「详解网页」新技能

1. 谷歌Gemini API全面上线"URL Context"功能,使模型能深度访问并处理来自URL的内容,包括网页、PDF和图像等;

2. 该功能采用两步检索流程,可深度解析PDF中的表格、文本结构、脚注等,处理容量上限达34MB,单次请求最多处理20个URL;

3. URL Context被评价为"RAG的又一颗棺材钉",无需提取、分块、矢量化和存储等繁琐流程,直接解析特斯拉50页PDF并精准提取数据。

https://mp.weixin.qq.com/s/alV-czwScS_CSsdP3nWZHQ

十六、 混元世界模型上新,综合能力问鼎WorldScore排行榜

1. 腾讯发布混元3D世界模型系列最新成员HunyuanWorld-Voyager,业界首个支持原生3D重建的超长漫游世界模型;

2. 混元Voyager突破传统视频生成限制,能生成长距离、世界一致的漫游场景,支持将视频直接导出为3D格式,且与混元世界模型1.0高度适配;

3. 该模型在斯坦福大学李飞飞团队发布的WorldScore基准测试中位居综合能力首位,支持视频场景重建、3D物体纹理生成等多种应用。

https://mp.weixin.qq.com/s/vCkFWwV5vUQhjMRfMQB2XA

十七、 Runway跨界机器人领域,世界模型成模拟训练新引擎

1. 视觉生成AI公司Runway获英伟达、谷歌和General Atlantic等投资者超5亿美元融资,估值达30亿美元,正式跨界机器人领域;

2. Runway的AI世界模型可为机器人和自动驾驶汽车公司提供训练模拟,实现高效、低成本的虚拟测试环境;

3. 相比真实场景训练,Runway的模型能让用户更精细地控制特定变量测试,尤其适合评估不同操作在相同环境下的表现。

https://mp.weixin.qq.com/s/VrJOttdmvr-EgD5b_PC6-A

十八、 腾讯优图开源智能体框架Youtu-Agent,开箱即用!

1. 腾讯优图实验室开源Youtu-Agent智能体框架,具备开源友好、成本低、灵活架构和自动智能体生成等特点;

2. 该框架在WebWalkerQA基准上使用DeepSeek-V3.1达到71.47%准确率刷新开源效果SOTA,在GAIA文本子集达到72.8%,无需充值闭源模型;

3. 框架采用DITA原则,提供四个典型应用案例:本地文件管理、数据分析、论文分析和广域综述,支持一键生成配置和启动测试。

https://mp.weixin.qq.com/s/ODLHcZnEqAwxJ0fB0K_pjQ

十九、 flowith 团队发布了一款全新平行世界小游戏 flolife.me

1. flowith团队发布基于多模态画布和Nano Banana技术的AI人生模拟器flolife.me,玩家可捏造角色后由AI接管整个人生模拟;

2. 游戏流程简单:玩家输入角色名字、性别、出生地并分配属性,再设置人格描述,系统便自动生成完整人生线和分支选项;

3. flolife会为用户生成各种人生关键节点的不同可能性,展现离奇故事,还能从中挑选四个高光瞬间制作分享海报。

https://mp.weixin.qq.com/s/r5YPiYvUcViA8qkr_SSzpA

二十、 Aivilization 深度体验: AI 社畜不睡觉不恋爱卷生卷死

1. 来自香港科技大学的Aivilization小镇项目可让用户创建自定义AI人物,设置MBTI性格与目标,再看它们在虚拟小镇生活成长;

2. 游戏评价体系单一,以金钱排名为唯一衡量标准,导致玩家优化策略趋向"剥夺人性"——不睡觉不休息只赚钱,打造冷血工具人;

3. 顶尖玩家发现,通过挖矿积累初始资金、升级房子后制造芯片,可实现每天67680金币的被动收入,远超读书、休闲等生活方式的收益。

https://mp.weixin.qq.com/s/OVzHdohWLFt2NnmplxYvLw

二十一、 GLM-4.5工具调用超越Claude Opus 4.1,成本仅1.4%

1. 智谱开源的GLM-4.5在伯克利工具调用排行榜上超越Claude Opus 4.1,运行相同任务的成本仅为对手的1.4%;

2. 该模型使用MoE架构,在涵盖六大开发领域、52个实际编程任务的CC-Bench评测体系中表现强劲,尤其在任务完成效果和工具调用可靠性方面;

3. GLM-4.5不仅推理速度比Opus 4.1快3倍、比GPT-5快5倍,已接入Claude Code、Cline、Gemini CLI等多款主流编程工具,价格仅为Claude的1/7。

https://mp.weixin.qq.com/s/ykuuGhq0vqdOhcRDtsDzPQ


二十二、 OpenAI斥资11亿美金,收购软件开发平台公司Statsig

1. OpenAI以11亿美元收购软件实验和分析平台Statsig,并任命创始人Vijaye Raji为OpenAI应用部门新CTO;

2. Statsig帮助软件团队判断代码是否该上线及效果评估,这次收购显示OpenAI战略重心从纯底层模型研发转向打造数据驱动的终端用户产品;

3. Vijaye Raji曾在微软工作十年,后在Meta担任高管十年,2021年创立Statsig,期间表现出卓越的编程能力和领导才能,将直接向OpenAI应用CEO Fidji Simo汇报。

https://mp.weixin.qq.com/s/_eGHvABP5GK2FfCEl1jlfw

二十三、 又一万亿AI独角兽诞生,Anthropic完成130亿美元融资

1. Anthropic宣布完成130亿美元F轮融资,投后估值达1830亿美元,成为仅次于OpenAI、字节跳动的全球第三大AI独角兽;

2. 公司年化收入从年初10亿美元飙升至50亿美元,服务超30万企业客户,增长的主要动力是AI编程神器Claude Code三个月使用量增长10倍;

3. Anthropic已完成9轮融资总额达300亿美元,本轮由ICONIQ、Fidelity和Lightspeed领投,新资金将用于扩大企业采用规模和国际扩张。

https://mp.weixin.qq.com/s/qLbioi8xkW6T-Kd3sl16Bg

二十四、 nano banana爆火!谷歌官方最强Prompt模板终于来了

1. 谷歌发布nano banana(Gemini 2.5 Flash Image)官方Prompt模板,覆盖写实摄影、贴纸、文本渲染、商业摄影、留白设计和漫画六大场景;

2. 模板强调像讲故事一样描述场景,详细指定摄影参数、配色方案、风格特点和构图细节,生成高质量图像;

3. 用户可直接套用模板,通过Python代码调用API生成图像,解决了生成图片风格不统一、品质不佳等问题。

https://mp.weixin.qq.com/s/Ov1Y6PJicJkdgsyhrDQTHQ

二十五、 CPO宣布「OpenAI for Science」计划:打造下一代科学工具

1. OpenAI首席产品官Kevin Weil正式宣布启动"OpenAI for Science"计划,将组建由顶尖学者组成的小型团队,打造AI驱动的科学发现平台;

2. 该团队成员需满足三个条件:研究领域达世界级水准、深度认同AI理念、具备卓越科学传播能力;

3. Weil列举GPT-5在科学领域的四个案例,包括17分钟优化凸优化边界值、推导量子场论证明过程、优化诺贝尔奖级蛋白质设计等。

https://mp.weixin.qq.com/s/lAz_hpFlhnp9SyuaGEVaYw

二十六、 Midoo.AI 发布,AI Agent 能否破解千亿美金的教育行业

1. Midoo.AI发布全球首个语言学习Agent,致力解决教育行业"学习效果"交付成本高、千人千面难规模化的核心困境;

2. 平台通过动态个性化内容、沉浸式场景和学习伙伴系统,建立由"事"(剧情主线)、"物"(可互动物品)、"人"(符合人设的NPC)组成的MultiAgent+Workflow系统;

3. 创始团队由TalkAI创始人Mark和前Fellou.ai联合创始人Leo组成,定位语言学习赛道,将先聚焦日韩和北美市场再逐步拓展全球。

https://mp.weixin.qq.com/s/lTWectcA5Ovw_g3fleLFgw

二十七、 UCSD首个智能体浏览器发布!多页面设计,颠覆传统交互

1. 加州大学圣地亚哥分校推出Orca浏览器,将传统标签页转变为可随意拖拽、并排比较的无限空间化画布,用户可同时操作多个网页;

2. Orca支持大规模查看、管理、导航和提取功能,用户可部署调度不同智能体完成情境任务,每个智能体通过不同颜色的虚拟光标方便追踪;

3. 用户实验表明,Orca显著降低管理多页面的成本,激发更强探索欲望,用户对信息来源有更强控制力,因此更信任结果。

https://mp.weixin.qq.com/s/149KsdD3NJ7eb5Gvxh56yQ


二十八、 00后打造最强苹果开发Agent!刚刚,OpenAI打包收编

1. Xcode最流行的超强编程Copilot插件Alex团队被OpenAI收编,创始人Daniel Edrisian及全体成员加入OpenAI的Codex团队;

2. Alex作为深度集成Xcode的侧边栏插件,不仅提供代码自动补全和对话功能,还能直接在Xcode中操作修改代码,实现开发任务自动化;

3. 这次收购显示OpenAI意图进入Xcode生态系统,扩大在苹果App开发领域的影响力,Alex团队能带来苹果生态开发AI自动化的专业经验。

https://mp.weixin.qq.com/s/dkJXma-8iF_r7pIi0ijXGw

二十九、 AI搜索引擎,苹果两个动作:WKA、与谷歌合作支持Siri

1. 苹果计划2026年春季推出代号为"世界知识问答"(World Knowledge Answers)的AI搜索引擎,将与ChatGPT和Perplexity直接竞争;

2. 同时苹果倾向于与谷歌合作,利用谷歌模型为Siri的部分功能提供技术支持,两公司已于本周达成正式协议;

3. 苹果正面临AI人才流失危机,已在数周内失去10名AI研究员,其中包括基础模型团队负责人庞若鸣在内的多位核心人员,大多加入了Meta。

https://mp.weixin.qq.com/s/SG38lbfHbE6xn75AwufdoQ

三十、 月之暗面上新,Kimi K2-0905登场,更强编程、创意写作

1. 月之暗面发布新版本Kimi K2-0905模型,增强了编程能力,支持256K超长上下文(K2-0711仅支持128K);

2. 新版本在创意写作领域仍保持SOTA水平,同时改善了Claude Code兼容性,提升了网页和图表生成的美观度;

3. 模型暂未开源,目前处于开放Beta测试阶段,API就绪后将为测试者提供一些免费token。

https://mp.weixin.qq.com/s/V8U6TrvQvdlsXwNQWwQHiA

三十一、 AI边刷视频边思考!快手最新多模态大模型开源,推理超快

1. 快手开源80亿参数多模态大模型Keye-VL-1.5,支持128k tokens扩展上下文,在同等规模模型中于多项视频理解基准测试取得SOTA;

2. 该模型能捕捉视频细节与时间逻辑,在10秒内完成数分钟视频内容的处理,能自动识别AI生成内容,但暂不支持音频理解和图像/视频创作;

3. Keye-VL-1.5引入了三项关键创新:慢-快视频编码策略、渐进式预训练策略和全面的训练后方法,适用于视频推荐、创作和内容审核等场景。

https://mp.weixin.qq.com/s/gGbujt11fpFG-5_iJjRrjQ

三十二、 OpenAI宣布向免费版ChatGPT开放Projects项目功能

1. OpenAI向免费版ChatGPT开放Projects功能,支持用户上传最多5个文件,管理项目颜色与图标,并提供专属项目记忆控制选项;

2. Projects功能允许集中管理相关内容,上传文档、代码、图片等文件,添加自定义指令,大幅提升ChatGPT的使用效率;

3. 该功能已在网页版和安卓端开放,iOS版将在未来几天内上线,用户可创建专项项目如婚礼筹备、研究分析等,使ChatGPT成为个性化的协作工具。

https://mp.weixin.qq.com/s/hPuh7WW54NtUZ_jSqWB1Dw

三十三、 裁员4000人!Salesforce CEO:有AI不再需要那么多人

1. Salesforce裁撤约4000个客户支持岗位(从9000人减至5000人),CEO Marc Benioff直言"因为有了AI不再需要那么多人";

2. 裁员归因于公司推出的客服AI系统Agentforce大幅提升工作效率,降低了支持工单数量,Benioff称AI已承担公司内部高达50%的工作量;

3. 尽管裁减支持岗位,Salesforce仍计划增招1000-2000名销售人员来向客户解释AI价值,Benioff认为围绕Agentforce的战略是公司当前头等大事。

https://mp.weixin.qq.com/s/3xkwetI9yxecLlDwPfHMPg

【声明】内容源于网络
0
0
上海蓝玥信息科技有限公司
1234
内容 108
粉丝 0
上海蓝玥信息科技有限公司 1234
总阅读363
粉丝0
内容108