9agent.ai
点击蓝字 关注我们
每日AI简讯
2025-08-22
01
大模型
LLM
Seed-OSS-36B | 字节跳动发布全新开源长文本处理模型 Seed-OSS-36B
字节跳动旗下Seed团队发布全新开源大型语言模型Seed-OSS-36B,专注高级推理与开发者友好性,支持最长512,000个tokens输入,远超OpenAI、Anthropic等产品。该模型包含三个变体,分别适用于一般用途、研究及任务执行,采用Apache-2.0许可,支持免费使用与修改。其具备36亿参数、64层架构等特征,在数学、编程任务中表现优异,支持4/8位量化部署及工具集成脚本,降低操作门槛。
GPT-5 Pro | AI数学天才诞生:GPT-5 Pro独立证明新定理震撼学界,OpenAI总裁惊呼这是"生命迹象"
OpenAI的GPT-5 Pro在测试中展现数学推理突破,其阅读凸优化论文后独立推导出更精确的数学结论并提供完整证明,证明思路与人类学者不同,体现独立思考和创新能力。原论文作者后续更新成果超越GPT-5 Pro,但AI的独创性仍被OpenAI总裁称为"生命迹象",标志AI向高层次智能迈进。
DeepSeek-V3.1 | DeepSeek-V3.1发布:更高思考效率 更强Agent 能力
深度求索科技于8月21日发布AI模型DeepSeek-V3.1,升级混合推理架构,支持思考与非思考模式切换,提升思考效率及工具使用、智能体任务表现。官方App、网页端及API同步升级,上下文容量扩展至128K,新增功能调用支持。其Base模型已在Huggingface和魔搭平台开源,9月6日起调整API价格并取消夜间优惠。
Seed-OSS | 字节跳动发布开源大语言模型 Seed-OSS,助力开发者与研究者
字节跳动Seed团队于2025年8月20日推出开源大语言模型系列Seed-OSS,专注国际化应用场景,具备长文本理解、推理等能力。其中Seed-OSS-36B模型含360亿参数,支持512K长上下文,在基准测试中表现优异。系列分含/不含合成指令数据两种版本,支持“思考预算”灵活控制推理长度,优化推理任务,适用于学术研究及开发任务,提供快速入门指南和量化支持,助力开发者与研究者。
Claude | Anthropic将Claude Code整合进企业计划 提升AI开发治理能力
Anthropic宣布将Claude Code纳入团队和企业订阅服务,并推出合规API,旨在提升AI开发治理能力。Claude Code作为Claude套件的企业组成部分,可优化开发流程;合规API支持IT和安全团队追踪使用情况及内容指标,执行治理与监控。此举应对了Claude Code用户激增(2025年夏季增长超300%)带来的管理压力,同时区别于竞争对手的生产力导向,专注企业治理需求以抢占监管行业市场。
GPT-6 | Altman押注GPT-6记忆革命 OpenAI战略转向代理系统开发
OpenAI首席执行官Sam Altman在GPT-5发布受挫后,将战略重心转向GPT-6开发,计划加速推出下一代模型。GPT-6核心创新在于记忆能力,可记住用户偏好、行为等,实现长期个性化交互。同时,OpenAI正从聊天机器人转向AI代理系统,专注复杂任务执行,推动AI从"对话伙伴"向"工作助手"演进。
百度蒸汽机 | 百度蒸汽机2.0视频生成大模型重磅升级 行业首创多人有声视频生成
百度蒸汽机(MuseSteamer)音视频一体化模型完成2.0版本升级,行业内首次实现多人有声视频一体化生成功能,突破此前单人视频生成限制,支持多人物视觉与音频同步。其Turbo版、Lite版等产品矩阵全面开放,个人用户可通过百度搜索或"绘想"平台使用,企业用户可在百度千帆平台体验,为内容创作、教育等行业提供新方案。
Seed-OSS-36B | 字节跳动王炸出击:Seed-OSS-36B开源模型横空出世,512K超长上下文碾压DeepSeek引爆AI圈
字节跳动宣布开源Seed-OSS-36B大语言模型,该模型具备360亿参数规模和原生512K超长上下文窗口,远超主流开源模型的128K限制。其采用Apache-2.0协议,支持学术与商业使用,并引入"思考预算"机制平衡推理深度与成本,技术架构融合RoPE位置编码等先进技术,基准测试表现突出,对开源生态及多行业应用有重要意义。
02
产品&应用
Product Application
Gemini Live AI助手 | 谷歌 Gemini Live AI 助手全新功能上线,实时互动更智能
谷歌推出Gemini Live AI助手新功能,包括屏幕高亮(扫描物品并高亮指引)、应用集成(与短信、电话等互动,自动草拟信息)及音频模型更新(改善语调、节奏,支持调节语速和特定角色口音),提升实时互动的自然性与便利性。新功能8月28日随Pixel10上线,后续扩展至安卓、iOS。
谷歌Pixel10系列 | 谷歌Pixel10抢跑AI赛道:搭载情感识别功能,领先苹果两年布局智能手机未来
谷歌发布Pixel10系列智能手机,搭载Tensor G5处理器及Gemini Nano模型,AI功能全面升级。新增Gemini Live音频情感识别、视觉叠加指导,Magic Cue主动交互助手,Camera Coach摄影AI等,还实现实时语音翻译、AI留言记录等通信突破,并率先支持C2PA数字内容验证标准,领先苹果AI手机布局两年。
Claude Code企业版 | Anthropic重磅升级:Claude Code企业版正式上线,命令行编程工具迎来变革时刻
Anthropic于2025年8月21日宣布推出Claude Code企业版,将其纳入Claude企业版订阅套餐,结束了该命令行编程工具仅限个人账户使用的历史。企业版针对个人用户此前的使用限制问题,提供精细化支出控制、资源灵活扩展等功能,并支持与Claude.ai聊天机器人深度整合,提升企业开发效率与智能化办公能力,旨在争夺企业级命令行工具市场份额。
AutoGLM 2.0 | 智谱AI发布革命性产品AutoGLM 2.0 语音一句话即可代替双手操控全网
8月20日,智谱AI发布革命性产品AutoGLM 2.0,作为新一代AI代理产品,其具备强大的自然语言理解和多平台操作能力,用户通过语音指令即可完成点外卖、订机票、社交内容发布等操作,还能跨平台执行信息检索、文章撰写、视频制作及多平台发布等复杂工作流。该产品云端独立运行,不占本地资源,并开放API接口,可融入各类智能硬件,推动AI代理进入实用化时代。
Vercel AI Gateway | Vercel AI Gateway发布!百种AI模型一键调用,零门槛打造智能应用
2025年8月,Vercel宣布其AI Gateway正式全面可用,为开发者提供高效AI模型调用平台。该工具支持OpenAI、xAI等供应商的数百种模型(如GPT-5、Claude Sonnet4),开发者可通过统一接口调用,无需单独配置API密钥。平台零成本加价,支持BYOK功能,延迟低至20毫秒以下,内置自动故障转移机制,兼容OpenAI API格式,并与Vercel AI SDK v5深度整合,降低开发与迁移成本。
Eleven v3 Alpha API | ElevenLabs 发布 v3 Alpha API:支持超过 70 种语言和无限数量的虚拟角色
全球领先的AI语音技术公司ElevenLabs于2025年8月20日推出Eleven v3 Alpha API,这是一款突破性的文本转语音工具,支持超70种语言,能生成自然流畅且富有情感的语音。其新增对话模式可创建多角色互动场景,支持无限虚拟角色及语气情感变化;还支持高级音频标签功能,通过标签精确控制语音语气节奏,适用于有声书、互动游戏等音频内容制作。
Flyme Auto2 AI座舱、智能体Eva | 未来已来!吉利银河M9首搭AI座舱,智能体Eva陪你畅享智慧出行
吉利银河M9首搭全球首个可大规模应用的AI座舱Flyme Auto2,该系统整合多品牌研发实力,支持跨车型无缝切换,提供情感交互、实况桌面等创新功能。同时,吉利发布超拟人智能体Eva,集成星睿AI大模型,具备情感识别与自主任务执行能力。其云端AI中心算力达23.5EFLOPS,车端AI Box算力200TOPS,支撑强大AI能力,未来将通过OTA更新覆盖更多用户。
Windows11 Copilot | 微软测试Windows11Copilot新功能:AI智能搜索文件和图片
微软正测试Windows11 Copilot新功能,包括AI智能搜索文件、全新家庭体验界面及图片分析功能。用户可用自然语言描述搜索文件,如"查找包含鸡肉玉米饼食谱的文件";新界面展示最近应用、文件等,提供个性化体验;还支持上传照片询问信息。功能面向Copilot Plus PC的Windows Insiders用户开放测试,提升办公和文件管理效率。
03
硬件&底层技术
Hardware Technology
FieldAI | 贝索斯4.05亿美元押注机器人大脑:FieldAI欲造万能AI,从人形机器人到自动驾驶全面统治
加州初创公司FieldAI获4.05亿美元融资(含贝索斯远征基金等领投的3.14亿美元),用于开发"基础具身AI模型",即通用机器人大脑。该模型基于物理学原理,能让机器人快速适应新环境并评估风险,用户可设定风险阈值调整行为。FieldAI已在建筑、能源等行业获订单,资金将用于研发、扩产及海外拓展,目标打造跨机器人类型的通用智能。
Intel | Intel 发布全新机架级 AI 芯片 Jaguar Shores,搭载 HBM4 内存
Intel近日发布新一代机架级AI芯片Jaguar Shores,该芯片采用18A工艺并配备HBM4内存,封装尺寸92.5mm×92.5mm,专为高性能计算设计。其作为Intel首款机架级解决方案,未来将与Diamond Rapids Xeon CPU结合。尽管此前Intel在AI领域表现不佳,但Jaguar Shores的推出标志其调整战略,聚焦高性能计算需求以提升市场竞争力。
Tinker Diffusion发布:从单一视角到3D编辑,AI重塑多视角一致性!
2025年8月,AI领域发布Tinker Diffusion,一款多视角一致性3D编辑工具。其通过结合单目深度先验与视频扩散模型,仅需单一或少量视角输入即可生成高质量3D场景,解决传统方法依赖密集视角、耗时且易产生伪影的问题,生成速度快且几何精度高,在VR、AR等领域应用前景广泛。
04
上市公司动态
Listed Company Updates
金山办公(股票代码:688111) | 金山办公半年报:AI月活用户突破2900万,WPS365营收暴增62%
金山办公(688111)发布2025年半年报,上半年营收26.57亿元,同比增10.12%;净利润7.47亿元,同比增3.57%。截至6月30日,WPS AI月活用户达2951万,WPS Office全球月活设备6.51亿创新高。企业级WPS365营收3.09亿元,同比暴增62.27%,成增长新引擎,同时发布WPS AI3.0及智能体“灵犀”,研发投入9.59亿元,同比增18.70%。
05
行业动态&政策
Industry Trends Policies
NVIDIA 与美国国家科学基金会携手打造开放科学 AI 模型
近日,美国国家科学基金会(NSF)与 NVIDIA 联合宣布投资1.52亿美元开展“开放多模态 AI 基础设施加速科学”(OMAI)项目,由艾伦人工智能研究所牵头,目标是开发开放源代码的多模态 AI 模型,助力各学科研究人员提升科研效率。项目将创建开放 AI 生态系统,提供配备 Blackwell Ultra GPU 的硬件及软件支持,联合多所大学参与,确保前沿技术惠及更广泛科研人员。OMAI 承诺开放模型、数据等资源,提升科研透明性,契合白宫 AI 行动计划,推动开放合作模式转变。
企业已向生成式 AI投资大量资金,但95%的回报为零
MIT报告显示,企业在生成式AI领域投入300亿至400亿美元,却有95%的组织未获回报,仅5%的试点项目创造数百万美元价值。超80%企业探索或试点ChatGPT、Copilot等工具,主要用于提升个人效率而非公司收益。整合AI面临工作流程脆弱等问题,且短期不会导致大规模失业。
阿里分拆斑马智行赴港上市:智能汽车操作系统迎来独立发展
8月21日,阿里巴巴宣布拟分拆斑马智行赴港上市,目前其持有斑马智行约44.72%股份,分拆后仍持股超30%。斑马智行由上汽与阿里共同发起,主要提供智能汽车操作系统等业务,8月20日港交所已披露其上市申请,联席保荐人为德意志银行等。此次分拆将助力其在智能汽车市场占据更有利位置。
06
其他
Other
OpenAI 首次突破月收入10亿美元,算力需求依然紧张
OpenAI财务主管Sarah Friar透露,公司首次实现月收入突破10亿美元,7月营收达10亿,预计今年营收将增两倍至127亿美元。但仍面临算力不足问题,正与Oracle、Coreweave合作分散风险,微软仍是关键伙伴。近期推出ChatGPT-5,推理工作量提升八倍,Plus和Pro订阅增长加速,同时正谈判出售60亿美元股票,估值达5000亿美元。
微软员工分享薪资数据:Cloud + AI 部门平均薪资突破20万美元
微软员工通过共享电子表格自发分享薪酬信息,已收集超850条数据(含基本薪资、奖金、股票奖励等)。数据显示,Cloud + AI部门平均基本薪资超20万美元。为吸引顶尖AI人才,微软推出数百万美元薪酬方案。数据由员工自愿匿名提交,存在样本量小、可能遗漏高薪员工等局限性,为求职者提供参考。
快手 Q2 财报出炉:营收超预期,可灵AI收入2.5亿元
快手发布2025年第二季度财报,营收350.5亿元超预期,同比增13.1%;调整后净利润56.2亿元,同比增20.1%。线上营销服务收入198亿元,电商GMV达3589亿元增17.6%。可灵AI收入2.5亿元,生成超2亿视频和4亿图片。海外巴西收入增20.5%至13亿,本地生活收入增近120%。日活用户4.09亿,董事会宣布首次派特别股息每股0.46港元。
⬇️更多AI资讯关注我们⬇️

