9agent.ai
点击蓝字 关注我们
每日AI简讯
2025-08-27
01
大模型
LLM
Wan 2.2-S2V | 阿里通义万相预告Wan 2.2-S2V模型:解锁AI视频音频同步生成
阿里通义万相团队预告推出AI模型Wan 2.2-S2V,其核心亮点是能同步生成视频与音频,实现多模态融合。传统视频生成模型需单独处理音频或后期合成,该模型解决了这一瓶颈,为内容创作者提供更高效工具,预示AI内容生成将更具沉浸感与真实感。
MiniCPM-V4.5 | 手机也能跑!面壁智能重磅发布MiniCPM-V4.5:4.1亿参数碾压GPT-4.1-mini
面壁智能联合清华大学NLP实验室发布端侧多模态大模型MiniCPM-V4.5,总参数量4.1亿,在OpenCompass评估中得分69.0,超越GPT-4.1-mini等模型。该模型支持单图、多图及视频理解,可处理高分辨率图像,支持30多种语言,在iPhone16Pro Max上首token延迟低于2秒,解码速度超17token/s,支持多种部署方式并开源,推动边缘AI应用普及。
VibeVoice | 微软开源VibeVoice TTS模型:90分钟超长语音,可4人对话,中文效果惊艳!
微软近日开源文本转语音(TTS)模型VibeVoice,支持生成90分钟超长语音,突破传统时长限制,适用于播客、有声书等场景;可流畅生成最多4人对话语音,自然度接近真人;中文合成在语调、发音等方面表现优异,支持添加背景音乐,提升播客沉浸感。该模型已于8月26日在GitHub发布,助力开发者构建创新语音应用。
Ovis2.5 | 阿里国际发布多模态大模型 Ovis2.5,推动视觉感知与深度推理新进展
阿里国际发布新一代多模态大模型Ovis2.5并开源,该模型专注原生分辨率视觉感知、深度推理及高性价比场景设计。其包含9B和2B两个参数版本,在OpenCompass评测中分别获78.3和73.9分,保持同类开源模型SOTA水平。模型在架构、训练策略及数据工程上进行创新,代码和模型已在GitHub、Hugging Face上线。
02
产品&应用
Product Application
AI招聘工具 | 技术人才对 AI 招聘工具的不信任:68% 专业人士表示担忧
Dice报告显示,68%的科技专业人士对AI驱动的招聘系统不信任,80%倾向人类主导的招聘方法,近30%受访者因挫败感考虑离开科技行业(女性更明显)。问题根源在于AI招聘工具缺乏透明度和人类监督,92%认为其依赖关键词优化易忽视合格者,78%被迫夸大资历,65%调整简历迎合筛选。Dice首席执行官强调,需更负责任地整合AI,采用混合招聘模型(AI支持人类决策)以提升信任度。
AI网络安全应用 | 以人工智能助力网络安全的 Seemplicity 获得 5000 万美元融资
以色列网络安全公司Seemplicity完成5000万美元B轮融资,由Sienna Venture Capital领投。该公司专注利用AI优化企业漏洞与风险管理,通过自动化漏洞汇总、排序及修复,减少安全团队手动操作。融资将用于加速AI代理开发,提供个性化风险洞察与指导,目标减少95%曝光噪声。自2022年A轮以来,其年经常性收入增长800%,客户数三倍提升。
AIDesigner | Genspark推出AIDesigner:一键生成品牌全案,重新定义AI设计新格局
阿里巴巴旗下人工智能创新公司Genspark近日推出AI设计工具AIDesigner,该工具以“一键生成完整品牌设计”为核心,支持通过自然语言指令完成品牌Logo、包装、网站设计等全链路创意任务。用户输入简单提示后,数分钟内即可获得包含多模态设计的完整方案,涵盖矢量图标、3D渲染等多种格式,降低了设计门槛,引发行业关注。
AI虚拟人物"奶奶" | AI奶奶玄学养生视频小红书走红 一条视频获赞8.1万
有创作者利用AI虚拟人物"奶奶"形象,在小红书发布玄学+养生短视频(如"佩戴珠宝的健康益处"等内容),一条视频获赞8.1万。其操作流程包括确定"智慧可信赖"的奶奶人设、准备口语化健康玄学脚本、用即梦生成视频并发布,配合热门标签吸引流量,最终实现变现,适合不愿真人出镜或想低成本生产视频的创作者。
Imagen 4 | 谷歌Imagen 4正式上线 Gemini API 和 Google AI Studio
谷歌发布文本转图像生成模型Imagen4,已通过Gemini API和Google AI Studio开放。该模型含标准版、Fast版、Ultra版,分别优化图像质量、处理速度及细节精度,支持生成高质量自然景观等图像,为艺术创作、广告设计等行业提供工具支持。
事业单位AI刷题班 | 粉笔发布事业单位AI刷题班新品:垂域大模型赋能个性化备考
在线职业教育公司粉笔近日推出事业单位AI刷题班,该产品基于自主研发的垂域AI大模型,提供"测-学-练-考"一体化闭环学习体验,针对性解决事业单位考试特殊性问题。系统能智能识别用户知识弱项,推送定制化学习内容,改变传统盲目刷题模式。截至6月30日,其首个AI刷题系统班累计销售约5万人次,收款2000万元,验证市场认可。
钉钉 ONE AI办公应用 | 国产大模型崛起,智能体引领 AI 新时代!
钉钉近日推出“钉钉 ONE”AI办公应用,作为人与AI的自然语言交流入口,通过智能体驱动工作信息流高效运转,标志着智能体技术在日常工作中落地。智能体具备自主感知、决策等能力,未来将有用户自助创建、厂商提供、企业配备三类应用场景。拓尔思、汉得信息等上市公司也布局智能体领域,推动企业运营智能化,开启AI新时代。
豆包 | 豆包正式上线未成年人保护模式
豆包宣布正式上线未成年人保护模式,家长输入密码开启后,推荐视频、浏览第三方网页、与豆包外智能体对话及AI创作功能将默认关闭,翻译、深入研究等功能仍可正常使用,旨在防止未成年人不适当使用设备。
03
硬件&底层技术
Hardware Technology
Humain | 沙特AI公司Humain启动首批数据中心建设,计划2026年投入运营
沙特AI公司Humain在利雅得和达曼启动首批数据中心建设,计划2026年初投入运营,初始容量100兆瓦。公司已获批准采购18000枚英伟达AI芯片,半导体主要从美国进口。Humain由沙特主权财富基金支持,目标通过建设AI基础设施等将海湾国家打造成区域AI强国,还与AMD等企业合作,计划到2030年新增1.9吉瓦数据中心产能。
英伟达 | 英伟达发布Jetson Thor机器人计算平台 算力提升7.5倍售价2.5万元
英伟达发布全新Jetson Thor机器人计算平台,采用Blackwell GPU架构,AI算力达2070TFLOPS,较上一代提升7.5倍,能效提高3.5倍,配备128GB内存。该平台支持主流生成式AI框架,可同时运行多AI模型,旨在推动物理AI与机器人交互。开发者套件美国售价3499美元(约2.5万元),中国区售价将另行公布。
苹果 | 苹果新研究揭示LLM对齐新范式:清单式强化学习优于传统奖励模型
苹果研究人员提出清单式强化学习方案(RLCF),旨在提升开源大型语言模型(LLM)的复杂指令遵循能力。该方法通过教师模型生成具体清单,让学生模型对照清单条目评分并优化,在多个基准测试中性能提升显著,部分任务提升达8.2%,优于传统RLHF。研究指出RLCF专注复杂指令遵循,但存在应用场景局限、依赖强教师模型及非安全校准等不足。
英伟达 | 英伟达发布新一代机器人芯片Jetson Thor,AI算力提升7.5倍!
英伟达近日推出新一代机器人专用芯片Jetson Thor,其AI算力较上一代提升7.5倍,达2070FP4TFLOPS,功耗130W且能效提升3.5倍,内存128G、显存带宽273GB/s。该芯片采用Blackwell架构GPU,支持生成式AI模型推理,配备软件工具助力开发者本地实验,支持NVIDIA AI软件栈覆盖多领域。开发套件起售价3499美元,模组2999美元,宇树科技、银河通用等国内机器人公司已宣布首发搭载。
快手可灵 | 港大携手快手可灵突破长视频一致性瓶颈,"记忆检索"技术震撼发布
香港大学与快手可灵团队联合提出"Context-as-Memory"方法,解决长视频生成中场景一致性控制难题。该技术将历史上下文作为"记忆",通过context learning学习上下文条件,并采用FOV记忆检索机制筛选相关历史帧,提升计算效率与降低成本。实验显示其在长视频场景记忆力及泛化性上超越现有方法,为虚拟世界构建、影视制作等领域提供新可能。
04
行业动态&政策
Industry Trends Policies
新华鲜报|重大部署!中国“人工智能+”行动“路线图”来了
国务院于8月26日印发《关于深入实施“人工智能+”行动的意见》,明确了“人工智能+”行动的总体要求、发展目标及重点方向。文件提出到2027年、2030年、2035年的阶段性目标,并部署6大重点行动和8项基础支撑能力,旨在以人工智能应用发展应对技术与外部环境变化,为强国建设提供支撑。
深圳将迎来通用人工智能盛会 上千家企业携AI黑科技齐聚鹏城
2025年8月27日至29日,深圳将举办(国际)通用人工智能大会暨产业博览会,展览面积约8万平方米,超1000家全球企业参展,涵盖人形机器人、大模型等AI全产业链。大会将首发100项前沿技术,设“AI未来城”实景区,举办多场专业论坛及全球采购专场,推动大湾区AI产业融合发展。
全球AI力量集结,这场人工智能盛会即将在深圳启幕→
2025 AGIC深圳(国际)通用人工智能大会暨博览会将于8月27日至29日在深圳国际会展中心举办,以“模驱具身·智启未来”为主题,通过“一展一会一赛”搭建技术展示与商业对接平台。大会吸引超20个国家和地区的1000家企业参展,覆盖人形机器人、大模型等AI全产业链,将有100项AI技术全球首发,如普渡机器人的全尺寸双足人形机器人,并设“AI未来城”实景演示区,比亚迪、优必选等企业将展示相关技术。
聚焦AI,深圳国际电子展暨嵌入式展elexcon开幕
8月26日,第22届深圳国际电子展暨嵌入式展(elexcon2025)在深圳(福田)会展中心开幕,首日吸引超万名专业观众。展会以“All for AI, All for Green”为主题,聚焦嵌入式AI、边缘计算等方向,同期举办中国嵌入式技术大会,邀请高通、瑞萨等企业专家围绕嵌入式AI等议题演讲,吸引全球400多家供应商参展,并举办开发者嘉年华等活动。
Perplexity AI 推出版权分成计划,将向新闻发行商付费
Perplexity AI近日推出“出版商收入分成计划”,设立4250万美元专项基金(资金来自新推Comet Plus订阅服务),旨在让传统媒体从平台内容流量中获收益,成为首个提出“直接分成”模式的AI公司。此前其因版权问题遭News Corp等媒体诉讼或发律师函,现正与《时代周刊》等多家媒体洽谈合作,以缓解紧张关系并降低法律风险。
马斯克旗下 xAI 起诉苹果和 OpenAI,指控阻碍 AI 竞争
马斯克旗下xAI于2025年8月26日在美国德克萨斯州联邦法院起诉苹果和OpenAI,指控二者非法合谋阻碍AI领域竞争,导致xAI及开发的应用X处于劣势。xAI要求赔偿数十亿美元,并提到苹果未积极展示其应用Grok。马斯克在X平台强调Grok有100万条评论、平均评分4.9却被苹果拒列榜单,OpenAI则称此诉讼是马斯克的骚扰行为,苹果未回应。此案反映AI领域竞争加剧,将影响行业竞争环境。
马斯克旗下xAI起诉苹果和OpenAI 指控合谋垄断AI市场
埃隆·马斯克旗下xAI于8月25日起诉苹果和OpenAI,指控二者合谋垄断AI市场。诉状称苹果与OpenAI合作使ChatGPT成其设备唯一生成式AI聊天工具,排除其他产品竞争;还指控苹果操控App Store排名、延迟更新,致xAI的Grok处于劣势。此案或影响AI行业竞争格局,苹果未回应,OpenAI称其为"骚扰"。
国务院发布《“人工智能+”行动意见》 2035年迈入智能社会
国务院近日印发《关于深入实施“人工智能+”行动的意见》,明确发展目标:2027年在6大重点领域实现AI深度融合,核心应用普及率超70%;2030年AI全面赋能各行业,核心应用普及率超90%;2035年全面迈入智能经济与智能社会新阶段,AI成现代化重要支撑。
05
其他
Other
不止文本!研究人员发现AI系统新漏洞,图像重采样竟成攻击入口
网络安全公司Trail of Bits的研究人员发现一种新型AI系统攻击方法,利用图像重采样技术在人眼不可见的图像中注入恶意指令,可劫持大型语言模型(LLM)并窃取用户数据。实验显示该攻击能渗透Google Gemini CLI等主流AI系统,研究人员已发布开源工具Anamorpher用于创建此类恶意图片,并提出尺寸限制、结果预览等防御建议。
字节跳动AI核心人才流失 视觉研究负责人冯佳时正式离职
字节跳动AI领域近日发生重要人事变动,其Seed大模型视觉基础研究团队负责人冯佳时正式离职。冯佳时在计算机视觉领域学术背景深厚,加入字节后负责视觉基础研究及多模态生成模型开发,发表超400篇论文并获多项荣誉,领导团队在多模态基础模型等前沿技术研究中贡献显著。其离职或影响相关项目推进,目前未公布下一步规划,字节暂未回应。
2025中国高校计算机大赛AIGC创新赛在东莞落幕 6390名学生参与竞技
8月25日,2025中国高校计算机大赛AIGC创新赛决赛在东莞结束,全国408所高校6390名学生参赛。赛事由vivo提供技术支持并开放蓝心大模型平台,设应用和创作赛道,鼓励学生将创意转化为AI解决方案。山东大学、广州城市理工学院等多支队伍获奖,展现了学生在医疗、金融等领域的AI创新能力。业内认为此类竞赛对培养AI人才意义重大,vivo表示将持续支持相关教育项目。
⬇️更多AI资讯关注我们⬇️

