8月27日丨每日AI简讯丨手机也能跑！面壁智能MiniCPM-V4.5碾压GPT-4.1-mini- 大数跨境

首页

8月27日丨每日AI简讯丨手机也能跑！面壁智能MiniCPM-V4.5碾压GPT-4.1-mini

久新数智

2025-08-27

导读：摘要信息

9agent.ai

点击蓝字关注我们

每日AI简讯

2025-08-27

大模型

LLM

Wan 2.2-S2V | 阿里通义万相预告Wan 2.2-S2V模型:解锁AI视频音频同步生成
阿里通义万相团队预告推出AI模型Wan 2.2-S2V，其核心亮点是能同步生成视频与音频，实现多模态融合。传统视频生成模型需单独处理音频或后期合成，该模型解决了这一瓶颈，为内容创作者提供更高效工具，预示AI内容生成将更具沉浸感与真实感。
MiniCPM-V4.5 | 手机也能跑!面壁智能重磅发布MiniCPM-V4.5:4.1亿参数碾压GPT-4.1-mini
面壁智能联合清华大学NLP实验室发布端侧多模态大模型MiniCPM-V4.5，总参数量4.1亿，在OpenCompass评估中得分69.0，超越GPT-4.1-mini等模型。该模型支持单图、多图及视频理解，可处理高分辨率图像，支持30多种语言，在iPhone16Pro Max上首token延迟低于2秒，解码速度超17token/s，支持多种部署方式并开源，推动边缘AI应用普及。
VibeVoice | 微软开源VibeVoice TTS模型:90分钟超长语音，可4人对话，中文效果惊艳!
微软近日开源文本转语音（TTS）模型VibeVoice，支持生成90分钟超长语音，突破传统时长限制，适用于播客、有声书等场景；可流畅生成最多4人对话语音，自然度接近真人；中文合成在语调、发音等方面表现优异，支持添加背景音乐，提升播客沉浸感。该模型已于8月26日在GitHub发布，助力开发者构建创新语音应用。
Ovis2.5 | 阿里国际发布多模态大模型 Ovis2.5，推动视觉感知与深度推理新进展
阿里国际发布新一代多模态大模型Ovis2.5并开源，该模型专注原生分辨率视觉感知、深度推理及高性价比场景设计。其包含9B和2B两个参数版本，在OpenCompass评测中分别获78.3和73.9分，保持同类开源模型SOTA水平。模型在架构、训练策略及数据工程上进行创新，代码和模型已在GitHub、Hugging Face上线。

产品&应用

Product Application

AI招聘工具 | 技术人才对 AI 招聘工具的不信任:68% 专业人士表示担忧
Dice报告显示，68%的科技专业人士对AI驱动的招聘系统不信任，80%倾向人类主导的招聘方法，近30%受访者因挫败感考虑离开科技行业（女性更明显）。问题根源在于AI招聘工具缺乏透明度和人类监督，92%认为其依赖关键词优化易忽视合格者，78%被迫夸大资历，65%调整简历迎合筛选。Dice首席执行官强调，需更负责任地整合AI，采用混合招聘模型（AI支持人类决策）以提升信任度。
AI网络安全应用 | 以人工智能助力网络安全的 Seemplicity 获得 5000 万美元融资
以色列网络安全公司Seemplicity完成5000万美元B轮融资，由Sienna Venture Capital领投。该公司专注利用AI优化企业漏洞与风险管理，通过自动化漏洞汇总、排序及修复，减少安全团队手动操作。融资将用于加速AI代理开发，提供个性化风险洞察与指导，目标减少95%曝光噪声。自2022年A轮以来，其年经常性收入增长800%，客户数三倍提升。
AIDesigner | Genspark推出AIDesigner:一键生成品牌全案，重新定义AI设计新格局
阿里巴巴旗下人工智能创新公司Genspark近日推出AI设计工具AIDesigner，该工具以“一键生成完整品牌设计”为核心，支持通过自然语言指令完成品牌Logo、包装、网站设计等全链路创意任务。用户输入简单提示后，数分钟内即可获得包含多模态设计的完整方案，涵盖矢量图标、3D渲染等多种格式，降低了设计门槛，引发行业关注。
AI虚拟人物"奶奶" | AI奶奶玄学养生视频小红书走红一条视频获赞8.1万
有创作者利用AI虚拟人物"奶奶"形象，在小红书发布玄学+养生短视频（如"佩戴珠宝的健康益处"等内容），一条视频获赞8.1万。其操作流程包括确定"智慧可信赖"的奶奶人设、准备口语化健康玄学脚本、用即梦生成视频并发布，配合热门标签吸引流量，最终实现变现，适合不愿真人出镜或想低成本生产视频的创作者。
Imagen 4 | 谷歌Imagen 4正式上线 Gemini API 和 Google AI Studio
谷歌发布文本转图像生成模型Imagen4，已通过Gemini API和Google AI Studio开放。该模型含标准版、Fast版、Ultra版，分别优化图像质量、处理速度及细节精度，支持生成高质量自然景观等图像，为艺术创作、广告设计等行业提供工具支持。
事业单位AI刷题班 | 粉笔发布事业单位AI刷题班新品:垂域大模型赋能个性化备考
在线职业教育公司粉笔近日推出事业单位AI刷题班，该产品基于自主研发的垂域AI大模型，提供"测-学-练-考"一体化闭环学习体验，针对性解决事业单位考试特殊性问题。系统能智能识别用户知识弱项，推送定制化学习内容，改变传统盲目刷题模式。截至6月30日，其首个AI刷题系统班累计销售约5万人次，收款2000万元，验证市场认可。
钉钉 ONE AI办公应用 | 国产大模型崛起，智能体引领 AI 新时代!
钉钉近日推出“钉钉 ONE”AI办公应用，作为人与AI的自然语言交流入口，通过智能体驱动工作信息流高效运转，标志着智能体技术在日常工作中落地。智能体具备自主感知、决策等能力，未来将有用户自助创建、厂商提供、企业配备三类应用场景。拓尔思、汉得信息等上市公司也布局智能体领域，推动企业运营智能化，开启AI新时代。
豆包 | 豆包正式上线未成年人保护模式
豆包宣布正式上线未成年人保护模式，家长输入密码开启后，推荐视频、浏览第三方网页、与豆包外智能体对话及AI创作功能将默认关闭，翻译、深入研究等功能仍可正常使用，旨在防止未成年人不适当使用设备。

硬件&底层技术

Hardware Technology

Humain | 沙特AI公司Humain启动首批数据中心建设，计划2026年投入运营
沙特AI公司Humain在利雅得和达曼启动首批数据中心建设，计划2026年初投入运营，初始容量100兆瓦。公司已获批准采购18000枚英伟达AI芯片，半导体主要从美国进口。Humain由沙特主权财富基金支持，目标通过建设AI基础设施等将海湾国家打造成区域AI强国，还与AMD等企业合作，计划到2030年新增1.9吉瓦数据中心产能。
英伟达 | 英伟达发布Jetson Thor机器人计算平台算力提升7.5倍售价2.5万元
英伟达发布全新Jetson Thor机器人计算平台，采用Blackwell GPU架构，AI算力达2070TFLOPS，较上一代提升7.5倍，能效提高3.5倍，配备128GB内存。该平台支持主流生成式AI框架，可同时运行多AI模型，旨在推动物理AI与机器人交互。开发者套件美国售价3499美元（约2.5万元），中国区售价将另行公布。
苹果 | 苹果新研究揭示LLM对齐新范式:清单式强化学习优于传统奖励模型
苹果研究人员提出清单式强化学习方案（RLCF），旨在提升开源大型语言模型（LLM）的复杂指令遵循能力。该方法通过教师模型生成具体清单，让学生模型对照清单条目评分并优化，在多个基准测试中性能提升显著，部分任务提升达8.2%，优于传统RLHF。研究指出RLCF专注复杂指令遵循，但存在应用场景局限、依赖强教师模型及非安全校准等不足。
英伟达 | 英伟达发布新一代机器人芯片Jetson Thor，AI算力提升7.5倍!
英伟达近日推出新一代机器人专用芯片Jetson Thor，其AI算力较上一代提升7.5倍，达2070FP4TFLOPS，功耗130W且能效提升3.5倍，内存128G、显存带宽273GB/s。该芯片采用Blackwell架构GPU，支持生成式AI模型推理，配备软件工具助力开发者本地实验，支持NVIDIA AI软件栈覆盖多领域。开发套件起售价3499美元，模组2999美元，宇树科技、银河通用等国内机器人公司已宣布首发搭载。
快手可灵 | 港大携手快手可灵突破长视频一致性瓶颈，"记忆检索"技术震撼发布
香港大学与快手可灵团队联合提出"Context-as-Memory"方法，解决长视频生成中场景一致性控制难题。该技术将历史上下文作为"记忆"，通过context learning学习上下文条件，并采用FOV记忆检索机制筛选相关历史帧，提升计算效率与降低成本。实验显示其在长视频场景记忆力及泛化性上超越现有方法，为虚拟世界构建、影视制作等领域提供新可能。

行业动态&政策

Industry Trends Policies

新华鲜报|重大部署！中国“人工智能+”行动“路线图”来了
国务院于8月26日印发《关于深入实施“人工智能+”行动的意见》，明确了“人工智能+”行动的总体要求、发展目标及重点方向。文件提出到2027年、2030年、2035年的阶段性目标，并部署6大重点行动和8项基础支撑能力，旨在以人工智能应用发展应对技术与外部环境变化，为强国建设提供支撑。
深圳将迎来通用人工智能盛会上千家企业携AI黑科技齐聚鹏城
2025年8月27日至29日，深圳将举办（国际）通用人工智能大会暨产业博览会，展览面积约8万平方米，超1000家全球企业参展，涵盖人形机器人、大模型等AI全产业链。大会将首发100项前沿技术，设“AI未来城”实景区，举办多场专业论坛及全球采购专场，推动大湾区AI产业融合发展。
全球AI力量集结，这场人工智能盛会即将在深圳启幕→
2025 AGIC深圳（国际）通用人工智能大会暨博览会将于8月27日至29日在深圳国际会展中心举办，以“模驱具身·智启未来”为主题，通过“一展一会一赛”搭建技术展示与商业对接平台。大会吸引超20个国家和地区的1000家企业参展，覆盖人形机器人、大模型等AI全产业链，将有100项AI技术全球首发，如普渡机器人的全尺寸双足人形机器人，并设“AI未来城”实景演示区，比亚迪、优必选等企业将展示相关技术。
聚焦AI，深圳国际电子展暨嵌入式展elexcon开幕
8月26日，第22届深圳国际电子展暨嵌入式展（elexcon2025）在深圳（福田）会展中心开幕，首日吸引超万名专业观众。展会以“All for AI, All for Green”为主题，聚焦嵌入式AI、边缘计算等方向，同期举办中国嵌入式技术大会，邀请高通、瑞萨等企业专家围绕嵌入式AI等议题演讲，吸引全球400多家供应商参展，并举办开发者嘉年华等活动。
Perplexity AI 推出版权分成计划，将向新闻发行商付费
Perplexity AI近日推出“出版商收入分成计划”，设立4250万美元专项基金（资金来自新推Comet Plus订阅服务），旨在让传统媒体从平台内容流量中获收益，成为首个提出“直接分成”模式的AI公司。此前其因版权问题遭News Corp等媒体诉讼或发律师函，现正与《时代周刊》等多家媒体洽谈合作，以缓解紧张关系并降低法律风险。
马斯克旗下 xAI 起诉苹果和 OpenAI，指控阻碍 AI 竞争
马斯克旗下xAI于2025年8月26日在美国德克萨斯州联邦法院起诉苹果和OpenAI，指控二者非法合谋阻碍AI领域竞争，导致xAI及开发的应用X处于劣势。xAI要求赔偿数十亿美元，并提到苹果未积极展示其应用Grok。马斯克在X平台强调Grok有100万条评论、平均评分4.9却被苹果拒列榜单，OpenAI则称此诉讼是马斯克的骚扰行为，苹果未回应。此案反映AI领域竞争加剧，将影响行业竞争环境。
马斯克旗下xAI起诉苹果和OpenAI 指控合谋垄断AI市场
埃隆·马斯克旗下xAI于8月25日起诉苹果和OpenAI，指控二者合谋垄断AI市场。诉状称苹果与OpenAI合作使ChatGPT成其设备唯一生成式AI聊天工具，排除其他产品竞争；还指控苹果操控App Store排名、延迟更新，致xAI的Grok处于劣势。此案或影响AI行业竞争格局，苹果未回应，OpenAI称其为"骚扰"。
国务院发布《“人工智能+”行动意见》 2035年迈入智能社会
国务院近日印发《关于深入实施“人工智能+”行动的意见》，明确发展目标：2027年在6大重点领域实现AI深度融合，核心应用普及率超70%；2030年AI全面赋能各行业，核心应用普及率超90%；2035年全面迈入智能经济与智能社会新阶段，AI成现代化重要支撑。

其他

Other

不止文本!研究人员发现AI系统新漏洞，图像重采样竟成攻击入口
网络安全公司Trail of Bits的研究人员发现一种新型AI系统攻击方法，利用图像重采样技术在人眼不可见的图像中注入恶意指令，可劫持大型语言模型（LLM）并窃取用户数据。实验显示该攻击能渗透Google Gemini CLI等主流AI系统，研究人员已发布开源工具Anamorpher用于创建此类恶意图片，并提出尺寸限制、结果预览等防御建议。
字节跳动AI核心人才流失视觉研究负责人冯佳时正式离职
字节跳动AI领域近日发生重要人事变动，其Seed大模型视觉基础研究团队负责人冯佳时正式离职。冯佳时在计算机视觉领域学术背景深厚，加入字节后负责视觉基础研究及多模态生成模型开发，发表超400篇论文并获多项荣誉，领导团队在多模态基础模型等前沿技术研究中贡献显著。其离职或影响相关项目推进，目前未公布下一步规划，字节暂未回应。
2025中国高校计算机大赛AIGC创新赛在东莞落幕 6390名学生参与竞技
8月25日，2025中国高校计算机大赛AIGC创新赛决赛在东莞结束，全国408所高校6390名学生参赛。赛事由vivo提供技术支持并开放蓝心大模型平台，设应用和创作赛道，鼓励学生将创意转化为AI解决方案。山东大学、广州城市理工学院等多支队伍获奖，展现了学生在医疗、金融等领域的AI创新能力。业内认为此类竞赛对培养AI人才意义重大，vivo表示将持续支持相关教育项目。

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 0

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读0

粉丝0

内容0