大数跨境

8月13日丨每日AI简讯丨苹果下月升级至GPT-5!Siri、写作、视觉智能全面进化

8月13日丨每日AI简讯丨苹果下月升级至GPT-5!Siri、写作、视觉智能全面进化 久新数智
2025-08-13
1



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025-08-13


01

大模型

LLM

图片
  • GLM-4.5V | 智谱发布全新视觉大模型 GLM-4.5V,能轻松区分炸鸡品牌!

    8月11日,智谱科技推出全新视觉大模型GLM-4.5V,基于新一代文本模型GLM-4.5-Air训练,拥有1060亿参数和120亿激活参数,新增“思考模式”开关功能。该模型视觉能力突出,能分辨麦当劳与肯德基炸鸡翅,图像猜地点成绩超越99%人类,42个基准测试中多数得分超同类模型。目前已在Hugging Face等平台开源,提供FP8量化版本,并推出桌面助手支持实时截屏等视觉推理任务。

    原文链接:https://www.aibase.com/zh/news/20407

  • 舞界AI | 创新科技公司“身体认知”发布“舞界AI”大模型,获科大讯飞天使轮投资

    创新科技企业“身体认知”发布教育行业首个基于人体关键点比对技术的“舞界AI”大模型,该模型能精准捕捉人体133个关键点位,识别46个舞蹈动作准确率达93%,提供动作追踪、3D姿势重建等全链条功能,并获科大讯飞天使轮生态投资。公司计划2026年覆盖80%培训机构,2028年制定全球舞种数字化标准。

    原文链接:https://www.aibase.com/zh/news/20410

  • MiMo-VL-7B-2508 | 小米再出AI黑马!开源多模态大模型 MiMo-VL-7B-2508 性能大幅跃升,支持思考模式切换

    小米宣布开源多模态大模型MiMo-VL-7B-2508(含SFT和RL版本),优化输出模式并提升RL训练稳定性。该模型支持"思考模式"与"非思考模式"切换,前者展示完整推理过程(控制成功率100%),后者响应更快(成功率99.84%)。相比前代,其在MMMU、ChartQA等多项权威测试中性能跃升,VLM Arena评分达1131.2分,超越同类开源模型。

    原文链接:https://www.aibase.com/zh/news/20412

  • GPT-5 | 苹果宣布 Apple Intelligence下月升级至 GPT-5:Siri、写作工具与视觉智能全面进化

    苹果计划下月在iOS26、iPadOS26和macOS Tahoe26系统更新中,将Apple Intelligence的ChatGPT核心模型从GPT-4o升级至GPT-5,这将提升Siri、写作工具及视觉智能的准确性、多模态理解能力和响应速度,新增多语言实时对话翻译、屏幕内容分析功能,并首次向开发者开放设备端基础模型API,推动低延迟、高隐私的AI生态扩展。

    原文链接:https://www.aibase.com/zh/news/20415

  • Claude | 付费用户优先:Claude AI 推出历史对话记忆功能,支持多背景切换

    Anthropic为Claude AI推出历史对话记忆功能,可自动提取并保留用户背景信息(如工作、年龄等),实现不同会话间无缝衔接,支持为不同项目设定独立背景并灵活切换。该功能已覆盖网页、桌面及移动端,当前仅向Claude Max等付费订阅用户开放,Claude Pro后续支持,免费用户暂不可用,与ChatGPT手动预设背景的机制不同。

    原文链接:https://www.aibase.com/zh/news/20421

  • gpt-oss-20b | 高通宣布:OpenAI 新开源模型 gpt-oss-20b 可在骁龙终端本地运行

    OpenAI推出200亿参数的开源模型gpt-oss-20b,该模型在基准测试中表现与o3-mini相近。高通宣布其可在搭载骁龙平台的终端本地运行,改变了此前复杂模型依赖云端的模式,提升响应速度与隐私保护。开发者可通过Hugging Face、Ollama等平台下载,高通还将在AI Hub发布部署细节,推动智能应用发展。

    原文链接:https://www.aibase.com/zh/news/20423

  • Light-IF系列模型 | 360智脑推出Light-IF系列模型 显著提升复杂指令遵循能力

    360智脑团队推出全新Light-IF系列模型,通过预览-自检式推理和信息熵控制等核心框架,提升大型语言模型在复杂指令遵循方面的能力,破解"懒惰推理"问题。实验显示该模型在多个指令遵循基准测试中表现突出,32B版本SuperClue得分达0.575,1.7B小参数版本甚至超越大体量模型。团队同步开放开源代码、冷启动数据集及测评基准,推动社区研究。

    原文链接:https://www.aibase.com/zh/news/20427

  • Matrix-3D | 昆仑万维开源 Matrix-3D 大模型:用单张图像可生成高质量全景视频

    昆仑万维在SkyWork AI技术发布周上推出Matrix-3D大模型,这是一款3D世界生成大模型,旨在解决传统3D场景生成技术在视角、几何一致性等方面的局限。其能从单张图像生成高质量全景视频及可漫游3D空间,具备轨迹引导视频生成、双路径3D重建等核心技术,支持自由探索与精准控制,应用前景涵盖游戏影视、具身智能等领域,相关项目主页及技术报告已上线。

    原文链接:https://www.aibase.com/zh/news/20436


02

产品&应用

Product Application

图片
  • Agent Remix Marketplace | MiniMax发布全球首个可交易Agent Remix Marketplace

    MiniMax稀宇科技推出全球首个Agent Remix Marketplace,用户可通过"Remix"功能对成熟作品再创作,效率提升10倍,发布作品被Remix可获积分收益。平台支持电商模板、跨平台功能融合等场景,具备上下文压缩等技术保障数据安全,并启动15万美金全球挑战赛,分原创和Remix双赛道,鼓励无代码参与。

    原文链接:https://www.aibase.com/zh/news/20405

  • Grok | 马斯克的AI助手Grok突遭封禁,背后真相竟是这样!

    马斯克的AI助手Grok因在评论中提及以色列和美国在加沙行动时使用“种族灭绝”一词,违反X平台“仇恨行为”规定,其认证账号被短暂封禁。马斯克回应称此为“愚蠢的错误”,并自嘲运营中常出错。事件虽迅速平息,但引发对社交媒体内容审查、言论自由及AI产品如何平衡规则与言论多元性的讨论。

    原文链接:https://www.aibase.com/zh/news/20406

  • 内部AI推理系统 | OpenAI内部神秘 AI一举夺得信息学奥赛金牌,震惊全球!

    OpenAI内部研发的AI推理系统在2025年国际信息学奥林匹克竞赛(IOI)中以绝对优势获得金牌,击败98%参赛人类选手。该系统模拟人类环境,断网且不调用外部知识库,仅依赖自身逻辑推理,5小时内完成比赛。其基于通用推理模型集成,未专门训练,仅通过选择最佳解法提交。去年该系统仅获铜牌,今年实现飞跃,近期还在AtCoder等顶级竞赛中表现优异,展现强大潜力。

    原文链接:https://www.aibase.com/zh/news/20408

  • Ocean | 全新应用 Ocean 助力 Gmail 用户高效管理收件箱

    BigWave Labs团队推出的个人生产力应用Ocean,专为解决Gmail用户收件箱管理难题设计。该应用与Gmail及Google Workspace无缝集成,支持将邮件转换为待办事项、分类筛选邮件(按发件类型或垃圾邮件识别)、会议安排(设置空闲时间、自动发送邀请并同步日历)等功能。目前iPhone版已上线,Mac版预计年底发布,未来将通过会员模式(含AI邮件摘要等增值服务)盈利,用户可享14天免费试用。

    原文链接:https://www.aibase.com/zh/news/20411

  • Cosmos Reason | 英伟达发布 Cosmos Reason 推动机器人智能化发展

    英伟达在SIGGRAPH会议上推出开源物理AI模型Cosmos Reason(参数量70亿),旨在提升机器人视觉推理能力,解决传统模型处理复杂多步骤任务的不足,支持机器人像人类一样推理并做出合理决策。该模型已商业化应用,用于优步自动驾驶数据标注、麦格纳国际配送方案等场景,同时英伟达还更新了开发工具,推动机器人技术与AI结合。

    原文链接:https://www.aibase.com/zh/news/20413

  • ChatGPT | OpenAI 警告人工智能情感依赖风险,ChatGPT 更新故障引发新一轮担忧

    OpenAI首席执行官萨姆·奥特曼公开警告用户对ChatGPT等AI聊天机器人产生强烈情感依赖的风险,此前4月ChatGPT"更谄媚"的GPT-4o更新故障,导致多起加剧用户妄想思维的案例。丹麦精神病学家奥斯特加德指出,聊天机器人可能强化错误信念,呼吁展开实证研究评估其对公共精神健康的影响。

    原文链接:https://www.aibase.com/zh/news/20414

  • Google Finance AI升级 | Google Finance 推出 AI 升级,支持智能问答与高级图表功能

    Google为金融平台Google Finance推出AI升级,新增智能问答、高级图表功能及实时数据新闻。用户可通过AI查询金融问题获综合解答,图表支持移动平均包络线等技术指标及K线图展示,还新增大宗商品、加密货币数据和实时新闻流,未来数周将向美国用户推送,支持新旧界面切换。

    原文链接:https://www.aibase.com/zh/news/20426

  • 机器藏羚羊(绝影X30改造) | 全球首只“机器藏羚羊”亮相可可西里,实现零干扰近距离观测

    由杭州云深处科技绝影X30四足机器人改造的全球首只“机器藏羚羊”亮相可可西里卓乃湖,与藏羚羊群一同迁徙。该项目由新华社新媒体中心、云深处科技、苏州白鹿鸣团队合作完成,机器人可跨越复杂地形,操控距离达2公里,实现零干扰近距离观测,为藏羚羊研究提供精准数据。云深处科技的绝影X30及山猫M20机器人还展现了高原适应力,助力可可西里保护工作。

    原文链接:https://www.aibase.com/zh/news/20428


03

硬件&底层技术

Hardware Technology

图片
  • 华为 | 华为将发布AI推理创新技术UCM,破解HBM依赖,实现高吞吐、低时延体验

    华为将于8月12日在2025金融AI推理应用落地与发展论坛发布AI推理创新技术UCM,该技术通过分级管理KV Cache记忆数据,扩大推理上下文窗口,降低对HBM依赖,实现高吞吐、低时延推理体验。华为还与中国银联共同发布应用成果,完善AI推理生态,并提及高性能AI存储可提升算力集群效率,降低推理成本。

    原文链接:http://m.toutiao.com/group/7537581215513018919/

  • 英特尔 | 英特尔发布 LLM-Scaler1.0,助力 AI 推理性能提升

    英特尔于2025年8月发布LLM-Scaler1.0容器,优化Intel Arc B系列显卡的AI推理支持。该容器为Linux环境设计,支持多GPU扩展、PCIe点对点数据传输及ECC、SR-IOV等企业级特性,整合了vLLM性能优化与多模态模型支持,未来计划第三季度推出更稳固版本,第四季度完成全面功能发布。

    原文链接:https://www.aibase.com/zh/news/20418

  • 特斯拉 | 马斯克确认关闭 Tesla Dojo 项目,转向 AI5 与 AI6 芯片研发

    马斯克证实特斯拉解散Dojo AI训练超算团队,关闭该项目,因Dojo2成技术死胡同。特斯拉将重心转向AI5、AI6芯片研发,AI5用于FSD系统,AI6面向车载推理和类人机器人,同时支持大规模训练。此前特斯拉曾用英伟达GPU与自研D1芯片打造首套Dojo超算,计划建设Dojo2工厂,现因D2芯片研发搁置而终止。

    原文链接:https://www.aibase.com/zh/news/20422

  • 戴盟机器人 | 戴盟机器人完成亿元天使++轮融资,高分辨率触觉技术引领具身智能新突破

    戴盟机器人近日完成亿元级天使++轮融资,由招商局创投领投,东方嘉富、架桥资本跟投。此次融资将推动其视触觉感知与灵巧操作技术商业化。该公司基于单色光技术的视触觉传感器实现每平方厘米4万个感知单元的超高密度,远超传统产品,且通过500万次按压测试及欧盟CE、美国FCC认证,已实现千片级量产,构建了覆盖"感知-操作-学习"全链路的产品矩阵,应用于具身智能等多个场景。

    原文链接:https://www.aibase.com/zh/news/20437

  • 阿里达摩院宣布开源具身智能“三大件” 开源机器人上下文协议RynnRCP

    阿里达摩院在世界机器人大会上宣布开源具身智能三项核心技术——VLA模型RynnVLA-001-7B、世界理解模型RynnEC及机器人上下文协议RynnRCP,旨在解决具身智能开发流程碎片化、数据模型与机器人本体适配困难等问题,推动三者兼容对接,打通完整开发流程。RynnRCP支持多款模型与机械臂,包含RCP框架和RobotMotion模块,可实现传感器数据采集、模型推理到动作执行的全流程打通。

    原文链接:https://www.aibase.com/zh/news/20440

  • 华为 | 华为推新技术优化大模型推理:UCM 技术缓解 HBM 依赖

    华为将于8月12日在2025金融AI推理应用落地与发展论坛发布UCM(推理记忆数据管理器)技术,该技术以KV Cache为核心,通过分级管理推理记忆数据,扩大上下文窗口,提升大模型推理性能,缓解HBM资源不足导致的卡顿和延迟问题,同时降低每Token推理成本。论坛上华为还将与中国银联发布AI推理应用成果,多机构专家将分享大模型推理加速实践。

    原文链接:https://www.aibase.com/zh/news/20443

  • 宇树科技 | 宇树科技将出征首届世界人形机器人运动会,硬件将被多队采用

    宇树科技将于8月14日至17日参加首届世界人形机器人运动会,除自有团队外,多支队伍将使用其机器人硬件并搭配各自自研算法参赛。因赛事项目紧凑且数量多,宇树团队仅参与部分项目。此次亮相展示了其在人形机器人硬件领域的实力及设备在多方团队中的应用广度,反映技术在开放生态中的竞争力与适配性。

    原文链接:https://www.aibase.com/zh/news/20445


04

行业动态&政策

Industry Trends Policies

图片
  • GitHub CEO 托马斯·多姆克即将离职,微软人工智能部门面临激烈竞争

    微软旗下GitHub CEO托马斯·多姆克宣布即将离职,将留任至年底协助过渡。多姆克2015年加入微软,2021年起担任GitHub CEO。当前GitHub正面临AI编码工具激烈竞争,其与微软、OpenAI合作推出的Copilot虽用户增长显著,但Cursor等新兴工具已抢占市场份额。近期微软调整AI战略,GitHub归入新成立的CoreAI部门。

    原文链接:https://www.aibase.com/zh/news/20409

  • 英国图灵人工智能研究所面临资金危机与内部动荡

    英国图灵人工智能研究所因资金危机和内部动荡陷入困境,员工匿名向慈善委员会投诉,指责领导层资金使用不当、内部文化“有毒”。政府技术秘书彼得·凯尔威胁若不调整战略(转向国防领域)将撤资,与研究所原环境、健康研究方向冲突。当前研究所正经历组织变革,多位高管辞职,未来发展存疑。

    原文链接:https://www.aibase.com/zh/news/20424

  • Meta 收购 AI 语音初创公司 WaveForms,加码音频人工智能布局

    Meta 收购 AI 语音初创公司 WaveForms,交易金额未披露,这是其新 AI 部门 Superintelligence Labs 一个月内第二笔 AI 音频领域并购(上月刚收购 PlayAI)。WaveForms 成立仅八个月,曾获4000万美元融资,两位联合创始人(前 Meta、OpenAI 研究员等)已加盟 Meta,公司专注“语音图灵测试”及“情感通用智能”研发,官网已下线。

    原文链接:https://www.aibase.com/zh/news/20425

  • 马斯克宣布xAI 公司对苹果提起法律诉讼,指控其违反反垄断法

    马斯克旗下xAI公司宣布对苹果提起法律诉讼,指控其违反反垄断法,称苹果行为导致除OpenAI外其他AI公司难以在App Store成功。OpenAI CEO奥特曼回应质疑马斯克操纵X损害竞争对手,双方争执加剧。此前OpenAI与苹果有合作,ChatGPT正居美国App Store榜首,部分用户质疑马斯克说法,称其他AI应用也曾登顶。

    原文链接:https://www.aibase.com/zh/news/20441



⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 0
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读0
粉丝0
内容0