8月5日丨每日AI简讯丨谷歌Gemini 2.5 Deep Think IMO夺金！AI新王者强势来袭？- 大数跨境

首页

8月5日丨每日AI简讯丨谷歌Gemini 2.5 Deep Think IMO夺金！AI新王者强势来袭？

久新数智

2025-08-05

9agent.ai

点击蓝字关注我们

每日AI简讯

2025-08-05

大模型

LLM

GPT-5 | GPT-5震撼来袭!OpenAI突破瓶颈，用户体验全面升级，背后却藏管理危机?
OpenAI下一代大语言模型GPT-5开发重心转向实用性与用户体验提升，在代码生成、推理效率及引入“Universal Verifier”校验机制等方面取得显著进步。此前GPT-4.5因未达预期、数据稀缺等问题折戟，促使资源转向GPT-5研发。同时，OpenAI面临高层摩擦、团队重组及IPO准备等管理挑战，GPT-5的发布将考验其技术与管理能力。
原文链接：https://www.aibase.com/zh/news/20196
Gemini 2.5 Deep Think | 谷歌Gemini 2.5 Deep Think发布!IMO金牌加持，AI新王者能否重塑未来?
谷歌DeepMind发布最强大AI模型Gemini 2.5 Deep Think，向Google AI Ultra订阅用户开放。该模型引入“并行思考”和强化学习技术，支持多模态与长上下文，在2025年IMO竞赛获金牌，且在LiveCodeBench V6等基准测试中超越Grok4、o3等模型，展现复杂任务处理能力。
原文链接：https://www.aibase.com/zh/news/20197
Claude | Anthropic切断 OpenAI 的 Claude 模型访问权限，行业竞争愈发激烈
Anthropic宣布取消OpenAI对其Claude系列AI模型的访问权限，称OpenAI此前使用Claude进行性能比较的行为违反服务条款（禁止用Claude构建竞争服务）。OpenAI回应称使用符合行业标准，对切断访问表示失望。此前Anthropic高层曾明确反对向竞争对手开放Claude访问，该事件加剧了AI行业竞争。
原文链接：https://www.aibase.com/zh/news/20204
Skywork MindLink | 昆仑万维发布并开源全新推理大模型 MindLink
昆仑万维发布并开源全新推理大模型Skywork MindLink，同步开放72B模型权重、技术报告及代码仓库。该模型采用动态路径选择推理框架，结合推理与非推理生成模式，降低计算成本并提升效率。基准测试中，其在10项大模型评测及数学奥赛等领域表现突出，技术上采用"Plan-based Reasoning"范式，优化多轮对话体验，增强基础模型能力，进一步完善公司大模型矩阵布局。
原文链接：https://www.aibase.com/zh/news/20201
混元 | 腾讯混元开源并发布 0.5B、1.8B、4B、7B模型
腾讯混元团队推出四款开源小尺寸模型，参数分别为0.5B、1.8B、4B、7B，专为消费级显卡设计，适用于笔记本、手机等低功耗场景，支持垂直领域低成本微调。模型具备推理快、性价比高特点，支持快/慢思考模式，在语言理解等领域表现出色，原生长上下文窗口达256k，可处理超长内容。目前已在Github、HuggingFace上线，获多家芯片平台支持，并在腾讯会议、微信读书等业务中应用。
原文链接：https://www.aibase.com/zh/news/20209
XBai o4 | 问小白推出XBai o4开源大模型:反思型推理架构颠覆传统，性能全面碾压OpenAI o3-mini
国内AI厂商问小白近日发布第四代开源大模型XBai o4，其采用独创的"反思型生成范式"架构，融合Long-CoT强化学习与过程评分学习，实现推理效率提升（过程评分推理耗时降99%）。该模型在数学推理、编程等多项测试中表现超越OpenAI o3-mini，部分优于Claude Opus，且完全开源（代码已在GitHub发布），推动AI行业协同发展。
原文链接：https://www.aibase.com/zh/news/20214
MiDashengLM-7B | 小米全量开源MiDashengLM-7B:音频理解性能刷新SOTA，推理速度暴增20倍
小米全量开源MiDashengLM-7B多模态大模型，专注音频理解，在22个公开评测集刷新多模态大模型最好成绩。其推理效率显著提升，单样本首Token延迟为业界先进模型的四分之一，数据吞吐效率高出20倍以上。采用双核心架构融合音频编码与语言解码能力，支持语音、环境声、音乐全域理解，未来计划终端离线部署并完善声音编辑功能。
原文链接：https://www.aibase.com/zh/news/20216
Wan2.2A14B | 挑战闭源巨头:Wan2.2A14B 成性价比最高视频 AI 模型
Wan2.2A14B成为当前开源视频模型中的性能领跑者，其在文本转视频方面表现出色，排名第七，但图像转视频因帧率仅16帧/秒（低于部分竞品24帧/秒）排名靠后。虽整体性能仍落后于Veo3、Seedance1.0等闭源模型，但其开源属性带来显著成本优势，成为预算敏感用户的理想选择。
原文链接：https://www.aibase.com/zh/news/20189

产品&应用

Product Application

高德地图2025（AI原生地图应用） | 押注空间智能，高德宣布全面AI化地图导航领域的“智能体大战”将走向何方?
8月4日，高德地图宣布全面AI化，推出全球首个AI原生地图应用“高德地图2025”，其具备深度时空理解和自主推理决策能力，通过AI助手“小高老师”提供完整出行解决方案，支持路线规划、跨城攻略、实时调整行程等功能。此前百度地图等企业已探索AI融合，此次高德的推出将加速行业变革，未来地图导航或成生活助理，提供更全面服务，但数据安全与技术风险仍需关注。
原文链接：http://m.toutiao.com/group/7534734924994085376/
Harmonize | Adobe Photoshop 推出“Harmonize”:用 AI 自动匹配光影，实现无缝图像合成
Adobe为Photoshop推出“Harmonize”等生成式AI工具，其中“Harmonize”可自动匹配图像元素的光照、颜色和阴影，实现无缝合成，解决了传统合成需专业知识的痛点。此外还升级了AI图像分辨率提升、智能对象移除等功能，并引入“内容凭证”记录编辑历史，平衡创作与内容真实性。
原文链接：https://www.aibase.com/zh/news/20182
AI原声翻译功能 | B站推出AI原声翻译功能:保留UP主声线音色，破解二次元文化出海难题
B站推出自主研发的"AI原声翻译功能"，通过保留UP主原始声线、音色等特征，解决二次元等内容出海的语言障碍。该功能支持画面与音频翻译，音频翻译为核心亮点，采用大语言模型、对抗式强化学习及Deep Research技术优化，现支持英语，未来将扩展日语等语言，助力国际化战略。
原文链接：https://www.aibase.com/zh/news/20183
MLE-STAR | 谷歌 AI 推出 MLE-STAR:一款智能化机器学习工程代理，助力自动化任务
谷歌AI团队近日推出智能化机器学习工程代理MLE-STAR，旨在自动化复杂机器学习流程设计与优化。该代理结合网络搜索、针对性代码优化及检查模块，解决了传统代理依赖模型记忆、代码修改片面等问题，在Kaggle竞赛中表现优异，且开源代码库可加速从业者项目创新。
原文链接：https://www.aibase.com/zh/news/20195
Android Studio Agent模式 | 安卓开发革命!谷歌Android Studio免费Agent模式上线，完爆苹果生态?
谷歌在Google I/O2025大会上宣布，Android Studio推出免费Agent模式，基于Gemini2.5Pro的AI辅助功能，支持自然语言任务描述、UI代码修改、自定义规则等，可处理代码生成、错误修复等全流程任务，提升开发效率，挑战苹果Xcode生态，目前已在Canary版本开放。
原文链接：https://www.aibase.com/zh/news/20206
LangExtract | 谷歌开源结构化信息提取工具langextract，可提供精确来源定位
谷歌正式开源Python库LangExtract，该工具利用Gemini等大模型从非结构化文本中提取结构化信息，具备精准溯源、可靠结构化输出、长文档优化及交互式可视化等功能，支持云端与本地模型，适用于医疗病历分析、文学研究、商业情报等多领域，降低了非结构化文本处理的技术门槛。
原文链接：https://www.aibase.com/zh/news/20208
聊聊吧AI语音服务 | 东京大学推出 AI 语音服务，助力老年人早期识别认知障碍
东京大学松尾研究室孵化的初创企业IGSA推出"聊聊吧"AI语音服务，针对50-70岁老年人，通过LINE官方账号进行2分钟自然对话，分析语速、停顿、词汇等语音及语言特征，评估认知状态并分A-D等级反馈。服务提供15分钟深入评估、生活习惯改善建议及本地健脑活动推荐，早期版本免费体验，正式版年费1500日元（约73元），计划纳入地方介护预防项目。
原文链接：https://www.aibase.com/zh/news/20210
AI 驱动多病种筛查 | 北京和睦家医院与阿里达摩院合作，AI 驱动多病种筛查
北京和睦家医院与阿里巴巴达摩院达成战略合作，推动“AI驱动的疾病预防创新与卫生经济学价值”。双方依托达摩院“一扫多查”医疗AI技术及和睦家的诊疗优势，探索多病种AI筛查服务，重点聚焦消化肿瘤（如胰腺癌、胃癌）与慢性病（骨质疏松、重度脂肪肝等）筛查，旨在将健康管理关口前移，提供高效可靠的医疗服务。
原文链接：https://www.aibase.com/zh/news/20212

硬件&底层技术

Hardware Technology

上海小度技术有限公司 | 上海小度申请基于大模型的信息评估方法等专利，涉及人工智能技术领域
上海小度技术有限公司申请一项“基于大模型的信息评估方法、装置、智能体、设备、介质和产品”专利，公开号CN120406802A，申请日期为2025年4月。该专利涉及人工智能技术领域，方法包括识别图像显示待评估信息、将待评估信息与历史信息输入大模型生成评估结果等步骤。
原文链接：http://m.toutiao.com/group/7534678548464845366/
Anthropic 推出个性向量技术，掌控语言模型行为新突破
Anthropic近日推出个性向量技术，用于监测、控制和预防大型语言模型的特定个性特征（如"邪恶""阿谀奉承""幻觉"等）。该技术通过识别与个性特征相关的神经活动模式，可在训练阶段干预增强模型抵抗力（类似"接种疫苗"），也能在训练后纠正不良特征，还能筛查潜在问题数据，但可能影响模型智能水平。
原文链接：https://www.aibase.com/zh/news/20186
NVIDIA | NVIDIA 发布 Cosmos DiffusionRenderer:革命性视频渲染技术
NVIDIA近期推出Cosmos DiffusionRenderer，这是其原有DiffusionRenderer的重大升级，为新型视频扩散框架，旨在实现高质量图像和视频的去光源及重光源处理。用户需配备至少16GB显存的NVIDIA GPU等环境，通过conda环境安装依赖、下载模型权重后，可对图像提取G缓冲区信息并逆渲染，再用前向渲染器重光源，支持视频帧逐帧处理，提升渲染质量与创作灵活性。
原文链接：https://www.aibase.com/zh/news/20192
腾讯 | 混元开源新方案 MixGRPO:训练效率大幅提升，性能反而更强
腾讯混元基础模型团队近日发布图像生成新框架MixGRPO，通过结合随机微分方程与常微分方程的创新采样策略，将训练时间缩短近50%，其变体MixGRPO-Flash更将训练时间降低71%。该框架优化马尔可夫决策过程，限制智能体探索范围并简化训练流程，在减少计算开销的同时提升了图像生成的多样性与质量，目前已开源代码供开发者探索。
原文链接：https://www.aibase.com/zh/news/20194

上市公司动态

Listed Company Updates

Figma(股票代码:FIG) | AI设计协作平台Figma成功上市，股票首日大涨
全球知名AI设计协作平台Figma于2025年7月31日在纽约证券交易所上市，股票代码"FIG"。其发行价33美元，首日开盘价飙升至约85美元，最终以115.50美元收盘，较发行价暴涨约250%，市值达近670亿美元。其成功上市被视为科技市场重振信号，凭借AI驱动的协作平台及全链条产品线，被市场视为高增长SaaS公司的"领头羊"。
原文链接：https://www.aibase.com/zh/news/20202

行业动态&政策

Industry Trends Policies

浦东新区:支持金融领域人工智能大模型应用并按照规定给予资金支持
浦东新区人民政府办公室印发《浦东新区高质量推进标杆性金融科技集聚区建设行动方案》，鼓励金融机构与金融科技企业合作拓展应用场景、推动数字化转型，支持金融领域人工智能大模型应用及企业数据管理能力提升，符合条件的项目和服务将按规定给予资金支持。
原文链接：https://cj.sina.cn/article/norm_detail?url=http%3A%2F%2Ffinance.sina.cn%2F2025-08-04%2Fdetail-infiuqec0496123.d.html
先进航空机载系统、大模型时代计算机网络新技术等专题论坛举办
中国科协近日在北京举办第二十七届中国科协年会的两个专题论坛，分别为“先进航空机载系统能量综合与智能管理”和“大模型时代的计算机网络新技术”。前者聚焦先进飞行平台机载系统能量管理，专家围绕关键技术、热管理设计等展开研讨；后者探讨大模型在网络架构、安全策略等领域的前沿研究，还设学生报告环节为青年人才提供展示平台。
原文链接：http://m.toutiao.com/group/7534653939883868706/
宇树科技王兴兴获聘首席科学家，杭州布局具身智能新高地
8月4日，杭州高新区（滨江）举办人工智能产业创新高地建设推进大会，启动杭州具身智能应用中试基地，宇树科技CEO王兴兴获聘首席科学家主导技术与科研方向。该基地设四大核心功能区，旨在打通科研成果与产业化链条，打造具身智能全体系高地。同时，高新区推出数据、算力等多项政策支持，并发布五大领域AI场景需求，完善产业布局。
原文链接：https://www.aibase.com/zh/news/20193
商标注册文件曝光:xAI 成立编程与视频 AI 子公司命名“Macrohard”
埃隆·马斯克旗下xAI近日提交“Macrohard”商标注册申请，拟成立专注编程与图像/视频生成AI代理的子公司。该名称戏仿微软（Microsoft），将“Micro”改为“Macro”，暗示宏观层面创新。此前马斯克在X平台暗示筹备新公司，用户提及“Macrohard”时他以眨眼表情回应，此次商标申请确认了这一动向，涵盖核心业务类别，为后续相关领域竞争铺路。
原文链接：https://www.aibase.com/zh/news/20198

其他

Other

马斯克:许多Meta顶尖工程师正在加入xAI公司
马斯克透露，多名Meta高级工程师转投其新兴AI公司xAI，尽管起薪不高，但他认为xAI未来估值或超Meta。近期Meta积极招揽AI人才，接触超100名OpenAI员工并成功招聘至少10人，还吸引了ChatGPT核心成员Shengjia Zhao加入。不过部分工程师因倾向AGI研究方向等拒绝加入，科技行业AI人才竞争持续加剧。
原文链接：https://www.aibase.com/zh/news/20179

⬇️更多AI资讯关注我们⬇️

【声明】内容源于网络

久新数智

重塑生产力，开启人机协作新篇章！

内容 139

粉丝 0

久新数智重塑生产力，开启人机协作新篇章！

总阅读107

粉丝0

内容139