大数跨境

8月5日丨每日AI简讯丨谷歌Gemini 2.5 Deep Think IMO夺金!AI新王者强势来袭?

8月5日丨每日AI简讯丨谷歌Gemini 2.5 Deep Think IMO夺金!AI新王者强势来袭? 久新数智
2025-08-05
2



9agent.ai

点击蓝字 关注我们



每日AI简讯

2025-08-05


01

大模型

LLM

图片
  • GPT-5 | GPT-5震撼来袭!OpenAI突破瓶颈,用户体验全面升级,背后却藏管理危机?

    OpenAI下一代大语言模型GPT-5开发重心转向实用性与用户体验提升,在代码生成、推理效率及引入“Universal Verifier”校验机制等方面取得显著进步。此前GPT-4.5因未达预期、数据稀缺等问题折戟,促使资源转向GPT-5研发。同时,OpenAI面临高层摩擦、团队重组及IPO准备等管理挑战,GPT-5的发布将考验其技术与管理能力。

    原文链接:https://www.aibase.com/zh/news/20196

  • Gemini 2.5 Deep Think | 谷歌Gemini 2.5 Deep Think发布!IMO金牌加持,AI新王者能否重塑未来?

    谷歌DeepMind发布最强大AI模型Gemini 2.5 Deep Think,向Google AI Ultra订阅用户开放。该模型引入“并行思考”和强化学习技术,支持多模态与长上下文,在2025年IMO竞赛获金牌,且在LiveCodeBench V6等基准测试中超越Grok4、o3等模型,展现复杂任务处理能力。

    原文链接:https://www.aibase.com/zh/news/20197

  • Claude | Anthropic切断 OpenAI 的 Claude 模型访问权限,行业竞争愈发激烈

    Anthropic宣布取消OpenAI对其Claude系列AI模型的访问权限,称OpenAI此前使用Claude进行性能比较的行为违反服务条款(禁止用Claude构建竞争服务)。OpenAI回应称使用符合行业标准,对切断访问表示失望。此前Anthropic高层曾明确反对向竞争对手开放Claude访问,该事件加剧了AI行业竞争。

    原文链接:https://www.aibase.com/zh/news/20204

  • Skywork MindLink | 昆仑万维发布并开源全新推理大模型 MindLink

    昆仑万维发布并开源全新推理大模型Skywork MindLink,同步开放72B模型权重、技术报告及代码仓库。该模型采用动态路径选择推理框架,结合推理与非推理生成模式,降低计算成本并提升效率。基准测试中,其在10项大模型评测及数学奥赛等领域表现突出,技术上采用"Plan-based Reasoning"范式,优化多轮对话体验,增强基础模型能力,进一步完善公司大模型矩阵布局。

    原文链接:https://www.aibase.com/zh/news/20201

  • 混元 | 腾讯混元开源并发布 0.5B、1.8B、4B、7B模型

    腾讯混元团队推出四款开源小尺寸模型,参数分别为0.5B、1.8B、4B、7B,专为消费级显卡设计,适用于笔记本、手机等低功耗场景,支持垂直领域低成本微调。模型具备推理快、性价比高特点,支持快/慢思考模式,在语言理解等领域表现出色,原生长上下文窗口达256k,可处理超长内容。目前已在Github、HuggingFace上线,获多家芯片平台支持,并在腾讯会议、微信读书等业务中应用。

    原文链接:https://www.aibase.com/zh/news/20209

  • XBai o4 | 问小白推出XBai o4开源大模型:反思型推理架构颠覆传统,性能全面碾压OpenAI o3-mini

    国内AI厂商问小白近日发布第四代开源大模型XBai o4,其采用独创的"反思型生成范式"架构,融合Long-CoT强化学习与过程评分学习,实现推理效率提升(过程评分推理耗时降99%)。该模型在数学推理、编程等多项测试中表现超越OpenAI o3-mini,部分优于Claude Opus,且完全开源(代码已在GitHub发布),推动AI行业协同发展。

    原文链接:https://www.aibase.com/zh/news/20214

  • MiDashengLM-7B | 小米全量开源MiDashengLM-7B:音频理解性能刷新SOTA,推理速度暴增20倍

    小米全量开源MiDashengLM-7B多模态大模型,专注音频理解,在22个公开评测集刷新多模态大模型最好成绩。其推理效率显著提升,单样本首Token延迟为业界先进模型的四分之一,数据吞吐效率高出20倍以上。采用双核心架构融合音频编码与语言解码能力,支持语音、环境声、音乐全域理解,未来计划终端离线部署并完善声音编辑功能。

    原文链接:https://www.aibase.com/zh/news/20216

  • Wan2.2A14B | 挑战闭源巨头:Wan2.2A14B 成性价比最高视频 AI 模型

    Wan2.2A14B成为当前开源视频模型中的性能领跑者,其在文本转视频方面表现出色,排名第七,但图像转视频因帧率仅16帧/秒(低于部分竞品24帧/秒)排名靠后。虽整体性能仍落后于Veo3、Seedance1.0等闭源模型,但其开源属性带来显著成本优势,成为预算敏感用户的理想选择。

    原文链接:https://www.aibase.com/zh/news/20189


02

产品&应用

Product Application

图片
  • 高德地图2025(AI原生地图应用) | 押注空间智能,高德宣布全面AI化 地图导航领域的“智能体大战”将走向何方?

    8月4日,高德地图宣布全面AI化,推出全球首个AI原生地图应用“高德地图2025”,其具备深度时空理解和自主推理决策能力,通过AI助手“小高老师”提供完整出行解决方案,支持路线规划、跨城攻略、实时调整行程等功能。此前百度地图等企业已探索AI融合,此次高德的推出将加速行业变革,未来地图导航或成生活助理,提供更全面服务,但数据安全与技术风险仍需关注。

    原文链接:http://m.toutiao.com/group/7534734924994085376/

  • Harmonize | Adobe Photoshop 推出“Harmonize”:用 AI 自动匹配光影,实现无缝图像合成

    Adobe为Photoshop推出“Harmonize”等生成式AI工具,其中“Harmonize”可自动匹配图像元素的光照、颜色和阴影,实现无缝合成,解决了传统合成需专业知识的痛点。此外还升级了AI图像分辨率提升、智能对象移除等功能,并引入“内容凭证”记录编辑历史,平衡创作与内容真实性。

    原文链接:https://www.aibase.com/zh/news/20182

  • AI原声翻译功能 | B站推出AI原声翻译功能:保留UP主声线音色,破解二次元文化出海难题

    B站推出自主研发的"AI原声翻译功能",通过保留UP主原始声线、音色等特征,解决二次元等内容出海的语言障碍。该功能支持画面与音频翻译,音频翻译为核心亮点,采用大语言模型、对抗式强化学习及Deep Research技术优化,现支持英语,未来将扩展日语等语言,助力国际化战略。

    原文链接:https://www.aibase.com/zh/news/20183

  • MLE-STAR | 谷歌 AI 推出 MLE-STAR:一款智能化机器学习工程代理,助力自动化任务

    谷歌AI团队近日推出智能化机器学习工程代理MLE-STAR,旨在自动化复杂机器学习流程设计与优化。该代理结合网络搜索、针对性代码优化及检查模块,解决了传统代理依赖模型记忆、代码修改片面等问题,在Kaggle竞赛中表现优异,且开源代码库可加速从业者项目创新。

    原文链接:https://www.aibase.com/zh/news/20195

  • Android Studio Agent模式 | 安卓开发革命!谷歌Android Studio免费Agent模式上线,完爆苹果生态?

    谷歌在Google I/O2025大会上宣布,Android Studio推出免费Agent模式,基于Gemini2.5Pro的AI辅助功能,支持自然语言任务描述、UI代码修改、自定义规则等,可处理代码生成、错误修复等全流程任务,提升开发效率,挑战苹果Xcode生态,目前已在Canary版本开放。

    原文链接:https://www.aibase.com/zh/news/20206

  • LangExtract | 谷歌开源结构化信息提取工具langextract,可提供精确来源定位

    谷歌正式开源Python库LangExtract,该工具利用Gemini等大模型从非结构化文本中提取结构化信息,具备精准溯源、可靠结构化输出、长文档优化及交互式可视化等功能,支持云端与本地模型,适用于医疗病历分析、文学研究、商业情报等多领域,降低了非结构化文本处理的技术门槛。

    原文链接:https://www.aibase.com/zh/news/20208

  • 聊聊吧AI语音服务 | 东京大学推出 AI 语音服务,助力老年人早期识别认知障碍

    东京大学松尾研究室孵化的初创企业IGSA推出"聊聊吧"AI语音服务,针对50-70岁老年人,通过LINE官方账号进行2分钟自然对话,分析语速、停顿、词汇等语音及语言特征,评估认知状态并分A-D等级反馈。服务提供15分钟深入评估、生活习惯改善建议及本地健脑活动推荐,早期版本免费体验,正式版年费1500日元(约73元),计划纳入地方介护预防项目。

    原文链接:https://www.aibase.com/zh/news/20210

  • AI 驱动多病种筛查 | 北京和睦家医院与阿里达摩院合作,AI 驱动多病种筛查

    北京和睦家医院与阿里巴巴达摩院达成战略合作,推动“AI驱动的疾病预防创新与卫生经济学价值”。双方依托达摩院“一扫多查”医疗AI技术及和睦家的诊疗优势,探索多病种AI筛查服务,重点聚焦消化肿瘤(如胰腺癌、胃癌)与慢性病(骨质疏松、重度脂肪肝等)筛查,旨在将健康管理关口前移,提供高效可靠的医疗服务。

    原文链接:https://www.aibase.com/zh/news/20212


03

硬件&底层技术

Hardware Technology

图片
  • 上海小度技术有限公司 | 上海小度申请基于大模型的信息评估方法等专利,涉及人工智能技术领域

    上海小度技术有限公司申请一项“基于大模型的信息评估方法、装置、智能体、设备、介质和产品”专利,公开号CN120406802A,申请日期为2025年4月。该专利涉及人工智能技术领域,方法包括识别图像显示待评估信息、将待评估信息与历史信息输入大模型生成评估结果等步骤。

    原文链接:http://m.toutiao.com/group/7534678548464845366/

  • Anthropic 推出个性向量技术,掌控语言模型行为新突破

    Anthropic近日推出个性向量技术,用于监测、控制和预防大型语言模型的特定个性特征(如"邪恶""阿谀奉承""幻觉"等)。该技术通过识别与个性特征相关的神经活动模式,可在训练阶段干预增强模型抵抗力(类似"接种疫苗"),也能在训练后纠正不良特征,还能筛查潜在问题数据,但可能影响模型智能水平。

    原文链接:https://www.aibase.com/zh/news/20186

  • NVIDIA | NVIDIA 发布 Cosmos DiffusionRenderer:革命性视频渲染技术

    NVIDIA近期推出Cosmos DiffusionRenderer,这是其原有DiffusionRenderer的重大升级,为新型视频扩散框架,旨在实现高质量图像和视频的去光源及重光源处理。用户需配备至少16GB显存的NVIDIA GPU等环境,通过conda环境安装依赖、下载模型权重后,可对图像提取G缓冲区信息并逆渲染,再用前向渲染器重光源,支持视频帧逐帧处理,提升渲染质量与创作灵活性。

    原文链接:https://www.aibase.com/zh/news/20192

  • 腾讯 | 混元开源新方案 MixGRPO:训练效率大幅提升,性能反而更强

    腾讯混元基础模型团队近日发布图像生成新框架MixGRPO,通过结合随机微分方程与常微分方程的创新采样策略,将训练时间缩短近50%,其变体MixGRPO-Flash更将训练时间降低71%。该框架优化马尔可夫决策过程,限制智能体探索范围并简化训练流程,在减少计算开销的同时提升了图像生成的多样性与质量,目前已开源代码供开发者探索。

    原文链接:https://www.aibase.com/zh/news/20194


04

上市公司动态

Listed Company Updates

图片
  • Figma(股票代码:FIG) | AI设计协作平台Figma成功上市,股票首日大涨

    全球知名AI设计协作平台Figma于2025年7月31日在纽约证券交易所上市,股票代码"FIG"。其发行价33美元,首日开盘价飙升至约85美元,最终以115.50美元收盘,较发行价暴涨约250%,市值达近670亿美元。其成功上市被视为科技市场重振信号,凭借AI驱动的协作平台及全链条产品线,被市场视为高增长SaaS公司的"领头羊"。

    原文链接:https://www.aibase.com/zh/news/20202


05

行业动态&政策

Industry Trends Policies

图片
  • 浦东新区:支持金融领域人工智能大模型应用 并按照规定给予资金支持

    浦东新区人民政府办公室印发《浦东新区高质量推进标杆性金融科技集聚区建设行动方案》,鼓励金融机构与金融科技企业合作拓展应用场景、推动数字化转型,支持金融领域人工智能大模型应用及企业数据管理能力提升,符合条件的项目和服务将按规定给予资金支持。

    原文链接:https://cj.sina.cn/article/norm_detail?url=http%3A%2F%2Ffinance.sina.cn%2F2025-08-04%2Fdetail-infiuqec0496123.d.html

  • 先进航空机载系统、大模型时代计算机网络新技术等专题论坛举办

    中国科协近日在北京举办第二十七届中国科协年会的两个专题论坛,分别为“先进航空机载系统能量综合与智能管理”和“大模型时代的计算机网络新技术”。前者聚焦先进飞行平台机载系统能量管理,专家围绕关键技术、热管理设计等展开研讨;后者探讨大模型在网络架构、安全策略等领域的前沿研究,还设学生报告环节为青年人才提供展示平台。

    原文链接:http://m.toutiao.com/group/7534653939883868706/

  • 宇树科技王兴兴获聘首席科学家,杭州布局具身智能新高地

    8月4日,杭州高新区(滨江)举办人工智能产业创新高地建设推进大会,启动杭州具身智能应用中试基地,宇树科技CEO王兴兴获聘首席科学家主导技术与科研方向。该基地设四大核心功能区,旨在打通科研成果与产业化链条,打造具身智能全体系高地。同时,高新区推出数据、算力等多项政策支持,并发布五大领域AI场景需求,完善产业布局。

    原文链接:https://www.aibase.com/zh/news/20193

  • 商标注册文件曝光:xAI 成立编程与视频 AI 子公司命名“Macrohard”

    埃隆·马斯克旗下xAI近日提交“Macrohard”商标注册申请,拟成立专注编程与图像/视频生成AI代理的子公司。该名称戏仿微软(Microsoft),将“Micro”改为“Macro”,暗示宏观层面创新。此前马斯克在X平台暗示筹备新公司,用户提及“Macrohard”时他以眨眼表情回应,此次商标申请确认了这一动向,涵盖核心业务类别,为后续相关领域竞争铺路。

    原文链接:https://www.aibase.com/zh/news/20198


06

其他

Other

图片
  • 马斯克:许多Meta顶尖工程师正在加入xAI公司

    马斯克透露,多名Meta高级工程师转投其新兴AI公司xAI,尽管起薪不高,但他认为xAI未来估值或超Meta。近期Meta积极招揽AI人才,接触超100名OpenAI员工并成功招聘至少10人,还吸引了ChatGPT核心成员Shengjia Zhao加入。不过部分工程师因倾向AGI研究方向等拒绝加入,科技行业AI人才竞争持续加剧。

    原文链接:https://www.aibase.com/zh/news/20179


图片


⬇️更多AI资讯关注我们⬇️



【声明】内容源于网络
0
0
久新数智
重塑生产力,开启人机协作新篇章!
内容 139
粉丝 0
久新数智 重塑生产力,开启人机协作新篇章!
总阅读107
粉丝0
内容139