9agent.ai
点击蓝字 关注我们
每日AI简讯
2025-08-08
01
大模型
LLM
通义千问 | 通义千问推出Qwen3-4B系列小模型 手机也能轻松跑
通义千问推出Qwen3-4B系列小模型,包括Instruct和Thinking两个版本。该模型体积小巧、性能强劲,端侧部署友好,手机即可运行。其通用能力超越GPT-4.1-nano,推理能力媲美中等规模的Qwen3-30B模型,支持256K长文本处理,已在魔搭社区和Hugging Face开源,推动端侧AI应用发展。
原文链接:https://www.aibase.com/zh/news/20295
GPT-5 | GPT-5正式发布:OpenAI新一代AI模型全面上线 重新定义AI助手体验
2025年8月8日,OpenAI发布新一代AI模型GPT-5,整合多模态、推理等技术,采用智能路由系统自动适配任务。其数学、编程等核心性能显著提升,降低45%事实错误率,效率优化明显。支持分层用户权限,免费用户首次获得推理模型权限,演示中展示"氛围编程"等功能,有望推动人机交互与企业AI应用发展。
原文链接:https://www.aibase.com/zh/news/20330
MiniCPM-V 4.0 | 面壁智能新一代多模态模型 MiniCPM-V 4.0 开源
面壁智能在魔搭ModelScope社区正式开源新一代多模态模型MiniCPM-V4.0,该模型以4B参数量在多个评测榜单取得同级SOTA成绩,支持手机等移动设备稳定流畅运行。官方同步开源推理部署工具CookBook,助力开发者轻量部署。其独特结构设计实现了同尺寸模型最快首响时间与更低显存占用,并发测试吞吐量远超同类模型,标志多模态模型在端侧应用迈出重要一步。
原文链接:https://www.aibase.com/zh/news/20304
dots.vlm1 | 小红书发布开源多模态大模型 dots.vlm1,以 NaViT 视觉编码器领跑行业
小红书Hi Lab近日发布并开源自研多模态大模型dots.vlm1,该模型基于12亿参数的NaViT视觉编码器和DeepSeek V3大语言模型,性能接近Gemini2.5Pro等闭源模型,在多模态视觉理解与推理任务中表现出色,尤其在表格、图表等非典型图片处理及奥数等高难度任务中展现优势。未来团队计划扩大数据规模并引入强化学习优化模型。
原文链接:https://www.aibase.com/zh/news/20317
SWE-Swiss-32B | 北大、字节跳动联手发布SWE-Swiss:一把修复代码Bug的「瑞士军刀」,完整配方直指开源SOTA
北大、字节跳动Seed团队及香港大学联合提出SWE-Swiss训练配方,推出32B参数模型SWE-Swiss-32B,在SWE-bench Verified基准测试中准确率达60.2%,同尺寸级别达SOTA。该配方通过多任务监督微调和两阶段强化学习提升模型能力,并采用增强自我一致性方法优化测试效果,模型及数据已开源。
原文链接:https://www.jiqizhixin.com/articles/2025-08-08
GPT-5 | 刚刚,奥特曼发布GPT-5!人人免费用「博士级」智能,基准图错误遭全网吐槽
奥特曼及OpenAI发布GPT-5大模型,该模型为集成系统,可自动切换模型处理不同问题,在数学、编程等多领域基准测试中表现突出,分免费版、Plus和Pro计划,API定价明确。但发布中出现跑分图错误等问题,部分表现未达预期,现可在微软平台使用。
原文链接:https://www.jiqizhixin.com/articles/2025-08-08-2
GPT-5 | GPT-5登顶LMArena排行榜:创造AI模型评测新纪录
OpenAI的GPT-5在权威AI模型评测平台LMArena中以最高Arena得分登顶排行榜首位,超越Google Gemini2.5 Pro、Anthropic Claude Opus4等对手,展现六大核心领域(困难提示处理、编程能力、数学推理等)的全面领先。其测试阶段代号"Summit"已预示领先潜力,此次登顶重塑AI行业竞争格局,反映科技巨头在大模型领域的激烈竞争。
原文链接:https://www.aibase.com/zh/news/20334
文心大模型 | 消息称百度 8 月底前将发布新AI推理模型 文心5.0未来数月推出
百度加速推进文心大模型更新,消息称其最快8月底发布最新版推理模型,该模型在逻辑推理、复杂计算能力上有望超越OpenAI的o3满血版;未来数月还将推出文心基座大模型新版本,或在百度世界大会亮相,旨在提升全球AI市场竞争力。
原文链接:https://www.aibase.com/zh/news/20325
02
产品&应用
Product Application
大疆扫地机器人 ROMO | 大疆扫地机器人 ROMO 震撼登场,4399 元起开启智能清洁新时代
8月6日,大疆正式发布扫拖一体式机器人ROMO,含S、A、P三个型号,分水箱版和上下水版。其吸力达25000Pa,清洁能力强;搭载双目鱼眼视觉传感器、广视角固态激光雷达及可外扩柔性机械臂,实现精准避障与无死角清洁。外观设计独特,A款透明背盖,P款全透明外观。P款标配尘袋UV杀菌和污水箱除臭模块,其他型号可选配。现预售,4399元起。
原文链接:https://www.aibase.com/zh/news/20290
Cursor1.4 | Cursor1.4正式发布:聚焦异步长程任务,加速大型代码库自动化进程
2025年8月6日,AI代码编辑器Cursor正式发布1.4版本,重点增强异步和长程任务处理能力,优化大型代码库表现。新版本Agent功能升级,支持后台执行代码生成、错误修复等任务,可在独立环境运行并无缝交接;针对大型代码库,优化代码索引与搜索,缩短响应时间,新增多根工作区支持;同时提升协作与上下文管理,集成GitHub、Slack,支持任务分配与审查,AI自动记录关键决策。
原文链接:https://www.aibase.com/zh/news/20293
Bing Image Creator | 微软Bing Image Creator免费上线GPT-4o图像生成模型
微软宣布Bing Image Creator免费上线OpenAI的GPT-4o图像生成模型,该模型相比DALL-E3文本渲染更精准,支持图片编辑但渲染时间延长。微软保留DALL-E3和GPT-4o双模型供用户选择,使用政策维持免费,提供15次快速生成机会,超出需消耗积分,用户可通过多平台访问。
原文链接:https://www.aibase.com/zh/news/20320
星火代码画布 | 科大讯飞推出星火代码画布 一句话即可直接生成交互网页
科大讯飞推出"星火代码画布"功能,用户通过语音指令、草图、链接或文字描述即可快速生成交互网页,极大提升开发效率。该功能适用于产品经理、设计师等非技术用户,可生成招聘页、界面demo、品牌形象页等,还能还原UI细节,支持日常生成个税计算器、小游戏等场景,降低开发门槛,助力创意实现。
原文链接:https://www.aibase.com/zh/news/20326
基于多模态AI大模型的MR导览系统 | 元界星球申请基于多模态AI大模型的MR导览系统专利,降低运营成本
元界星球(北京元界星球科技有限公司)申请了一项“基于多模态AI大模型的MR导览系统”专利,公开号CN120429607A。该系统通过AI处理单元提高数据质量,生成个性化导览词及聊天内容,降低运营成本;提取特征单元包含Leopard、CogVLM等模型,满足不同特征提取需求。
原文链接:http://m.toutiao.com/group/7535784107235394067/
空地一体化AI城市监测系统 | 江苏腾遥申请空地一体化AI城市监测系统专利,显著提升城市事件监测的广域性、实时性与决策智能化水平
江苏腾遥数据科技有限公司申请了一项名为“一种空地一体化AI城市监测系统”的专利(公开号CN120431498A)。该系统基于异构模块协同控制与全链路推理调度架构构建,包含星载、空域、地面、楼宇及数据融合等模块,具备全链路智能感知与推理能力,可显著提升城市事件监测的广域性、实时性与决策智能化水平。
原文链接:http://m.toutiao.com/group/7535645718632088116/
Jules | 谷歌AI编程助手Jules正式上线,异步代码修复功能挑战传统开发工具
谷歌AI编程助手Jules正式结束测试阶段上线,该工具基于Gemini 2.5 Pro,采用异步代理架构,可与GitHub集成,在开发者处理其他任务时自动修复或更新代码。其提供免费及付费(月费19.99美元和124.99美元)版本,隐私政策明确私有代码库数据不用于训练。测试期间获数万开发者使用,用户反馈推动功能优化,支持移动设备访问,谷歌内部也在项目中应用。
原文链接:https://www.aibase.com/zh/news/20310
HD视频模式 | Midjourney 推出 HD 视频模式,专为专业人士打造高品质影像
Midjourney向Pro和Mega订阅用户推出HD视频模式,该模式生成成本为默认SD模式的3.2倍,像素分辨率提升约4倍,可满足广告、影视制作等专业场景对高清影像的需求。用户可通过现有流程将静态图转化为高质量视频,目前仅开放给上述订阅计划,此举是其在AI视频生成领域的重要进展,同时面临版权诉讼挑战。
原文链接:https://www.aibase.com/zh/news/20303
03
硬件&底层技术
Hardware Technology
迅奥科技 | 迅奥科技申请AI驱动的自适应存储分层与缓存预取系统专利,解决存储分层及缓存预取中存储空间未有效划分问题
迅奥科技申请一项"AI驱动的自适应存储分层与缓存预取系统"专利,旨在解决现有存储分层及缓存预取中存储空间未有效划分的问题。该系统涉及数据存储技术领域,通过历史数据划分空间、多层存储处理、缓存预取及AI实时更新分配等功能,提升数据查找与调用效率,避免调用异常。
原文链接:http://m.toutiao.com/group/7535678984151974438/
AMD、高通 | AMD、高通宣布旗下硬件支持 gpt-oss 系列开放模型
AMD与高通联合宣布旗下硬件支持OpenAI推出的gpt-oss系列开放推理模型,包括gpt-oss-20b和gpt-oss-120b。AMD锐龙AI Max+395处理器成首款运行gpt-oss-120b的消费级AI PC处理器,采用GGML框架和MXFP4格式,实现每秒30个Token输出;高通骁龙平台运行gpt-oss-20b展现出色推理能力,开发者可通过Hugging Face等平台访问。
原文链接:https://www.aibase.com/zh/news/20302
摩尔线程 | 摩尔线程 MUSA 架构强势适配 llama.cpp,助力 AI 推理新纪元!
摩尔线程自主研发的通用并行计算架构MUSA成功适配开源推理框架llama.cpp。此次适配使开发者可在摩尔线程MTT S80、S3000和S4000系列GPU上通过官方容器镜像高效进行AI推理,结合此前MUSA SDK 4.0.1对Intel及海光平台的扩展,进一步降低了大模型部署门槛,为国内AI硬件生态注入新活力。
原文链接:https://www.aibase.com/zh/news/20327
04
行业动态&政策
Industry Trends Policies
2025世界机器人大会开幕在即,具身智能或是人工智能的下一波浪潮
2025世界机器人大会将于8月8日至12日举行,主题为“让机器人更智慧让具身体更智能”,主论坛设产业发展等篇章,超200家企业参展。腾讯此前发布具身智能开放平台Tairos,为国内首个模块化具身智能软件平台。国泰海通预计港股互联网巨头或加大AI投入,小米等企业正布局机器人产业,相关科技股或受益。
原文链接:http://m.toutiao.com/group/7535666701711475200/
美国紧急启动"ATOM计划"应对中国开源AI崛起
面对中国开源AI的强势发展,美国本周一启动"ATOM计划",旨在重夺开源AI全球领导地位。中国"通义千问"等开源模型因性能强、免费成开发者首选,全球前15强开源大模型均由中国企业开发。该计划将建非营利AI实验室,配备超10000块先进GPU,获多位行业领袖支持,以应对可能丧失技术影响力的挑战。
原文链接:https://www.aibase.com/zh/news/20323
谷歌否认AI搜索功能影响网站流量,但数据显示"零点击"搜索激增
谷歌否认AI搜索功能冲击网站流量,称自然点击量同比稳定且质量略升,但数据显示"零点击"搜索比例从2024年5月的56%增至2025年5月的69%。其搜索部门负责人Liz Reid表示用户趋势正转移流量至论坛、视频等网站,且谷歌已推出工具帮助出版商流量变现,反映出搜索流量因用户习惯变化早有衰落趋势。
原文链接:https://www.aibase.com/zh/news/20301
⬇️更多AI资讯关注我们⬇️

