【灵思周刊】人工智能行业一周要闻（4.27-5.3）- 大数跨境

首页

【灵思周刊】人工智能行业一周要闻（4.27-5.3）

灵思极智

2026-05-05

产业要闻

DeepSeek-V4：在智能体任务中排名开源首位，幻觉率上升，令牌消耗较大

4月24日消息，DeepSeek-V4预览版正式推出并同步开源。官方宣称其在Agent能力、世界知识与推理性能三大领域达到国内及开源领先水准。该模型分为Pro与Flash双版本，均支持百万级（1M）令牌超长上下文。两个版本显著降低了对算力和显存的需求，使每个标记的推理FLOP减少73%，KV缓存内存占用下降90%。全球最大AI模型API聚合平台OpenRouter数据显示，V4-Flash调用量达270亿Token，V4-Pro为47.9亿Token，但未登上排行榜。V4-Pro在人工分析智能指数中获得52分，相比V3.2版本的42分提升10分，成为仅次于Kimi K2.6的全球第二大开源推理模型。V4-Flash得分为47分，性能弱于V4-Pro，但明显优于DeepSeek-V3.2，综合智能水平对标Claude Sonnet 4.6（全力版），介于顶尖闭源模型与主流中端模型之间。DeepSeek-V4在Vibe Code Benchmark中以“压倒性优势”位居开源权重模型首位，较前代V3.2实现约10倍性能增长，甚至超越了如Gemini 3.1 Pro等顶级闭源模型。DeepSeek-V4也是该基准上唯一得分突破40%的开源权重模型。

消息源自【每日经济新闻】

腾讯混元Hy3 preview语言模型发布并开源

4月24日消息，混元Hy3 preview语言模型正式发布并开源。作为混元3.0的预览版，这是一个融合快慢思考的混合专家模型，总参数量295B，激活参数量21B，最高支持256K上下文长度。腾讯表示，这是混元迄今最智能的模型，在复杂推理、指令遵循、上下文学习、代码、智能体等能力以及推理性能方面均有大幅提升。

消息源自【钛媒体】

OpenAI正式发布GPT-5.5模型，编程能力显著增强

4月24日消息，OpenAI正式推出GPT-5.5模型。该公司称其为当前最智能、使用最直观的模型，是迈向在计算机上以全新方式完成工作的下一步。新版GPT-5.5在代码编写与调试、在线研究、制作表格和文档，以及跨不同工具协同完成这些任务等场景中表现出色。该模型能自主规划、调用工具、检查成果、应对模糊情境并持续推进任务。

消息源自【AI云资讯】

具身智能领域首个国际标准成功立项

4月23日消息，我国在国际标准化组织成功推动立项具身智能领域全球首项国际标准《人形机器人数据集》，并推动成立了首个由我国专家担任召集人的工作组。此次立项的国际标准参考了我国在研的人形机器人数据集系列国家标准内容，来自全球多地的专家将共同参与该标准及后续人形机器人领域其他标准的制定工作。

消息源自【国家市场监督管理总局（国家标准委）】

OpenAI发布ChatGPT团队工作流AI智能体，实现复杂任务自动化处理

4月23日消息，OpenAI宣布在ChatGPT中推出Workspace Agents，支持团队创建能够处理复杂任务和长周期工作流的协作智能体。这些智能体具备文件处理、代码运行、工具调用及记忆存储能力，系统支持定时调度和Slack集成。例如，产品团队可构建智能体在Slack频道内自动回答员工问题、关联文档并提交工单。

消息源自【IT之家】

Images 2获机构Arena.ai评测第一

4月22日消息，海外大模型评测平台Arena.ai发布消息称，OpenAI的GPT-Image-2已登顶所有Image Arena排行榜首位，并在文生图领域以创纪录的242分优势领先第二名谷歌Nano-banana-2。

消息源自【格隆汇】

OpenAI Codex推出Chronicle功能：通过屏幕录制构建上下文记忆库

4月21日消息，OpenAI为其Codex应用推出Chronicle功能。该功能通过屏幕录制构建记忆库，Codex可将这些记忆作为后续任务的上下文参考，从而无需用户每次重复说明，便能知晓其所指内容、所用工具及正在进行的项目。该功能目前以可选预览版形式面向macOS系统的ChatGPT Pro订阅用户提供，用户可在Codex设置的“个性化”选项中依次开启“记忆”与“Chronicle”功能，并授予macOS屏幕录制及辅助功能权限后即可使用。

消息源自【IT之家】

福布斯发布2026年AI 50榜单，OpenAI与Anthropic领跑

4月21日消息，福布斯发布第八届《福布斯》人工智能50强榜单，评选全球最具潜力的非上市AI企业。本届榜单共有20家新上榜公司。其中，OpenAI与Anthropic两家AI巨头累计融资2426亿美元，约占今年AI 50上榜企业总融资额3056亿美元的80%。

消息源自【福布斯中文网】

月之暗面最强模型：Kimi K2.6发布，可连续13小时编写代码，对标GPT-5.4

4月21日消息，月之暗面发布并开源Kimi K2.6模型。该模型在代码能力、长程任务执行及Agent集群能力等方面实现全面升级，目前已上线官网、最新版应用、API及Kimi Code编程助手。在多项权威基准测试中，无论是难度较高的Humanity's Last Exam，还是侧重真实软件工程能力的SWE-Bench Pro以及评估Agent检索能力的DeepSearchQA，成绩均达到行业领先水平，与GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等闭源模型持平或更优。

消息源自【快科技】

华为发布首款鸿蒙AI眼镜

4月20日消息，华为首款鸿蒙AI眼镜正式发布。该眼镜搭载1200万像素超感光摄像头，支持AI构图矫正，具备0.7秒超清晰AI闪拍功能，内置小艺智能体，可提供AI实时视频交互，并支持“看一下”支付宝支付。

消息源自【ZAKER科技】

TrendForce预测：2026年全球AI光模块市场规模将增长57.6%

4月20日消息，TrendForce预测今年全球AI专用光模块市场规模将达到260亿美元，同比增长57.6%。机构认为，AI产业发展推高了数据中心流量，促使微软、谷歌、Meta等巨头加大算力基础设施建设，连接算力系统的光模块市场也因此迎来强劲增长。AI光模块的技术路线正加速向低功耗的LPO及SiPh方案演进，减少对传统DSP方案的依赖。该领域在2026年还将迎来新一波800G与1.6T ZR/ZR+相干光模块市场扩张。

消息源自【IT之家】

阿里通义推出语音识别大模型Fun-ASR1.5：覆盖30种语言，支持汉语七大方言体系

4月20日消息，阿里通义实验室近日正式推出语音识别大模型Fun-ASR1.5。该模型基于统一的大模型架构，单一模型即可无缝覆盖30种语言、汉语七大方言体系及20余种地方口音，甚至能够精准转写古诗词吟诵。测试显示，在典型方言场景下，字错误率相对下降56.2%。目前已有5种方言识别准确率突破90%，15种超过80%。Fun-ASR1.5还具备智能语音内容整理能力：可自动为长句添加标点，并将口语化的数字、日期、金额、手机号等统一转换为标准书面格式。在会议纪要、采访录音、司法笔录整理等场景中，能大幅减少人工校对工作量。

消息源自【快科技】

———— END ————

灵思极智旗下“极智系列”三款AI智能应用