大数跨境

AI 圈大事件一网打尽!⑭|DeepSeek识图模式上线;Seed3D2.0发布;小米人形机器人进厂实测

AI 圈大事件一网打尽!⑭|DeepSeek识图模式上线;Seed3D2.0发布;小米人形机器人进厂实测 丰周AI
2026-04-30
2
导读:快讯速览➤DeepSeek开启识图模式灰度测试,多模态视觉能力正式落地➤字节跳动发布S

快讯速览

DeepSeek开启识图模式灰度测试,多模态视觉能力正式落地

字节跳动发布Seed3D2.0:几何与纹理双SOTA,API同步上线

小米新款人形机器人亮相:已进厂实测,复杂安装成功率超90%

蚂蚁集团正式开源万亿级大模型Ling-2.6-1T

小红书成立AI一级部门"Dots",AI战略升级

Chrome正式发布Prompt API:浏览器原生AI时代来临

阿里发布QoderWake:程序员"数字分身"实现代码修复全流程无人值守

月之暗面计划Q3推出Kimi K3大模型:参数达2.5万亿

商汤发布SenseNova U1:原生理解生成统一模型告别插件式AI

Claude深度集成Adobe、Blender等八大神器:AI代画代练时代开启

DeepSeek开启识图模式灰度测试,多模态视觉能力正式落地

DeepSeek在发布DeepSeek-V4后迅速开启多模态识图功能的灰度测试,标志着其多模态能力进入实质性阶段。该功能在移动端与网页版新增了"识图模式"入口,支持基础视觉理解、画面描述及逻辑推理等功能。用户可通过上传图片或截屏,让DeepSeek分析画面内容并回答相关问题。该功能在复杂场景下仍有优化空间,但在常规视觉理解任务中表现优异,标志着开源模型在多模态领域的又一次突破。


字节跳动发布Seed3D2.0:几何与纹理双SOTA,API同步上线

字节跳动Seed团队发布新一代3D生成大模型Seed3D2.0,标志着AI 3D内容生成向"生产级可用"迈出关键一步。该模型在几何精度与材质真实度上实现显著突破,核心指标均达到行业SOTA水平,有效解决了此前3D生成中边缘软化、拓扑失真及材质物理一致性缺失等行业痛点。Seed3D2.0支持部件级拆解与复杂场景组合,可无缝对接物理仿真引擎,API已同步上线火山引擎,为游戏、影视、建筑等行业提供了更高效的3D内容生产工具。


小米新款人形机器人亮相:已进厂实测,复杂安装成功率超90%

小米新款人形机器人在投资者大会上正式亮相,已进入汽车工厂实测阶段,复杂安装任务成功率超过90%,展现了强大的感知与执行能力。该机器人展示了极强的手臂精细操作能力,能精准识别并抓取细微目标物。小米计划在未来5年内实现大批量工厂进驻,并逐步渗透至办公及家庭场景。小米同时开源了VLA大模型后训练全流程,推动开发者生态建设,降低高性能机器人开发门槛。


蚂蚁集团正式开源万亿级大模型Ling-2.6-1T

蚂蚁集团正式开源万亿级大模型Ling-2.6-1T,该模型通过创新的混合架构优化了指令执行、工具适配及长上下文承接能力,显著提升了智效比。Ling-2.6-1T能够适配多工具、多约束的复杂业务场景,在代码生成、缺陷修复以及噪声环境下的精准推理方面均达到了开源领域顶尖水平。此次开源展示了蚂蚁在AI大模型领域的技术积累,为开发者提供了又一款高性能开源选择。


小红书成立AI一级部门"Dots",AI战略升级

小红书宣布成立AI一级部门"Dots"和企业智能部,以增强对人工智能的技术投入。"Dots"部门涵盖AI模型研发、基础设施、工程落地和产品应用等多个环节,标志着小红书AI战略的全面升级。同时,小红书还设立海外部门"Rednote"和Lab 1327团队,推动国际化业务和新产品孵化。小红书首次公布「AI治理主张」,强调AI在创作中的积极作用,明确反对AI造假、侵权等不良行为,致力于维护社区的真实性与安全。


Chrome正式发布Prompt API:浏览器原生AI时代来临

Chrome正式发布Prompt API,允许开发者通过JavaScript直接调用内置的Gemini Nano模型,实现本地AI能力。这一功能标志着浏览器AI能力的"民主化",模型在本地运行,数据不上传云端,提升隐私保护的同时降低了开发门槛。开发者无需依赖外部API即可在网页中实现智能功能,为浏览器端AI应用开辟了新道路。目前该功能已在Chrome最新版本中上线,支持主流AI交互场景。


阿里发布QoderWake:程序员"数字分身"实现代码修复全流程无人值守

阿里巴巴发布QoderWake和Qoder移动端,标志着其AI智能体生态实现全场景覆盖。QoderWake作为生产级数字员工,能够自主执行代码变更简报整理、错误诊断等任务并生成修复代码,实现代码修复全流程无人值守。Qoder移动端支持跨端协同与交互体验革新,用户可通过手机远程操控桌面端Agent执行复杂任务。阿里通过Qoder产品布局,推动AI从辅助工具演变为具备独立任务处理能力的生产要素。


月之暗面计划Q3推出Kimi K3大模型:参数达2.5万亿

月之暗面计划于第三季度推出Kimi K3大模型,其参数规模达到2.5万亿,远超同类产品,并在长文本处理能力上实现突破。上下文长度提升至约100万字,能够处理超长文档和复杂对话任务。月之暗面在技术迭代和商业落地方面持续展现出极强的工程能力,Kimi系列产品的用户规模和商业化收入均保持稳健增长。K3的发布将进一步巩固月之暗面在国产大模型领域的领先地位。


商汤发布SenseNova U1:原生理解生成统一模型告别插件式AI

商汤科技发布原生理解生成统一模型SenseNova U1,打破了传统多模态模型依赖于不同模块"拼接"的思路,实现了架构统一。该模型基于NEO-unify架构,在单一模型框架内实现了多模态理解、推理与生成的深度统一,提升了信息处理效率和生成能力的自然度与精准度。商汤同时推出轻量版SenseNova U1 Lite率先开源,计划推出更强大的版本。专家认为,该技术将为自动驾驶、智能硬件等领域带来全新应用空间。


Claude深度集成Adobe、Blender等八大神器:AI代画代练时代开启

Anthropic宣布Claude与Adobe生态深度整合,支持Photoshop、Premiere等50多项核心功能调用,标志着AI助手从对话机器人向专业工具的深度转型。Claude能够理解专业软件逻辑并协助创作者完成复杂任务,包括图像编辑、视频剪辑、3D建模等。同时,Claude通过Python API集成Blender,开发者可让AI分析并调试复杂3D场景。音频领域覆盖Ableton和Splice,音乐制作人可快速检索采样库和查询文档。Claude的深度集成标志着AI代画代练时代的正式开启。


AI周五5分钟快报

AI周五5分钟快报,助您用5分钟时间系统回顾一周要闻,轻松把握周期脉络,为周末思考或下周决策提供"信息底稿"。

为什么选择周五?

一周技术/产品发布高峰已过,信息"熟成",可去噪;帮你提前排雷:政策、安全、漏洞、踩坑提醒,周六日不炸机。

对抗信息洪流,去芜存菁。我们只聚焦那些真正推动技术边界、影响行业格局或预示未来趋势的关键事件。


联系我们

了解更多AI行业动态,欢迎关注「丰周智能AI」公众号。我们每周五为您带来AI领域最新资讯,聚焦技术创新与产业应用。

【声明】内容源于网络
0
0
丰周AI
丰周AI助力企业实现AI技术的高效应用与价值落地。
内容 105
粉丝 0
丰周AI 丰周AI助力企业实现AI技术的高效应用与价值落地。
总阅读196
粉丝0
内容105