继上周发布V4版本后,DeepSeek突然推出识图模式灰度测试,标志着其备受期待的多模态能力正式落地。更新后的网页版及App用户已可体验该功能。项目组研究员通过推特释出"Now, we see you"信号,经实测,DeepSeek成功解析出图像中无文字隐喻,精准推断出这是关于多模态更新的宣告,并总结道:"那个看不见世界的鲸鱼,现在终于睁开眼了。"核心突破在于其推理机制:不同于传统AI仅描述表层元素,DeepSeek主动溯源发布者身份、分析品牌标识及符号隐喻。面对推特截图,模型会深度追问"创作者意图"与"潜在语义",模拟人类观图时的自然思维路径。特别值得注意的是其思维纠错机制:当一度将眼罩误联至动漫《天元突破》时,能自我修正;更创新性建立"思考答辩会"流程——先验证客观事实,再判断事件性质,最后形成结论,完整复现人类认知决策链条。基础能力测试显示:日常场景识别准确率较高,如电影剧照、抽象图像及商品图均能精准解析。响应速度达半秒级,满足实用需求。目前存在两方面局限:一是在极端测试场景(如数手指、特定爱心图案)中仍有误差,需交互引导才能修正;二因未接入实时搜索,仅基于知识库作答,对2023年后新事物(如苹果Finder吉祥物)及HEIF格式图片尚不支持。该功能上线标志着国产大模型在视觉理解领域取得实质性进展。随着多模态能力持续迭代,国内AI生态格局有望迎来新一轮调整。
【声明】内容源于网络
0
0
APPSO
AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al
内容 15362
粉丝 0
APPSO
AI第一新媒体,「超级个体」的灵感指南。 #AIGC #智能设备 #独特应用 #Generative Al