(文/陈济深 编辑/张广凯)继 500 亿元融资落定后,DeepSeek 正加速完善其模型能力。6 月 18 日,DeepSeek 在网页版和 APP 端正式上线识图功能,标志着其首次补齐多模态能力短板。
识图功能实测:人物识别存在“脸盲”现象
测试发现,DeepSeek 在人物识别上表现不稳定。在未经过特定上下文引导时,模型经常无法识别其母公司深度求索创始人梁文锋,甚至将他人误认为梁文锋。例如,使用梁文锋的百度百科照片进行测试,模型错误地将其识别为李柘远。
当输入带有 DeepSeek 标志性鲸鱼 LOGO 且与梁文锋同框的图片时,模型成功识别出人物身份。随后,即使去除 LOGO,仅保留梁文锋照片,模型也能正确回答。这表明 DeepSeek 在识图模式下高度依赖前后文关联信息,人物识别不仅基于图像本身,还结合了上下文语境。
上下文干扰导致识别偏差
受上下文影响,模型曾将腾讯汤道生、宇树王兴兴的照片,依据眼镜特征及历史对话信息,错误判定为不同状态下的梁文锋。
不过,这种“脸盲”并非绝对。在面对 360 创始人周鸿祎的照片时,模型将其误认为拼多多创始人黄铮;而在测试多位戴眼镜的知名人物时,大部分被归类为“梁文锋家族”,但腾讯马化腾的照片则被一次性准确识别。
多模态理解能力进阶
除人物识别外,DeepSeek 在建筑场景、文字组合及梗图解构等测试中表现优异。模型不仅能精准提取图片元素,更能深入理解图片核心内容及隐藏信息,延续了其在文本模型上的优势。
在梗图测试中,DeepSeek 能够结合画面元素解析笑点;在复杂的成语接龙图片题中,经过约 3 分钟的深度思考,模型也成功给出解答。整体而言,识图功能的上线有效扩充了 DeepSeek 的能力边界。
超 500 亿融资落定,坚守技术长期主义
DeepSeek 曾以“不追求商业化”著称,依托创始人梁文锋背后的幻方资本,公司在量化交易和智能金融领域拥有深厚的技术积累与算力基础,是国内首批具备万卡集群的大模型企业。行业评价梁文锋为“有 AI 信仰的技术浪漫主义者”。此前,因坚持纯技术研发、拒绝过度商业化变现及股权让渡,DeepSeek 在去年初 R1 模型爆火后仍未能吸引 VC 机构投资。
随着国产大模型竞争加剧及人才流动带来的舆论压力,DeepSeek 迎来了首次开放融资。就在识图模式上线前夕,公司确认完成超 500 亿元首轮融资。其中,梁文锋个人出资约 200 亿元,为最大单一出资方;腾讯出资约 100 亿元;宁德时代体系(含溥泉资本)出资约 50 亿元;网易、京东、Monolith 砺思资本、IDG 资本各出资约 30 亿元;正心谷投资、拾象科技各出资约 15 亿元。
今年 4 月,V4 模型的发布再次巩固了 DeepSeek 的行业第一梯队地位。该模型不仅凭借创新架构引发关注,更实现了对国产芯片的全面适配。华为计算信息显示,昇腾超节点产品已全面支持 DeepSeek-V4 系列模型,双方通过芯模协同推动了国产 AI 算力的崛起。
面对外界的赞誉与期待,DeepSeek 官方团队在 V4 预览版上线时致辞:“不诱于誉,不恐于诽,率道而行,端然正己。”公司表示,将始终秉持长期主义原则,专注于不懈创新,稳步向实现通用人工智能(AGI)的目标靠近。

