DeepSeek(杭州深度求索人工智能基础技术研究有限公司,中文简称深度求索)是一家在人工智能领域具有重要影响力的公司。以下是关于它的详细介绍:
公司背景:
- 成立时间:2023 年 7 月 17 日,由知名量化资管巨头幻方量化创立,幻方量化为其技术研发提供了强大的硬件支持。
- 创始人:梁文锋,毕业于浙江大学,曾在量化交易基金领域积累了丰富经验和财富,后投身于人工智能领域的研究和开发。

- 总部地点:位于中国浙江省杭州市。
技术优势:
- 模型性能出色:
- 其推出的 deepseek-r1 模型在数学、代码、自然语言推理等任务上,性能可与 OpenAI 的 O1 模型正式版相媲美。
- deepseek-v3 模型拥有 6710 亿参数,尽管只激活了 370 亿参数,但表现已接近国际顶尖模型。
- 独特的架构设计:通过自研的多头潜在注意力(MLA)架构和 DeepSeek MOE 架构,大幅降低了模型训练成本。
- 高效的计算资源利用:在有限的硬件条件下,能通过高效的架构设计实现具有竞争力的性能。例如,仅使用 2048 个英伟达的 H800 芯片和相对较少的资金,就训练出了大规模参数的模型,而相比之下,OpenAI 和谷歌训练同等规模的 AI 模型所花费的费用要高出约十倍。
产品及业务范围:
- 大语言模型产品:已发布多个大语言模型,如 2024 年 1 月 5 日发布首个大模型 deepseekllm;2024 年 5 月开源第二代 MOE 大模型 deepseek-v2;2024 年 12 月 26 日宣布模型 deepseek-v3 首个版本上线并同步开源;2025 年 1 月 20 日正式发布 deepseek-r1 模型等。这些模型具备文本生成、问答系统、机器翻译等多种功能,在语义理解和生成能力上表现优秀。
- 多模态技术探索:除了语言模型,公司也在探索多模态领域,如 2025 年 1 月 28 日发布的多模态大模型 janus-pro,在图像生成基准测试中表现出色,超过了 OpenAI 的 DALL-E3。
- 应用领域广泛:业务覆盖自然语言处理、计算机视觉、智能语音等领域,技术可以应用于安防、医疗、交通、教育、金融、内容创作等行业,为这些行业的智能化升级提供支持。例如,在安防领域可用于人员身份识别、行为分析、车辆识别与追踪等;在智能语音交互方面,支持语音识别、语音合成等功能,满足不同场景下的语音交互需求。
市场表现及影响力:
- 下载量与排名:2025 年 1 月,其应用程序的下载量可观,且在 1 月 27 日登顶苹果中国地区和美国地区应用商店免费 APP 下载排行榜,超越了 ChatGPT 等产品。
- 行业影响:其崛起引发了全球对人工智能行业的重新审视,推动了相关概念股的上涨,并且为人工智能行业的发展带来了新的思路和方向,加速了行业的多元化发展。
总的来说,DeepSeek 凭借其卓越的技术实力、高效的成本控制和开源策略,在全球人工智能领域迅速崛起,成为备受关注的人工智能公司。未来,它有望在更多领域发挥重要作用,推动人工智能技术的发展和应用。
在应用日活飙涨的同时,国内外主要的云厂商和芯片厂商近日接连宣布接入DeepSeek模型。
海外市场方面,1月31日,微软的Azure云服务宣布DeepSeek-R1正式上线微软的Azure AI Foundry以及GitHub。同日,全球第一大云巨头亚马逊AWS宣布DeepSeek-R1模型全面上线,英伟达也宣布NVIDIA NIM已经可以使用DeepSeek-R1模型。
国内方面,2月1日,华为云宣布,经过华为云和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。华为云还提到,得益于自研推理加速引擎加持,双方支持部署的DeepSeek模型可以获得持平全球高端GPU部署模型的效果。
紧接着,腾讯云2月2日也宣布,DeepSeek-R1大模型可一键部署至腾讯云HAI上,开发者仅需3分钟就能接入调用。腾讯云表示,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤,只需两步即可调用DeepSeek-R1模型。2月3日,阿里云、百度智能云发文宣布,正式接入DeepSeek-V3、DeepSeek-R1模型。至此,国内四大云巨头都已正式接入了DeepSeek。
业内人士分析称,在大模型领域,OpenAI、Anthropic等市场上领先的玩家选择了闭源的封闭路线,而DeepSeek选择了开源,任何人都可以部署、修改、优化其模型。“这就像是传统软件时代的Windows和Linux之争”,DeepSeek代表的不仅是一个模型,也是一种新的行业范式与游戏规则。当云厂商们纷纷选择接入DeepSeek,将有越来越多的企业选择DeepSeek 这样的开源方案,从而形成DeepSeek“生态圈”。
中航证券研报表示,DeepSeek在基础模型训练和推理模型训练均有创新,有效克服了推高模型成本的FP8训练精度不足、高质量数据匮乏等困难,极大降低了训练和推理成本。DeepSeek的研究还表明,较大的基础模型发现的推理模式对于提高较小模型的推理能力至关重要。在大模型蒸馏技术的加持下,端侧小模型的普惠化指日可待。
同时,研报还指出,美国科技巨头英伟达NIM,微软Azure,亚马逊AWS等智能云平台已上线部署支持用户访问DeepSeek-R1模型。DeepSeek以创新的技术路线吸引了全球科技巨头,说明国产科技在开放创新的开源环境里具备强大的竞争力,有望涌现出更多的普适技术,我国本土科技企业的价值理应被重估。
关于华友会|华友会创投军团


【感谢您的阅读,转发是最大的鼓励】,欢迎邀请前华为投资人(华为离职和退休)加入到华友会创投分会群,华友会|小花瓣微信:ExHWer005

