DeepSeek-R1引爆大模型新纪元
2025年春节前夕,DeepSeek-R1的发布被视为AI领域的分水岭,重新定义了中国大模型的发展方向。国内某云服务器工程师透露,接到紧急任务调优芯片适配R1模型仅用时一周,而一家To B厂商负责人则表示客户对R1性能验证的需求极为迫切。
从GPT到o系列:推理模型时代来临
自OpenAI于2022年推出基于GPT-3.5的ChatGPT以来,国内厂商一直在追赶其步伐。2023年进入“百模大战”,2024年“AI六小虎”崭露头角,但DeepSeek-R1的火爆让行业迅速转向推理模型研发。
OpenAI的o系列聚焦结构化推理能力,补充了GPT的语言偏重路线。GPT4将于2025年4月30日退役,完全被GPT4o取代。技术人士指出,推理模型成为大模型竞争中的必选路径。
六大国产推理模型迎战o3
OpenAI的o3作为最强大推理模型之一,智商测试达136,多项基准测试中表现优异。然而,百度、阿里、科大讯飞等厂商紧随其后发布了各自推理模型。
- 科大讯飞的星火X1支持快慢两种思考模式,部署成本极低。
- 阿里千问系列提供多样选择,性价比高。
- 百度文心一言采用协同训练方式,增强Agent能力。
- 字节豆包因价格优势受AI玩具厂商青睐。
- 腾讯混元虽起步较晚,但通过集团资源倾斜实现了快速追赶。
大模型全面国产化趋势
尽管当前大模型发展仍面临算力限制等问题,但科大讯飞等公司已展现出全栈国产化的潜力。英伟达暂停RTX 5090D销售的消息进一步凸显国产化重要性。未来,更多国产大模型或将走向独立自主道路,与国际顶尖模型同台竞技。