

从百舸争流到自成畦径——2026年中国AI投资策略

求数科技

2025-12-15

导读：算力：国产算力产业化元年，多维度迭代出新• 供给侧：国产算力放量，国产AI芯片从可用到好用，超节点展现国产工程

算力：国产算力产业化元年，多维度迭代出新• 供给侧：国产算力放量，国产AI芯片从可用到好用，超节点展现国产工程能力。• 需求侧：互联网、运营商智算中心需求旺盛。• 国产创新：芯片、超节点、IDC多维度工程创新，提升整体计算性能，独树一帜。

◼ 模型：中美大模型差距缩小，从单纯的性能提升迈向商业化落地• 模型：2025年，全球大模型迭代速度整体放缓，中美大模型之间的差距迅速缩小，预计在 2026年将进一步缩小差距乃至在部分领域超越。• 国产创新：大模型的训练范式上不仅追求Scaling，且在性能、效率与成本间寻求更优平衡。• 模型发展演绎：1）突破长上下文瓶颈；2）多模态，世界模型；3）Mid-training。• 未来中国的AI范式为人机共驾，模型难以取代具备定制化特点的软件。

◼ 应用：多领域落地验证大模型价值，软件行业进入最佳布局窗口• 趋势：模型迭代后获得了更优秀的长上下文的能力，为更深度的应用做好准备。• 商业化：大量公司AI收入占比突破10%，软件行业迎来技术革新带来的“最佳击球点”。• 看好Deep Research、AI编程、多模态、行业Agent等方向。

量：25年加速消化21-23年存量有效供给，而核心区位资源紧缺，新增供给显著下降• 在建工程转固作为后验指标，已清晰体现24年以来需求回升与第三方IDC存量资源的快速响应，预计25-26年这一趋势进一步放大。◼ 上架率：核心区位整体上架率持续回升，交付与上架周期相较历史显著缩短至约6个月◼ 价：供需关系改善以来逐步企稳，需求集中节点核心区位边际定价小幅回升

DeepSeek提供创新性光学上下文压缩新思路：视觉模态作为文本高效压缩媒介，文本→图像→视觉token• 处理效率大幅提升：压缩比<10倍时，精度达97%；压缩比20倍时，精度~60%。实际应用中单张A100-40G GPU可支持20万页数据处理每日。• 视觉输入模拟人类记忆衰减：久远上下文压缩为低分辨率图像实现自然遗忘，实现优化长上下文管理。

核心架构设计是编码器、压缩、解码器• DeepEncoder编码器：80M SAM-base（窗口注意力主导，局部特征提取）、16倍卷积压缩、 300M Clip-large（密集全局注意力，全局语义理解）三级串联。• DeepSeek-3B-MoE解码器：3B参数规模(570激活参数)，将视觉token重建为原始文本表征。◼ DeepEncoder是核心创新：• 例如1024x1024输入图像，先分割成4096patch token，前半部分80M产数量激活内存消耗可接受，进入全局注意力之前先压缩至256个，使整体激活内存有效控制。• 文字transformer计算复杂度O(n^2)，DS-OCR在Clip以前为O(n)。• 处理高分辨率能力、高分辨率下低激活内存、少量视觉token、支持多分辨率输入、适中参数量。

从过去的“预训练+后训练”两阶段变为“预训练-中期训练-后训练”三阶段：• 预训练：接触大规模多样化语料库奠定基础能力（类比通识教育阶段）；• 中期训练：通过部分高质量、特定领域数据系统性增强模型核心能力（类比专业深造阶段）；• 后训练：微调和对齐（类比岗前培训）。◼ 标志大模型开发从相对粗放的规模扩张进入精细化的系统工程阶段