作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
以下内容节选自沙丘智库《DeepSeek将如何影响企业基础设施战略?》
传统的顶级大模型(如Gemini、OpenAI的GPT系列和Llama)开发成本极高,通常超过1亿美元,并且需要上万个高端GPU或专用AI芯片。这种高昂的成本限制了AI创新,使其主要集中在少数大型企业手中。
近年来,一些领先的AI创新公司(如DeepSeek、Anthropic等)通过设计模型、框架和基础设施,成功地以更低的成本实现了比以往模型更强大的能力。这些创新者的共同目标是通过优化模型结构和资源利用,降低大模型的技术门槛,使更多的企业能够负担得起并应用这项技术。
DeepSeek展示了如何通过算法创新在保持模型性能的同时显著降低对基础设置资源的需求。
随着类似DeepSeek等大模型不断通过高效和训练和推理过程减低AI成本,企业必须将未来的AI基础设施战略与这些资源利用率高的大模型对齐,从而最大程度地利用AI创新,使基础设施投资收益最大化,并确保企业能够适应未来的变化。
沙丘智库建议企业:
第一,投资智算中心并制定稳健的可扩展性规划,以适应不同规模和需求的AI模型,确保企业能够灵活应对技术发展和业务需求的变化;
第二,充分利用云服务的灵活性,以敏捷响应模型迭代,加速评估和合规部署,同时利用云平台的serverless选项和多样化模型选择;
第三,进行全面的安全和合规评估,特别是在规划第三方托管的大模型时,确保数据安全、访问控制和漏洞测试,以保护企业免受潜在风险。
以上内容节选自沙丘智库《DeepSeek将如何影响企业基础设施战略?》
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738

