01
什么是 SLM?
虽然大型模型可以拥有数千亿甚至数万亿个参数,但 SLM 通常在几百万到大约 100 亿个参数范围内运行,因此需要的内存、处理能力和存储空间要少得多。
从技术上讲,SLM 部署的 Transformer 架构与其规模更大的同类产品相同,但知识提炼、剪枝和量化等优化技术使其能够以极低的资源成本保持特定任务的高性能。通过使用特定领域的训练数据集,SLM 可以在特定任务(例如公司特定的电子邮件摘要或呼叫中心查询解决)上表现出色,而不像 LLM 那样拥有通用的全知能力。
02
什么是LLM?
LLM,例如 GPT-4 和 Gemini,是利用涵盖数字化世界大量文本的海量数据集进行训练的可扩展神经网络。凭借多达数万亿个可学习参数,LLM 在语言、推理、摘要、代码等方面展现出卓越的流畅性。它们的优势在于适应性和广度——从法律文件分析到诗歌,LLM 可以处理各种领域。
然而,这种规模也伴随着成本。训练和运行LLM需要巨大的计算能力、跨专用硬件(GPU、TPU)的协调以及持续的互联网连接。这不仅增加了财务支出,还会放大碳足迹。
03
什么使得 SLM 比 LLM 更具可持续性?
可持续生命周期管理 (SLM) 较低的能源足迹是其被应用于可持续发展战略的主要驱动力。随着每个 AI 模型规模的缩小,其训练和推理所需的能源需求也随之大幅下降,这使得组织能够在满足排放目标的同时,扩大自动化和智能服务的使用。
与 LLM 不同,SLM 可以直接部署在边缘设备或最少的内部部署基础设施上,从而进一步减少对能源密集型集中式数据中心的依赖。
绿色人工智能是一项在人工智能发展中优先考虑效率、环境责任和包容性的运动,而可持续土地管理自然与这些目标相一致。
对于许多正在提升 AI 基础设施的公司来说,SLM 的成本效率极具吸引力,尤其是对于那些希望实现 AI 大众化或在云成本受限的情况下进行规模部署的组织而言。更小的模型意味着更低的基础设施成本、更快的微调速度以及最低的 GPU 需求。
SLM 不仅更环保、更经济,也更易于审计和控制。其更简单的结构使数据科学家和合规团队能够比 LLM 不透明、庞大的架构更快地解释、调试和降低风险。
同样的透明度在医疗保健和银行业等受监管的行业中尤其有价值,因为快速的模型可解释性是法律的必要条件。
SLM 提供现代 IT 战略的核心运营灵活性。其紧凑的尺寸使其能够部署在边缘设备、私有本地服务器或云端,满足任何对延迟、隐私或合规性有要求的地方。
SLM 使组织能够为每个 AI 工作负载选择最合适的位置,从而使他们摆脱可能损害纯云方法的带宽和隐私限制。
04
Phi-4:微软最新的SLM
微软首席可持续发展官 Melanie Nakagawa 表示:“先进的云和人工智能服务的能源强度促使我们加快努力提高效率和减少能源消耗。”
微软首席可持续发展官 Melanie Nakagawa
“随着人工智能场景变得越来越复杂,我们正在帮助开发人员构建和优化能够实现类似结果但需要更少资源的人工智能模型。”
微软的 Phi-4 是其 SLM 系列开发中的最新产品。Phi-4 可通过 Azure AI Foundry、HuggingFace 和 Nvidia API Catalog 获取,包括 Phi-4-multimodal 和 Phi-4-mini。
2025-07-28
2025-07-25
2025-07-24




