仅280页PDF，从零构建大模型！- 大数跨境

机器学习AI算法工程

2026-01-07

介绍

《从零构建大模型》是一本基于PyTorch框架的实战指南，摒弃了对现成库的依赖，引导读者从零开始亲手构建功能强大的大语言模型。本书由畅销书作家塞巴斯蒂安·拉施卡撰写，从基础知识讲起，由内而外地剖析大模型核心原理，并通过清晰的文字、图表和实例，系统讲解模型各组成部分的规划与实现、数据集的准备、通用语料预训练及任务定制微调的全过程。

书中不仅详细阐述了如何利用人工反馈确保模型遵循指令、加载预训练权重等关键技术，还特别设置了DeepSeek彩蛋章节，深入解析推理模型的构建与优化策略。通过理论与实践的结合，本书旨在帮助读者在掌握LLM理论知识的同时，获得从零打造大模型的完整实战能力。

第1章：理解大型语言模型

第2章：处理文本数据

第3章：编码注意力机制

第4章：从零开始实现 GPT 模型

第5章：在无标注数据上进行预训练

第6章：进行文本分类的微调

第7章：进行遵循指令的微调

扫码回复“大模型神书”

免费领取电子书