DeepSeek系列公开课
📑 直播概览
主题:DeepSeek系列公开课第二季第一讲:从大模型智能体到复杂AI应用系统的构建
🎯 重点内容
大模型推理能力的提升
大模型推理能力的快速提升是近年来人工智能领域的重要突破。
以GPT系列和DeepSeek为代表的新一代模型,显著提高了复杂问题的推理能力。
推理能力的提升得益于“思维链”机制的引入,模拟人类深思熟虑的过程。
推理能力的增强使得大模型在数学、编程等任务上表现卓越。
例如,DeepSeek RY在数学推理任务中表现优异,达到博士级别的科学问题解答能力。
智能体的概念与应用
智能体是大模型与物理世界交互的关键桥梁。
智能体通过调用工具和记忆功能,扩展了大模型的应用场景。
例如,智能体可以自动完成复杂任务,如邮件回复、报告撰写等。
智能体的核心在于任务拆解和工具调用。
通过任务规划和工具组合,智能体实现了从任务分解到执行的全流程自动化。
DeepSeek的技术创新
DeepSeek通过工程化创新,显著提升了大模型的训练和推理效率。
混合专家模型(MOE)使得模型在激活少量参数的情况下,保持高效推理能力。
推理模型通过强化学习(GPO)和少量高质量数据,实现了低成本高性能的推理能力。
推理大模型的出现标志着从生成到推理的范式转变。
DeepSeek RY在逻辑推理和复杂任务处理上表现出色,成为理科博士生级别的模型。
智能体在产业中的应用
智能体结合大模型在产业领域的应用前景广阔。
以“产业大脑”为例,智能体可以帮助政府和企业进行产业链治理、技术监测和趋势预测。
智能体通过整合创新链、产业链、资金链和人才链的数据,提供精准的产业决策支持。
智能体在区域经济中的应用案例:
宁波的绿色产业创新平台、杭州的“市股”产业大脑等,均采用了智能体技术。
从大语言模型到智能体的演进
大语言模型(如GPT)是智能体的核心大脑。
智能体通过逻辑推理和工具调用,完成复杂任务的闭环。
推理大模型的出现进一步推动了智能体的发展。
智能体的未来发展方向:
结合知识图谱和推理能力,智能体将成为复杂AI应用系统的开发范式。
📝 章节纪要
第1章 课程背景与第一季回顾
核心内容:介绍了DeepSeek系列公开课的背景和第二季的主题“渗透与再生:大模型生态下AI+X产业的新触角”。
第一季课程聚焦于人工智能技术的普及与科普。
涉及人工智能历史、大模型算力成本、算法逻辑等技术要点。
第二季课程将重点转向AI技术在不同行业的应用。
包括AI+政法、金融、医疗、脑机接口等领域的案例分享。
第2章 大模型推理能力的提升
核心内容:大模型推理能力的提升是近年来人工智能领域的重要突破。
推理能力的提升得益于“思维链”机制的引入。
模拟人类深思熟虑的过程,逐步分解复杂问题。
推理模型的应用案例:
DeepSeek RY在数学推理任务中表现优异,达到博士级别的科学问题解答能力。
推理能力的增强使得大模型在多任务上表现卓越。
第3章 智能体的概念与应用
核心内容:智能体是大模型与物理世界交互的关键桥梁。
智能体通过调用工具和记忆功能,扩展了大模型的应用场景。
例如,智能体可以自动完成复杂任务,如邮件回复、报告撰写等。
智能体的核心在于任务拆解和工具调用。
通过任务规划和工具组合,智能体实现了从任务分解到执行的全流程自动化。
第4章 DeepSeek的技术创新
核心内容:DeepSeek通过工程化创新,显著提升了大模型的训练和推理效率。
混合专家模型(MOE)使得模型在激活少量参数的情况下,保持高效推理能力。
推理模型通过强化学习(GPO)和少量高质量数据,实现了低成本高性能的推理能力。
推理大模型的出现标志着从生成到推理的范式转变。
第5章 智能体在产业中的应用
核心内容:智能体结合大模型在产业领域的应用前景广阔。
以“产业大脑”为例,智能体可以帮助政府和企业进行产业链治理、技术监测和趋势预测。
智能体通过整合创新链、产业链、资金链和人才链的数据,提供精准的产业决策支持。
智能体在区域经济中的应用案例:
宁波的绿色产业创新平台、杭州的“市股”产业大脑等,均采用了智能体技术。
第6章 从大语言模型到智能体的演进
核心内容:大语言模型(如GPT)是智能体的核心大脑,推动了智能体的发展。
智能体通过逻辑推理和工具调用,完成复杂任务的闭环。
推理大模型的出现进一步推动了智能体的发展。
智能体的未来发展方向:
结合知识图谱和推理能力,智能体将成为复杂AI应用系统的开发范式。
💡 金句提炼
“推理大模型的出现,标志着从生成到推理的范式转变。”
“智能体是大模型实现闭环应用的最重要一环。”
“通过智能体,AI技术可以真正渗透到产业链的每一个环节。”
“推理能力的增强,让大模型在复杂任务中展现出超越人类的潜力。”

