「Z计划」是智谱面向未上市初创企业与优秀独立开发者/团队,提供 Tokens 赞助、投资支持和技术支持等资源的创新加速计划。面向全球,持续招募中!🐋(点击报名)「星连资本(Z基金)」是专注于大模型生态的风险投资基金,侧重早期,管理规模 15 亿元人民币。
🔥清华大学经管学院x-lab“AI+创业实训营”火热开展中,「智谱Z计划」与「星连资本(Z基金)参与联合发起。
“实训营”汇聚了创业实战派教授、业界大咖与创业导师,所授课程覆盖前沿技术与应用探索。通过举办AI领军人物圆桌论坛、闭门研讨会等活动,并提供概念验证金支持,促进并拓宽学生对AI领域的理解力和实践能力,共同推动大模型创新的应用发展。
💡智谱概念创新应用 CIT 团队负责人冯小平参与课程教授,围绕大模型的最新进展、核心能力与未来发展路径,进行了深入的技术探讨。
· 冯小平 ·
👇以下是其课程内容要点。
1.大模型在翻译、知识总结、推理、代码生成等基础功能的跃升:
模型规模与训练数据的急速扩张使得原先纯粹的语言处理模型,逐步涌现出“上下文理解”“复杂推理”“多模态处理”等新型能力。
尤其是大模型在指令遵循和示例学习上的突破,令它们能在少量示例甚至零示例的前提下,灵活应对各类任务,并通过自主规划和连贯推理给出答案。
2.从通用大模型到行业应用定制的演进过程:
当前大模型虽已展现通用性,但在垂直领域如医疗、金融、教育等仍需对业务知识、专业术语、推理环节进行强化。
要想让模型在实际场景下完成复杂任务,就必须在其通用语言能力之上,叠加特定行业的业务逻辑和数据结构,从而实现对需求分解、数据调用和决策执行的有机结合。
3.多模态交互如何扩展模型边界:
大模型不再局限于文字输入与输出,模型可以接收图像、语音、视频等多种形式,并生成更丰富的结果形态,如文本转语音、图像描述或虚拟人播报等。
配合可穿戴设备(AR眼镜)或移动端工具,未来的人机交互模式将更加自然、更贴近日常使用场景。
4.大模型+代理(Agent)的潜力:
模型不但能产出文本,而且能通过调用外部工具搜索数据接口执行复杂指令来完成多步骤任务。
这一过程需要模型在内部做出计划与推理,再将特定任务外包给其他API或插件,从而形成自我迭代的闭环,实现高度自动化的场景应用。
5.关注知识产权、数据合规、隐私保护等现实挑战:
大模型会在输出软件转向输出服务的浪潮中带来新的商业形态。
传统SaaS或办公系统可能被以生成式服务为核心的方案替代,企业也需重新思考如何以更灵活的方式将大模型融入业务流程。
在基础设施层面,模型创建已成为大厂专属赛道,硬件池化、微调和推理等技术日趋成熟。
应用层则涌现出文案创作、PPT生成等多样化场景。Sequoia资本的研究显示,AIGC领域已形成完整的用户层级和技术栈,其中开发工具和框架(如LangChain)尤为关键。
2.Agent架构最佳实践:从RAG到生产级部署
2025年后,Agent开发将更注重实际用例,强调将对话结果转化为可交付的知识产物(如PDF、HTML文档)。
RAG(检索增强生成)技术因其能有效结合上下文学习而备受关注,其完整流程包括数据向量化、语义缓存、模型保护和输出验证等环节。
3.AI Agent技术栈:记忆-工具-规划的三角革命
AI Agent开发五大核心要素:角色定义(Determination)、记忆系统(Memory)、工具调用(Tools)、规划能力(Planning)和行动执行(Action)。
4.MCP与A2A:下一代Agent基础设施
MCP(模型控制协议)通过标准化封装使Agent能力可以API形式提供服务,目前腾讯云和阿里云已推出相关产品。
A2A(Agent间通信)则致力于解决Agent间的安全协作、任务管理和能力发现等关键问题。未来,这些技术将大幅降低Agent开发门槛,但也可能加剧行业马太效应。
5.未来挑战:护城河与端侧模型的悖论
技术快速迭代的背景下,单纯的技术优势难以形成持久壁垒;而端侧模型由于算力和能耗限制,未来3-5年内难有实质性突破。

内容来源|清华x-lab“AI+创业实训营”
排版 | 王福多
审阅 | 邓瑞恒
* 本文不代表智谱公司必然认同以上任何观点。

