“大模型,目前AI最好的实现方式。”
现在大模型的发展如火如荼,但怎么定制化一个属于自己的个性化的大模型,或者说怎么定制一个垂直领域的大模型,是一个值得思考的问题。(
01
—
大模型实现过程
什么是大模型?
大模型就是一种有巨大参数量的一种机器学习的模型;其实现过程是通过大规模的训练数据,对模型进行训练之后,得到一个具有“智能”的计算机乘车;所以大模型也叫做预训练大模型。
大模型从技术的角度来说,是采用一种机器学习的底层架构,仿照的是人类神经元;然后就像人类学习一样,通过大量的数据进行训练,这样大模型就具备了丰富的知识,自然也就变得“智能”了。
而不同的数据训练出来的模型,其结果是不一样的;就像文科生和理科生一样,文科生学习的政治历史地址,理科生学习的物理化学生物;因为学习的内容不一样,所以其具备的能力也不一样。

这样,大模型就有了不同的分类;基于垂直领域数据训练出来的大模型其在某个领域会更加擅长,而基于普通数据训练出来的大模型更像一个百科全书;什么都懂,但什么都不够擅长。
02
—
怎么定制化大模型
要想定制化一个大模型,有以下几种方式:
第一,根据开源的机器学习架构,自己搭建一个模型,然后自己整理需要的数据进行训练;这样的好处是,整个大模型完全由自己定制,可以随意发挥;但缺点就是训练一个大模型的成本比较高,普通人负担不起;一般只有企业才可以实现。
第二,使用已经训练好的大模型,不论是垂直领域的大模型,还是类似于GPT这种通用大模型;在其基础之上,自己进行适当的微调,然后让其更加适合自己的使用场景。缺点就是只能进行微调,不能全部由自己把控;优点就是成本比较低。
大模型+本地知识库
第三,搭建本地知识库,给大模型提供足够的数据支撑;也就是所谓的大模型+知识库。所谓的知识库就像是例题,让大模型做什么之前,先给它一些例题作为参考,这样大模型就可以做出更加准确的判断和回答。
第四,前三种方式都是懂技术的人才能可以做到的方式;而如果你不懂技术,又想要一个大模型,那么你就要学习prompt,也就是提示工程;因为大模型本身经过训练之后,虽然其什么都会;但如果你能够更加准确的说出你的需求,那么它就能够给你一个更加准的回答。
总结下来,要想获得一个更加个性化的大模型;最好的方式就是自己训练一个,但缺点是成本太高,而且有技术门槛;其次,就是使用第三方已经训练好的大模型,然后自己进行微调,或者搭建一个知识库;
最简单最直接的方式,就是学习prompt,也就是怎么提问;让自己的提问更加准确,然后大模型才能回答的更好。

