“ 大模型和生成式AI,是有重叠但又不一样的东西”
大模型和生成式模型是一个东西吗?那大模型和生成式AI呢?
再具体一点,一个自然语言处理的大模型是生成式大模型吗?
如果一个模型,能够总结文档,那么这个模型是生成式模型吗?
大模型和生成式模型
很多人在很多时候,想当然地把大模型当作人工智能,也把大模型和生成式模型混为一谈。
在上面的问题中,自然语言处理模型属于生成式大模型吗?
思考一下什么是生成式人工智能?什么是大模型?什么是生成式模型?
生成式人工智能是一种旨在通过学习训练数据的分布,模型来生成新的原创的内容。
大模型是指使用机器学习算法实现的,具有大量参数并且使用大规模数据训练出来的模型。

而生成式模型是指用大模型技术实现的生成式人工智能的一种方式。
单纯的说这些概念,可能很多人都不明白,也不知道有什么用,那咱就来举个例子。先记住一句话,生成式AI的作用是生成新的,原创的内容。
说到自然语言处理可能不是很好理解,那就用视觉模型来举例;一个图片处理的大模型,它按照我们的描述生成一种图片。
比如说,给我生成一个可爱的,活泼又精明的灰太狼,这时大模型按照我们的要求生成了一张图片。
但如果我们把一张现有的图片,用一个大模型去除水印,这时这个大模型还是生成式大模型吗?
它有生成新的图片或者新的内容吗?好像并没有。

拿我们工作或生活来举例,第一种,有一天领导突然说,依照我们公司的产品,你给我做一套新的营销方案来。
第二种,领导说你把某某公司的营销方案拿过来看看,开会的时候给我总结说明一下。
这时,第一种这叫做”生成“,因为这是一套新的内容,是你做到一套营销方案;而第二种不能叫做生成,因为它并没有生成新的,原创性的东西。
当然,你可能会说他做到营销方案,也是借鉴别人的啊,并不是完全原创。
那如果从技术角度来考虑,设计和训练一个能够生成新图片的模型,和设计训练一个能够去水印,让图片更清晰的模型。
它们是同一种模型吗?能够用同一种设计,训练方法和训练数据吗?
为什么要区分这两种情况?
如果你没有真正的去设计或训练一个大模型,那么你可能很难理解这两种模型。网络上大部分关于大模型的内容,都是浅尝辄止,根本没有真正深入讲述过大模型的内在机制。
或许是因为嫌麻烦懒得讲,或许是因为他们自己都不明白这里面有什么区别。
在不了解人工智能技术的人来说,大模型就是人工智能,人工智能就是大模型;但对真正学习过人工智能技术的人来说,大模型和人工智能是有区别的。大模型只是实现人工智能的一种方式,它并不能完全代表大模型。
就类似于,我们以为大模型能够回答我们的问题,那它就是一个生成式大模型,但事实上,它们之间是有区别的。
而如果弄不明白这两者之间的区别,那么就很难想象得到大模型的应用场景,或者说很难真正用大模型来解决业务问题。
因为在你的眼中,大模型只能用来回答问题,而不知道大模型真正的能力范围,以及怎么才能弄出来一个解决实际问题的大模型。

