大数跨境
0
0

【科普】一文弄懂监督式学习、非监督式学习以及强化式学习

【科普】一文弄懂监督式学习、非监督式学习以及强化式学习 AI算法之道
2022-06-21
0
导读:大部分的机器学习入门课当中,一开始也最基础的观念就是机器学习的三类方式,它们分别是监督式学习、非监督式学习与强化式学习。这边我尝试用家长教育孩子的方式来解释他们的概念,如果有任何疏漏之处,欢迎大家多多






01


引言



大部分的机器学习入门课当中,一开始也最基础的观念就是机器学习的三类方式,它们分别是监督式学习(Supervised learning)、非监督式学习(Unsupervised learning)与强化式学习(Reinforcement learning)。很多同学对这三个名字都有些陌生。  这边我尝试用家长教育孩子的方式来解释他们的概念,如果有任何疏漏之处,欢迎大家多多指教。


闲话少说,我们直接开始吧!





02


机器学习到底机器是在学什么


从字面上来看,机器学习 就是让机器(电脑)学习一件事情,就和我们一样,从小到大,我们深受父母、教师或朋友等影响,形成了现在的我们。机器学习也是一样,让我们假设今天电脑是你的小孩,你可以选择采用哪种教育方针教导它,使它未来能得到你预期的结果。





03


 监督式学习


我们首先来介绍我们的大儿子--监督式学习
它的个性单纯、踏实,大部分的事情我们必须先跟它解释够多遍,它才有足够的判断力做出相应的决定。

举例来说,我们今天带着它来到公园,为了让他了解什么是植物,你指向榕树、矮树林、灌木丛与草地,看!这些都是植物,接着指着天空、汽车和房子说这些不是植物,带着它认识大部分的物件后,大儿子最终找到了规律(绿色、有根或叶),学会了如何判断什么是植物。

所以,监督式学习必须要在数据有标记(labeled)的状况下使用,在现实例子中,针对大型电商,他们手上可能有一份记录着顾客月收入、年龄、性别等标记的数据清单,将这份数据喂给电脑处理,便可让电脑从中根据指标来判断下一个使用者出现时,会购买商品的机率是多少。





04


 非监督式学习


接着我们来介绍我们的第二个孩子--非监督式学习。它喜欢将看到的物件依照结构分门别类、划分成不同群组,当我们将一箱动物玩具放在它面前时,它很快就能够从中分出不同的小圈子.

往往让人感到惊讶的是,我们事先并没有告诉它每只动物是属于哪种类别,它却可以透过观察将其分成有翅膀能够飞的、能在水中生活的或只能在路上爬的动物,有些甚至有它独特的分类方法是我们没有预想到的,这就是非监督式学习。我们不必透过监督,就可以从玩具中透过观察解析结构将数据做好分类。

非监督式学习只需要无标记(unlabeled)的数据,便能正常工作。换成现实中的例子,想到的是消费者喜好分析,一般在分类不同消费群组时,我们习惯根据性别、年纪等做分组,但假如今天我们观察发现有个会员会在白天购买化妆品、傍晚购买啤酒、晚上买电动,而且这个种群的数量还不算少,若只看性别和年纪应该会满头雾水,觉得这个消费者是不是得了精神分裂症。而这组会员其实就是家庭,全家爸爸、妈妈、小孩共享同一个帐号进行网购的现象,若套用非监督式学习去分析消费者的行为,便有机会筛检出这些具有相同消费属性的群体。





05


强化学习


最后我们最小的女儿--强化学习。她最喜欢下棋,常常要求我们跟它对弈,一开始我们一定会窃笑它的思路缺乏常识,总是下险棋犯些很明显的错误,但经过一局又一局的对弈之后,它不断思考每一局的过错是不是有改变的可能,所以它越下越好,思考的套路也更加深层,没错!AlphaGo就是强化式学习的一种应用。

更近一步,强化式学习的特征是训练必须要有正负回报·(positive/negative reward),在训练过程中,模型会根据不同的状况(state)尝试各种决定(action),再根据此决定得到的结果进行学习改进。






06

总结


最后我们对本文做个简单的总结:

  • 监督式学习:数据已有标记,运用已标记数据来做训练。
  • 非监督式学习:数据没有标记,从中找出拥有相同特征的数据群。

  • 强化式学习:可能手上没有任何数据,直接让模型执行,再将执行结果反馈回去做训练。

 

您学废了嘛?






点击上方小卡片关注我



万水千山总关情,点个在看行不行。

【声明】内容源于网络
0
0
AI算法之道
一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号,涵盖视觉CV、神经网络、模式识别等方面,包括相应的硬件和软件配置,以及开源项目等。
内容 573
粉丝 0
AI算法之道 一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号,涵盖视觉CV、神经网络、模式识别等方面,包括相应的硬件和软件配置,以及开源项目等。
总阅读195
粉丝0
内容573