
01
引言
大部分的机器学习入门课当中,一开始也最基础的观念就是机器学习的三类方式,它们分别是监督式学习(Supervised learning)、非监督式学习(Unsupervised learning)与强化式学习(Reinforcement learning)。很多同学对这三个名字都有些陌生。 这边我尝试用家长教育孩子的方式来解释他们的概念,如果有任何疏漏之处,欢迎大家多多指教。
闲话少说,我们直接开始吧!
02
机器学习到底机器是在学什么
03
监督式学习
它的个性单纯、踏实,大部分的事情我们必须先跟它解释够多遍,它才有足够的判断力做出相应的决定。
举例来说,我们今天带着它来到公园,为了让他了解什么是植物,你指向榕树、矮树林、灌木丛与草地,看!这些都是植物,接着指着天空、汽车和房子说这些不是植物,带着它认识大部分的物件后,大儿子最终找到了规律(绿色、有根或叶),学会了如何判断什么是植物。
所以,监督式学习必须要在数据有标记(labeled)的状况下使用,在现实例子中,针对大型电商,他们手上可能有一份记录着顾客月收入、年龄、性别等标记的数据清单,将这份数据喂给电脑处理,便可让电脑从中根据指标来判断下一个使用者出现时,会购买商品的机率是多少。
04
非监督式学习
接着我们来介绍我们的第二个孩子--非监督式学习。它喜欢将看到的物件依照结构分门别类、划分成不同群组,当我们将一箱动物玩具放在它面前时,它很快就能够从中分出不同的小圈子.

往往让人感到惊讶的是,我们事先并没有告诉它每只动物是属于哪种类别,它却可以透过观察将其分成有翅膀能够飞的、能在水中生活的或只能在路上爬的动物,有些甚至有它独特的分类方法是我们没有预想到的,这就是非监督式学习。我们不必透过监督,就可以从玩具中透过观察解析结构将数据做好分类。
非监督式学习只需要无标记(unlabeled)的数据,便能正常工作。换成现实中的例子,想到的是消费者喜好分析,一般在分类不同消费群组时,我们习惯根据性别、年纪等做分组,但假如今天我们观察发现有个会员会在白天购买化妆品、傍晚购买啤酒、晚上买电动,而且这个种群的数量还不算少,若只看性别和年纪应该会满头雾水,觉得这个消费者是不是得了精神分裂症。而这组会员其实就是家庭,全家爸爸、妈妈、小孩共享同一个帐号进行网购的现象,若套用非监督式学习去分析消费者的行为,便有机会筛检出这些具有相同消费属性的群体。
05
强化学习

更近一步,强化式学习的特征是训练必须要有正负回报·(positive/negative reward),在训练过程中,模型会根据不同的状况(state)尝试各种决定(action),再根据此决定得到的结果进行学习改进。
06
总结
最后我们对本文做个简单的总结:
-
监督式学习:数据已有标记,运用已标记数据来做训练。 非监督式学习:数据没有标记,从中找出拥有相同特征的数据群。
强化式学习:可能手上没有任何数据,直接让模型执行,再将执行结果反馈回去做训练。
您学废了嘛?
点击上方小卡片关注我
万水千山总关情,点个在看行不行。

