原文出自Medium
作者:Terence Shin
京东智联云开发者社区编译
重申一下,在监督学习中,有两个子类别:回归和分类。
在回归模型中,输出是连续的。以下是一些最常见的回归模型类型。
线性回归示例
线性回归的概念就是简单地找到一条最适合数据的直线。线性回归的扩展包括多元线性回归(例如,找到最佳拟合的平面)和多项式回归(例如,找到最佳拟合的曲线)。
-决策树
图片来自Kaggle
-随机森林
-神经网络
神经网络的视觉表示
神经网络是一种受人脑启发的多层模型。就像我们大脑中的神经元一样,上面的圆圈代表一个节点。蓝色的圆圈代表输入层,黑色的圆圈代表隐藏层,绿色的圆圈代表输出层。隐藏层中的每个节点代表特定输入的一个函数,最终生成绿色圆圈中的输出。
在分类模型中,输出是离散的。以下是一些最常见的分类模型类型。
-逻辑回归
-支持向量机
-朴素贝叶斯
决策树,随机森林,神经网络……这些模型遵循与先前解释相同的逻辑。唯一的区别是其输出是离散的而不是连续的。

图片来自GeeksforGeeks
聚类是一种无监督学习的技术,它涉及对数据点的分组或聚类。通常用于客户细分、欺诈检测和文档分类等场景。
常见的聚类技术包括k均值聚类、分层聚类、均值漂移聚类和基于密度的聚类。尽管每种技术在寻找聚类时都有不同的方法,但它们都旨在实现同一目标。


