大数跨境
0
0

【白话机器学习】聊聊机器学习中的评估指标

【白话机器学习】聊聊机器学习中的评估指标 数据分析星球
2023-03-26
0
导读:准确率、精确率、召回率、这些机器学习指标你理解对了么?
公众号文章都是按照系列更新,大家可以按需获取哈,干货内容可以戳:

点我查看>>【数据分析思维系列】<<

点我查看>>【数据分析工具系列】<<

点我查看>>【数据分析面试系列】<<

点我查看>>【数据分析统计学系列】<<

点我查看>>【数据分析概述系列】<<
点我查看>>【白话数据分析系列】<<




00
写在前面


前面【白话数据分析】系列12篇文章已经更新完毕,很多小伙伴反馈说很久没看过那么接地气而且简单易懂的文章了,有了小伙伴们的鼓励,我就一鼓作气,继续更新下一个系列白话机器学习】。同样地,我们不讲机器学习复杂晦涩的原理和公式,只用大白话让你快速了解那些常见的机器学习算法。对了,我公众号的文章都是按照系列更新的,到目前为止,已经更新了【初识数据分析】、【数据分析思维】、【数据分析工具】、【数据分析统计学】、【数据分析面试宝典】、【白话数据分析】等6个系列,需要的小伙伴可以按需获取哈


机器学习是一种强大的工具,它可以帮助数据分析师更好地理解和利用数据。机器学习能够帮助数据分析师处理这些大量的数据,并从中提取有用的信息。另外,机器学习可以帮助数据分析师训练模型,从而预测未来的趋势和结果。同时,机器学习能够发现隐藏在数据中的模式和关联性。这些模式和关联性对于理解数据和制定决策非常重要。因此,掌握机器学习的知识对于数据分析师来说非常重要。


但是,众所周知,机器学习是一个对数学和编程技能要求很高的学科,里面有很多非常晦涩的概念,还有非常复杂的公式和算法,很多人看到这里就望而却步了,但是在这个系列文章中,没有晦涩难懂的公式和复杂的算法,我只是希望用大白话的形式,结合工作和生活中的各种各样的例子,用最简单直白但又不失本真的方式来讲解这些问题,帮助大家掌握一些机器学习的基本的知识



01 准确率/精确率/召回率

在机器学习中,评价指标是衡量模型性能的重要指标。一个好的模型需要具备高的准确率、精确率和召回率。本文将重点介绍这三个指标的定义、计算以及它们之间的关系。

    准确率

    准确率,英文叫做 Accuracy。顾名思义,准确率就是看整体里预测准确的概率是多少。准确率 = 预测正确的样本数量 / 预测总的样本数量。这个公式乍一看很有作用,但是用这样的方式来评估一个算法模型是有问题的。

    假设我设计了一个算法来辨别鹿的照片。我准备了 100 张图片,图片里边有 1 张鹿,99 张马。现在,我要让算法来识别这个图片里到底是鹿还是马。假如这个算法模型很准确,把一个鹿识别出来了,然后我们看这个准确率是多少呢,用刚刚的那个公式,你容易得出是 1/100,也就是说只有 1% 的准确率。这个和我们当时预期的明显不对。

    精确率

    那怎么样更好的去衡量这个算法模型呢?我们就有了一个新的概念,叫做精确率,英文叫做 precision,也叫作查准率

    这个概念稍微复杂了一些。还用刚才预测鹿和马的这个例子,我们先把几种预测结果的情况都列出来,整体上就是 4 种:预测马,它的确是马;本来是鹿,预测成马;本来是马,把它预测成鹿了;本来是鹿,预测对了还是鹿。

    官方说法是精确率为预测正确的正例 (TP) 在所有预测为正例的样本中出现的概率,即分类正确的正样本个数占分类器判定为正样本的样本个数的比例。是不是有点绕?你可以把表格和下面这个公式对照起来看,会更容易理解一些。精确率 =TP(指马为马)/(TP(指马为马)+FP(指鹿为马)),也就是说你预测为对的里面有多少是真的对,这就是查准率

    召回率

    召回率用官方的说法是预测正确的正例 (TP) 在实际所有正例样本中出现的概率,即分类正确的正样本个数占真正的正样本个数的比例。用公式来表示就是下面这样。召回率 =TP(指马为马)/(TP(指马为马)+FN(指马为鹿))那我们怎么能避免这种情况出现呢,我们就会用到另外一个指标——召回率(recall,也叫作查全率)。召回率用官方的说法是预测正确的正例 (TP) 在原始的所有正例样本中出现的概率,即分类正确的正样本个数占真正的正样本个数的比例。用公式来表示就是下面这样。召回率 =TP(指马为马)/(TP(指马为马)+FN(指马为鹿)),查全率,即真正对的样本有多少被预测出来了


    02 置信度与置信区间

    置信度与置信区间。用官方说法来说,置信区间估计是参数估算的一种,它是用一个区间来估计参数值,英文叫做 confidence interval 也就是一定信心下的区间。这个信心我们可以用前面讲到的准确率来去衡量,这个时候准确率有了一个新名字,叫做置信度。刚刚提到的 95%、100% 就是置信度,[0,750]和[600,630]就是置信区间。

    一般来讲置信度和置信区间是同向的,啥意思呢?就是置信度和置信区间一般是相同趋势。当置信度很高时,置信区间也会很大;当置信区间很大时,置信度也会很高。不过越高其实这个算法越没有用处。如果一个算命先生告诉你,我有 100% 把握你生命是在 1 岁到 200 岁之间,虽然置信度高,但显然是一句废话。所以置信度和置信区间是一组参数,来告诉你这个算法模型误差有多大


    03 如何选取评价指标?

    虽然精确率、召回率和置信区间这几个指标都很重要,但这几个指标却难以同时达到很好的水平,甚至是此消彼长。那在实际的工作中,这几个指标如何取舍呢?

    以“自动驾驶识别物体为例,如果你的精准度低了,代表着你遇到不是人的物体时,算法会把它判断成人然后刹车。这个系数太低,你开车就经常会出现莫名其妙的刹车的情况。

    如果我们召回率低了,代表着本来路上有一个人,我没有把人识别出来直接撞上去了,这个也不行。

    置信区间代表着能识别出多少物体。所以如果让你只能选择一个参数作为最关键的核心调优指标,你会选择哪一个参数呢?如果是我,我会优先选择召回率,这样算法如果不好,至多也就会和新手一样,宁可多刹点车也不要撞到人。毕竟对于汽车驾驶来讲,安全最重要。


更多【数据分析思维】、【数据分析工具】、【数据分析面试笔试】、【数据分析统计学】系列干货内容请回公众号,更多数据分析干货文章持续更新中,敬请期待,如果觉得不错,也欢迎分享、点赞和点在看哈~

点赞和在看后公众号后添加微信:data_xingqiu领取数据分析学习资料!


往期精选

end


关注公众号数据分析星球,持续更新数据分析思维和工具干货内容,公众号后台对话框回复关键词“数据分析”,更有史上最全数据分析资料包领取。添加个人微信:data_xingqiu,和更多小伙伴交流数据分析资料、岗位和面经!

【声明】内容源于网络
0
0
数据分析星球
8年+互联网大厂资深数据分析师,4年+数分团队负责人&面试官,专注数据分析提升与求职,提供数分课程,简历修改和面试辅导,数据路上,我们共同成长!
内容 121
粉丝 0
数据分析星球 8年+互联网大厂资深数据分析师,4年+数分团队负责人&面试官,专注数据分析提升与求职,提供数分课程,简历修改和面试辅导,数据路上,我们共同成长!
总阅读30
粉丝0
内容121