大数跨境
0
0

Python | sklearn模型效果评估(一)混淆矩阵!

Python | sklearn模型效果评估(一)混淆矩阵! 谁说菜鸟不会数据分析
2024-06-17
2
小伙伴们好!在机器学习中,模型测评是一个非常重要的步骤,用于评估模型的性能。

这会涉及到准确率、召回率等多个指标。自己算的话会很繁琐,在Python的scikit-learn(通常简称为sklearn)库中,模型性能评估变得非常方便,以下是一些常用的模型测评方法,我们直接上代码!演示一下在sklearn中如何进行模型效果评估。


混淆矩阵(Confusion Matrix)
首先要介绍的就是混淆矩阵,这是一个用于总结分类模型性能的表格,它显示了真正例(True Positives, TP)、假正例(False Positives, FP)、真反例(True Negatives, TN)和假反例(False Negatives, FN)的数量。
首先,我们构建一个分类模型。以逻辑回归为例。在训练集上
from sklearn.model_selection import train_test_split  from sklearn.linear_model import LogisticRegressionfrom sklearn.metrics import confusion_matrix    # 划分训练集和测试集  X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)  
# 初始化逻辑回归模型 model = LogisticRegression()# 训练模型 model.fit(X_train, y_train)
# 预测测试集 y_pred = model.predict(X_test)

然后,我们运用混淆矩阵来看一下预测的效果如何。confusion_matrix功能存在于sklearn.metrics模块中,用之前记得先加载哦!

【声明】内容源于网络
0
0
谁说菜鸟不会数据分析
以大数据分析为驱动,spss/R/python/数据分析交流技术分享,实用教程干货,敬请期待,B站UP主:谁说菜鸟不会数据分析 有更多在线实操视频。
内容 498
粉丝 0
谁说菜鸟不会数据分析 以大数据分析为驱动,spss/R/python/数据分析交流技术分享,实用教程干货,敬请期待,B站UP主:谁说菜鸟不会数据分析 有更多在线实操视频。
总阅读2
粉丝0
内容498