sklearn分类指标函数sklearn.metrics.classification_repor的用法详解（含源码）

2023-10-15 17:43:18

sklearn.metrics.classification_report

- 调整方法及参数：
- 参数说明
- - parameters:
  - Returns:
- 例子（官方文档）
- - 代码
  - 分析（针对第一个例子）

该函返回一个分类指标的结果，包括样本的precision、recall、accuracy、f1-score等

调整方法及参数：

from sklearn.metrics import classification_report
sklearn.metrics.classification_report(y_true, y_pred, *, labels=None, target_names=None, sample_weight=None, digits=2, output_dict=False, zero_division='warn')

官方score

参数说明

parameters:

y_true: 1d array-like, or label indicator array / sparse matrix. 真实标签
y_pred：1d array-like, or label indicator array / sparse matrix.预测标签
labels：array-like of shape (n_labels,), default=None.可选参数，要包含在报告中的可选标签索引列表，如[0,1,2]
target_names: list of str of shape (n_labels,), default=None.可选参数，与labels对应，分类的标签名，如[‘class0’, ‘class1’]
sample_weight: array-like of shape (n_samples,), default=None.样本的权重
digits：int, default=2. 用于格式化输出浮点值的位数。当output dict为True时，该值将被忽略，返回值不会四舍五入。
output_dict: bool, default=False. 如果为True则返回一个字典类型的报告
zero_division： “warn”, 0 or 1, default=”warn”. 设置当有零除法时返回的值。如果设置为warn，则其作用为0，但也会引发警告。

Returns:

report: str or dict

返回的内容包括precision、recall、f1-score、accuracy（后文根据距离例子介绍）、averages包括macro average、weight average、Micro average。

macro avarage: 每个标签的无权重均值；

weighted average: 根据每个标签样本权重计算的均值

Micro average: 所有TP、FN、FP的均值，只在多标签或者含子类的多分类问题中

例子（官方文档）

代码

from sklearn.metrics import classification_report
y_true = [0, 1, 2, 2, 2]
y_pred = [0, 0, 2, 2, 1]
target_names = ['class 0', 'class 1', 'class 2']
print(classification_report(y_true, y_pred, target_names=target_names))precision    recall  f1-score   supportclass 0       0.50      1.00      0.67         1class 1       0.00      0.00      0.00         1class 2       1.00      0.67      0.80         3accuracy                           0.60         5macro avg       0.50      0.56      0.49         5
weighted avg       0.70      0.60      0.61         5
y_pred = [1, 1, 0]
y_true = [1, 1, 1]
print(classification_report(y_true, y_pred, labels=[1, 2, 3]))precision    recall  f1-score   support1       1.00      0.67      0.80         32       0.00      0.00      0.00         03       0.00      0.00      0.00         0micro avg       1.00      0.67      0.80         3macro avg       0.33      0.22      0.27         3
weighted avg       1.00      0.67      0.80         3

分析（针对第一个例子）

首先对于y_true和y_pred画出混淆矩阵便于观察：

对于上图依次计算return中各个指标：

$\frac{TP}{TP+FP}$

$\frac{TP}{TP+FN}$

$\frac{right}{all}$

$\frac{2}{ \frac{1}{precision}+ \frac{1}{recall}}$

从class0开始分析：

TP，就是实际为正样本，预测也为正样本的，为混淆矩阵的（0,0）处的值：1

FP，就是实际为负样本，被预测为正样本的，为混淆矩阵的（1,0）和（1,2）处的值：1+0=1

FN，就是实际为正样本，被预测为负样本的，为混淆矩阵的（0,1）和（0,2）处的值：0+0=0

right，就是正样本被预测为正样本，负样本被预测为负样本，为（0,0）、（1,1）、（2,2）出处的值：1+0+2=3

all，就是总体样本数：5

因此class0对应的指标依次为：

$\frac{1}{1+1} = 0.5$

$\frac{1}{1+0} = 1$

$\frac{3}{5} = 0.6$

$\frac{2}{ \frac{1}{0.5}+ \frac{1}{1}}=0.67$

class1&class2相关指标计算同上，注意，对于class0他自身的标签可以看作为正例，它自身之外的所有标签都是反例。

最后，macro average为对应垂直方向上的指标的非加权均值，如precision的macro average为(0.5+0+1)/3=0.5；weight average为对应的指标与所占总体样本的权重的乘积，如precision的加权average为[(1/5)x0.5+(1/5)x0+(3/5)x1]=0.7

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 在安装docker时failure: repodata/repomd.xml from mirrors.aliyun.com_dockece_linux_centos_docker-ce.repor
下一篇 > 自定义Repor结构的开始

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce