博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
文本分类之六分类结果评估
阅读量:6949 次
发布时间:2019-06-27

本文共 812 字,大约阅读时间需要 2 分钟。

机器学习领域的算法评估有三个基本的指标。

  1. 召回率(Recall Rate,也叫查全率):是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率。
    召回率=系统检索到的相关文档数/系统所有相关文档的总数
  2. 准确率(Precision,也称为精度):是检索出的相关文档数与检索出的文档总数的比率,衡量的是检索系统的查准率。
    准确率=系统检索到的相关文件/系统所有检索到的文件总数

注意:准确率和召回率是互相影响的,理想情况下肯定是做到二者都高,但是一般情况下,准确率高,召回率就低;反之亦然。

  1. F-Score:机器学习中常用的评价标准。其中,最常见的是F1-Measure,公式为:F1=2PR/(P+R)
    文本分类项目的分类结果评估,代码如下:
from sklearn import metricedef metrics_result(actual, predict):      print '精度:{0:.3f}'.format(metrics.precision_score(actual, predict,average='weighted'))      print '召回:{0:0.3f}'.format(metrics.recall_score(actual, predict,average='weighted'))      print 'f1-score:{0:.3f}'.format(metrics.f1_score(actual, predict,average='weighted'))    metrics_result(test_set.label, predicted)

注意:单独运行这个代码会报错,把这一部分加到贝叶斯模型的程序中运行,就可以得到正确的结果。

转载于:https://www.cnblogs.com/sanmenyi/p/7040400.html

你可能感兴趣的文章
WP7基础学习---第十五讲
查看>>
mysql linux app
查看>>
DotNetCore学习-3.管道中间件
查看>>
Python基础11_函数名运用,闭包,迭代器
查看>>
java集合框架
查看>>
python之configparse模块
查看>>
用户数据文件损坏
查看>>
linux使用FIO测试磁盘的iops
查看>>
As3多线程
查看>>
CentOS6.2编译安装MySQL5.5.25
查看>>
Nyoj 星际之门(一)(Cayley定理)
查看>>
词法分析程序
查看>>
Mybatis 动态sql
查看>>
前端基础之css
查看>>
HTML标签权重分值排列
查看>>
sqlserver 2008手工修改表结构,表不能保存的问题与解决方法
查看>>
网址收藏
查看>>
Gtest:Using visual studio 2017 cross platform feature to compile code remotely
查看>>
Android Span的简单使用
查看>>
Aggressive cows 二分不仅仅是查找
查看>>