tnblog
首页
视频
资源
登录

HugginFace 使用评价指标工具(学习笔记)

5163人阅读 2023/10/22 16:05 总访问:3455877 评论:0 收藏:0 手机
分类: python

HugginFace 使用评价指标工具(学习笔记)

评价指标工具介绍


在训练和测试一个模型时往往需要计算不同的评价指标,如正确率、查准率、查全率、F1值等,具体需要的指标往往和处理的数据集、任务类型有关,HuggingFace提供了统一的评价指标工具,能够将具体的计算过程隐藏,调用者只需要提供计算结果,由评价指标工具给出评价指标的。

使用评价指标工具

列出可用的评价指标


使用list_metrics()函数课获取可用的评价指标列表,代码如下:

  1. from datasets import list_metrics
  2. metrics_list = list_metrics()
  3. len(metrics_list), metrics_list[:5]


我们可以看到这里有136个评价指标,由于篇幅原因这里只展示的5个。

加载一个评价指标


使用load_metric()函数加载一个评价指标。评价指标往往和对应的数据集配套使用,这里以glue数据集中的mrpc子集为例,代码如下:

  1. from datasets import load_metric
  2. metric = load_metric(path='glue', config_name='mrpc')


但并不是所有的数据集都有对应的评价指标在实际使用时以满足需求为准则选择合适的评价指标即可。

获取评价指标的使用说明


评价指标的inputs_description属性为一段文本,描述了评价指标的使用方法,不同的评价指标需要的输入往往是不同的,代码如下:

  1. print(metric.inputs_description)


输出的内容很长,包括了对此评价指标的介绍,要求输入格式的说明,输出指标的说明,以及部分示例代码,此处节选的部分翻译内容如下:

  1. 计算与每个 GLUE 数据集相关的 GLUE 评估指标。
  2. 参数:
  3. predictions:要评分的预测列表。
  4. 每个翻译都应标记为一个标记列表。
  5. references:每个翻译的引用列表。
  6. 每个参考资料都应标记为一个词块列表。
  7. 返回值:根据 GLUE 子集,一个或多个返回值:
  8. "accuracy" 准确度
  9. "f1": F1 分数
  10. "pearson" pearson 相关
  11. "spearmanr" spearmanr 相关
  12. "matthews_correlation" matthews 相关
  13. 示例:
  14. >>> glue_metric = datasets.load_metric('glue', 'sst2') # 'sst2' or any of ["mnli", "mnli_mismatched", "mnli_matched", "qnli", "rte", "wnli", "hans"]
  15. >>> references = [0, 1]
  16. >>> predictions = [0, 1]
  17. >>> results = glue_metric.compute(predictions=predictions, references=references)
  18. >>> print(results)
  19. {'accuracy': 1.0}

计算评价指标


按照上面的示例代码,可以实际的计算此评价指标,代码如下:

  1. predictions = [0, 1, 0]
  2. references = [0, 1, 1]
  3. metric.compute(predictions=predictions, references=references)


可以看到,这个评价指标的计算输出包括正确率和F1值。


欢迎加群讨论技术,1群:677373950(满了,可以加,但通过不了),2群:656732739

评价

HugginFace 初探

HugginFace 初探[TOC] 安装环境python环境是3.6。import sys sys.version 安装torch,简单起见,避免环境问题,并且计...

HugginFace 使用编码工具(学习笔记)

HugginFace 使用编码工具(学习笔记)[TOC] 安装环境# 我这里的python是3.11 %pip install -q transformers==4.18 datasets...

HugginFace 使用数据集(学习笔记)

HugginFace 使用数据集(学习笔记)[TOC] 数据集工具介绍HuggingFace 提供了统一的数据集处理工具,让不同的数据集通过统一...

HugginFace 使用管道工具(学习笔记)

HugginFace 使用管道工具(学习笔记)[TOC] 管道工具介绍HuggingFace 有一个巨大的模型库,其中一些是已经非常成熟的经典模...

HugginFace 使用训练工具(学习笔记)

HugginFace 使用训练工具(学习笔记)[TOC] 训练工具介绍HuggingFace提供了巨大的模型库,但我们往往还需要对特定的数据集进...

HugginFace 中文情感分类(学习笔记)

HugginFace 中文情感分类(学习笔记)[TOC] 数据集介绍本章使用的是lansinuote/ChnSentiCorp数据集,这是一个情感分类数据集...

HugginFace 中文填空(学习笔记)

HugginFace 中文填空(学习笔记)[TOC] 数据集介绍本章使用的仍然是情感分类数据集,每条包括一句购物评价一集以及是不是好...

HugginFace 中文数据关系推断(学习笔记)

HugginFace 中文数据关系推断(学习笔记)[TOC] 实现代码安装包加载的环境可以通过如下命令进行安装。%pip install -q trans...

HugginFace 中文命名实体识别(学习笔记)

HugginFace 中文命名实体识别(学习笔记)[TOC] 任务简介简单来说就是的识别人名、机构名、地名。数据集的介绍本章所使用的...

常用的很厉害的工具

图片压缩相对图片无损放大来说是小kiss。下面是非常非常帅气的图片无损放大http://bigjpg.com/图片压缩https://www.upyun.c...

一些有用的资源分享(工具+电子书)

工具类图片相关工具TinyPNG:https://tinypng.com/ 免费的在线图片压缩工具,压缩率高,无损画质,直接拖拽使用,很方便。p...

开发自己的代码生成工具

在一个项目中其实有很多代码都是重复的,几乎每个基础模块的代码都有增删改查的功能,而这些功能都是大同小异,如果这些功...

windoes 强力下载工具Internet Download Manager

大家好,我是刘小贱,今天呢我给大家推荐一款Windows系统上的下载神器:Internet Download Manager ,这款软件通过在浏览器上...

net core使用jwt 三: 使用过滤器实现通用token验证Token验证工具

net core使用jwt二 : 验证前台传递的tokenhttp://www.tnblog.net/aojiancc2/article/details/2845过滤器实现通用token验证...

oralce plsql打开执行sql的工具

如果不小心关闭了,要打开执行sql的工具栏如下箭头的地方右键即可
这一世以无限游戏为使命!
排名
2
文章
633
粉丝
44
评论
93
docker中Sware集群与service
尘叶心繁 : 想学呀!我教你呀
一个bug让程序员走上法庭 索赔金额达400亿日元
叼着奶瓶逛酒吧 : 所以说做程序员也要懂点法律知识
.net core 塑形资源
剑轩 : 收藏收藏
映射AutoMapper
剑轩 : 好是好,这个对效率影响大不大哇,效率高不高
ASP.NET Core 服务注册生命周期
剑轩 : http://www.tnblog.net/aojiancc2/article/details/167
ICP备案 :渝ICP备18016597号-1
网站信息:2018-2025TNBLOG.NET
技术交流:群号656732739
联系我们:contact@tnblog.net
公网安备:50010702506256
欢迎加群交流技术