数据报告

数据校验

class ricco.etl.data_reporter.DataReporter(data: (<class 'str'>, <class 'pandas.core.frame.DataFrame'>), only: list | None = None, exclude: list | None = None)

基类:Docx

数据检测并生成描述性统计报告,方便排查数据问题

参数:
  • data – 待检测的数据,文件路径或Dataframe

  • only – 要检测的列

  • exclude – 要排除的列,如果only有值,则以only为准

Methods:

basic()

基础信息描述

col_by_col()

逐列检测

examine_all(file_path)

整套流程

preprocess()

数据预处理

basic()

基础信息描述

col_by_col()

逐列检测

examine_all(file_path)

整套流程

preprocess()

数据预处理