GB/T 6380-2008 数据的统计处理和解释 Ⅰ型极值分布样本离群值的判断和处理

GB/T 6380-2008 Statistical interpretation of data—Detection and treatment of outliers in the sample from typeⅠextreme value distribution

国家标准 中文简体 被代替 已被新标准代替,建议下载标准 GB/T 6380-2019 | 页数:12页 | 格式:PDF

基本信息

标准号
GB/T 6380-2008
相关服务
标准类型
国家标准
标准状态
被代替
中国标准分类号(CCS)
国际标准分类号(ICS)
发布日期
2008-07-28
实施日期
2009-01-01
发布单位/组织
中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会
归口单位
全国统计方法应用标准化技术委员会
适用范围
本标准规定了判断和处理Ⅰ型极值分布的样本中上侧离群值和Ⅰ型极小值分布的样本中下侧离群值的一般原则和实施方法。 本标准适用于来自Ⅰ型极值分布或Ⅰ型极小值分布总体的样本。 本标准适用于样本量为5至50的情形。

研制信息

起草单位:
宁波工程学院、中国标准化研究院、北京大学、天津大学、海南省产品质量监督检验所
起草人:
荆广珠、丁文兴、于振凡、蔡军伟、孙山泽、马逢时、黄艳等
出版信息:
页数:12页 | 字数:21 千字 | 开本: 大16开

内容描述

ICS03.120.30

A41

中华人民共和国国家标准

GB/T6380—2008

代替GB/T6380—1986

数据的统计处理和解释

I型极值分布样本离群值的判断和处理

Statisticalinterpretationofdata—Detectionandtreatmentof

outliersinthesamplefromtype[extremevaluedistribution

2008-07-28发布2009-01-01实施

发布

GB/T6380—2008

目次

前言ni

引言N

1范围1

2规范性引用文件1

3术语、定义和符号1

3.1术语和定义1

3.2符号和缩略语2

4离群值判断2

4.1离群值的来源与判定2

4.2检出离群值个数的上限2

4.3单个离群值情形2

4.4多个离群值情形2

5离群值处理3

5.1处理方式3

5.2处理规则3

5.3备案3

6单个离群值的判断规则3

6.1检验方法的选择3

6.2狄克逊(Dixon)检验法3

6.3欧文(Irwin)检验法4

7多个离群值的判断规则5

7.1检验步骤5

7.2多个离群值检验示例5

附录A(规范性附录)临界值表6

参考文献8

T

GB/T6380—2008

-1.Z-—1—

刖弓

本标准代替GB/T6380—1986《数据的统计处理和解释I型极值分布样本异常值的判断和处

理》。本标准与GB/T6380—1986相比较,技术内容的变化主要包括:

—按GB/T1.1—2000《标准化工作导则第1部分:标准的结构和编写规则》的要求对标准格式

进行了修改;

——增加了术语、定义和符号;

—将标准名称中“I型极值分布样本异常值的判断和处理”改为“I型极值分布样本离群值的

断和处理”;

—将术语“检出异常值”和“高度异常值”分别改为“歧离值”和“统计离群值”,并进一步明确了二

者的含义及相互差异;

——增加了检出水平和剔除水平的定义;

-检出水平由原标准中“检出水平一般取为1%,5%或10%”改为“除非根据本标准达成协议的

各方另有约定,检出水平应为0.05”;

-明确规定剔除水平的值,除非根据本标准达成协议的各方另有约定,剔除水平应为0.01;

——增加了各种情形“统计离群值”的检验步骤;

——增加了“多个离群值的判断规则”;

—将“没有异常值”和“没有高度异常的异常值”分别改为“未发现离群值”和“未发现统计离群

值”。

本标准的附录A是规范性附录。

本标准由全国统计方法应用标准化技术委员会提出并归口。

本标准起草单位:宁波工程学院、中国标准化研究院、北京大学、天津大学、海南省产品质量监督检

验所。

本标准主要起草人:荆广珠、丁文兴、于振凡、蔡军伟、孙山泽、马逢吋、黄艳等。

本标准所代替标准的历次版本发布情况为:

——GB/T6380—1986

ni

GB/T6380—2008

引言

从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不

开统计方法。统计学是研究数字资料的整理、分析和正确解释的一门学科。人们各自从不同的来源取

得各种数字资料,这些数字资料通常都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计

方法就可使数据整理、排列的有条有理,用图形或少量的几个重要参数,就可将大量数据的特征表达出

来,这样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益。

国家标准《数据的统计处理和解释》包含以下各项:

——统计容忍区间的确定(GB/T3359)

——均值的估计和置信区间(GB/T3360)

——在成对观测值情形下两个均值的比较(GB/T3361)

——二项分布参数的估计与检验(GB/T4088)

——泊松分布参数的估计和检验(GB/T4089)

——正态性检验(GB/T4882)

——正态样本离群值的判断和处理(GB/T4883)

——正态分布均值和方差的估计与检验(GB/T4889)

——正态分布均值和方差检验的功效(GB/T4890)

——I型极值分布样本离群值的判断和处理(GB/T6380)

——伽玛分布(皮尔逊IH型分布)的参数估计(GB/T8055)

——指数分布样本离群值的判断和处理(GB/T8056)

本标准尚无相应的国际标准。

GB/T6380—2008

数据的统计处理和解释

I型极值分布样本离群值的判断和处理

1范围

本标准规定了判断和处理I型极值分布的样本中上侧离群值和I型极小值分布的样本中下侧离群

值的一般原则和实施方法。

本标准适用于来自I型极值分布或I型极小值分布总体的样本。

本标准适用于样本量为5至50的情形。

注:由于经过变换Z=—X后,T型极小值分布的随机变量将服从T型极值分布,所以只对T型极值分布给出检出

上侧离群值的方法。

2规范性引用文件

下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有

的修改单(不包括勘误的内容)或修订版本均不适于本标准,然而,鼓励根据本标准达成协议的各方研究

是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。

IS3534-1=2006统计学词汇及符号第1部分:一般统计术语与用于概率的术语

IS3534-2=2006统计学词汇及符号第2部分:应用统计

3术语、定义和符号

IS3534-1:2006JS()3534-2=2006确立的术语、定义和符号以及下列术语、定义和符号适用于本

标准。

3.1术语和定义

3.1.1

I型极值分布typeIextremevaluedistribution(Gumbeldistribution)

具有下述分布函数的连续型分布。

F(.r)=exp(—er(r~a)/b)

其中:〃>0,—x>0<+oo

3.1.2

I型极小值分布typeIminimumvaluedistribution

具有下述分布函数的连续型分布。

F(z)=1—exp(—

其中:方>0,—oo<h<+oo

3.1.3

离群值outlier

样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。

注:离群值按显著性的程度分为歧离值和统计离群值。

3.1.4

统计离群值statisticaloutlier

在剔除水平(3.1.7)下统计检验为显著的离群值。

1

GB/T6380—2008

3.1.5

歧离值straggler

在检出水平(3.1.6)下显著,但在剔除水平(3.1.7)下不显著的离群值。

3.1.6

检出水平detectionlevel

为检出离群值而指定的统计检验的显著性水平。

注:除非根据本标准达成协议的各方另有约定,检出水平应为0.05。

3.1.7

剔除水平deletionlevel

为检出离群值是否高度离群而指定的统计检验的显著性水平。

注:剔除水平的值应不超过检出水平的值。除非根据本标准达成协议的各方另有约定,剔除水平应为0.01。

3.2符号和缩略语

”样本量(观测值个数)

a检验离群值所使用的显著性水平,简称检出水平

/检验统计离群值所使用的显著性水平,简称剔除水平(/<«)

工⑺观测值自小到大排序后的第/个值

D”样本量5<»<30时,检验最大的观测值X”〉是否为离群值时所用的统计量

从_。(")检出水平为a吋,用统计量D,作检验时的临界值

仁样本量30<//<50时,检验最大的观测值不”〉是否为离群值时所用的统计量

检出水平为a吋,用统计量I”作检验时的临界值

4离群值判断

4.1离群值的来源与判定

4.1.1来源

离群值按产生原因分为两类:第一类离群值是总体固有变异性的极端表现,这类离群值与样本中其

余观测值属于同一总体;第二类离群值是由于试验条件和试验方法的偶然偏离所产生的结果,或产生于

观测、记录、计算中的失误,这类离群值与样本中其余观测值不属于同一总体。

4.1.2判定

对离群值的判定通常可根据技术上或物理上的理由直接进行,例如当试验者已经知道试验偏离规

定的试验方法,或测试仪器发生问题等。当上述理由不明确吋,可用本标准规定的方法。

4.2检出离群值个数的上限

应规定在样本中检出离群值个数的上限(与样本量相比应较小),当检出离群值个数达到了这个上

限时,对此样本应作慎重的研究和处理。

4.3单个离群值情形

检验规则如下:

a)原假设为所有观测值来自同一总体,备择假设为观测数据有下侧离群值,根据统计学原理选用

判断离群值的统计量(见6.1);

b)确定适当的显著性水平;

c)根据显著性水平及样本量,确定检验的临界值;

d)由观测值计算相应统计量的值,根据所得值与临界值的比较结果作出判断。

4.4多个离群值情形

在允许检出离群值的个数大于1的情况下,重复使用4.3规定的检验规则进行检验,并按下述规则

决定检验停止的时机:

2

GB/T6380—2008

a)若没有检出离群值,则整个检验停止;

b)

定制服务

    推荐标准