GB/T 6380-2008 数据的统计处理和解释 Ⅰ型极值分布样本离群值的判断和处理
GB/T 6380-2008 Statistical interpretation of data—Detection and treatment of outliers in the sample from typeⅠextreme value distribution
基本信息
发布历史
-
1986年05月
-
2008年07月
-
2019年12月
研制信息
- 起草单位:
- 宁波工程学院、中国标准化研究院、北京大学、天津大学、海南省产品质量监督检验所
- 起草人:
- 荆广珠、丁文兴、于振凡、蔡军伟、孙山泽、马逢时、黄艳等
- 出版信息:
- 页数:12页 | 字数:21 千字 | 开本: 大16开
内容描述
ICS03.120.30
A41
中华人民共和国国家标准
GB/T6380—2008
代替GB/T6380—1986
数据的统计处理和解释
I型极值分布样本离群值的判断和处理
Statisticalinterpretationofdata—Detectionandtreatmentof
outliersinthesamplefromtype[extremevaluedistribution
2008-07-28发布2009-01-01实施
发布
GB/T6380—2008
目次
前言ni
引言N
1范围1
2规范性引用文件1
3术语、定义和符号1
3.1术语和定义1
3.2符号和缩略语2
4离群值判断2
4.1离群值的来源与判定2
4.2检出离群值个数的上限2
4.3单个离群值情形2
4.4多个离群值情形2
5离群值处理3
5.1处理方式3
5.2处理规则3
5.3备案3
6单个离群值的判断规则3
6.1检验方法的选择3
6.2狄克逊(Dixon)检验法3
6.3欧文(Irwin)检验法4
7多个离群值的判断规则5
7.1检验步骤5
7.2多个离群值检验示例5
附录A(规范性附录)临界值表6
参考文献8
T
GB/T6380—2008
-1.Z-—1—
刖弓
本标准代替GB/T6380—1986《数据的统计处理和解释I型极值分布样本异常值的判断和处
理》。本标准与GB/T6380—1986相比较,技术内容的变化主要包括:
—按GB/T1.1—2000《标准化工作导则第1部分:标准的结构和编写规则》的要求对标准格式
进行了修改;
——增加了术语、定义和符号;
—将标准名称中“I型极值分布样本异常值的判断和处理”改为“I型极值分布样本离群值的
断和处理”;
—将术语“检出异常值”和“高度异常值”分别改为“歧离值”和“统计离群值”,并进一步明确了二
者的含义及相互差异;
——增加了检出水平和剔除水平的定义;
-检出水平由原标准中“检出水平一般取为1%,5%或10%”改为“除非根据本标准达成协议的
各方另有约定,检出水平应为0.05”;
-明确规定剔除水平的值,除非根据本标准达成协议的各方另有约定,剔除水平应为0.01;
——增加了各种情形“统计离群值”的检验步骤;
——增加了“多个离群值的判断规则”;
—将“没有异常值”和“没有高度异常的异常值”分别改为“未发现离群值”和“未发现统计离群
值”。
本标准的附录A是规范性附录。
本标准由全国统计方法应用标准化技术委员会提出并归口。
本标准起草单位:宁波工程学院、中国标准化研究院、北京大学、天津大学、海南省产品质量监督检
验所。
本标准主要起草人:荆广珠、丁文兴、于振凡、蔡军伟、孙山泽、马逢吋、黄艳等。
本标准所代替标准的历次版本发布情况为:
——GB/T6380—1986
ni
GB/T6380—2008
引言
从事科学研究、工农业制造以及管理工作都离不开数据,而对这些数据的整理、分析和解释都离不
开统计方法。统计学是研究数字资料的整理、分析和正确解释的一门学科。人们各自从不同的来源取
得各种数字资料,这些数字资料通常都是杂乱无章的,必须经过整理和简缩才能利用,使用完善的统计
方法就可使数据整理、排列的有条有理,用图形或少量的几个重要参数,就可将大量数据的特征表达出
来,这样既可避免不正确的解释,又可将获得满意数据的成本降到最低限度,提高了经济效益。
国家标准《数据的统计处理和解释》包含以下各项:
——统计容忍区间的确定(GB/T3359)
——均值的估计和置信区间(GB/T3360)
——在成对观测值情形下两个均值的比较(GB/T3361)
——二项分布参数的估计与检验(GB/T4088)
——泊松分布参数的估计和检验(GB/T4089)
——正态性检验(GB/T4882)
——正态样本离群值的判断和处理(GB/T4883)
——正态分布均值和方差的估计与检验(GB/T4889)
——正态分布均值和方差检验的功效(GB/T4890)
——I型极值分布样本离群值的判断和处理(GB/T6380)
——伽玛分布(皮尔逊IH型分布)的参数估计(GB/T8055)
——指数分布样本离群值的判断和处理(GB/T8056)
本标准尚无相应的国际标准。
GB/T6380—2008
数据的统计处理和解释
I型极值分布样本离群值的判断和处理
1范围
本标准规定了判断和处理I型极值分布的样本中上侧离群值和I型极小值分布的样本中下侧离群
值的一般原则和实施方法。
本标准适用于来自I型极值分布或I型极小值分布总体的样本。
本标准适用于样本量为5至50的情形。
注:由于经过变换Z=—X后,T型极小值分布的随机变量将服从T型极值分布,所以只对T型极值分布给出检出
上侧离群值的方法。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有
的修改单(不包括勘误的内容)或修订版本均不适于本标准,然而,鼓励根据本标准达成协议的各方研究
是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
IS3534-1=2006统计学词汇及符号第1部分:一般统计术语与用于概率的术语
IS3534-2=2006统计学词汇及符号第2部分:应用统计
3术语、定义和符号
IS3534-1:2006JS()3534-2=2006确立的术语、定义和符号以及下列术语、定义和符号适用于本
标准。
3.1术语和定义
3.1.1
I型极值分布typeIextremevaluedistribution(Gumbeldistribution)
具有下述分布函数的连续型分布。
F(.r)=exp(—er(r~a)/b)
其中:〃>0,—x>0<+oo
3.1.2
I型极小值分布typeIminimumvaluedistribution
具有下述分布函数的连续型分布。
F(z)=1—exp(—
其中:方>0,—oo<h<+oo
3.1.3
离群值outlier
样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。
注:离群值按显著性的程度分为歧离值和统计离群值。
3.1.4
统计离群值statisticaloutlier
在剔除水平(3.1.7)下统计检验为显著的离群值。
1
GB/T6380—2008
3.1.5
歧离值straggler
在检出水平(3.1.6)下显著,但在剔除水平(3.1.7)下不显著的离群值。
3.1.6
检出水平detectionlevel
为检出离群值而指定的统计检验的显著性水平。
注:除非根据本标准达成协议的各方另有约定,检出水平应为0.05。
3.1.7
剔除水平deletionlevel
为检出离群值是否高度离群而指定的统计检验的显著性水平。
注:剔除水平的值应不超过检出水平的值。除非根据本标准达成协议的各方另有约定,剔除水平应为0.01。
3.2符号和缩略语
”样本量(观测值个数)
a检验离群值所使用的显著性水平,简称检出水平
/检验统计离群值所使用的显著性水平,简称剔除水平(/<«)
工⑺观测值自小到大排序后的第/个值
D”样本量5<»<30时,检验最大的观测值X”〉是否为离群值时所用的统计量
从_。(")检出水平为a吋,用统计量D,作检验时的临界值
仁样本量30<//<50时,检验最大的观测值不”〉是否为离群值时所用的统计量
检出水平为a吋,用统计量I”作检验时的临界值
4离群值判断
4.1离群值的来源与判定
4.1.1来源
离群值按产生原因分为两类:第一类离群值是总体固有变异性的极端表现,这类离群值与样本中其
余观测值属于同一总体;第二类离群值是由于试验条件和试验方法的偶然偏离所产生的结果,或产生于
观测、记录、计算中的失误,这类离群值与样本中其余观测值不属于同一总体。
4.1.2判定
对离群值的判定通常可根据技术上或物理上的理由直接进行,例如当试验者已经知道试验偏离规
定的试验方法,或测试仪器发生问题等。当上述理由不明确吋,可用本标准规定的方法。
4.2检出离群值个数的上限
应规定在样本中检出离群值个数的上限(与样本量相比应较小),当检出离群值个数达到了这个上
限时,对此样本应作慎重的研究和处理。
4.3单个离群值情形
检验规则如下:
a)原假设为所有观测值来自同一总体,备择假设为观测数据有下侧离群值,根据统计学原理选用
判断离群值的统计量(见6.1);
b)确定适当的显著性水平;
c)根据显著性水平及样本量,确定检验的临界值;
d)由观测值计算相应统计量的值,根据所得值与临界值的比较结果作出判断。
4.4多个离群值情形
在允许检出离群值的个数大于1的情况下,重复使用4.3规定的检验规则进行检验,并按下述规则
决定检验停止的时机:
2
GB/T6380—2008
a)若没有检出离群值,则整个检验停止;
b)
定制服务
推荐标准
- JY/T 0657-2025 普通高中地理教学装备配置标准 2025-06-12
- JY/T 0656-2025 普通高中生物学教学装备配置标准 2025-06-12
- JY/T 0654-2025 普通高中物理教学装备配置标准 2025-06-12
- JY/T 0655-2025 普通高中化学教学装备配置标准 2025-06-12
- T/GARIRPA 016-2025 岩黄连种苗繁育及仿野生栽培技术规程 2025-06-27
- DB1508/T 171-2025 酸枣生态种植技术规程 2025-06-19
- JY/T 0653-2025 普通高中数学教学装备配置标准 2025-06-12
- JY/T 0658-2025 普通高中通用技术教学装备配置标准 2025-06-12
- DB1508/T 170-2025 酸枣覆膜育苗技术规程 2025-06-19
- DB1508/T 169-2025 细穗柽柳育苗及造林技术规程 2025-06-19