GB/T 10092-2009 数据的统计处理和解释 测试结果的多重比较
GB/T 10092-2009 Statistical interpretation of data—Multiple comparison for test results
基本信息
发布历史
-
1988年12月
-
2009年10月
研制信息
- 起草单位:
- 中国标准化研究院、中国科学院数学与系统科学研究院、深圳计量检测研究院、北京理工大学
- 起草人:
- 丁文兴、项可风、张鹏、谢田法、于振凡、陈敏、吴国富等
- 出版信息:
- 页数:23页 | 字数:42 千字 | 开本: 大16开
内容描述
ICS03.120.30
A41OB
中华人民共和国国家标准
GB/T10092—2009
代替GB/T10092—1988
数据的统计处理和解释
测试结果的多重比较
Statisticalinterpretationofdata—Multiplecomparisonfortestresults
2009-10-15发2009-12-01实施
发
GB/T10092—2009
目次
前言ni
i范围1
2规范性引用文件1
3术语和定义1
4试验领导小组及其职责2
5测试结果的整理、计算和检验2
5.1测试结果的整理2
5.2计算各处理的平均值和处理的样本方差3
5.3方差齐性检验3
5.4重新计算处理的平均值并计算公共方差的估计值3
6多重比较程序4
6.1怡种处理与参照处理之间的比较4
6.2怡种处理的两两比较(T法)5
6.3几组处理均值间的比较(S法)6
7应用示例6
附录A(规范性附录)不同多重比较方法的选择和试验重复次数"的确定11
附录B(资料性附录)多重比较的统计用表12
T
GB/T10092—2009
-1.Z-—1—
刖弓
“数据的统计处理和解释”包括以下国家标准:
——GB/T3359数据的统计处理和解释统计容忍区间的确定
——GB/T3361数据的统计处理和解释在成对观测值情形下两个均值的比较
——GB/T4087数据的统计处理和解释二项分布可靠度单侧置信下限
——GB/T4088数据的统计处理和解释二项分布参数的估计与检验
——GB/T4089数据的统计处理和解释泊松分布参数的估计和检验
——GB/T4882数据的统计处理和解释正态性检验
——GB/T4883数据的统计处理和解释正态样本离群值的判断和处理
——GB/T4885正态分布完全样本可靠度置信下限
-GB/T4889数据的统计处理和解释正态分布均值和方差的估计与检验
——GB/T4890数据的统计处理和解释正态分布均值和方差检验的功效
——GB/T8055数据的统计处理和解释卩分布(皮尔逊皿型分布)的参数估计
—数据的统计处理和解释指数分布样本离群值的判断和处理
—GB/T8056
—GB/T6380数据的统计处理和解释I型极值分布样本离群值的判断和处理
——GB/T10092数据的统计处理和解释测试结果的多重比较
-GB/T10094正态分布分位数与变异系数的置信限
本标准代替GB/T10092—1988《测试结果的多重比较》。
本标准与GB/T10092—1988相比主要变化如下:
—按GB/T1.1—2000《标准化工作导则第1部分:标准的结构和编写规则》的要求对标准格式
进行了修订;
-增加了术语和定义;
——将“方差的一致性检验”改为“方差齐性检验”;
——修改了“4.3方差的一致性检验”部分4.3.2后的注;
-统一将“处理结果的比较”改为“处理的比较”;
——改正了一些错误的公式;
——删去了GB/T10092—1988中的附录C。
本标准的附录A为规范性附录,附录B为资料性附录。
本标准由全国统计方法应用标准化技术委员会(SAC/TC21)提出并归口。
本标准起草单位:中国标准化研究院、中国科学院数学与系统科学研究院、深圳计量检测研究院、北
京理工大学。
本标准主要起草人:丁文兴、项可风、张鹏、谢出法、于振凡、陈敏、吴国富等。
本标准所代替标准的历次版本发布情况为:
—GB/T10092—1988O
ni
GB/T10092—2009
数据的统计处理和解释
测试结果的多重比较
1范围
本标准规定了对多种处理的同一单项指标进行多重比较试验及统计分析的基本原则和方法,用以
求得比较的结论。
本标准适用于生产和科学实验中的任意同一单项指标(均值)的比较问题。如比较几种产品的质量
指标,几种工艺条件或几种试验方法的结果。
注:本标准假设同一种处理的测试结果是来白同一正态总体,参与比较的不同处理的方差基本一致。
2规范性引用文件
下列文件中的条款通过本标准的引用而成为本标准的条款。凡是注日期的引用文件,其随后所有
的修改单(不包括勘误的内容)或修订版均不适用于本标准,然而,鼓励根据本标准达成协议的各方研究
是否可使用这些文件的最新版本。凡是不注日期的引用文件,其最新版本适用于本标准。
GB/T3358.1统计学词汇及符号第1部分:一般统计术语与用于概率的术语(GB/T3358.1-
2009,ISO3534-1:2006,IDT)
GB/T3358.2统计学词汇及符号第2部分:应用统计(GB/T335&2—2009,ISO3534-2:2006,
IDT)
GB/T3358.3统计学词汇及符号第3部分:实验设计(GB/T335&3—2009,ISO3534-3:1999,
IDT)
GB/T6379.2测量方法与结果的准确度(正确度与精密度)第2部分:确定标准测量方法重复
性与再现性的基本方法(GB/T6379.2—2004,ISO5725-2:1994,IDT)
3术语和定义
GB/T3358.1.GB/T335&2和GB/T335&3确立的以及下列术语和定义适用于本标准。
3.1
测试结果tesresults
按规定的测试方法所获得的特性值。
注1:测试方法宜指明观测是一个还是多个,报告的测试结果是观测值的平均数还是它的其他函数(例如中位数或
标准差)。它可以要求按适用的标准进行修正,如气体体积按标准温度和压力进行的修正。因此一个测试结
果可以是通过几个观测值讣算的结果。在最简单情形,测试结果即为观测值本身。
注2:测试方法在ISO/IEC导则2中定义为“完成某项测试的规定技术程序”。
3.2
处理treatmen
参与比较的各种对象称为处理。
3.3
参照处理referencetreatmen
在处理的比较中起着基准作用的特殊处理。
3.4
多重比较multiplecomparison
同时比较多种处理之间有无显著性差异的统计检验。
GB/T10092—2009
3.5
试样tessample
制备所得的可用于一次或数次测试或分析的样本。
3.6
离群值outlier
样本中的一个或几个观测值,它们离开其他观测值较远,暗示它们可能来自不同的总体。
4试验领导小组及其职责
应当有组织有计划地进行多重比较试验,由负责试验的单位或部门组织试验领导小组,该小组至少
有一名成员具有统计数据分析知识并且懂得多重比较方法的应用。
领导小组应讨论和确定:
a)本次试验屮处理的具体含义。
b)本次试验中所比较的单项指标。
c)应选用哪一种统计方法进行比较;一旦确定以后,就不能随意更改。
d)每种处理的试验重复次数"取多大(见附录A)。
e)如何安排好试验,保证同一处理的”次重复是在基本相同的条件下进行。
f)如何保证样本抽取的随机性。
g)在试样的制备、分发、运输、储存及测试等各环节如何保证试样的均匀性。
h)对测试结果进行统计分析,讨论有关统计分析的报告,做出比较的结论。
5测试结果的整理、计算和检验
5.1测试结果的整理
将测试结果整理成表1的形式。
表1
处理试验重复次数n观测值为和
1.yu,)12,•••,小丁1
2)21,)22,…,珈2t2
::
knt"1,必2,…,畑Tk
总和NT
参照处理必.V01,)02,…?.Vo„oTo
总和NT
表中:
旳为第,种处理的第丿次观测值;
心为第7:种处理的试验重复次数。在设计试验时,一般要求心尽可能相同。
Ti=工力
>=1
kk
T=J;T,f=2t„
?=1?=0
2
GB/T10092—2009
k
N=工n,
i=1?=0
5.2计算各处理的平均值和处理的样本方差
按式(1)计算各处理的平均值:
卩=—,i=0,1,-,k(1)
"i
按式(2)计算各处理的样本方差:
U.
[§(”)2_n,i=0,1,…M(2)
n,
将计算结果整理成表2的形式。
表2
处理试验重复次数"各处理的平均值刃各处理的样本方差S?
1
2"2
:
:
k
参照处理
5.3方差齐性检验
5.3.1为保证参与比较试验的不同处理的方差基本相等,必须进行方差齐性检验。在检验前首先应要
求各处理重复测试结果中没有离群值,为此有必要采用GB/T6379.2中规定的格拉布斯(Grubbs)检验
和狄克逊(Dixon)检验以发现离群值。
5.3.2本标准规定用科克伦(Cochran)检验法检验各处理的方差齐性。按式(3)计算科克伦检验统计
量C的数值。
C=-(3)
7=1
式中:
sLx—诸sf中的最大值。
科克伦检验的临界值表参见表B.1。表中“为试验重复次数。
注:如有些处理的试验重复次数不同时,"取大多数处理的重复次数。
若科克伦检验统计量c的数值大于0.05(或0.01)临界值,则除去S爲X以后,继续对其余^-1个方
差中的最大方差进行检验,直到其余方差都满足方差齐性要求为止。
因方差过大而被剔除的处理,不能参与比较,应将其全部数据剔除。
注:本标准规定的科克伦检验是一种单侧方差齐性检验。它只检出最大方差中不满足齐性要求者。实际上可能有
的处理方差偏小而不满足齐性要求,本标准没有考虑偏小方差的检验问题。
5.4重新计算处理的平均值并计算公共方差的估计值
经过离群值检验,方差齐性检验和更正或剔除数据之后,处理的个数、各处理的试验重复次数、平均
值和处理的样本方差都可能发生变化,因此,应重新计算某些处理的平均值刃并计算公共方差的估计
值F。
将计算结果整理成表3的形式。为简单起见,表3中符号灯、心的数值可能有变化,但符号仍
不变。
3
GB/T10092—2009
表3
处理试验重复次数n各处理的平均值.V,各处理的样本方差Sf公共方差估讣值F
1S?
:::
kS,2
参照处理%、餵
表中:
k为科克伦检验后最终保留的处理个数;
为剔除离群值后第/种处理的试验重复次数;
刃为经离群值检验和更正或剔除数据之后,计算得到的第,种处理的平均值,9=十;
Sf为经离群值检验和更正或剔除数据之后,计算得到的第:种处理的样本方差;
而F为公共方差的估计值,计算方法如下:
当无参照处理结果吋,
kk"ik丁2
,(儿—i)&s—S
夕=―=二^_—一-(4)
1)z
7=1
其中f=N-k为自由度;
当有参照处理结果吋,
kknik丁2
S(",—l)Sf,立述—£十
=UO__________=—「:•.—1一0•(5)
究(H,—1)f
i=0
其中/=N-(^+l)为自由度。
6多重比较程序
6.1k种处理与参照处理之间的比较
6.1.1参与比较的k种处理和参照处理的试验重复次数相等(n0=«,=«2=-=«*=«)的情形(D法)
实施步骤:
a)按第5章的程序,得到表3中参照处理和其他k种处理的平均值弘,刃,…,刃.及公共方差的估
计值F。
b)给定显著性水平a(—般取a=0.05或0.01),计算自由度于=N-(^+1),根据a,/查表
B2,得d^k,f)的值。
注:在此情形可不理会dAk,f)右上角g的值。
c)由以下公式计算人的值:
k=clAk,'f(6)
An
d)结论:在口®…,気中,凡落在(艮一区间内的处理,均判在水平a下与参照处理
无显著差异;凡落在(片一-,W+Q区间外的处理,均判在水平a下与参照处理有显著差异。
6.1.2参照处理的试验重复次数大于其他《种处理的试验重复次数,且其他处理的试验重复次数相等
So>农1=兀2…=心=斤)的情形(D法)
实施步骤:
4
GB/T10092—2009
a)同6.1.la);
b)给定显著性水平a(—般取«=0.05或0.01),计算自由度/=N-(^+l),根据a,/查表
B.2得da(kJ,其右上角小号数值q用于心>“吋计算修正值〃;(k,f,公式为:
d;(k,f=[1+*1—产)/100]〃"/)(7)
例如:k=2,心=21,,=“2=11,/=40,a=0.05
查表B.2得:2.291-4,即儿.。5(2,40)=2.29,y=1.4,则
血。5(2,40)=[l+1.4(l—^)/100]X2.29=2.31
c)由以下公式计算―的值:
〜;i1
4(-^+-V(8)
0»0"
d)同6.1.1d)o
6.1.3参照处理的结果为已知的情形
实施步骤:
a)按第5章的程序,得到表3中怡种处理的平均值0,凫,…,刃及公共方差估计值F。
b)给定显著性水平a,计算自由度=N—k及饥=1—(1—aX,〃=1—x/2。由.f,”查
表B.3的/分布分位数表,得tfi(/)的值。
c)由以下公式计算的仃G)值:
la(i=tp(/)'—,'=1,2,…,&(9)
d)结论:分别比较b种处理的平均值刃,艮,…,风与参照处理已知值*之差。凡|刃一刃|£
/„(0的处理,均判在水平a下与参照处理无显著差异,凡|刃一为|〉厶G)的处理7•均判在水
平a下与参照处理有显著差异。
6.2R种处理的两两比较(7法)
在一些实际问题中,没有参照处理作为比较的基准,而需对怡种处理中任意两种进行比较。这种两
两比较共有出」组,可分为以下两种情形:
6.2.1参与比较的k种处理的试验重复次数相等(心=n2=-=nk=")的情形
实施步骤:
a)同6.1.3a);
b)给定显著性水平a,计算自由度f=N-k,由a,k,f查表B4得qaCk,f的值;
c)由以下公式计算仃的值。
la=c/Ak,f.:—(10)
d)结论:对特定的处理7,凡落在Cy,-la区间内的处理,均判在水平a下与第,种处理无
显著差异;凡落在(刃一仃,刃+仃)区间外的处理,均判在水平a下与第?:种处理有显著差异。
6.2.2参与比较的每种处理的试验重复次数不等的情形
实施步骤:
a)同6.1.3a);
b)同6.2.lb);
c)由以下公式计算人的值;
仃(亍,j)=qQjf人‘当(丄+丄)F,i=1,2,・・・,;j=1,2,・・・M;亍Hj(11)
■A2nfHj
5
GB/T10092—2009
式中:",,"丿分别为所比较的任意两种处理八丿的试验重复次数。
d)结论:若|y—yIMAG,",则判第,种处理与第丿种处理在水平a下无显著差异;若
|刃一刃丨>以,,丿),则判第7种处理与第丿种处理在水平a下有显著差异。
6.3几组处理均值间的比较(S法)
有些实际问题,需要在若干组处理的均值之间进行比较,例如,某种处理的均值与总平均的比较,
怡种处理中a种处理的均值与Z,种处理的均值之间的比较等,这些比较统称为任意线性比较。本标准
对任意线性比较,只规定了以下两种特殊情形:
6.3.1一种处理的均值与k种处理的总平均的比较
实施步骤:
a)按5.1-5.3程序,计算第7种处理的平均值卩和沧种处理的总平均值歹与公共方差的估计值
茁,
F,其中y=。
J=1
b)给定显著性水平a,由,查表B.5,得Sa(k,f之值。
C)计算J(丄)F之值。
、n,N
d)由以下公式计算仃G)之值:
!_ii
4(0=Sa(k,f.(丄_总)定(12)
\n,Z
e)结论:凡|艮一刃£-G),则判第?种处理的均值与总平均在水平a下无显著差异;凡
\y,~y\>lAO,则判第,种处理的平均值与总平均在水平a下有显著差异。
6.3.2k种处理中任意a种处理的均值与另外任意b种处理的均值之间的比较
实施步骤:
a)按5.1-5.3程序,计算k种处理中任意a种(不妨假定为前a种)处理的平均值又和另外任意
"种(不妨假定为紧接着的后b种)处理的平均值W和公共方差的估计值产。
a+bM怡
b)同6.3.lb);
d)由以下公式计算la(a,b之值:
la(a,b=SaCk,f^(-S-+手号|石卩2(13)
e)结论:若\y„-I,则判“种处理的均值与另外”种处理的均值在水平a下无显著
性差异;若I元一刃,1〉人(",/»,则判a种处理的均值与另外“种处理的均值在水平a下有显
著差异。
7应用示例
棉花的色征是评定棉花品级的主要指标之一。在用棉花色泽仪测定棉花的色征吋,同吋测定反射
率尺和黄色深度+"两个指标。目前我国棉花标准分为7级,自1级至7级,值逐渐减小,而+"值
逐渐增大。人们认为1、2、3级之间差异不大。现由15个省市各选送1〜7级的棉样1〜2套,用色泽仪
测得结果如表4、表5所示,试用这批数据比较各级之间有无显著性差异。
6
GB/T10092—2009
分析:(1)这是两项指标(&和+厉的比较问题,将两项指标分别计算与比较,化作两个单项指标的
比较。本次试验中,处理的含义是棉花的不同等级。
(2)根据经验,和+b的数值服从正态分,故不必进行正态性检验。
(3)棉花1〜7级的色征差异较大,因此不同级(即不同处理)的方差可能不相等。
多重比较的实施步骤如下:
a)将15个省(市)的测试结果整理成表4、表5的形式。
分别计算各处理的平均值和处理的样本方差,列成表6、表7的形式。
表4
处理试验重复次数测试结果反射率R“和
79.079.576.47&97&178.8
1〔级1876.874.877.57&87&978.81412.6
7&775.178.182.582.079.0
80.279.076.677.776.277.2
2〔级)1975.177.876.677.377.677.91480.3
77.77&175.67&080.781.679.4
78.877.574.876.875.976.476.0
3〔级)1977.276.276.17&575.677.17&31467.9
75.177.080.081.279.4
76.771.573.475.874.174.773.0
4〔级)1976.073.373.975.977.676.675.61433.7
72.676.277.980.97&0
69.070.374,772.372.769.274.6
5〔级)1869.772.374,076.372.073.871.41320
73.776.680.277.2
67.665.171.869.166.864.871.8
6〔级)1868.56&870.772.66&373.26&21259.2
63.673.680.074.7
64.364.470.266.859.962.071.6
7〔级)1564.06&167.771.266.265.164.8997
70.7
总和126
表5
处理试验重复次数测试结果黄色深度+6和
8.1&09.0&8&8&58.7&2&8
1(级)18155.8
8.0&59.19.29.09.28.1&49.4
&1&49.0&79.3&89.1&2&3
2(级)198.9&38.39.29.39.09.3&38.4166.7
9.3
8.3&59.2&99.3&98.8&3&2
3〔级)199.0&59.09.39.19.19.5&0&3167.4
9.2
8.89.59.49.39.79.18.9&6&5
4(级)1910.39.29.19.19.39.59.59.3&4175.2
9.7
9.010.19.69.8&89.38.9&712.0
5(级)18172.4
10.19.89.39.69.810.09.2&59.9
7
GB/T10092—2009
表5(续)
处理试验重复次数测试结果黄色深度+6和
9.810.49.910.19.29.29.39.112.8
6(级)18185.2
11.59.19.59.71().313.711.49.211.0
9.910.410.510.110.39.59.79.313.9
7(级)15161.2
11.810.49.810.712.812.1
总利126
表6
处理试验重复次数各处理平均值%,各处理样本方差si
118陆=78.48S%=3.88
219弘2=77.91S驚=2.82
319%广77.26S%=2.95
419%]=75.46S缸=5.24
518陀=73.33si=9.57
618y,,=69.96S&F6.33
715%=66.47S^7=ll.98
表7
处理试验重复次数各处理平均值%各处理样本方差S.
118叫=&66s£=0.202
219%=&77Sl2=0.181
319%=8.81S右一O・194
419yff=9.22si=0.212
4
518y=9.58s=0.616
定制服务
推荐标准
- T/FSIPA 3-2021 建材类企业知识产权管理规范 2021-10-11
- T/FSIPA 5-2021 装备制造类企业知识产权管理规范 2021-10-11
- T/GDES 82-2024 数智时代高质量绿色发展优质产品评价通则 2024-02-19
- T/CDWJCY 1-2019 农村群宴集中办宴点管理规范 2019-08-01
- T/ZJVITIA 01-2024 汽车工业全流程竞争力质量管理体系 2024-07-15
- T/GHLM 001-2024 全过程工程咨询企业品牌评价标准 2024-01-01
- T/CAQ 10105-2017 卓越绩效评价准则 医疗卫生 2017-12-27
- T/CSBX 0026-2024 “碱”字标 评价通则 2024-11-04
- T/QAHN 007-2024 质量创新技术成果等级评价准则 2024-12-20
- T/CASMES 373-2024 PFM行业品牌评价建设指南 2024-09-10