4-1 随机化完全集区设计
(The Randomized Complete Block Design)
在任何实验中,扰动因子(Nuisance Factor)引起的变异对其结果会有影响。扰动因子之定义: 一设计因子,其对反应有效果而实验者却对此效果无兴趣。未知且无法控制(Unknown and Uncontrolled)的扰动因子:不知其存在及实验进行时可能改变水准。随机化是一种设计技巧用来防范此『潜伏』的扰动因子。然而,已知但不可控制(Known but Uncontrollable)的扰动因子,倘于每次实验时会观测到此的扰动因子之值,则于ANOVA时其会被补偿。如扰动变异来源是已知且可控制(Known and Controllable)时,集区划分(Blocking)之设计将可系统化地消除其对处理间统计比较的影响。
兹欲研究硬度机性能测试实验,共有4种尖锐物和4块可供测试的金属物品。每1种尖锐物在每块金属物品上测试一次,另期望实验误差是愈小愈好,因此从实验误差中将金属物品间的变异给隔离开来,成为一随机化完全集区设计(Randomized Complete Block Design (RCBD))。”完全”即是每个集区(金属物品)包含了所有的处理(尖锐物种类)。经由此设计,集区(金属物品)形成一同构型更高的实验单位来比较尖锐物,同时在任一集区内,4种尖锐物测试的顺序是随机,则此策略亦很有效地改善尖锐物间比较之准确性。
尖锐物种类
金属物品(集区)
1
2
3
4
1
2
3
4
(Rockwell C尺度之硬度值) - 40
随机化完全集区设计使用非常广泛,如测试仪器、机器设备、原料的批次、人、与时间,这些经常是实验中扰动变异的来源(Known and Controllable),可用集区划分的方式加以系统化地控制。
随机化完全集区设计之统计分析
(Statistical Analysis of the RCBD)
假设有a种处理要比较及b个集区,在每个集区里每种处理各有一观测值,同时每个集区中各处理进行的顺序是随机决定的,因为单一的处理的随机化是在集区里,故通称集区是一受限制之随机化(Restricted Randomization)。
Block 1
Block 2
….
Block b
y11
y12
…
y1b
y21
y22
…
y2b
y31
y23
….
y3b
.
.
…
.
ya1
ya2
…
yab
此设计之统计模式是
yij = ( + (i + (j + (ij , i = 1, 2,…, a;j =1 , 2,…, b
(4-1)
式中,(是总平均、是(i第i种处理的效果、是(j第j个集区的效果、与随机误差项(ij ~ NID(0, (2)。处理与集区暂时考虑为固定效果因子,另处理与集区效果均定义为从总平均的离差(Deviation),所以,
(i=1 a (i
= 0
and
(j=1 b (j = 0
另亦可用”均值模式”表示,
yij = (ij + (ij , i = 1, 2,…, a;j =1 , 2,…, b
式中,(ij = ( + (i + (j ,欲研究处理平均是否相等,检定假设为
H0:(1 = (2 = … = (a
H1:至少一个(i ( (j
因为第i种处理平均值 (i = (1/b) (j=1 b ( ( + (i + (j) = ( + (i,如此检定假设另一种表示为
H0:(1 = (2 = … = (a
H1:至少一个(i ( 0
若yi(为第i种处理下之所有观测值总和、y(j为第j个集区下之所有观测值的总和、y((为所有观测值总和、及N = ab
为所有观测值的数目,则
yi(= (j=1 b (yij)
i = 1, 2, …,a
(4-2)
y(j= (i=1 a (yij)
j = 1, 2, …,b
(4-3)
y((= (i=1 a (j=1 b (yij)=(i=1 a ( yi( )=(j=1 b ( y(j )
(4-4)
同理,
为第i种处理下之所有观测值的平均值、
为第j个集区下之所有观测值的平均值、
为所有观测值的平均值,则
= yi(/b;
= y(j /a;
= y((/N
(4-5)
总(校正)平方和(Total Corrected Sum of Squares)
(4-6)
=
(4-7)
此表示对总平方和的一种分割,故(4-7)式可表示成,
SST= SSTreatments + SSBlocks + SSE
(4-8)
变异来源
平方和SS
自由度df
处理(组间)
SSTreatments
a-1
集区
SSBlocks
b-1
误差(组内)
SSE
(a-1)(b-1)
总和
SST
N-1
(4-8)式左右两边之自由度相等,因此,如假设误差项为常态,则可引用Cochran定理证明SSTreatments/ (2,SSBlocks /(2,与SSE/(2均为独立分配的卡方随机变量。另每个平方和除以本身之自由度即为个别的均方,这些均方的期望值,当处理和集区为固定时,则
E[MSTreatments]= (2 + b(i=1 a ((i2)/(a-1)
E[MSBlocks]= (2 + a(j=1 b ((j2)/(b-1)
E[MSE]= (2
所以,若欲检定处理平均值相等与否,其检定统计式为,
F0= MSTreatments /MSE
,当F0>F(, (a-1), (a-1)(b-1) ,拒绝H0。
另亦可对集区平均值做比较,倘这些平均值无太大差异,则未来实验时可无须集区划分。
变异来源
平方和SS
自由度df
均方MS
F0
处理(组间)
SSTreatments
a-1
SSTreatments / a-1
SSTreatments/ MSE
集区
SSBlocks
b-1
SSBlocks /b-1
误差(组内)
SSE
(a-1)(b-1)
SSE/
(a-1)(b-1)
总和
SST
N-1
(4-6)~(4-8)式亦可修改以利用手算,如
SST = (i=1 a (j=1 b yij 2 - y((2 /N
(4-9)
SSTreatments = ((i=1 a yi( 2 )/b - y((2 /N
(4-10)
SSBlocks = ((i=1 b y(j 2 )/a - y((2 /N
(4-11)
SSE = SST - SSTreatments - SSBlocks
(4-12)
************
例题4-1
欲研究硬度实验。共有4种尖锐物和4块可供测试的金属物品。每1种尖锐物在每块金属物品上测试一次,成为一个集区随机设计。
尖锐物种类
金属物品(集区)
1
2
3
4
1
2
3
4
SOL:
变异来源
平方和
自由度
均方
F
P-Value
处理(尖锐物种类)
3
集区(金属物品)
3
误差
9
总和
15
F(=)值大于临界值(=),且P-值为小于显著水准
Reject H0 (( (尖锐物种类的确会影响平均硬度读值。
(倘无考虑集区)
变异来源
平方和SS
自由度df
均方MS
F
处理(尖锐物种类)
3
误差
12
总和
15
F(=)值小于临界值(=)。
Accept H0 (( (尖锐物种类的平均硬度读值相等。
*************
另残差之计算,
eij = yij -
,
其中配适值为,
所以
eij = yij -
= yij
(4-13)
下节再将用残差进行”模式适当性检验”。
多重比较(Multiple Comparisons)
倘随机化集区设计中之处理是固定的,且分析出处理平均值间有显著差异,则用多重比较检视何者平均值不同,上一章(第节)多重比较的方法均可使用。
模式适当性检本(Model Adequacy Checking)
前一章已述,检查假设的模式之适当性是非常重要,一般而言,检查项目包括常态假设、处理或集区的不相等误差变异、与集区-处理的交互作用等潜在问题。如完全随机设计一样,残差分析是此种诊断检查的主要工具。
图4-4 例题4-1残差之常态机率图
由图4-4残差之常态机率图视出,未有严重的”非常态”迹象,与无任何可能的离群值。
倘某尖锐物的残差相当离散,即表示此种尖锐物所产生的硬度读值相当不稳定。又如某金属样本的残差相当离散,即表示此种金属样本本身硬度的均匀性不佳。
(a) 残差与处理图
(b) 残差与集区图
图4-5 例题4-1残差与处理、集区图
由图4-5示,例题4-1看不出以处理或以集区有任何变异不相等的迹象。
图4-6 例题4-1残差与配适值图
检视图4-6,残差大小与配适值无任何关系,没有不寻常的讯息。有时残差与配适值呈曲线的形状,此意味着处理与集区的交互作用(Interaction),如确有此形态发生,则利用转换以尽可能消除或极小化该交互作用,有关这部分问题将于第5章详述。
随机化完全集区设计之其它方面
(Some Other Aspects of the Randomized Complete Block Design)
随机化集区模式之可加性(Additivity of the Randomized Block Model)
随机化集区设计的线性模式,
yij = ( + (i + (j + (ij ,
是具有完全地可加性,此表示
E[(1] = 5,
E[(1] = 2,
则
E[y11 ] = ( + (1 + (1 = ( + 5 + 2 = ( +7
此简单的加法模式是很有用的,但亦有不适用的情况,如处理与集区发生交互作用。同理,用不当的尺度量测反应时会造成处理与集区发生交互作用,假设原尺度是乘法关系,
E[yij ] = ( (i (j
在对数尺度将是一线性或可加性的关系,如
lnE[yij ] =ln(+ln (i +ln (j
残差分析及一些诊断手法有助于检视非可加性。一但出现交互作用,其严重甚至可能造成ANOVA无效,其会膨胀误差均方及可能影响处理间的比较,如有此况,则用”因子设计(Factorial Design)”,此部份5-9章详述。
随机处理与集区(Random Treatments and Block)
上述已说明处理与集区为固定因子时之检定程序,同样步骤可以用在当处理或集区(或两者)是随机时,然所对应结果的解释上须有所改变,如希望处理间的比较对于实验随机选出的集区来自整个集区母体(Population of Blocks)是一样的。对于均方期望值亦有对应改变,如集区具有相同变异数的独立随机变量,则
E[MSBlocks ] = (2 + (2(
其中(2(为集区效果的变异数,无论如何,E[MSTreatments ]永远不包含任何集区效果,而处理间比较的检定统计量永远是
F0 = MSTreatments /MSE
当集区是随机时,倘处理与集区有交互作用,则处理平均值间之比较不受交互作用的影响,理由是处理及误差的均方期望值均包含交互作用之效应,所以,处理平均值间差异之检定同前,亦即比较处理均方与误差均方,但不提供任何交互作用的讯息。
样本大小之选择(Choice of Sample Size)
选择样本大小、或集区数目,是随机化集区设计中的一重要决策,
样本大小之选择(Choice of Sample Size)
选择样本大小、或集区数目,是随机化集区设计中的一重要决策
估计模式参数与一般性回归显著检定
(Estimating Model Parameters and the General Regression Significance Test)
如处理与集区是固定的,用最小平方法来估计随机化完全集区模式中的参数,此线性统计模式是
yij = ( + (i + (j + (ij , i = 1, 2,…, a;j =1 , 2,…, b
(4-17)
常态方程式(Normal Eq.),则
…
(4-18)
….
第2到第(a+1)个方程式加总即为第1个常态方程式,而最后b个方程式加总亦为第1个常态方程式,因此,2个线性相依在(4-18)式中,意味着需要有2个限制式来解,其限制式为
(4-19)
利用限制式,常态方程式简化为
(4-20)
而其解则为
(4-21)
利用(4-21)式中常态方程式的解,则yij的估计值或配适值,
一般性回归显著检定可用来发展随机化集区设计的ANOVA,利用(4-21)式的常态方程式的解,为配适完整模式,其简化(Reduction)平方和为
且有(a+b-1)个自由度,与误差平方和为,
且有(a-1)(b-1)个自由度,此式与(4-7)式的SSE比较。
为检定H0 : (i = 0之假设,则”简化的模式”
yij = ( + (i + (ij ,
而此正是1因子ANOVA,依照类似(3-5)式的做法,则配适这”简化的模式”之简化(Reduction)平方和为,
而有a个自由度。所以,在配适 ( 和{ (i }之后的{ (i }的平方和为,
R((|(, () = R((, (, () - R((, () = R(Full Model)- R(Reduced Model)
而正是处理平方和及有a-1个自由度,如(4-10)式。
透过配适”简化的模式”可得到集区平方和
yij = ( + (i + (ij ,
而此亦是1因子ANOVA,则配适这”简化的模式”之简化(Reduction)平方和为,
而有a个自由度。所以,在配适 ( 和{ (i }之后的{ (i }的平方和为,
R((|(,() = R((, (, () - R((,()
有b-1个自由度,如(4-11)式。
上述利用一般性回归显著检定来发展完全集区设计的处理、集区及误差的平方和,此程序对更一般的随机化集区设计,很有用处。
遗漏值问题的精确分析(Exact Analysis of the Missing Value Problem)
在节中呈现一个近似方法来处理随机化集区设计的遗漏值问题,此近似分析是估计遗漏值使误差平方极小,
隨機化集區,拉丁方陣,與相關設計
Chap 4. Randomized Blocks, Latin Squares, and Related Design
� EMBED \* MERGEFORMAT ���
� EMBED \* MERGEFORMAT ���
� EMBED \* MERGEFORMAT ���
� EMBED \* MERGEFORMAT ���
PAGE
2
Chart1
0
Residual
Fitted Value
Residual
Residual vs Fitted Value
硬度測試ANOVA
金屬物品3 金屬物品4
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
雙因子變異數分析:無重複試驗
摘要 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
金屬物品1 4
金屬物品2 4
金屬物品3 4
金屬物品4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
列 3
欄 3
錯誤 9
總和 15
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
單因子變異數分析
摘要
組 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
組間 3
組內 12
總和 15
Model Adequacy Checking
金屬物品3 金屬物品4 Average
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
Average
Total Average
Observation Observed Value Predicted Value Residual Pk
1
2
3
4 10
5
6
7
8
9
10
11
12
13
14
15 10
16 0
Observation Residual Pk
1
2
3
4
5
6
7
8
9 0
10
11
12
13
14
15
16
Model Adequacy Checking
殘差
常態機率
殘差 vs 常態機率
Sheet3
Residual
Fitted Value
Residual
Residual vs Fitted Value
Chart1
0
Residual
Type of Tip
Residual
Residual vs Treatment
硬度測試ANOVA
金屬物品3 金屬物品4
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
雙因子變異數分析:無重複試驗
摘要 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
金屬物品1 4
金屬物品2 4
金屬物品3 4
金屬物品4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
列 3
欄 3
錯誤 9
總和 15
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
單因子變異數分析
摘要
組 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
組間 3
組內 12
總和 15
Model Adequacy Checking
金屬物品3 金屬物品4 Average
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
Average
Total Average
Observation Observed Value Predicted Value Residual Pk
1
2
3
4 10
5
6
7
8
9
10
11
12
13
14
15 10
16 0
Observation Residual Pk
1
2
3
4
5
6
7
8
9 0
10
11
12
13
14
15
16
Residual
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4 0
Residual
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4 0
Model Adequacy Checking
殘差
常態機率
殘差 vs 常態機率
Sheet3
Residual
Fitted Value
Residual
Residual vs Fitted Value
Residual
Type of Tip
Residual
Residual vs Treatment
Residual
Coupon(Block)
Residual
Residual vs Block
Chart2
0
Residual
Coupon(Block)
Residual
Residual vs Block
硬度測試ANOVA
金屬物品3 金屬物品4
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
雙因子變異數分析:無重複試驗
摘要 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
金屬物品1 4
金屬物品2 4
金屬物品3 4
金屬物品4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
列 3
欄 3
錯誤 9
總和 15
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
單因子變異數分析
摘要
組 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
組間 3
組內 12
總和 15
Model Adequacy Checking
金屬物品3 金屬物品4 Average
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
Average
Total Average
Observation Observed Value Predicted Value Residual Pk
1
2
3
4 10
5
6
7
8
9
10
11
12
13
14
15 10
16 0
Observation Residual Pk
1
2
3
4
5
6
7
8
9 0
10
11
12
13
14
15
16
Residual
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4 0
Residual
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4 0
Model Adequacy Checking
殘差
常態機率
殘差 vs 常態機率
Sheet3
Residual
Fitted Value
Residual
Residual vs Fitted Value
Residual
Type of Tip
Residual
Residual vs Treatment
Residual
Coupon(Block)
Residual
Residual vs Block
Chart2
殘差
常態機率
殘差 vs 常態機率
硬度測試ANOVA
金屬物品3 金屬物品4
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
雙因子變異數分析:無重複試驗
摘要 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
金屬物品1 4
金屬物品2 4
金屬物品3 4
金屬物品4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
列 3
欄 3
錯誤 9
總和 15
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
單因子變異數分析
摘要
組 個數 總和 平均 變異數
尖銳物 1 4
尖銳物 2 4
尖銳物 3 4
尖銳物 4 4
ANOVA
變源 SS 自由度 MS F P-值 臨界值
組間 3
組內 12
總和 15
Model Adequacy Checking
金屬物品3 金屬物品4 Average
尖銳物 1 10
尖銳物 2
尖銳物 3
尖銳物 4 10
Average
Total Average
Observation Observed Value Predicted Value Residual Pk
1
2
3
4 10
5
6
7
8
9
10
11
12
13
14
15 10
16 0
Observation Residual Pk
1
2
3
4
5
6
7
8
9 0
10
11
12
13
14
15
16
Model Adequacy Checking
殘差
常態機率
殘差 vs 常態機率
Sheet3
Residual
Fitted Value
Residual
Residual vs Fitted Value