有學過6
sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. 宏; 變異數分析
v.s.方差分析; 進階 v.s. 高级…
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!
先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
ANOVA > One-Way ANOVA
單因子變異數分析 > 匯總
單因子變異數分析 (ANOVA) 檢定「多個總體的平均值相等」這一假設。此方法是雙樣本 t 檢定的擴展形式,尤其適用於假定總體變異數相等的情況。單因子變異數分析具有下列要求:
· 從取樣單位獲得反應或量測資料。
· 系統地變更了的因子或離差變數。為因子變數所選的各種值稱為因子水準。分析中每個因子水準都對應一個較大的總體及其平均值。樣本平均值是對整個總體水準平均值的估計值。
單因子變異數分析可用於檢定水準平均值之間在統計意義上是否有顯著差異。檢定的原假設是全部總體平均值(水準平均值)都相同。備擇假設是有一個或多個總體的平均值異於其他總體。
除了協助評估是否全部水準平均值都相同之外,Minitab 還提供輸出以協助確定存在差異時哪些水準平均值不同。
資料描述
調查員比較了四種不同配方的油漆的硬度。將每種油漆配方取六份樣品塗到一小塊金屬上,然後待其凝固,量測其硬度。此外,還記錄每份樣品的凝固溫度以及塗油漆的人(作業員)的編號。
資料:
油漆硬度.MTW (在樣本資料檔案夾中)
單因子變異數分析 > 變異數分析表 - 變異數分析表統計量
變異數分析表中最重要的統計量是 p 值 (P)、S、R 和調整的 R 值。這些值可以共同描述水準平均值之間是否有顯著差異以及模型對資料的適合度。
p 值
· 如果
P 小於或等於已選的 a 水準,則一個或多個平均值有顯著差異。
· 如果
P 大於已選的 a 水準,則平均值之間沒有顯著差異。
如果變異數分析得到的結果表明有顯著差異,則可以檢視個別值統計量和信賴區間以進一步瞭解這些差異。
S、R 和調整的 R 是模型對資料的適合度的量測。這些值有助於您選擇具有最佳適配的模型。
· S 以反應變數的單位進行量測,它表示資料值與適配得標準距離。對於給定研究,模型預測反應的效果越好,S 越小。
· R(R
平方)描述在觀測的反應值中由預測變數解釋的變異量。R 始終隨預測變數的增加而增大。範例,最佳的五預測變數模型的 R 始終比最佳的四預測變數模型的高。因此,比較相同大小的模型時 R 最有效。
· 調整的 R 表示已根據模型中的項數調整的修正 R。如果包含了不必要的項,R 會人為地變得很高。與 R 不同,調整的 R 在您向模型中增加項時可能變小。使用調整的 R 比較預測變數數不同的各個模型。
輸出範例
來源 自由度 SS
MS F P
油漆 3 281.7
93.9 6.02 0.004
誤差 20 312.1
15.6
合計 23 593.8
S = 3.950 R-Sq = 47.44% R-Sq(調整) = 39.56%
解釋
油漆硬度變異數分析得到的 p 值是 0.004。因此,假設選擇常用的 a 水準 0.05 進行檢定,則將斷定油漆配方之間的硬度存在顯著差異。
對於油漆資料,S 為 3.950,R 為 47.44%,調整的 R 為
39.56%。如果要比較不同的油漆硬度模型,則通常要尋找可使 S 最小化並使兩個 R 值最大化的模型。
單因子變異數分析 > 個別值統計量和信賴區間 - 個別值統計量
使用個別值統計量的表評定資料的下列計數值:
· N。因子每個水準所包含的觀測值數。
· 平均值。每個水準觀測值的平均值。這些樣本平均值是對每個水準總體平均值的估計值。
· 標準差。每個水準的樣本標準差。變異數分析假定全部水準的總體標準差相等。因此,如果樣本標準差差異很大,則可能需要使用變異數相等檢定指令來檢定資料的變異數相等性。
· 合併標準差。合併標準差是對全部水準公共標準差的估計值。
輸出範例
平均值(基於合併標準差)的單組 95% 信賴區間
水準 N 平均值 標準差 +---------+---------+---------+---------
混合 1 6 14.733
3.363
(-----*------)
混合 2 6 8.567
5.500 (------*------)
混合 3 6 12.983
3.730 (------*------)
混合 4 6 18.067 2.636 (------*------)
+---------+---------+---------+---------
5.0 10.0
15.0 20.0
合併標準差 = 3.950
解釋
油漆硬度分析的結果表明:
· 配方
2 的硬度平均值最低 (8.567),配方 4 的最高 (18.067)。
·
不同配方的標準差之間的差異還不足以引起關心。
合併標準差為 3.950。
單因子變異數分析 > 個別值統計量和信賴區間 - 個別值信賴區間
Minitab 為因子的每個水準都提供 95% 的信賴區間。當變異數分析表中的 p 值表明因子水準平均值之間有差異時,可以使用個別值信賴區間的表來研究差異:
· 每個星號都表示樣本平均值。
· 每對圓括號都表示總體平均值的 95% 的信賴區間。每個水準的總體平均值位於相應區間內的可信度為 95%。
· 如果兩個平均值的區間不重疊,則表明總體平均值不同。但應該謹慎解釋這些區間,因為進行多重比較時類型 I 錯誤的比例會增加。因此,進行多重比較時應該使用四種可用方法之一來控制類型 I 錯誤的比例。
輸出範例
平均值(基於合併標準差)的單組 95% 信賴區間
水準 N 平均值 標準差 +---------+---------+---------+---------
混合 1 6 14.733
3.363
(-----*------)
混合 2 6 8.567
5.500 (------*------)
混合 3 6 12.983
3.730 (------*------)
混合 4 6 18.067
2.636
(------*------)
+---------+---------+---------+---------
5.0 10.0
15.0 20.0
合併標準差 = 3.950
解釋
在油漆硬度的結果中,配方 2 和配方 4 平均值的區間不重疊。這表明這些水準的總體平均值不同。
單因子變異數分析 > 多重比較
- Tukey 法
Tukey 法使用全族誤差率(通常稱為全族範圍誤差率)比較每對因子水準的平均值以控制類型 I 錯誤的比例。全族誤差率是對整個一組比較產生一個或多個類型 I 錯誤的機率。Tukey 法以所選的全族誤差率為基礎調整個別值信賴水準。
結果顯示為一個分組表和平均值對之間差異的一組同時信賴區間。
使用匯總格式的分組資訊表顯示沒有顯著差異的各組因子水準平均值。如果某個水準平均值不在組中,則其平均值與該組存在顯著差異。
分組資訊表顯示下列資訊:
· 方法–用於構造從中產生分組表的信賴區間系列的多重比較方法。
· 比較項–用於比較一個因子的各個水準的每個分組資訊表。
· N–各因子水準的樣本大小。
· 平均值–按降序排序的最小平方平均值。
· 分組–包含用於分組因子水準的字母欄。共享同一個字母的水準並不存在顯著差異。相反,如果它們並不共享一個字母,水準平均值就會存在顯著差異。
使用信賴區間來確定兩個平均值之間差異的可能範圍:
· 如果區間不包含 0,則相應平均值之間在統計意義上有顯著差異。
· 如果區間包含 0,則平均值之間在統計意義上無顯著差異。
輸出範例
使用 Tukey 法對資訊進行分組
油漆 N 平均值 分組
混合 4 6 18.067 A
混合 1 6 14.733 A B
混合 3 6 12.983 A B
混合 2 6 8.567
B
不共享字母的平均值之間具有顯著差異。
Tukey 95% 整體信賴區間
油漆
水準間的全部配對比較
單組信賴水準 = 98.89%
油漆 = 混合 1 減自:
油漆 下限 中心 上限 +---------+---------+---------+---------
混合 2 -12.553 -6.167
0.219 (-------*-------)
混合 3 -8.136 -1.750
4.636
(-------*-------)
混合 4 -3.053 3.333
9.719
(-------*-------)
+---------+---------+---------+---------
-16.0 -8.0 0.0
8.0
油漆 = 混合 2 減自:
油漆 下限 中心 上限 +---------+---------+---------+---------
混合 3 -1.969 4.417
10.803
(-------*-------)
混合 4 3.114 9.500
15.886
(-------*-------)
+---------+---------+---------+---------
-16.0 -8.0
0.0 8.0
油漆 = 混合 3 減自:
油漆 下限 中心 上限 +---------+---------+---------+---------
混合 4 -1.303 5.083
11.469
(-------*-------)
+---------+---------+---------+---------
-16.0 -8.0 0.0
8.0
解釋
油漆硬度資料的分組資訊顯示組 A 包含混合 1、3 和 4,而組 B 包含混合 1、2 和 3。這兩個組都包含混合 1 和 3。組內的因子水準之間並不存在顯著差異。因為混合 2 和 4 並不共享同一個字母,混合 4 具有一個比混合 2 顯著高很多的平均值。
信賴區間顯示全部平均值差異的可能範圍:
· 配方
2 和配方 4 的平均值之間差異的信賴區間為
(3.114,15.886)。此範圍不包含 0,表明這些平均值之間差異顯著。
· 其餘平均值對的信賴區間都包含 0,表明這些平均值之間差異不顯著。
單因子變異數分析 > 多重比較
- Fisher 最低顯著性差異 (LSD)
Fisher LSD 法使用所選的個別誤差率比較每對因子水準的平均值。請注意,全族誤差率(整個一組比較中產生一個或多個類型 I 錯誤的機率)將高於每個個別值比較的誤差率。
結果顯示為一個分組表和平均值對之間差異的一組信賴區間。
使用匯總格式的分組資訊表顯示沒有顯著差異的各組因子水準平均值。如果某個水準平均值不在組中,則其平均值與該組存在顯著差異。
分組資訊表顯示下列資訊:
· 方法–用於構造從中產生分組表的信賴區間系列的多重比較方法。
· 比較項–用於比較一個因子的各個水準的每個分組資訊表。
· N–各因子水準的樣本大小。
· 平均值–按降序排序的最小平方平均值。
· 分組–包含用於分組因子水準的字母欄。共享同一個字母的水準並不存在顯著差異。相反,如果它們並不共享一個字母,水準平均值就會存在顯著差異。
使用信賴區間來確定兩個平均值之間差異的可能範圍:
· 如果區間不包含 0,則相應平均值之間在統計意義上有顯著差異。
· 如果區間包含 0,則平均值之間在統計意義上無顯著差異。
輸出範例
使用 Fisher 方法對資訊進行分組
油漆 N 平均值 分組
混合 4 6 18.067 A
混合 1 6 14.733 A B
混合 3 6 12.983
B C
混合 2 6 8.567
C
不共享字母的平均值之間具有顯著差異。
Fisher 95% 兩水準差異信賴區間
油漆
水準間的全部配對比較
同時信賴水準 = 80.83%
油漆 = 混合 1 減自:
油漆 下限 中心 上限 --------+---------+---------+---------+-
混合 2 -10.924 -6.167
-1.409 (-----*-----)
混合 3 -6.507 -1.750
3.007 (-----*-----)
混合 4 -1.424 3.333
8.091
(-----*-----)
--------+---------+---------+---------+-
-8.0 0.0 8.0
16.0
油漆 = 混合 2 減自:
油漆 下限 中心 上限 --------+---------+---------+---------+-
混合 3 -0.341 4.417
9.174
(-----*----)
混合 4 4.743 9.500
14.257
(-----*-----)
--------+---------+---------+---------+-
-8.0 0.0 8.0
16.0
油漆 = 混合 3 減自:
油漆 下限 中心 上限 --------+---------+---------+---------+-
混合 4 0.326 5.083
9.841
(-----*-----)
--------+---------+---------+---------+-
-8.0 0.0 8.0
16.0
解釋
油漆硬度資料的分組資訊顯示組 A 包含混合 1 和 4;組 B 包含混合 1 和 3;而組 C 包含混合 2 和 3。混合 1 和 3 分別位於兩個組中。組內的因子水準之間並不存在顯著差異。因為下列因子水準組合不共享同一個字母,所以它們的平均值存在顯著差異:
· 混合
1 和 2
· 混合
2 和 4
· 混合
3 和 4
信賴區間顯示全部平均值差異的可能範圍:
· 配方
1 和配方 2 的平均值之間差異的信賴區間為
(-10.924,-1.409)。此範圍不包含 0,表明這些平均值之間差異顯著。
· 類似地,配方 2 和配方 4 之間差異的信賴區間
(4.743,14.257) 以及配方 3 和配方 4 之間差異的信賴區間 (0.326,9.841) 也不包含 0,表明這些差異也顯著。
· 其餘平均值對的信賴區間都包含 0,表明這些平均值之間差異不顯著。
單因子變異數分析 > 多重比較
- Dunnett 與控制的比較
Dunnett 法將每個水準的平均值與對照水準的平均值進行比較。對照水準通常是要將全部其他水準與之進行比較的標準。
此方法使用全族誤差率(通常稱為全族範圍誤差率)來控制類型 I 錯誤的比例。全族誤差率是對整個一組比較產生一個或多個類型 I 錯誤的機率。Dunnett 法以所選的全族誤差率為基礎來調整個別值比較的誤差率(個別誤差率)。
結果顯示為一個分組表和一組對照水準的平均值和其他因子水準平均值之間差異的信賴區間。
使用匯總格式的分組資訊表顯示沒有顯著差異的各組因子水準平均值。如果某個水準平均值不在組中,則其平均值與該組存在顯著差異。
分組資訊表顯示下列資訊:
· 方法–用於構造從中產生分組表的信賴區間系列的多重比較方法。
· 比較項–用於比較一個因子的各個水準的每個分組資訊表。
· N–各因子水準的樣本大小。
· 平均值–按降序排序的最小平方平均值。
· 分組–包含用於分組因子水準的字母欄。共享同一個字母的水準並不存在顯著差異。相反,如果它們並不共享一個字母,水準平均值就會存在顯著差異。
使用信賴區間來確定兩個平均值之間差異的可能範圍:
· 如果區間不包含 0,則相應平均值之間在統計意義上有顯著差異。
· 如果區間包含 0,則平均值之間在統計意義上無顯著差異。
輸出範例
使用 Dunnett 方法對資訊進行分組
水準 N 平均值 分組
混合 1 (控制)
6 14.733 A
混合 4 6 18.067 A
混合 3 6 12.983 A
混合 2 6 8.567
沒有標明字母 A 的平均值與控制水準平均值的差異顯著。
Dunnett 與對照的比較
全族誤差率 = 0.05
個別誤差率 = 0.0195
臨界值 = 2.54
對照 = 油漆 的水準(混合 1)
處理平均值減對照平均值的區間
水準 下限 中心 上限 +---------+---------+---------+---------
混合 2 -11.960 -6.167
-0.373 (---------*--------)
混合 3 -7.544 -1.750
4.044
(---------*---------)
混合 4 -2.460 3.333
9.127
(---------*--------)
+---------+---------+---------+---------
-12.0 -6.0 0.0
6.0
解釋
油漆硬度資料的分組資訊顯示只有混合 2 不屬於組 A,因此它與控制水準之間存在顯著差異。混合 1、3 和 4 均產生相等的油漆硬度,而混合 2 則顯著較軟。
對照水準(配方 1)和配方 2 的平均值之間差異的信賴區間為 (-11.960,-0.373)。此範圍不包含 0,表明這些平均值之間差異顯著。
其餘平均值對的信賴區間都包含 0,表明這些平均值之間差異不顯著。
單因子變異數分析 > 多重比較
- 許氏與最佳值的多重比較 (MCB)
許氏法將每個因子水準的平均值與其餘因子水準的最佳平均值進行比較。必須指定將最小還是最大的平均值視為最佳。
此方法使用全族誤差率(通常稱為全族範圍誤差率)來控制類型 I 錯誤的比例。全族誤差率是對整個一組比較產生一個或多個類型 I 錯誤的機率。使用此方法前必須設定全族誤差率。
結果顯示為平均值對之間差異的一組同時信賴區間。
未顯示許氏與最佳值的多重比較的分組資訊表。
使用信賴區間來確定平均值是否有差異:
· 如果區間的終點為 0,則相應平均值之間在統計意義上有顯著差異。
· 如果區間的終點不為 0,則平均值之間的差異在統計意義上不顯著。
輸出範例
許氏 MCB(與最佳值的多重比較)
全族誤差率 = 0.05
臨界值 = 2.19
各水準平均值減最大值水準平均值區間
水準 下限 中心 上限 ----+---------+---------+---------+-----
混合 1 -8.333 -3.333
1.667
(-------*--------)
混合 2 -14.500 -9.500
0.000 (-------*---------------)
混合 3 -10.083 -5.083
0.000 (--------*-------)
混合 4 -1.667 3.333
8.333
(--------*-------)
----+---------+---------+---------+-----
-12.0 -6.0 0.0
6.0
解釋
對於油漆硬度分析,將最大平均值指定為最佳。因此,配方 1 的平均值 (14.733)、配方
2 的平均值 (8.567) 和配方 3 的平均值 (12.983) 都與配方 4 (18.067) 的平均值進行比較,因為後者是最大(最佳)平均值。配方 4 本身的平均值與配方 1 的平均值進行比較,因為後者是其餘三個平均值中最大的。
結果表明:
· 配方
4 的平均值與配方 2 的平均值之間差異的信賴區間
(-14.500,0.000) 以及與配方 3 的平均值之間差異的信賴區間 (-10.083,0.000) 都以 0 為終點,表明這些差異顯著。
· 其餘兩個區間的終點不為 0,表明差異不顯著。
單因子變異數分析 > 圖表 - 個別值圖
個別值圖對每個因子水準資料的下列計數值進行圖解:
· 離差。每個點都表示在樣本中觀測到的值。
· 平均值。每個點上的藍色符號表示樣本的平均值。
輸出範例
解釋
油漆硬度資料的個別值圖顯示:
· 一般情況下配方 4 的硬度值最高。
· 全部四個水準中資料的展開程度(離差)幾乎都相同。
·
任何點與其餘點相比都不異常大或異常小(異常值)。
單因子變異數分析 > 圖表 - 資料的箱形圖
箱形圖對每個水準資料的下列計數值進行圖解:
· 形狀。箱表示資料的中間 50% 部分。貫穿箱的線表示中位數。從箱伸出的線(須)表示資料的最上面 25% 和最下面 25% 的部分(不包含異常值)。異常值用星號 (*) 表示。
· 平均值。每個圖上的符號表示樣本的平均值。
注意
資料集中有許多觀測值時,箱形圖將是最佳選擇。
輸出範例
解釋
油漆硬度資料的箱形圖對下列情況進行圖解:
· 配方
4 的硬度值、平均值和中位數均為最大。
· 配方
2 的硬度值、平均值和中位數均為最小。
· 配方
2 資料的中間一半展開的程度很大,如大箱所示。
· 配方
2 的值的整體範圍最大,如細絲的末端所示。
· 任何水準的資料中都沒有異常值(星號)。
此例中,每個水準只有六個觀測值,因此個別值圖可能比箱形圖更合適。
單因子變異數分析 > 圖表 - 殘差的直方圖
殘差的直方圖顯示全部觀測值的殘差異布。使用直方圖作為研究工具來瞭解資料的下列特徵:
· 典型值、波動或變異以及形狀
· 資料中的異常值
殘差的直方圖應該為鍾形。使用此圖尋找下列資訊:
此圖表趨勢... 表明...
長尾 偏斜度
遠離其他長條的長條 異常值
由於直方圖的外觀會根據用於對資料進行分組的區間數而變更,因此請使用常態機率圖和適合度檢定來評定殘差是否為常態。
輸出範例
解釋
對於油漆硬度資料,沒有證據表明存在偏斜度或異常值。
單因子變異數分析 > 圖表 - 殘差的常態機率圖
此圖表圖示當分布為常態時的殘差及其期望值。根據分析得出的殘差應該是常態分布的。實際上,對於平衡或接近平衡的設計,或者對於具有大量觀測值的資料,略微偏離常態性不會嚴重影響結果。
殘差的常態機率圖應該大致為一條直線。使用此圖尋找下列資訊:
此圖表趨勢... 表明...
非直線 非常態性
尾部為曲線 偏斜度
遠離直線的點 異常值
斜率不斷變化 未確定的變數
如果資料的觀測值不足 50 個,則即使殘差是常態分布的,圖也可能在尾部顯示曲率。隨著觀測值數的減少,機率圖甚至可能會顯示更大的變異和非線性。使用常態機率圖和適合度檢定來評定小資料集中殘差的常態性。
輸出範例
解釋
對於油漆硬度資料,殘差顯示為直線。沒有證據表明存在非常態性、偏斜度、異常值或未確定的變數。
單因子變異數分析 > 圖表 - 殘差與適配
此圖表圖示殘差與適配。殘差應該在 0 附近隨機分散。使用此圖尋找下列資訊:
此圖表趨勢... 表明...
殘差相對適配呈扇形或不均勻分散 異變異數
曲線 缺少高次項
遠離 0 的點 異常值
輸出範例
解釋
從此圖中可以看出,殘差隨機分散在 0 附近。沒有證據表明存在異變異數、缺項或異常值。
單因子變異數分析 > 圖表 - 殘差與順序
此圖表以相應觀測值的順序圖示殘差。觀測值的順序可能影響結果時此圖會很有用,以時間順序或以某些其他順序(如地理區域)採集資料時可能影響結果。此圖在試驗未被隨機化的設計實驗中尤其有協助。
圖中的殘差應該在中心線附近隨機波動。檢查此圖以檢視相鄰誤差項之間是否存在任何相關性。殘差之間的相關性可以表示為:
· 殘差中的上升或下降趨勢
· 相鄰殘差的符號快速變化
輸出範例
解釋
對於油漆硬度資料,殘差隨機分散在 0 附近。沒有證據表明誤差項彼此相關。
單因子變異數分析 > 圖表 - 殘差與變數
此圖表圖示殘差與其他變數。殘差應該在中心線附近隨機波動。如果變數已經包含在模型中,則請使用此圖確定是否應該增加該變數的高次項。如果變數尚未包含在模型中,則請使用此圖確定變數是否系統地影響反應。
使用此圖尋找下列資訊:
此圖表趨勢... 表明...
殘差排欄成圖表趨勢 變數正在系統地影響反應
點的排欄有曲率 應該在模型中包含變數的高次項
輸出範例
解釋
對於油漆硬度資料,殘差隨機分散在 0 附近。沒有證據表明殘差中存在模式或資料中存在曲率。此圖表明樣本凝固的溫度似乎沒有對反應產生系統化影響。
單因子變異數分析 > 圖表 - 四合一殘差圖
四合一殘差圖在一個圖表視窗中同時顯示四種不同的殘差圖。此版面有助於比較這些圖以確定模型是否符合分析的假設。此圖表中的殘差圖包含:
· 直方圖 - 表明資料是否偏斜或資料中是否存在異常值
· 常態機率圖 - 表明資料是否為常態分布的、其他變數是否影響反應或資料中是否存在異常值
· 殘差與適配 - 表明變異數是否恆定、是否存在非線性關係或資料中是否存在異常值
· 殘差與資料順序 - 表明資料中是否存在因時間或資料採集順序而產生的系統化影響
輸出範例
解釋
要檢視四合一圖中每個殘差圖的解釋,請參考本主題之前每種殘差圖的個別值主題。
ANOVA > One-Way ANOVA > more
假設檢定
假設檢定是統計決策中最常用的方法之一。一般而言,假設檢定是一種假定初始聲明為真,然後使用樣本資料檢定該聲明的製程。通常,初始聲明是指相關的總體參數,如總體平均值 (m)。
假設檢定包含兩個假設:原假設(以 H0 表示)和備擇假設(以 H1 表示)。原假設是初始聲明,且通常使用先前的研究或常識進行指定。備擇假設是可以相信為真實或有望證明為真實的內容。備擇假設有時稱為研究假設。
假設檢定的決策製程可以基於給定檢定的機率值(p 值)。
· 如果
p 值小於或等於預先確定的顯著性水準(a 水準),則否定原假設,並聲明支援備擇假設。
· 如果
p 值大於 a 水準,則不能否定原假設,且不聲明支援備擇假設。
執行假設檢定時,有四種可能的結果。結果取決於原假設的真假以及能否否定原假設。下表中匯總了這些結果:
如果原假設為真,但否定了原假設,則發生類型 I 錯誤。發生類型 I 錯誤的機率稱為阿爾法 (a),有時也稱為顯著性水準。
如果原假設為假,但未能否定它,則發生類型 II 錯誤。發生類型 II 錯誤的機率稱為 b。
原假設為假時,否定它的機率等於 1 - b。此值也稱為檢定的檢定力。
選擇 a 水準
對 a 的選擇決定類型 I 錯誤的機率。此值越小,錯誤地否定原假設 (H0) 的幾率就越小。但是,a 值越小就意味著檢定力越低,並因此降低了檢測到效應(如果存在)的幾率。
按照慣例,最常用的 a 水準為 0.05。a = 0.05
表示發現實際並不存在的效應的幾率僅為 5%。大多數情況下,認為這種出現錯誤的機率可允收。但是,對特定檢定選擇 a 時,可能需要考慮何種錯誤更嚴重:發現實際不存在的效應,或未發現實際存在的效應。
選擇較小的 a。有時選擇較小、較保守的 a 值更好。範例,假設要檢定新銑床中的樣本,並嘗試決定是否購買並在加工車間中安裝一批這種機器。如果新機器比當前使用的機器更精確,則會節省大量資金,因為生產的殘次品將會減少。但是,購買和安裝一批機器的成本非常高。購買前需要確信新機器更加精確。這種情況下,可能需要選擇較低的 a 值,如 0.001。這樣,如果實際上並非如此,將斷定新機器更精確的幾率也僅為 0.1%。
選擇較大的 a。另一方面,有時選擇較大、較寬鬆的 a 值更好。範例,假設噴氣發動機製造商要檢定一種價格較低的新滾珠軸承的穩定性。很明顯,如果滾珠不合格,則節省的少量滾珠成本沒有潛在災難性後果的代價值得重視。因此,可能需要選擇較高的 a 值,如 0.1。儘管這意味著在不存在差異的情況下將更可能錯誤地斷定存在差異,但更重要的是更可能檢測到軸承穩定性中的差異(如果存在)。
統計意義與實際意義
即使以統計學觀點來看水準平均值有顯著差異,這種差異可能也沒有任何實際意義。在油漆硬度資料中,最小平均值和最大平均值分別為 8.567 和 18.067。這
9.5 個單位的差異有任何實際意義嗎?這個問題只能用該學科領域的知識回答,而不能用統計學回答。
全族誤差率和個別誤差率
全族誤差率是對於整個比較集發生一個或多個類型 I 錯誤的機率。
個別誤差率是對於每個單獨比較發生類型 I 錯誤(不存在差異時判斷為存在差異)的機率。
進行多重比較時考慮全族誤差率很重要,因為對於一系列比較而言,發生類型 I 錯誤的幾率比單獨進行任何一個個別值比較的誤差率都要高。
假設使用 Fisher 法比較四個水準平均值(每個都有 6 個觀測值),並選擇 0.05 作為個別誤差率。在六個配對比較中發生至少一個類型 I 錯誤的幾率為 0.192,而這大大高於 0.05。
要使用何種多重比較方法
當決定要使用何種多重比較方法時,請牢記下列內容:
· Tukey 法和 Fisher 法之間的區別是所選擇的誤差率。在 Tukey 法中,選擇全族誤差率,並相應地調整個別誤差率。但是,在 Fisher 法中設定個別誤差率。
· 對於給定的全族誤差率,Dunnett 和許氏法比 Tukey 法更有效(更可能檢測到效應)。當然,這些方法進行的比較較少,因此必須首先確保這些方法合適。
對於給定的全族誤差率,許氏法比 Dunnett 法更有效。但是,這兩種檢定所進行的比較不同,因此必需首先確定該方法合適。
圖和 p 值
下列兩個個別值圖中的資料集具有完全相同的因子水準平均值。因此,由於因子而產生的資料變異性對於這兩個資料集是相同的。觀察這些圖之後,可能會斷定這兩種案例平均值不同。但是請注意,第二個資料集中的因子水準變異性大大高於第一個資料集。
要估計平均值之間的差異,必須將這些差異與觀測值在平均值附近的展開進行比較。這就是變異數分析所進行的內容。使用變異數分析得出對應於第一個圖的 p 值為 0.000,對應於第二個圖的
p 值為 0.128。
因此,使用 0.05 的 a 水準,檢定結果是第一個資料集中的平均值之間有顯著差異。但是,第二個資料集的樣本平均值之間的差異很可能是資料中整體可變性較大的隨機結果。
低變異性圖
高變異性圖
什麼是殘差
Minitab 提供三種類型的殘差:
· 常規殘差:觀測值 - 預測值。
· 標準化殘差:常規殘差 / 常規殘差的標準差。
標準化消除了資料點位置對於預測值或因子的影響。
· 學習化已刪除殘差:對於 ith 資料點,公式遵循與標準化殘差相同的表達方式。但是,計算第i個 學習化已刪除殘差時適配和標準差都是在刪除第i個觀測後得到的。與標準化殘差相比,學習化已刪除殘差在出現異常資料點時會變大。
模型假設
迴歸和變異數分析製程關於誤差做出下列假設:
· 誤差為常態分布,且平均值為 0。
· 誤差變異數不會為不同因子水準或根據預測反應的值而發生變更。
· 每種誤差都獨立於全部其他誤差。在所設計的實驗中,獲得獨立誤差的最好方式是隨機化實驗的實驗順序。
在分析中檢定這些假設的有效性。殘差是誤差的最佳估計值。因此,可以使用殘差圖以圖表方式檢查每個假設。
如果模型違反這些假設,則分析的結果可能有誤導性。範例,如果誤差相互關聯,則可能會錯誤地估計係數的標準誤差,從而導致錯誤的 t 值和 p 值。
直方圖和常態性
下列是從常態分布中抽取的九個資料集樣本。這些樣本沒有問題;但是,這些直方圖中大多數看起來不是鍾形,這描述了為什麼不應該使用直方圖來判斷資料的常態性。判斷資料是否為常態分布需要使用常態機率圖。
隨機產生樣本的直方圖
每個樣本包含常態分布中的 24 個觀測值。
轉換反應變數
殘差表示異變異數或非常態性時,必須進行轉換。
您可能還會發現在模型表現出顯著缺適性時資料轉換非常有用,而且這種轉換在反應曲面實驗的分析中尤為重要。假設在模型中包含全部顯著的交互作用和二次項,但缺適性檢定表明需要高次項。轉換可以消除缺適性。
如果資料轉換修正了此問題,使用迴歸分析比用其他可能更複雜的分析方法要好一些。迴歸分析或實驗設計分析的結果可以指導我們選擇合適的資料轉換方法解決不同的問題。
Box-Cox 轉換是最常用的變異數穩定轉換。在下面第一個圖表中,殘差表示異變異數。第二個圖表顯示變異數穩定轉換之後的殘差。適配的刻度(x 軸)變更,而變異數變為恆定。
常態機率圖中的圖表趨勢
下列圖表趨勢違反了誤差為常態分布這一假設。
非常態性的效應
迴歸和變異數分析的一個假設為殘差來自常態分布。但是,如果設計僅有固定因子,設計為平衡或接近平衡,且具有相當多的觀測值,則略微偏離常態性不會嚴重影響結果。
發現非常態圖表有趨勢時該怎麼做
可能難以正確指出常態機率圖中明顯偏離常態性的原因。可能的原因包含:
· 齊次變異數假設失敗
· 殘差異常大(異常值)
· 模型中缺少重要變數
· 資料來自非常態總體
對於完整分析,請將常態機率圖與其他診斷圖以及適合度統計量結合使用。
如果發現非常態圖表趨勢:
1 使用其他診斷圖檢視非常態性是否由非常態總體中的資料之外的因素所導致。
2 使用統計 > 基本統計 > 常態性檢定來執行常態性檢定。
3 如果確定資料來自非常態總體,則可以在繼續分析之前轉換資料。請參見轉換反應變數。
注意
修復不等變異數問題的轉換通常也修復常態性問題。
殘差與適配圖中的圖表趨勢
下列圖表趨勢顯示異常值和對誤差為恆定這一假設的衝突。
異常值圖
右上角的殘差比圖中其他全部都大很多,因此為異常值。如果異常值過多,則模型可能不妥當。異常值可能是由於量測錯誤所導致。應該調查異常值以確定其原因。
異變異數圖
殘差的變異數隨適配增加。請注意,隨著適配的增加,殘差在零殘差線周圍分散得更廣,指明不等的(非恆定)變異數。此圖表趨勢表明誤差變異數隨平均值的增加而增加。資料的轉換會有助於穩定這些變異數。
發現圖表有趨勢時該怎麼做
如果圖顯示... 執行此操作...
異變異數 1使用統計 > 變異數分析 > 變異數相等檢定來檢定相等變異數的假設。
2如果圖或檢定表明變異數不等,則考慮轉換反應變數。
異常值或有影響的點 1驗證觀測值不是量測或資料錄入錯誤。
2考慮執行分析時不包含此觀測值來檢視它是否影響結果。
缺少高次項 增加此項並重新適配模型。
殘差與順序圖中的圖表趨勢
下列圖表趨勢違反了誤差彼此獨立這一假設。
發現圖表有趨勢時該怎麼做
殘差與資料順序圖中的圖表趨勢表明誤差不是獨立的。此指示可能嚴重影響分析的結論,因此應該至少考慮下列一種補救措施:
· 由於誤差的非獨立性往往難以修正,因此如果要進行設計的實驗,應該盡量透過隨機化試驗以防止出現這種問題。
· 向模型中增加時間效應以消除誤差項的相關。範例,正在檢視幾個月期間的日收入。增加表示一周中某天的因子會消除誤差項中的非獨立性。
· 考慮時間序列製程(如 ARIMA)以解決誤差項中的自相關。
發現圖表有趨勢時該怎麼做
殘差與變數圖中的圖表趨勢表明可能未在模型中包含重要變數或未包含變數的高次項。
· 如果該變數在模型中,請為該變數增加高次項並重新適配模型。範例,曲線圖表趨勢表明應該增加平方項。
· 如果該變數不在模型中,請為該變數增加一項並重新適配模型。
詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/
和 http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構…等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.
沒有留言:
張貼留言