2012年9月28日 星期五

Minitab: 6 sigma 專業軟體 繁體中文討論-98



有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
ANOVA > Fully Nested ANOVA

完全套疊變異數分析 > 匯總  
完全套疊變異數分析 (ANOVA) 檢查多個因子在完全套疊(分層)設計中對反應變數的效應。假定完全套疊變異數分析中的全部因子都是隨機因子,因此,該分析檢定每個因子的變異數是否為零。
資料描述
某一生產軍需品的公司要嘗試降低火藥燃燒率的可變性。該公司使用許多不同的流程來製造相同的產品。為了確定燃燒率的可變性是否是使用不同生產流程的函數,他們從三種不同生產流程所生產的四批不同火藥中抽取樣本。批次與生產流程是隨機抽取的樣本。每個樣本抽取三個觀測值。
資料: 火藥.MTW (在樣本資料檔案夾中)

完全套疊變異數分析 > 變異數分析表  
變異數分析表中最重要的統計量是 p (P)。使用 p 值可檢定反應中每個因子的效應是否顯著(即每個因子的變異數是否為零):
·    如果 P 小於或等於已選的 a 水準,則描述該因子的變異數與零之間存在顯著差異。
·    如果 P 大於已選的 a 水準,則描述變異數與零之間不存在顯著差異。
輸出範例
比例 的變異數分析
來源    自由度         SS        MS       F      P
處理         2   676.0556  338.0278   1.464  0.281
批處理       9  2077.5833  230.8426  12.203  0.000
誤差        24   454.0000   18.9167
合計        35  3207.6389
解釋
研究人員為火藥分析選擇了常用的 a 水準 0.05。結果表明:
·    流程因子的 p 值大於所選的 a 水準 0.05,這表明不同生產流程對火藥燃燒率的可變性沒有顯著效應。
·    批次因子的 p 值(p = 0.000)小於 0.05,這表明每一生產流程內不同批次對燃燒率的可變性具有顯著效應。
根據上述結果,研究人員斷定燃燒率中可變性的主要來源是生產流程內批次之間的變異數。

完全套疊變異數分析 > 變異數分量表  
變異數分量表顯示模型中項的變異數估計值。
輸出範例
變異數分量
來源    變異數分量  總和的 %  標準差
處理       8.932      9.07   2.989
批處理    70.642     71.72   8.405
誤差      18.917     19.21   4.349
合計      98.491             9.924
解釋
火藥分析結果表明:
·    生產流程因子的變異數為 8.932,這在分析中占總變異數的 9.07%
·    批次因子的變異數最大,為 70.642。這在分析中占總變異數的 71.72%
·    分析中,由於誤差而導致的變異數為 18.917,占總變異數的 19.21%
從上述資料中可以明顯看出:批次間的可變性是火藥燃燒率中不一致的最大來源。

完全套疊變異數分析 > 期望均方表  
期望均方統計量可用來估計模型中項的均方 (MS)。在確定變異數分析表中報告的 F 值和 p 值時,這是一個必要步驟。
Minitab 在輸出中包含每項的期望均方的計算表。在每個等式中,圓括號中的數值代表已指示項的變異數。
輸出範例
期望均方
1  處理      1.00(3) +  3.00(2) + 12.00(1)
2  批處理    1.00(3) +  3.00(2)
3  誤差      1.00(3)
解釋
對於火藥分析而言:
(1) 代表模型中第一項的變異數(即生產流程的變異數 = 8.932
(2) 代表模型中第二項的變異數(即批次的變異數 = 70.642
(3) 代表模型中第三項的變異數(即誤差的變異數 = 18.917
因此,上述範例的流程因子的均方其估計值如下:
        1.00(3) + 3.00(2) + 12.00(1)
    =     1.00 * (18.917) + 3.00 * (70.642) + 12.00 * (8.932)
    =     338.027

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

2012年9月27日 星期四

Minitab: 6 sigma 專業軟體 繁體中文討論-97



有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
ANOVA > General Linear Model (GLM)

廣義線性模型 (GLM) > 匯總  
使用廣義線性模型指令對平衡資料或不平衡資料執行變異數分析 (ANOVA)、共變異數分析以及迴歸分析。
使用廣義線性模型製程執行變異數分析,可檢定「多個總體的平均值相等」這一假設。在此情況下,廣義線性模型具有下列要求:
·    從取樣單位獲得反應或量測資料。
·    一個或多個因子。
廣義線性模型的因子可以是下列兩種類型之一:
·    固定 - 固定因子是已系統地變更了的離差變數。
·    隨機 - 隨機因子是指從值的較大總體中隨機選擇其值的離差變數。
表示每個因子變數的各個不同值稱為因子水準。分析中每個因子水準都對應一個較大的總體及其平均值。樣本平均值是對整個總體水準平均值的估計值。
·    對於固定因子,變異數分析檢查因子水準平均值是否相同。
·    對於隨機因子,變異數分析檢查因子變異數是否為零。
除了協助評估是否全部水準平均值都相同之外,Minitab 還提供輸出以協助確定存在差異時哪些水準平均值不同。
資料描述
社會學家從某一大型都市大學教夜大課程的教授中隨機抽取 45 名教授作為樣本。收集的資料包含:
·    學科 - 課程主題:人文學科 (1)、社會科學 (2)、工程學 (3)、管理 (4)
·    學歷 - 該名教授所持有的最高學歷:學士 (1)、碩士 (2)、博士 (3)
·    薪金 - 教授此課程所獲得的收入金額(單位:千美元)。
社會學家希望得出學歷和學科對薪金的效應。資料是不平衡資料,因此該社會學家使用廣義線性模型 (GLM) 製程來對這些資料進行分析。
資料: 教授.MTW (在樣本資料檔案夾中)

廣義線性模型 (GLM) > 因子表  
因子表顯示下列資訊:
·    該模型中包含多個因子
·    每個因子的類型(固定因子或隨機因子)
·    每個因子的水準數
·    因子水準的值
輸出範例
因子  類型  水準數 
主題  固定       4  1, 2, 3, 4
學歷  固定       3  1, 2, 3
解釋
對於薪金分析,該表顯示下列內容:
·    此分析中包含兩個因子:學科和學歷。
·    這兩個因子都是固定因子。
·    學科因子具有四個水準,其值為:1234
·    學歷因子具有三個水準,其值為:123

廣義線性模型 (GLM) > 變異數分析表  
變異數分析表中最重要的統計量是 p (P)。模型中的每項都有 P 值(但誤差項除外)。項的 p 值表明對該項的效應是否顯著:
·    如果 P 小於或等於已選的 a 水準,則描述項的效應顯著。
·    如果 P 大於已選的 a 水準,則描述效應不顯著。
如果固定因子的效應顯著,那麼該因子的水準平均值之間存在顯著差異。
如果隨機因子的效應顯著,那麼該因子的變異數不為 0
如果交互作用項的效應顯著,那麼每個因子的效應在其他因子的不同水準之中有所不同。因此,沒有必要嘗試解釋顯著高次交互作用中所包含項的個別值效應。
輸出範例
薪金 的變異數分析,在檢定中使用調整的 SS
來源       自由度   Seq SS  Adj SS  Adj MS       F      P
主題            3   4.1676  4.2326  1.4109   64.85  0.000
學歷            2   8.3825  8.2287  4.1144  189.10  0.000
主題*學歷       6   0.0444  0.0444  0.0074    0.34  0.910
誤差           33   0.7180  0.7180  0.0218
合計           44  13.3124
解釋
在薪金分析中,學科效應、學歷效應以及學歷對學科的交互作用都已進行過評估。假定都選擇 a 水準為 0.05,那麼結果表明:
·    交互作用項的 p (0.910) 大於 0.05。因此,學科和學歷因子的交互作用不顯著,可以分別考慮個別值因子的效應。
·    學科因子的 p 值給定為 0.000。這表示實際 p 值小於 0.0005。由於該值小於選定的 a 水準 0.05,因此學科對薪金的效應十分顯著。換句話說,不同學科領域的平均薪金不同。
·    學歷的 p 值也小於 0.05,這表明學歷對薪金也存在顯著效應。換句話說,不同學歷的教授其平均薪金不同。

廣義線性模型 (GLM) > SR 平方和 R 平方(調整的)值 - SR 平方和 R 平方(調整的)值  
SR 和調整的 R 是模型對資料的適合度的量測。這些值有助於您選擇具有最佳適配的模型。
·    S 以反應變數的單位進行量測,它表示資料值與適配得標準距離。對於給定研究,模型預測反應的效果越好,S 越小。
·    RR 平方)描述在觀測的反應值中由預測變數解釋的變異量。R 始終隨預測變數的增加而增大。範例,最佳的五預測變數模型的 R 始終比最佳的四預測變數模型的高。因此,比較相同大小的模型時 R 最有效。
·    調整的 R 表示已根據模型中的項數調整的修正 R。如果包含了不必要的項,R 會人為地變得很高。與 R 不同,調整的 R 在您向模型中增加項時可能變小。使用調整的 R 比較預測變數數不同的各個模型。
輸出範例
S = 0.147504   R-Sq = 94.61%   R-Sq(調整) = 92.81%
解釋
對於薪金資料,S 0.147504R 94.61%,調整的 R 92.81%。如果要比較不同的薪金模型,則通常要尋找可使 S 最小化並使兩個 R 值最大化的模型。

廣義線性模型 (GLM) > 異常觀測值表 - 標準化殘差  
如果含有標準化殘差 (St Resid) 的觀測值與零的差異超過 2.00,那麼將會出現異常觀測值表。類似的觀測值可能是異常值,應對這些觀測值進行檢查,以確保它們不是由資料收集或資料輸入製程中所產生的誤差引起的。
輸出範例
薪金 的異常觀測值
                           適配            標準化
觀測值     薪金   適配   標準誤差      殘差    殘差
    39  2.30000  2.55000  0.10430  -0.25000   -2.40 R
    40  2.80000  2.55000  0.10430   0.25000    2.40 R
R 表示此觀測值含有大的標準化殘差
解釋
薪金分析輸出表明:39 40 這兩個觀測值的標準化殘差異別為 -2.40 +2.40

廣義線性模型 (GLM) > 平均值 - 最小平方平均值  
最小平方平均值表為指定的因子或交互作用項的每個水準顯示最小平方平均值(平均值)和平均值的標準誤差(SE 平均值)。
若要確定平均值之間的差異在統計意義上是否顯著,則應對平均值進行多重比較。
輸出範例
對 薪金 最小平方平均值
主題   平均值  平均值標準誤差
1     2.150     0.05215
2     2.807     0.04114
3     3.113     0.04792
4     2.840     0.05386
學歷
1     2.387     0.04878
2     2.467     0.04440
3     3.328     0.03246
解釋
薪金分析的結果表明:
·    教第 3 學科(工程學)的教授其平均薪金最高(3.113 $3113
·    教第 1 學科(人文學科)的教授其平均薪金最低(2.150 $2150
·    具有博士學位(學歷 = 3)的教授其平均薪金最高(3.328 $3328
·    具有學士學位(學歷 = 1)的教授其平均薪金最低(2.387 $2387

廣義線性模型 (GLM) > 多重比較
Tukey - 概要  
Tukey 法可將指定因子的全部可能水準平均值對進行比較。此方法使用全族誤差率(通常稱為全族範圍誤差率)來控制類型 I 錯誤的比例。
全族誤差率是對整個一組比較產生一個或多個類型 I 錯誤的機率。Tukey 法以所選的全族誤差率和比較數為基礎來調整個別值成對比較的誤差率(個別誤差率)。
進行多重比較時考慮全族誤差率很重要,因為對於一系列比較而言,發生類型 I 錯誤的幾率比單獨進行任何一個個別值比較的誤差率都要高。
Minitab 在分組資訊表、信賴區間表和假設檢定表中顯示多重比較結果。對於每個請求的因子,全部這三種表都是預設給定的。

廣義線性模型 (GLM) > 多重比較
Tukey - 分組資訊  
使用由 Tukey 法產生的匯總格式的分組資訊表顯示沒有顯著差異的各組因子水準平均值。如果某個水準平均值不在組中,則其平均值與該組存在顯著差異。
分組資訊表顯示下列資訊:
·    方法用於構造從中產生分組表的信賴區間系列的多重比較方法。
·    比較項用於比較一個因子的各個水準或多個因子的組合水準的每個分組資訊表。
·    N–各因子水準的樣本大小。
·    平均值按降序排序的最小平方平均值。
·    分組包含用於分組因子水準的字母欄。共享同一個字母的水準並不存在顯著差異。相反,如果它們並不共享一個字母,水準平均值就會存在顯著差異。
輸出範例
使用 Tukey 法和 95.0% 信賴度對資訊進行分組
主題   N  平均值  分組
3     11   3.1  A
4      9   2.8    B
2     13   2.8    B
1     12   2.1      C
不共享字母的平均值之間具有顯著差異。
解釋
對於薪金分析,要求對學科因子進行全部配對比較。
·    學科 3 的平均值 (3.1) 與學科 42 1 顯著不同,因為此學科在分組欄中並未共享任何字母。在此研究中,教工程學的所獲得的薪金顯著高於教任何其他學科。
·    學科 4 2 共享同一個分組字母 (B),因此它們的平均值 (2.8) 之間並不存在顯著差異。但是,這兩個學科與學科 3 1 顯著不同,因為它們之間並不共享相同的字母。
·    學科 1 與學科 34 2 顯著不同,因為此學科在分組欄中並不共享任何字母。在此研究中,教人文學科的所獲得的薪金顯著低於教任何其他學科。

廣義線性模型 (GLM) > 多重比較
Tukey - 信賴區間  
使用 Tukey 法產生的信賴區間可確定兩個平均值是否不同:
·    如果區間不包含 0,則相應平均值之間在統計意義上有顯著差異。
·    如果區間包含 0,則平均值之間在統計意義上無顯著差異。
輸出範例
Tukey 95.0% 整體信賴區間
反應變數 薪金
主題 水準間的全部配對比較
主題 = 1  減自:
主題    下限    中心    上限  ---------+---------+---------+-------
2     0.4768  0.6567  0.8366                     (--*---)
3     0.7715  0.9633  1.1551                          (---*---)
4     0.4870  0.6900  0.8930                     (---*---)
                              ---------+---------+---------+-------
                                     0.00      0.50      1.00
主題 = 2  減自:

主題     下限     中心    上限  ---------+---------+---------+-------
3      0.1356  0.30667  0.4777              (--*---)
4     -0.1502  0.03333  0.2169        (---*--)
                                ---------+---------+---------+-------
                                       0.00      0.50      1.00
主題 = 3  減自:
主題     下限     中心      上限  ---------+---------+---------+-------
4     -0.4686  -0.2733  -0.07809  (---*--)
                                  ---------+---------+---------+-------
                                         0.00      0.50      1.00
解釋
對於薪金分析,要求對學科因子進行全部配對比較。為區間所選的信賴水準為 95%,這與 0.05(或 5%)的全族誤差率相對應。由於學科有四個水準,所以這會產生六個配對比較。這些比較的信賴區間表明:
·    學科 1 的平均值(區間的頂集)與學科 2 (0.4768,0.8366)、學科 3 (0.7715,1.1551) 和學科 4 (0.4870,0.8930) 的平均值之間的差異的信賴區間都只包含大於零的值。這表明教全部其他學科所得的薪金顯著高於教學科 1 所得的薪金。
·    學科 2 和學科 3 的平均值差異的信賴區間(0.1356,0.4777,區間的中集)也僅包含正數,這表明學科 3 的平均值顯著大於學科 2 的平均值。
·    學科 2 和學科 4 的平均值之間差異的信賴區間(-0.1502,0.2169,區間的中集)包含零,這表明不存在顯著差異。
·    學科 3 和學科 4 的平均值差異的信賴區間(-0.4686,-0.07809,區間的底集)僅包含負數,這表明學科 4 的平均值顯著小於學科 3 的平均值。

廣義線性模型 (GLM) > 多重比較
Tukey - 假設檢定  
使用個別值假設檢定所提供的調整的 p 值來確定平均值對是否有差異。在所需 a 水準(在此情況中為 0.05)對 p 值進行調整,以保持全族誤差率:
·    如果某一比較的調整的 p 值小於或等於所選 a 水準,那麼平均值之間不存在顯著差異。
·    如果調整的 p 值大於所選 a 水準,那麼平均值之間不存在顯著差異。
輸出範例
Tukey 整體檢定
反應變數 薪金
主題 水準間的全部配對比較
主題 = 1  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
2       0.6567     0.06642   9.886  0.0000
3       0.9633     0.07083  13.601  0.0000
4       0.6900     0.07497   9.204  0.0000
主題 = 2  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
3      0.30667     0.06316  4.8556  0.0002
4      0.03333     0.06777  0.4918  0.9604
主題 = 3  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
4      -0.2733     0.07209  -3.791  0.0032
解釋
配對比較是針對薪金分析的學科因子執行的由於學科有四個水準,所以這會產生六個配對比較。這些比較的假設檢定表明:
·    學科 1 平均值(檢定的頂集)以及學科 2 (0.0000)、學科 3 (0.0000) 和學科 4 (0.0000) 的平均值之間差異的調整 p 值都小於所選 a 水準 0.05,這表明差異顯著。另外,平均值之間的差異(平均值差異)都為正數,這表明教學科 2、學科 3 和學科 4 所得的薪金高於學科 1
·    學科 2 和學科 3 的平均值之間差異(0.0002,檢定的中集)的調整 p 值表明這些平均值之間存在顯著差異。另外,該差異 (0.30667) 為正數,表明學科 3 的平均值大於學科 2 的平均值。
·    學科 2 和學科 4 的平均值之間差異(0.9604,檢定的中集)的調整 p 值大於所選的 a 水準,這表明這些平均值之間沒有顯著差異。
學科 3 和學科 4 的平均值之間差異(0.0032,檢定的底集)小於所選的 a 水準,這表明學科 4 與學科 3 的平均值之間存在顯著差異。另外,平均值之間的差異 (-0.2733) 為負數,這表明教學科 3 所得的薪金高於學科 4

廣義線性模型 (GLM) > 多重比較
Dunnett - 概要  
Dunnett 法(針對指定因子)將每個水準的平均值與對照水準的平均值進行比較。對照水準通常是要將全部其他水準與之進行比較的標準。此方法使用全族誤差率(通常稱為全族範圍誤差率)來控制類型 I 錯誤的比例。
全族誤差率是對整個一組比較產生一個或多個類型 I 錯誤的機率。Dunnett 法以所選的全族誤差率和比較數為基礎來調整個別值成對比較的誤差率(個別誤差率)。
進行多重比較時考慮全族誤差率很重要,因為對於一系列比較而言,發生類型 I 錯誤的幾率比單獨進行任何一個個別值比較的誤差率都要高。
Minitab 在分組資訊表、信賴區間表和假設檢定表中顯示多重比較結果。對於每個請求的因子,全部這三種表都是預設給定的。

廣義線性模型 (GLM) > 多重比較
Dunnett - 分組資訊  
使用由 Dunnett 法產生的匯總格式的分組資訊表顯示沒有顯著差異的各組因子水準平均值。如果某個水準平均值不在組中,則其平均值與該組存在顯著差異。
分組資訊表顯示下列資訊:
·    方法用於構造從中產生分組表的信賴區間系列的多重比較方法。
·    比較項用於比較一個因子的各個水準或多個因子的組合水準的每個分組資訊表。
·    N–各因子水準的樣本大小。注意:如果樣本大小不相等,則檢定力不相等,並且較小的差異可能會很顯著,而較大的差異卻不顯著。
·    LS 平均值按降序排序的最小平方平均值。
·    分組包含用於分組因子水準的字母欄。共享同一個字母的水準並不存在顯著差異。相反,如果它們並不共享一個字母,水準平均值就會存在顯著差異。
輸出範例
使用 Dunnett 方法和 95.0% 信賴度對資訊進行分組
主題         N  平均值  分組
4 (控制)   9   2.8  A
3           11   3.1
2           13   2.8  A
1           12   2.1
沒有標明字母 A 的平均值與控制水準平均值的差異顯著。
解釋
對於薪金分析,要求對對照水準的平均值(學科 4)和該學科因子的全部其他水準的平均值進行比較。
·    學科 2 與對照水準共享一個分組字母 (A)。因此,學科 2 的平均值 (2.8) 與對照水準的平均值 (2.8) 不存在顯著差異。
·    學科 1 3 沒有分組字母。因此,它們的平均值(2.1 3.1)與對照水準的平均值 (2.8) 顯著不同。教學科 3 獲得的薪金顯著高於對照學科,而教學科 1 獲得的薪金顯著較低。

廣義線性模型 (GLM) > 多重比較
Dunnett - 信賴區間  
使用 Dunnett 法產生的信賴區間可確定兩個平均值是否不同:
·    如果區間不包含 0,則相應平均值之間在統計意義上有顯著差異。
·    如果區間包含 0,則平均值之間在統計意義上無顯著差異。
輸出範例
Dunnett 95.0% 整體信賴區間
反應變數 薪金
與對照水準比較
主題 = 4  減自:
主題     下限     中心     上限   --+---------+---------+---------+----
1     -0.8734  -0.6900  -0.5066   (----*---)
2     -0.1991  -0.0333   0.1324                    (---*---)
3      0.0970   0.2733   0.4497                           (----*---)
                                  --+---------+---------+---------+----
                                 -0.80     -0.40     -0.00      0.40
解釋
對於薪金分析,要求對學科 4 的平均值(指定的對照水準)和該學科因子的全部其他水準的平均值進行比較。為區間所選的信賴水準為 95%,這與 0.05(或 5%)的全族誤差率相對應。這些比較的信賴區間表明:
·    學科 4 和學科 1 的平均值之間差異的信賴區間 (-0.8734,-0.5066) 所包含的數量都小於零,這表明教學科 4 所得的薪金顯著高於學科 1
·    學科 4 和學科 2 的平均值之間差異的信賴區間 (-0.1991,0.1324) 包含零,這表明不存在顯著差異。
學科 4 和學科 3 的平均值之間差異的信賴區間 (0.0970,0.4497) 也僅包含正數,這表明學科 3 的平均值顯著高於學科 4 的平均值。

廣義線性模型 (GLM) > 多重比較
Dunnett - 假設檢定  
使用個別值假設檢定所提供的調整的 p 值來確定平均值對是否有差異。在所需 a 水準(在此情況中為 0.05)對 p 值進行調整,以保持全族誤差率:
·    如果某一比較的調整的 p 值小於或等於所選 a 水準,那麼平均值之間不存在顯著差異。
·    如果調整的 p 值大於所選 a 水準,那麼平均值之間不存在顯著差異。
輸出範例
Dunnett 整體檢定
反應變數 薪金
與對照水準比較
主題 = 4  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
1      -0.6900     0.07497  -9.204  0.0000
2      -0.0333     0.06777  -0.492  0.9207
3       0.2733     0.07209   3.791  0.0017
解釋
對於薪金分析,要求對學科 4 的平均值(指定的對照水準)和該學科因子的全部其他水準的平均值進行比較。這些比較的信賴區間表明:
·    學科 4 和學科 1 的平均值之間差異(0.0000)的調整的 p 值小於所選的 a 水準 0.05,這表明這些平均值之間存在顯著差異。另外,平均值之間的差異(平均值差異,-0.6900)為負數,這表明教學科 1 所得的薪金低於學科 4
·    學科 4 和學科 2 的平均值之間差異(0.9207)的調整的 p 值大於所選的 a 水準,這表明這些平均值之間沒有顯著差異。
學科 4 和學科 3 的平均值之間差異的調整的 p (0.0017) 小於所選的 a 水準,這表明學科 4 與學科 3 的平均值之間存在顯著差異。另外,平均值之間的差異 (0.2733) 為正數,這表明教學科 3 所得的薪金高於學科 4

廣義線性模型 (GLM) > 多重比較
Bonferroni - 概要  
Bonferroni 法可以用來將指定因子的全部可能水準平均值對進行比較,或者將每個平均值與對照組的平均值進行比較。此方法使用全族誤差率(通常稱為全族範圍誤差率)來控制類型 I 錯誤的比例。
全族誤差率是對整個一組比較產生一個或多個類型 I 錯誤的機率。Bonferroni 法以所選的全族誤差率和比較數為基礎來調整個別值配對比較的誤差率(個別誤差率)。
進行多重比較時考慮全族誤差率很重要,因為對於一系列比較而言,發生類型 I 錯誤的幾率比單獨進行任何一個個別值比較的誤差率都要高。
Minitab 在分組資訊表、信賴區間表和假設檢定表中顯示多重比較結果。對於每個請求的因子,全部這三種表都是預設給定的。

廣義線性模型 (GLM) > 多重比較
Bonferroni - 分組資訊  
使用由 Bonferroni 法產生的匯總格式的分組資訊表顯示沒有顯著差異的各組因子水準平均值。如果某個水準平均值不在組中,則其平均值與該組存在顯著差異。
分組資訊表顯示下列資訊:
·    方法用於構造從中產生分組表的信賴區間系列的多重比較方法。
·    比較項用於比較一個因子的各個水準或多個因子的組合水準的每個分組資訊表。
·    N–各因子水準的樣本大小。注意:如果樣本大小不相等,則檢定力不相等,並且較小的差異可能會很顯著,而較大的差異卻不顯著。
·    平均值按降序排序的最小平方平均值。
·    分組包含用於分組因子水準的字母欄。共享同一個字母的水準並不存在顯著差異。相反,如果它們並不共享一個字母,水準平均值就會存在顯著差異。
輸出範例
使用 Bonferroni 方法和 95.0% 信賴度對資訊進行分組
主題   N  平均值  分組
3     11   3.1  A
4      9   2.8    B
2     13   2.8    B
1     12   2.1      C
不共享字母的平均值之間具有顯著差異。
解釋
對於薪金分析,要求對學科因子進行全部配對比較。
·    學科 3 的平均值 (3.1) 與全部學科顯著不同,因為此學科在分組欄中並未共享任何字母。在此研究中,教工程學的所獲得的薪金顯著高於教任何其他學科。
·    學科 4 2 共享同一個分組字母 (B),因此它們的平均值 (2.8) 之間並不存在顯著差異。 但是,這兩個學科與學科 3 1 顯著不同,因為它們之間並不共享相同的字母。
·    學科 1 與全部學科顯著不同,因為此學科在分組欄中並未共享任何字母。在此研究中,教人文學科的所獲得的薪金顯著低於教任何其他學科。

廣義線性模型 (GLM) > 多重比較
Bonferroni - 信賴區間  
使用 Bonferroni 法產生的信賴區間可確定兩個平均值是否不同:
·    如果區間不包含 0,則相應平均值之間在統計意義上有顯著差異。
·    如果區間包含 0,則平均值之間在統計意義上無顯著差異。
輸出範例
Bonferroni 95.0% 整體信賴區間
反應變數 薪金
主題 水準間的全部配對比較
主題 = 1  減自:
主題    下限    中心    上限     +---------+---------+---------+------
2     0.4702  0.6567  0.8431                        (---*---)
3     0.7645  0.9633  1.1621                              (---*---)
4     0.4796  0.6900  0.9004                         (---*---)
                                 +---------+---------+---------+------
                              -0.50      0.00      0.50      1.00
主題 = 2  減自:
主題     下限     中心    上限     +---------+---------+---------+------
3      0.1294  0.30667  0.4839                  (--*---)
4     -0.1569  0.03333  0.2236            (---*--)
                                   +---------+---------+---------+------
                                -0.50      0.00      0.50      1.00
主題 = 3  減自:
主題     下限     中心      上限     +---------+---------+---------+------
4     -0.4757  -0.2733  -0.07098     (----*---)
                                     +---------+---------+---------+------
                                  -0.50      0.00      0.50      1.00
解釋
對於薪金分析,要求對學科因子進行全部配對比較。由於學科有四個水準,所以這會產生六個配對比較。為區間所選的信賴水準為 95%,這與 0.05(或 5%)的全族誤差率相對應。這些比較的信賴區間表明:
·    學科 1 的平均值(區間的頂集)與學科 2 (0.4702,0.8431)、學科 3 (0.7645,1.1621) 和學科 4 (0.4796,0.9004) 的平均值之間的差異的信賴區間都只包含大於零的值。這表明教全部其他學科所得的薪金顯著高於教學科 1 所得的薪金。
·    學科 2 和學科 3 的平均值差異的信賴區間(0.1294,0.4839,區間的中集)也僅包含正數,這表明學科 3 的平均值顯著大於學科 2 的平均值。
·    學科 2 和學科 4 的平均值之間差異的信賴區間(-0.1569,0.2236,區間的中集)包含零,這表明不存在顯著差異。
學科 3 和學科 4 的平均值差異的信賴區間(-0.4757,-0.07098,區間的底集)僅包含負數,這表明學科 4 的平均值顯著小於學科 3 的平均值。

廣義線性模型 (GLM) > 多重比較
Bonferroni - 假設檢定  
使用個別值假設檢定所提供的調整的 p 值來確定平均值對是否有差異。在所需 a 水準(在此情況中為 0.05)對 p 值進行調整,以保持全族誤差率:
·    如果某一比較的調整的 p 值小於或等於所選 a 水準,那麼平均值之間不存在顯著差異。
·    如果調整的 p 值大於所選 a 水準,那麼平均值之間不存在顯著差異。
輸出範例
Bonferroni 整體檢定
反應變數 薪金
主題 水準間的全部配對比較
主題 = 1  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
2       0.6567     0.06642   9.886  0.0000
3       0.9633     0.07083  13.601  0.0000
4       0.6900     0.07497   9.204  0.0000
主題 = 2  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
3      0.30667     0.06316  4.8556  0.0002
4      0.03333     0.06777  0.4918  1.0000
主題 = 3  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
4      -0.2733     0.07209  -3.791  0.0036
解釋
配對比較是針對薪金分析的學科因子執行的由於學科有四個水準,所以這會產生六個配對比較。這些比較的假設檢定表明:
·    學科 1 平均值(檢定的頂集)以及學科 2 (0.0000)、學科 3 (0.0000) 和學科 4 (0.0000) 的平均值之間差異的調整 p 值都小於所選 a 水準 0.05,這表明差異顯著。另外,平均值之間的差異(平均值差異)都為正數,這表明教學科 2、學科 3 和學科 4 所得的薪金高於學科 1
·    學科 2 和學科 3 的平均值之間差異(0.0002,檢定的中集)的調整 p 值表明這些平均值之間存在顯著差異。另外,該差異 (0.30667) 為正數,表明學科 3 的平均值大於學科 2 的平均值。
·    學科 2 和學科 4 的平均值之間差異(1,000,檢定的中集)的調整 p 值大於所選的 a 水準,這表明這些平均值之間沒有顯著差異。
學科 3 和學科 4 的平均值之間差異(0.0036,檢定的底集)小於所選的 a 水準,這表明學科 4 與學科 3 的平均值之間存在顯著差異。另外,平均值之間的差異 (-0.2733) 為負數,這表明教學科 3 所得的薪金高於學科 4

廣義線性模型 (GLM) > 多重比較
Sidak - 概要  
Sidak 法可以用來將指定因子的全部可能水準平均值對進行比較,或者將每個平均值與對照組的平均值進行比較。此方法使用全族誤差率(通常稱為全族範圍誤差率)來控制類型 I 錯誤的比例。
全族誤差率是對整個一組比較產生一個或多個類型 I 錯誤的機率。Sidak 法以所選的全族誤差率和比較數為基礎來調整個別值配對比較的誤差率(個別誤差率)。
進行多重比較時考慮全族誤差率很重要,因為對於一系列比較而言,發生類型 I 錯誤的幾率比單獨進行任何一個個別值比較的誤差率都要高。
Minitab 在分組資訊表、信賴區間表和假設檢定表中顯示多重比較結果。對於每個請求的因子,全部這三種表都是預設給定的。

廣義線性模型 (GLM) > 多重比較
Sidak - 分組資訊  
使用由 Sidak 法產生的匯總格式的分組資訊表顯示沒有顯著差異的各組因子水準平均值。如果某個水準平均值不在組中,則其平均值與該組存在顯著差異。
分組資訊表顯示下列資訊:
·    方法用於構造從中產生分組表的信賴區間系列的多重比較方法。
·    比較項用於比較一個因子的各個水準或多個因子的組合水準的每個分組資訊表。
·    N–各因子水準的樣本大小。注意:如果樣本大小不相等,則檢定力不相等,並且較小的差異可能會很顯著,而較大的差異卻不顯著。
·    平均值按降序排序的最小平方平均值。
·    分組包含用於分組因子水準的字母欄。共享同一個字母的水準並不存在顯著差異。相反,如果它們並不共享一個字母,水準平均值就會存在顯著差異。
輸出範例
使用 Sidak 方法和 95.0% 信賴度對資訊進行分組
主題   N  平均值  分組
3     11   3.1  A
4      9   2.8    B
2     13   2.8    B
1     12   2.1      C
不共享字母的平均值之間具有顯著差異。
解釋
對於薪金分析,要求對學科因子進行全部配對比較。
·    學科 3 的平均值 (3.1) 與全部學科顯著不同,因為此學科在分組欄中並未共享任何字母。在此研究中,教工程學的所獲得的薪金顯著高於教任何其他學科。
·    學科 4 2 共享同一個分組字母 (B),因此它們的平均值 (2.8) 之間並不存在顯著差異。 但是,這兩個學科與學科 3 1 顯著不同,因為它們之間並不共享相同的字母。
·    學科 1 與全部學科顯著不同,因為此學科在分組欄中並未共享任何字母。在此研究中,教人文學科的所獲得的薪金顯著低於教任何其他學科。

廣義線性模型 (GLM) > 多重比較
Sidak - 信賴區間  
使用 Sidak 法產生的信賴區間可確定兩個平均值是否不同:
·    如果區間不包含 0,則相應平均值之間在統計意義上有顯著差異。
·    如果區間包含 0,則平均值之間在統計意義上無顯著差異。
輸出範例
Sidak 95.0% 整體信賴區間
反應變數 薪金
主題 水準間的全部配對比較
主題 = 1  減自:
主題    下限    中心    上限     +---------+---------+---------+------
2     0.4708  0.6567  0.8425                        (---*---)
3     0.7651  0.9633  1.1615                              (---*---)
4     0.4802  0.6900  0.8998                         (---*---)
                                 +---------+---------+---------+------
                              -0.50      0.00      0.50      1.00
主題 = 2  減自:
主題     下限     中心    上限     +---------+---------+---------+------
3      0.1299  0.30667  0.4834                  (--*---)
4     -0.1563  0.03333  0.2230            (---*--)
                                   +---------+---------+---------+------
                                -0.50      0.00      0.50      1.00
主題 = 3  減自:
主題     下限     中心      上限     +---------+---------+---------+------
4     -0.4751  -0.2733  -0.07160     (----*---)
                                     +---------+---------+---------+------
                                  -0.50      0.00      0.50      1.00
解釋
對於薪金分析,要求對學科因子進行全部配對比較。由於學科有四個水準,所以這會產生六個配對比較。為區間所選的信賴水準為 95%,這與 0.05(或 5%)的全族誤差率相對應。這些比較的信賴區間表明:
·    學科 1 的平均值(區間的頂集)與學科 2 (0.4708,0.8425)、學科 3 (0.7651,1.1615) 和學科 4 (0.4802,0.8998) 的平均值之間的差異的信賴區間都只包含大於零的值。這表明教全部其他學科所得的薪金顯著高於教學科 1 所得的薪金。
·    學科 2 和學科 3 的平均值差異的信賴區間(0.1299,0.4834,區間的中集)也僅包含正數,這表明學科 3 的平均值顯著大於學科 2 的平均值。
·    學科 2 和學科 4 的平均值之間差異的信賴區間(-0.1563,0.2230,區間的中集)包含零,這表明不存在顯著差異。
學科 3 和學科 4 的平均值差異的信賴區間(-0.4751,-0.07160,區間的底集)僅包含負數,這表明學科 4 的平均值顯著小於學科 3 的平均值。

廣義線性模型 (GLM) > 多重比較
Sidak - 假設檢定  
使用個別值假設檢定所提供的調整的 p 值來確定平均值對是否有差異。在所需 a 水準(在此情況中為 0.05)對 p 值進行調整,以保持全族誤差率:
·    如果某一比較的調整的 p 值小於或等於所選 a 水準,那麼平均值之間不存在顯著差異。
·    如果調整的 p 值大於所選 a 水準,那麼平均值之間不存在顯著差異。
輸出範例
Sidak 整體檢定
反應變數 薪金
主題 水準間的全部配對比較
主題 = 1  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
2       0.6567     0.06642   9.886  0.0000
3       0.9633     0.07083  13.601  0.0000
4       0.6900     0.07497   9.204  0.0000
主題 = 2  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
3      0.30667     0.06316  4.8556  0.0002
4      0.03333     0.06777  0.4918  0.9973
主題 = 3  減自:
                                    調整的
主題  平均值差異  差異標準誤差    T     P
4      -0.2733     0.07209  -3.791  0.0036
解釋
配對比較是針對薪金分析的學科因子執行的由於學科有四個水準,所以這會產生六個配對比較。這些比較的假設檢定表明:
·    學科 1 平均值(檢定的頂集)以及學科 2 (0.0000)、學科 3 (0.0000) 和學科 4 (0.0000) 的平均值之間差異的調整 p 值都小於所選 a 水準 0.05,這表明差異顯著。另外,平均值之間的差異(平均值差異)都為正數,這表明教學科 2、學科 3 和學科 4 所得的薪金高於學科 1
·    學科 2 和學科 3 的平均值之間差異(0.0002,檢定的中集)的調整 p 值表明這些平均值之間存在顯著差異。另外,該差異 (0.30667) 為正數,表明學科 3 的平均值大於學科 2 的平均值。
·    學科 2 和學科 4 的平均值之間差異(0.9973,檢定的中集)的調整 p 值大於所選的 a 水準,這表明這些平均值之間沒有顯著差異。
學科 3 和學科 4 的平均值之間差異(0.0036,檢定的底集)小於所選的 a 水準,這表明學科 4 與學科 3 的平均值之間存在顯著差異。另外,平均值之間的差異 (-0.2733) 為負數,這表明教學科 3 所得的薪金高於學科 4

廣義線性模型 (GLM) > 圖表 - 主要效應圖  
使用主要效應圖可以使因子對反應的效應直觀化,並可比較效應的相對強度。Minitab 或者為一個因子繪製個別值主要效應圖,或者為兩個或多個因子繪製一系列圖。
Minitab 先繪製出每一製程變數水準的反應平均值,然後將各個因子的點連接起來。同時在整體(總)平均值處繪製一條參考線。檢查連接因子水準的線,以確定是否存在主要效應。只應根據變異數分析表來檢視顯著因子的主要效應圖。當某一因子在各個級別的平均值反應的變化都很顯著時,則存在主要效應。
·    當該線水準(與 x 軸平欄)時,則不存在主要效應。反應平均值不因因子水準而變化。
·    當該線非水準時(即,與 x 軸不平欄),則可能存在主要效應。反應平均值會因因子水準而變化。偏離水準的程度越大,則效應越強。透過比較各條線的斜率,可以比較製程變數效應的相對量值。
請記住,這些圖只表明了模式。要確定某一模式是否具有統計上的顯著性,必須進行相應的檢定。
輸出範例
解釋
對於薪金資料,主要效應圖表明:
·    教學科 3(工程學)的教授的薪金高於教人文學科、社會科學或管理的教授。
·    具有學歷 3(博士)的教授的薪金高於學士或碩士學歷的教授。
·    總體平均薪金(約為 2.7)跨每個組塊繪製。
這些圖表明:學歷對薪金的效應高於所教學科的效應。務必確定因子是否顯著。

廣義線性模型 (GLM) > 圖表 - 交互作用圖  
使用交互作用圖可以使兩個因子對反應的交互作用直觀化,並可以比較效應的相對強度。Minitab 為兩個因子繪製交互作用圖,或為三個或多個因子繪製圖矩陣。
對於每個製程變數組合,Minitab 將繪製反應平均值,並連接在 x 軸上繪製的低位和高位因子的點。檢查連接各個水準的線,以確定是否存在交互作用。只應根據變異數分析表來檢視顯著交互作用的交互作用效應圖。當一個因子從低位到高位的反應平均值變化取決於另一個因子的水準時,表明存在交互作用。
·    如果兩線彼此平欄,則表示不存在交互作用。因子從低水準變更為高水準時,反應平均值的變化不取決於另一因子的水準。
·    如果兩線彼此不平欄,則可能存在交互作用。因子從低水準變更為高水準時,反應平均值的變化取決於另一因子的水準。偏離平欄的程度越大,表明作用越強。務必確定交互作用是否顯著。
請記住,這些圖只表明了模式。要確定某一模式是否具有統計上的顯著性,必須進行相應的檢定。
輸出範例
解釋
對於薪金資料,圖中的線接近於平欄,因此沒有證據表明學科與學歷之間存在交互作用。也就是說,一個因子對反應的效應不受另一因子的影響。

廣義線性模型 (GLM) > 圖表 - 殘差的直方圖  
殘差的直方圖顯示全部觀測值的殘差異布。使用直方圖作為研究工具來瞭解資料的下列特徵:
·    典型值、波動或變異以及形狀
·    資料中的異常值
殘差的直方圖應該為鍾形。使用此圖尋找下列資訊:
此圖表趨勢...                         表明...
長尾                                        偏斜度
遠離其他長條的長條            異常值
由於直方圖的外觀會根據用於對資料進行分組的區間數而變更,因此請使用常態機率圖和適合度檢定來評定殘差是否為常態。
輸出範例
解釋
對於薪金資料,沒有證據表明存在偏斜度或異常值。

廣義線性模型 (GLM) > 圖表 - 殘差的常態機率圖  
此圖表圖示當分布為常態時的殘差及其期望值。根據分析得出的殘差應該是常態分布的。實際上,對於具有固定因子的平衡或接近平衡的設計,略微偏離常態性不會嚴重影響結果。
殘差的常態機率圖應該大致為一條直線。使用此圖尋找下列資訊:
此圖表趨勢...                 表明...
非直線                            非常態性
尾部為曲線                    偏斜度
遠離直線的點                異常值
斜率不斷變化                未確定的變數
如果資料的觀測值不足 50 個,則即使殘差是常態分布的,圖也可能在尾部顯示曲率。隨著觀測值數的減少,機率圖甚至可能會顯示更大的變異和非線性。使用常態機率圖和適合度檢定來評定小資料集中殘差的常態性。
輸出範例
解釋
對於薪金資料,殘差顯示為直線。沒有證據表明存在非常態性、偏斜度、異常值或未確定的變數。

廣義線性模型 (GLM) > 圖表 - 殘差與適配  
此圖表圖示殘差與適配。殘差應該在 0 附近隨機分散。使用此圖尋找下列資訊:
此圖表趨勢...                                                 表明...
殘差相對適配呈扇形或不均勻分散            異變異數
曲線                                                                缺少高次項
遠離 0 的點                                                  異常值
輸出範例
解釋
從此圖中可以看出,殘差隨機分散在 0 附近。沒有證據表明存在異變異數、缺項或異常值。

廣義線性模型 (GLM) > 圖表 - 殘差與順序  
此圖表以相應觀測值的順序圖示殘差。觀測值的順序可能影響結果時此圖會很有用,以時間順序或以某些其他順序(如地理區域)採集資料時可能影響結果。此圖在試驗未被隨機化的設計實驗中尤其有協助。
圖中的殘差應該在中心線附近隨機波動。檢查此圖以檢視相鄰誤差項之間是否存在任何相關性。殘差之間的相關性可以表示為:
·    殘差中的上升或下降趨勢
·    相鄰殘差的符號快速變化
輸出範例
解釋
對於薪金資料,殘差隨機分散在 0 附近。沒有證據表明誤差項彼此相關。

廣義線性模型 (GLM) > 圖表 - 殘差與變數  
此圖表圖示殘差與其他變數。殘差應該在中心線附近隨機波動。如果變數已經包含在模型中,則請使用此圖確定是否應該增加該變數的高次項。如果變數尚未包含在模型中,則請使用此圖確定變數是否系統地影響反應。
使用此圖尋找下列資訊:
此圖表趨勢...                         表明...
殘差排欄成圖表趨勢            變數正在系統地影響反應
點的排欄有曲率                    應該在模型中包含變數的高次項
輸出範例
解釋
對於薪金資料,殘差隨機分散在 0 附近。沒有證據表明殘差中存在模式或資料中存在曲率。此圖表明學期似乎沒有對反應產生系統化影響。

廣義線性模型 (GLM) > 圖表 - 四合一殘差圖  
四合一殘差圖在一個圖表視窗中同時顯示四種不同的殘差圖。此版面有助於比較這些圖以確定模型是否符合分析的假設。此圖表中的殘差圖包含:
·    直方圖 - 表明資料是否偏斜或資料中是否存在異常值
·    常態機率圖 - 表明資料是否為常態分布的、其他變數是否影響反應或資料中是否存在異常值
·    殘差與適配 - 表明變異數是否恆定、是否存在非線性關係或資料中是否存在異常值
·    殘差與資料順序 - 表明資料中是否存在因時間或資料採集順序而產生的系統化影響
輸出範例
解釋
要檢視四合一圖中每個殘差圖的解釋,請參考本主題之前每種殘差圖的個別值主題。

ANOVA > General Linear Model (GLM) > more

假設檢定
假設檢定是統計決策中最常用的方法之一。一般而言,假設檢定是一種假定初始聲明為真,然後使用樣本資料檢定該聲明的製程。通常,初始聲明是指相關的總體參數,如總體平均值 (m)
假設檢定包含兩個假設:原假設(以 H0 表示)和備擇假設(以 H1 表示)。原假設是初始聲明,且通常使用先前的研究或常識進行指定。備擇假設是可以相信為真實或有望證明為真實的內容。備擇假設有時稱為研究假設。
假設檢定的決策製程可以基於給定檢定的機率值(p 值)。
·    如果 p 值小於或等於預先確定的顯著性水準(a 水準),則否定原假設,並聲明支援備擇假設。
·    如果 p 值大於 a 水準,則不能否定原假設,且不聲明支援備擇假設。
執行假設檢定時,有四種可能的結果。結果取決於原假設的真假以及能否否定原假設。下表中匯總了這些結果:
如果原假設為真,但否定了原假設,則發生類型 I 錯誤。發生類型 I 錯誤的機率稱為阿爾法 (a),有時也稱為顯著性水準。
如果原假設為假,但未能否定它,則發生類型 II 錯誤。發生類型 II 錯誤的機率稱為 b
原假設為假時,否定它的機率等於 1 - b。此值也稱為檢定的檢定力。

選擇 a 水準
a 的選擇決定類型 I 錯誤的機率。此值越小,錯誤地否定原假設 (H0) 的幾率就越小。但是,a 值越小就意味著檢定力越低,並因此降低了檢測到效應(如果存在)的幾率。
按照慣例,最常用的 a 水準為 0.05a = 0.05 表示發現實際並不存在的效應的幾率僅為 5%。大多數情況下,認為這種出現錯誤的機率可允收。但是,對特定檢定選擇 a 時,可能需要考慮何種錯誤更嚴重:發現實際不存在的效應,或未發現實際存在的效應。
選擇較小的 a。有時選擇較小、較保守的 a 值更好。範例,假設要檢定新銑床中的樣本,並嘗試決定是否購買並在加工車間中安裝一批這種機器。如果新機器比當前使用的機器更精確,則會節省大量資金,因為生產的殘次品將會減少。但是,購買和安裝一批機器的成本非常高。購買前需要確信新機器更加精確。這種情況下,可能需要選擇較低的 a 值,如 0.001。這樣,如果實際上並非如此,將斷定新機器更精確的幾率也僅為 0.1%
選擇較大的 a。另一方面,有時選擇較大、較寬鬆的 a 值更好。範例,假設噴氣發動機製造商要檢定一種價格較低的新滾珠軸承的穩定性。很明顯,如果滾珠不合格,則節省的少量滾珠成本沒有潛在災難性後果的代價值得重視。因此,可能需要選擇較高的 a 值,如 0.1。儘管這意味著在不存在差異的情況下將更可能錯誤地斷定存在差異,但更重要的是更可能檢測到軸承穩定性中的差異(如果存在)。

統計意義與實際意義
即使以統計學觀點來看水準平均值有顯著差異,這種差異可能也沒有任何實際意義。在油漆硬度資料中,最小平均值和最大平均值分別為 8.567 18.067。這 9.5 個單位的差異有任何實際意義嗎?這個問題只能用該學科領域的知識回答,而不能用統計學回答。

什麼是交互作用?
如果交互作用顯著,那麼這表明個別值因子的效應在其他因子的不同水準之中有所不同。下表對汽車銷售量中色彩和季節效應之間的交互作用進行圖解:
                  季節       
色彩        夏季          冬季
黑色         600           200
白色         300           300
該表表明:黑車在夏季的銷量超過冬季,而白車的銷量在夏季和冬季相同。您可以得出如下結論:
·    色彩對汽車銷售量的效應取決於季節。
·    季節對汽車銷售量的效應與色彩相關。
預測反應變數值時,兩個(或多個因子)的這種相互依賴性叫做交互作用。
注意:如果交互作用中包含多個個別值因子,那麼解釋個別值因子的效應(主要效應)並無用處。範例,可以嘗試得出汽車銷售資料的一般結論,比如:夏季的汽車銷量更好(反映季節的主要效應)或者黑色汽車比白色汽車銷量更好(反映色彩的主要效應)。但類似的結論僅可傳達一部分資訊。如果經銷商需要確定每種色彩的汽車庫存數量,那麼他需要瞭解全部狀況。

選擇比較方法
對於對照的多重比較:
·    使用 DunnettBonferroni Sidak 法。
·    Dunnett 法通常比 Bonferroni Sidak 法更有效。
對於全部配對比較:
·    使用 TukeyBonferroni Sidak 法。
·    Tukey 法通常比 Bonferroni Sidak 法更有效。

什麼是殘差
Minitab 提供三種類型的殘差:
·    常規殘差:觀測值 - 預測值。
·    標準化殘差:常規殘差 / 常規殘差的標準差。
標準化消除了資料點位置對於預測值或因子的影響。
·    學習化已刪除殘差:對於 ith 資料點,公式遵循與標準化殘差相同的表達方式。但是,計算第i個 學習化已刪除殘差時適配和標準差都是在刪除第i個觀測後得到的。與標準化殘差相比,學習化已刪除殘差在出現異常資料點時會變大。

模型假設
迴歸和變異數分析製程關於誤差做出下列假設:
·    誤差為常態分布,且平均值為 0
·    誤差變異數不會為不同因子水準或根據預測反應的值而發生變更。
·    每種誤差都獨立於全部其他誤差。在所設計的實驗中,獲得獨立誤差的最好方式是隨機化實驗的實驗順序。
在分析中檢定這些假設的有效性。殘差是誤差的最佳估計值。因此,可以使用殘差圖以圖表方式檢查每個假設。
如果模型違反這些假設,則分析的結果可能有誤導性。範例,如果誤差相互關聯,則可能會錯誤地估計係數的標準誤差,從而導致錯誤的 t 值和 p 值。

直方圖和常態性
下列是從常態分布中抽取的九個資料集樣本。這些樣本沒有問題;但是,這些直方圖中大多數看起來不是鍾形,這描述了為什麼不應該使用直方圖來判斷資料的常態性。判斷資料是否為常態分布需要使用常態機率圖。
隨機產生樣本的直方圖
每個樣本包含常態分布中的 24 個觀測值。

轉換反應變數
殘差表示異變異數或非常態性時,必須進行轉換。
您可能還會發現在模型表現出顯著缺適性時資料轉換非常有用,而且這種轉換在反應曲面實驗的分析中尤為重要。假設在模型中包含全部顯著的交互作用和二次項,但缺適性檢定表明需要高次項。轉換可以消除缺適性。
如果資料轉換修正了此問題,使用迴歸分析比用其他可能更複雜的分析方法要好一些。迴歸分析或實驗設計分析的結果可以指導我們選擇合適的資料轉換方法解決不同的問題。
Box-Cox 轉換是最常用的變異數穩定轉換。在下面第一個圖表中,殘差表示異變異數。第二個圖表顯示變異數穩定轉換之後的殘差。適配的刻度(x 軸)變更,而變異數變為恆定。


常態機率圖中的圖表趨勢
下列圖表趨勢違反了誤差為常態分布這一假設。


非常態性的效應
迴歸和變異數分析的一個假設為殘差來自常態分布。但是,如果設計僅有固定因子,設計為平衡或接近平衡,且具有相當多的觀測值,則略微偏離常態性不會嚴重影響結果。

發現非常態圖表有趨勢時該怎麼做
可能難以正確指出常態機率圖中明顯偏離常態性的原因。可能的原因包含:
·    齊次變異數假設失敗
·    殘差異常大(異常值)
·    模型中缺少重要變數
·    資料來自非常態總體
對於完整分析,請將常態機率圖與其他診斷圖以及適合度統計量結合使用。
如果發現非常態圖表趨勢:
1    使用其他診斷圖檢視非常態性是否由非常態總體中的資料之外的因素所導致。
2    使用統計 > 基本統計 > 常態性檢定來執行常態性檢定。
3    如果確定資料來自非常態總體,則可以在繼續分析之前轉換資料。請參見轉換反應變數。
注意
 修復不等變異數問題的轉換通常也修復常態性問題。

殘差與適配圖中的圖表趨勢
下列圖表趨勢顯示異常值和對誤差為恆定這一假設的衝突。
異常值圖
右上角的殘差比圖中其他全部都大很多,因此為異常值。如果異常值過多,則模型可能不妥當。異常值可能是由於量測錯誤所導致。應該調查異常值以確定其原因。
異變異數圖
殘差的變異數隨適配增加。請注意,隨著適配的增加,殘差在零殘差線周圍分散得更廣,指明不等的(非恆定)變異數。此圖表趨勢表明誤差變異數隨平均值的增加而增加。資料的轉換會有助於穩定這些變異數。

發現圖表有趨勢時該怎麼做
如果圖顯示...                 執行此操作...
異變異數                        1    使用統計 > 變異數分析 > 變異數相等檢定來檢定相等變異數的假設。
2    如果圖或檢定表明變異數不等,則考慮轉換反應變數。
異常值或有影響的點    1    驗證觀測值不是量測或資料錄入錯誤。
2    考慮執行分析時不包含此觀測值來檢視它是否影響結果。
缺少高次項                    增加此項並重新適配模型。

殘差與順序圖中的圖表趨勢
下列圖表趨勢違反了誤差彼此獨立這一假設。
隨著觀測值的順序從左到右提高,殘差系統地降低。
殘差的值從低(左)到高(右)急劇變化。

發現圖表有趨勢時該怎麼做
殘差與資料順序圖中的圖表趨勢表明誤差不是獨立的。此指示可能嚴重影響分析的結論,因此應該至少考慮下列一種補救措施:
·    由於誤差的非獨立性往往難以修正,因此如果要進行設計的實驗,應該盡量透過隨機化試驗以防止出現這種問題。
·    向模型中增加時間效應以消除誤差項的相關。範例,正在檢視幾個月期間的日收入。增加表示一周中某天的因子會消除誤差項中的非獨立性。
·    考慮時間序列製程(如 ARIMA)以解決誤差項中的自相關。

發現圖表有趨勢時該怎麼做
殘差與變數圖中的圖表趨勢表明可能未在模型中包含重要變數或未包含變數的高次項。
·    如果該變數在模型中,請為該變數增加高次項並重新適配模型。範例,曲線圖表趨勢表明應該增加平方項。
·    如果該變數不在模型中,請為該變數增加一項並重新適配模型。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.