有學過6
sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. 宏; 變異數分析
v.s.方差分析; 進階 v.s. 高级…
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!
先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
DOE > Mixture > Analyze Mixture Design
分析混合設計 > 匯總
使用「分析混合設計」可將模型適配到使用混合設計(單體形心、單體格子或極端頂點)收集的資料。可以從六種標準模型(線性、二次、特殊立方、完全立方、特殊四次、完全四次)中進行選擇,也可以從全部可估計項的列表中選擇特定項。
還可以從下述四種模型適配方法中進行選擇:
· 混合迴歸
· 逐步迴歸
· 前向選擇法
· 後向消除法
資料描述
一家食品實驗室的研究人員正在嘗試改善奶酪火鍋的烹飪方法。他們要研究混合混合和火鍋的操作溫度如何影響口味。
混合物由三種成分組成:兩種類型的瑞士奶酪(Emmenthaler 和 Gruyere)和白葡萄酒。
資料:
火鍋.MTW (在樣本資料檔案夾中)
分析混合設計 > 混合迴歸 迴歸表 - P 值
使用 p 值 (P) 確定模型中哪些效應的統計意義顯著。要使用 p 值,需要:
· 為要評估的效應確認 p 值。
· 將此
p 值與您的 a 水準進行比較。常用的 a 水準為 0.05。
- 如果該 p 值小於或等於 a,則描述效應顯著。
- 如果該 p 值大於 a,則描述效應不顯著。
輸出範例
香料
的估計迴歸係數(分量比例)
變異數膨
項 係數 係數標準誤差 T P 脹因子
多孔乾酪 500 141.50 *
* 24937
格裡爾乾酪 -89 54.85 *
* 613
紅酒
395 143.73 *
* 43038
多孔乾酪*格裡爾乾酪
1200 375.92 3.19
0.019 2655
多孔乾酪*紅酒 -1676 593.83
-2.82 0.030 102454
格裡爾乾酪*紅酒 -869 409.98
-2.12 0.078 7888
多孔乾酪*溫度 -572 141.50
-4.04 0.007 24937
格裡爾乾酪*溫度
263 54.85
4.79 0.003 613
紅酒*溫度 -568 143.73
-3.95 0.008 43038
多孔乾酪*格裡爾乾酪*溫度 -1440
375.92 -3.83 0.009
2655
多孔乾酪*紅酒*溫度 2388 593.83
4.02 0.007 102454
格裡爾乾酪*紅酒*溫度 1433
409.98 3.50 0.013
7888
* 注 * 係數是為已編碼的製程變數計算的。
解釋
對於奶酪火鍋資料,迴歸表顯示下列內容:
· 與溫度的交互作用:模型中有六項是從溫度交互作用的角度來分析混合的。
- 兩分量混合與溫度:每個兩分量混合都體現了與溫度交互作用的效果。也就是說,全部兩分量混合的二元混合特徵因操作溫度而異:這些效果對應於迴歸表中的下列輸入:
· Emmentha*Gruyere*溫度:p 值 = .009
· Emmentha*葡萄酒*溫度:p 值 = .007
·
Gruyere*葡萄酒*溫度:p 值 = .013
- 一分量混合與溫度:每個單分量混合都體現了與溫度交互作用的效果。也就是說,全部單分量混合的混合特徵因操作溫度而異:這些效果對應於迴歸表中的下列輸入:
· Emmentha*溫度:p 值 = .007
· Gruyere*溫度:p 值 = .003
· 葡萄酒*溫度:p 值 = 0.008
· 二元混合:兩個兩分量混合具有顯著的二元混合效果。也就是說,兩分量混合混合的口味等級不同於單獨兩個分量的簡單平均。這些效果對應於迴歸表中的下列輸入:
- Emmentha*Gruyere:p 值 = .019。此外,係數為正 (1200) 表示兩個分量互相促進或互相補充。也就是說,該混合的平均認可記分高於計算兩種純混合的認可記分的簡單平均所得到的分數。
- Emmentha*葡萄酒:p 值 = 0.030。此外,係數為負 (-1676) 表示兩個分量之間具有反作用。也就是說,平均認可記分低於透過計算兩個認可記分的簡單平均而得到的分數。
- Gruyere*葡萄酒 p 值 = 0.078。p 值是二元混合中最不顯著的。
分析混合設計 > 混合迴歸 迴歸表 - 係數
模型中的每項都有係數。使用這些係數可以構造表示反應與設計變數(分量、製程變數和數量變數)之間關係的方程式。
要使用此方程式,請將分量比例和已編碼製程變數值代入,然後計算出預測的反應。由於係數是使用分量比例和已編碼製程變數估計的,因此將擬分量、數量或未編碼製程變數值的分量代入此方程式將無法得出正確的預測。
輸出範例
香料
的估計迴歸係數(分量比例)
變異數膨
項 係數 係數標準誤差 T P 脹因子
多孔乾酪 500 141.50 *
* 24937
格裡爾乾酪 -89 54.85 *
* 613
紅酒
395 143.73 *
* 43038
多孔乾酪*格裡爾乾酪
1200 375.92 3.19
0.019 2655
多孔乾酪*紅酒 -1676 593.83
-2.82 0.030 102454
格裡爾乾酪*紅酒 -869 409.98
-2.12 0.078 7888
多孔乾酪*溫度 -572 141.50
-4.04 0.007 24937
格裡爾乾酪*溫度
263 54.85
4.79 0.003 613
紅酒*溫度 -568 143.73
-3.95 0.008 43038
多孔乾酪*格裡爾乾酪*溫度 -1440
375.92 -3.83 0.009
2655
多孔乾酪*紅酒*溫度 2388 593.83
4.02 0.007 102454
格裡爾乾酪*紅酒*溫度 1433
409.98 3.50 0.013
7888
* 注 * 係數是為已編碼的製程變數計算的。
解釋
以奶酪火鍋資料為例,其迴歸方程式為:
口味 = 500(Emmentha) - 89(Gruyere) + 395(葡萄酒)+
1200(Emmentha*Gruyere) - 1676(Emmentha*葡萄酒)- 869(Gruyere*葡萄酒) -
572(Emmentha*溫度) + 263(Gruyere*溫度)- 568(葡萄酒*溫度)- 1440(Emmentha*Gruyere*溫度)+ 2388(Emmentha*葡萄酒*溫度)+ 1433(Gruyere*葡萄酒*溫度)
分析混合設計 > 混合迴歸 迴歸表 - R 平方
R 代表了由模型解釋的反應中的變數比例。Minitab 顯示三種類型的 R:
· R (R-Sq) 描述觀測反應中由模型解釋的變異的數量。
· 調整的 R 表示已根據模型中的項數調整的修正 R。如果包含了不必要的項,R 會人為地變得很高。與 R 不同,調整的 R 在您向模型中增加項時可能變小。
· 預測
R (R-Sq(pred)) 反映模型預測未來資料的準確度。
注意
透過在迴歸模型中包含過多的項,可使 R 人為增高。如果給模型增加不必要的預測變數,則即使沒有獲得關於反應的更多資訊,通常也會使 R 的值增大。由於調整的 R 考慮了模型中預測變數的數目,因此它比 R 更適合用來比較具有不同數目預測變數的模型。
輸出範例
S = 1.48597 PRESS = 484.810
R-Sq = 99.64% R-Sq(預測) =
86.92% R-Sq(調整)
= 98.99%
解釋
對於奶酪火鍋的資料,R 為 99.64%,調整的 R 為
98.99%,預測 R 為
86.92%。
分析混合設計 > 混合迴歸 變異數分析表
使用變異數分析表中的 p 值 (P) 確定模型中哪些效應的統計意義顯著。要使用 p 值,需要:
· 為要評估的效應確認 p 值。
· 將此
p 值與您的 a 水準進行比較。常用的 a 水準為 0.05。
- 如果該 p 值小於或等於 a,則描述效應顯著。
- 如果該 p 值大於 a,則描述效應不顯著。
輸出範例
對於
香料 的變異數分析(分量比例)
來源 自由度 Seq SS
Adj SS Adj MS F
迴歸
11 3693.03 3693.029
335.730 152.04
僅分量
線性 2 3207.12
553.195 276.597 125.26
二次 3 91.95
91.948 30.649 13.88
多孔乾酪*格裡爾乾酪 1 0.00
22.500 22.500 10.19
多孔乾酪*紅酒 1 82.03
17.586 17.586 7.96
格裡爾乾酪*紅酒 1 9.91
9.914 9.914 4.49
分量* 溫度
線性 3
294.55 53.799 17.933
8.12
多孔乾酪*溫度 1 250.09
36.033 36.033 16.32
格裡爾乾酪*溫度 1 37.66
50.654 50.654 22.94
紅酒*溫度 1 6.79
34.487 34.487 15.62
二次 3 99.42
99.419 33.140 15.01
多孔乾酪*格裡爾乾酪*溫度
1 24.46 32.400
32.400 14.67
多孔乾酪*紅酒*溫度 1 47.96
35.703 35.703 16.17
格裡爾乾酪*紅酒*溫度
1 26.99 26.995
26.995 12.23
殘差誤差
6 13.25 13.249
2.208
合計
17 3706.28
來源
P
迴歸
0.000
僅分量
線性 0.000
二次 0.004
多孔乾酪*格裡爾乾酪 0.019
多孔乾酪*紅酒 0.030
格裡爾乾酪*紅酒 0.078
分量* 溫度
線性 0.016
多孔乾酪*溫度 0.007
格裡爾乾酪*溫度 0.003
紅酒*溫度 0.008
二次 0.003
多孔乾酪*格裡爾乾酪*溫度
0.009
多孔乾酪*紅酒*溫度
0.007
格裡爾乾酪*紅酒*溫度
0.013
殘差誤差
合計
解釋
對於奶酪火鍋資料,變異數分析表會顯示下列內容:
· 迴歸:此項檢定模型中的項是否對反應有影響。在迴歸模型中反應是顯著的 (p = 0.000)。也就是說,迴歸方程式中至少有一項對平均值反應產生了影響。
迴歸進一步細分為僅分量以及分量和製程變數(溫度),然後再細分為模型中不同階的項 - 線性和二次。
- 僅分量
- 線性:全部線性項的 p 值為 0.000,表示至少有一個線性項對平均反應有影響。
- 二次:全部二次項的 p 值為 0.004,表示至少有一個二次項對平均反應有影響。Emmentha*葡萄酒項(p 值 = 0.030)和
Emmentha*格裡爾乾酪項(p 值 = 0.019)很顯著。
- 分量*溫度
- 線性:全部線性項的 p 值為 0.016,表示至少有一項對平均反應有影響。全部個別值線性項的 p 值都小於 0.05。
- 二次:全部二次項的 p 值為 0.003,表示至少有一個二次項對平均反應有影響。全部單獨二次項的 p 值都小於 0.05。
· 殘差誤差:殘差誤差量測反應中模型無法解釋的變異量。
分析混合設計 > 混合迴歸 異常觀測值
異常觀測表顯示帶有絕對值大於 2 的標準化殘差的案例。這些案例不那麼遵循建議的迴歸方程式。
對於異常觀測值,應調查資料記錄是否正確,資料收集製程是否受到其他因素的影響。
注意
殘差圖也有助於檢查有關迴歸模型的假設。
輸出範例
香料
的異常觀測值
適配 標準化
觀測值 標準順序 香料 適配 標準誤差 殘差 殘差
10 10
58.000 58.799 1.436
-0.799 -2.10R
12 12
94.000 93.210 1.436
0.790 2.07R
R 表示此觀測值含有大的標準化殘差
解釋
對於奶酪火鍋資料,有兩個觀測值異常:
· 觀測值 10,標準化殘差為 - 2.10
· 觀測值 12,標準化殘差為 2.07
分析混合設計 > 圖表 - 殘差的直方圖
殘差的直方圖顯示全部觀測值的殘差異布。使用直方圖作為研究工具來瞭解資料的下列特徵:
· 典型值、波動或變異以及形狀
· 資料中的異常值
殘差的直方圖應該為鍾形。使用此圖尋找下列資訊:
此圖表趨勢... 表明...
長尾 偏斜度
遠離其他長條的長條 異常值
由於直方圖的外觀會根據用於對資料進行分組的區間數而變更,因此請使用常態機率圖和適合度檢定來評定殘差是否為常態。
輸出範例
解釋
對於奶酪火鍋資料,沒有證據表明存在偏斜度或異常值。
分析混合設計 > 圖表 - 殘差的常態機率圖
此圖表圖示當分布為常態時的殘差及其期望值。根據分析得出的殘差應該是常態分布的。實際上,對於平衡或接近平衡的設計,或者對於具有大量觀測值的資料,略微偏離常態性不會嚴重影響結果。
殘差的常態機率圖應該大致為一條直線。使用此圖尋找下列資訊:
此圖表趨勢... 表明...
非直線 非常態性
尾部為曲線 偏斜度
遠離直線的點 異常值
斜率不斷變化 未確定的變數
如果資料的觀測值不足 50 個,則即使殘差是常態分布的,圖也可能在尾部顯示曲率。隨著觀測值數的減少,機率圖甚至可能會顯示更大的變異和非線性。使用常態機率圖和適合度檢定來評定小資料集中殘差的常態性。
輸出範例
解釋
對於奶酪火鍋資料,點非常接近直線分布,表明資料非常接近常態分布。儘管較低尾部的點看似異常,但仍可透過資料繪製直線且此點將非常接近該直線。此外,它還能成功透過常態性的統計檢定。
分析混合設計 > 圖表 - 殘差與適配
此圖表圖示殘差與適配。殘差應該在 0 附近隨機分散。使用此圖尋找下列資訊:
此圖表趨勢... 表明...
殘差相對適配呈扇形或不均勻分散 異變異數
曲線 缺少高次項
遠離 0 的點 異常值
在 x 方向遠離其他點的點 有影響的點
輸出範例
解釋
從此圖中可以看出,殘差隨機分散在 0 附近。沒有證據表明存在異變異數、缺項、異常值或有影響的點。
分析混合設計 > 圖表 - 殘差與順序
此圖表以相應觀測值的順序圖示殘差。觀測值的順序可能影響結果時此圖會很有用,以時間順序或以某些其他順序(如地理區域)採集資料時可能影響結果。此圖在試驗未被隨機化的設計實驗中尤其有協助。
圖中的殘差應該在中心線附近隨機波動。檢查此圖以檢視相鄰誤差項之間是否存在任何相關性。殘差之間的相關性可以表示為:
· 殘差中的上升或下降趨勢
· 相鄰殘差的符號快速變化
輸出範例
解釋
就奶酪火鍋資料而言,殘差並未隨機分散在 0 附近。有證據表明誤差項彼此相關。殘差的變異似乎隨順序遞增而增加,這表明時間或資料收集順序可能存在系統的影響。在評估其他證據後,可能需要轉換這些資料才能證實此假設。
分析混合設計 > 圖表 - 殘差與變數
此圖表圖示殘差與其他變數。殘差應該在中心線附近隨機波動。如果變數已經包含在模型中,則請使用此圖確定是否應該增加該變數的高次項。如果變數尚未包含在模型中,則請使用此圖確定變數是否系統地影響反應。
使用此圖尋找下列資訊:
此圖表趨勢... 表明...
殘差排欄成圖表趨勢 變數正在系統地影響反應
點的排欄有曲率 應該在模型中包含變數的高次項
輸出範例
解釋
就奶酪火鍋資料而言,殘差並未隨機分散在 0 附近。有證據表明殘差中存在圖表趨勢或資料中存在曲率。奶酪火鍋資料是使用多種食物收集的。在火鍋中浸入小蝦(1 級)、蘋果(2 級)和麵包(3 級)。殘差與食物圖表明浸入火鍋中的食物似乎對強量測存在系統性影響。蘋果的殘差與小蝦和麵包的殘差相比分布的範圍更廣。您可能需要在分析中包含食物並評估其對口味的影響。
分析混合設計 > 圖表 - 四合一殘差圖
四合一殘差圖在一個圖表視窗中同時顯示四種不同的殘差圖。此版面有助於比較這些圖以確定模型是否符合分析的假設。此圖表中的殘差圖包含:
· 直方圖 - 表明資料是否偏斜或資料中是否存在異常值
· 常態機率圖 - 表明資料是否為常態分布的、其他變數是否影響反應或資料中是否存在異常值
· 殘差與適配 - 表明變異數是否恆定、是否存在非線性關係或資料中是否存在異常值
· 殘差與資料順序 - 表明資料中是否存在因時間或資料採集順序而產生的系統化影響
輸出範例
解釋
要檢視四合一圖中每個殘差圖的解釋,請參考本主題之前每種殘差圖的個別值主題。
DOE > Mixture > Analyze Mixture Design > more
什麼是殘差
Minitab 提供三種類型的殘差:
· 常規殘差:觀測值 - 預測值。
· 標準化殘差:常規殘差 / 常規殘差的標準差。
標準化消除了資料點位置對於預測值或因子的影響。
· 學習化已刪除殘差:對於 ith 資料點,公式遵循與標準化殘差相同的表達方式。但是,計算第i個 學習化已刪除殘差時適配和標準差都是在刪除第i個觀測後得到的。與標準化殘差相比,學習化已刪除殘差在出現異常資料點時會變大。
模型假設
迴歸和變異數分析製程關於誤差做出下列假設:
· 誤差為常態分布,且平均值為 0。
· 誤差變異數不會為不同因子水準或根據預測反應的值而發生變更。
· 每種誤差都獨立於全部其他誤差。在所設計的實驗中,獲得獨立誤差的最好方式是隨機化實驗的實驗順序。
在分析中檢定這些假設的有效性。殘差是誤差的最佳估計值。因此,可以使用殘差圖以圖表方式檢查每個假設。
如果模型違反這些假設,則分析的結果可能有誤導性。範例,如果誤差相互關聯,則可能會錯誤地估計係數的標準誤差,從而導致錯誤的 t 值和 p 值。
直方圖和常態性
下列是從常態分布中抽取的九個資料集樣本。這些樣本沒有問題;但是,這些直方圖中大多數看起來不是鍾形,這描述了為什麼不應該使用直方圖來判斷資料的常態性。判斷資料是否為常態分布需要使用常態機率圖。
隨機產生樣本的直方圖
每個樣本包含常態分布中的 24 個觀測值。
轉換反應變數
殘差表示異變異數或非常態性時,必須進行轉換。
您可能還會發現在模型表現出顯著缺適性時資料轉換非常有用,而且這種轉換在反應曲面實驗的分析中尤為重要。假設在模型中包含全部顯著的交互作用和二次項,但缺適性檢定表明需要高次項。轉換可以消除缺適性。
如果資料轉換修正了此問題,使用迴歸分析比用其他可能更複雜的分析方法要好一些。迴歸分析或實驗設計分析的結果可以指導我們選擇合適的資料轉換方法解決不同的問題。
Box-Cox 轉換是最常用的變異數穩定轉換。在下面第一個圖表中,殘差表示異變異數。第二個圖表顯示變異數穩定轉換之後的殘差。適配的刻度(x 軸)變更,而變異數變為恆定。
常態機率圖中的圖表趨勢
下列圖表趨勢違反了誤差為常態分布這一假設。
非常態性的效應
迴歸和變異數分析的一個假設為殘差來自常態分布。但是,如果設計僅有固定因子,設計為平衡或接近平衡,且具有相當多的觀測值,則略微偏離常態性不會嚴重影響結果。
發現非常態圖表有趨勢時該怎麼做
可能難以正確指出常態機率圖中明顯偏離常態性的原因。可能的原因包含:
· 齊次變異數假設失敗
· 殘差異常大(異常值)
· 模型中缺少重要變數
· 資料來自非常態總體
對於完整分析,請將常態機率圖與其他診斷圖以及適合度統計量結合使用。
如果發現非常態圖表趨勢:
1 使用其他診斷圖檢視非常態性是否由非常態總體中的資料之外的因素所導致。
2 使用統計 > 基本統計 > 常態性檢定來執行常態性檢定。
3 如果確定資料來自非常態總體,則可以在繼續分析之前轉換資料。請參見轉換反應變數。
注意
修復不等變異數問題的轉換通常也修復常態性問題。
殘差與適配圖中的圖表趨勢
下列圖表趨勢顯示異常值和對誤差為恆定這一假設的衝突。
異常值圖
右上角的殘差比圖中其他全部都大很多,因此為異常值。如果異常值過多,則模型可能不妥當。異常值可能是由於量測錯誤所導致。應該調查異常值以確定其原因。
異變異數圖
殘差的變異數隨適配增加。請注意,隨著適配的增加,殘差在零殘差線周圍分散得更廣,指明不等的(非恆定)變異數。此圖表趨勢表明誤差變異數隨平均值的增加而增加。資料的轉換會有助於穩定這些變異數。
發現圖表有趨勢時該怎麼做
如果圖顯示... 執行此操作...
異變異數 1
使用統計 > 變異數分析 > 變異數相等檢定來檢定相等變異數的假設。
2 如果圖或檢定表明變異數不等,則考慮轉換反應變數。
異常值或有影響的點 1 驗證觀測值不是量測或資料錄入錯誤。
2 考慮執行分析時不包含此觀測值來檢視它是否影響結果。
缺少高次項 增加此項並重新適配模型。
殘差與順序圖中的圖表趨勢
下列圖表趨勢違反了誤差彼此獨立這一假設。
隨著觀測值的順序從左到右提高,殘差系統地降低。
殘差的值從低(左)到高(右)急劇變化。
發現圖表有趨勢時該怎麼做
殘差與資料順序圖中的圖表趨勢表明誤差不是獨立的。此指示可能嚴重影響分析的結論,因此應該至少考慮下列一種補救措施:
· 由於誤差的非獨立性往往難以修正,因此如果要進行設計的實驗,應該盡量透過隨機化試驗以防止出現這種問題。
· 向模型中增加時間效應以消除誤差項的相關。範例,正在檢視幾個月期間的日收入。增加表示一周中某天的因子會消除誤差項中的非獨立性。
· 考慮時間序列製程(如 ARIMA)以解決誤差項中的自相關。
發現圖表有趨勢時該怎麼做
殘差與變數圖中的圖表趨勢表明可能未在模型中包含重要變數或未包含變數的高次項。
· 如果該變數在模型中,請為該變數增加高次項並重新適配模型。範例,曲線圖表趨勢表明應該增加平方項。
· 如果該變數不在模型中,請為該變數增加一項並重新適配模型。
詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/
和 http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構…等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.
沒有留言:
張貼留言