2012年10月31日 星期三

Minitab: 6 sigma 專業軟體 繁體中文討論-110



有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
DOE > Response Surface > Analyze Response Surface Design

分析反應曲面設計 > 匯總  
使用「分析反應曲面設計」可對使用中心複合設計、Box-Behnken 設計或自設反應曲面設計收集的資料進行模型適配。
可以使用下列項適配模型:
·    線性項
·    二次項
·    交互作用項
資料描述
一個化工廠商正在嘗試最大限制地提高催化反應的產量。研究人員使用中心複合設計來研究時間(時間)和溫度(溫度)對反應產量(產量)的影響。由於資料是分兩天採集的,因此設計包含兩個集區。
資料: 催化反應.MTW (在樣本資料檔案夾中)

分析反應曲面設計 > 迴歸表 - P   
p (P) 確定模型中哪些效應的統計意義顯著。檢視迴歸表中的個別值效應前,應先檢查變異數分析表中全部線性、平方和交互作用效應的 F 綜合測試的 p 值。在確定一組顯著效應(範例,線性效應或交互作用效應)之後,可以使用迴歸表評估個別值效應。
如果變異數分析表表明平方效應或交互作用效應顯著,則應先觀察這些效應,因為它們會影響線性效應的解釋方式。要使用 p 值,需要:
·    為要評估的效應確認 p 值。
·    將此 p 值與您的 a 水準進行比較。常用的 a 水準為 0.05
-    如果該 p 值小於或等於 a,則描述效應顯著。
-    如果該 p 值大於 a,則描述效應不顯著。
輸出範例
分析是使用已編碼單位進行的。
產量 的估計迴歸係數
            係數  係數標準誤差        T      P
常數       87.2167      0.6218  140.271  0.000
集區        0.9286      0.4070    2.281  0.057
時間       -1.3837      0.5385   -2.570  0.037
溫度        0.3620      0.5385    0.672  0.523
時間*時間  -2.0646      0.5605   -3.684  0.008
溫度*溫度  -3.0146      0.5605   -5.379  0.001
時間*溫度  -4.8750      0.7615   -6.402  0.000
S = 1.52302    PRESS = 126.335
R-Sq = 93.00%  R-Sq(預測) = 45.50%  R-Sq(調整) = 86.99%
解釋
對於催化反應資料,迴歸表顯示:
·    集區效應:資料是連續兩天採集的,每天都作為一個集區。
集區的 p 值為 0.057,不小於 0.05。因此,沒有顯著的集區效應。也就是說,資料在兩個集區(每個集區表示不同的一天)中採集這一事實並不對催化反應的產量有顯著效應。
·    交互作用效應:該模型包含一個雙因子交互作用(時間*溫度)。由於只有一個交互作用項,該表格中欄出的 p 值與變異數分析表中時間*溫度的效應的 p 值相同。
時間與溫度交互作用的 p 值為 0.000,小於 0.05,這描述此交互作用的效應顯著。換言之,時間對反應產量的效應取決於溫度。
·    平方效應:該模型包含兩個平方效應(時間*時間和溫度*溫度)。平方項用於評估反應曲面中是否存在曲率(二次)。由於平方項在變異數分析表中被識別為顯著(p = 0.001),因此可以逐個檢視各項。
這兩個平方效應的 p 值(時間*時間 = 0.008,溫度*溫度 = 0.001)都小於 0.05。因此,存在顯著的二次效應。也就是說,時間和產量以及溫度和產量之間的關係符合曲線規律而不是直線規律。
·    線性效應:該模型包含兩個線性效應(時間和溫度),用該模型評估是否存在顯著的交互作用效應和平方效應時應非常謹慎。
時間的 p 值為 0.037,小於 0.05。因此,存在顯著的時間線性效應。也就是說,產量會隨反應時間的變化而變化。
溫度的 p 值為 0.523,不小於 0.05。因此,沒有顯著的溫度效應。也就是說,產量不會隨反應溫度的變化而改變。

分析反應曲面設計 > 迴歸表 - 係數  
模型中的每項都有係數。使用這些係數構建表示反應與因子之間關係的方程式。
要使用此方程式,請插入已編輯因子值並計算預測的反應。由於這些係數是用已編碼單位估計的,因此將未編碼因子值代入此方程式會得出關於反應產量的錯誤預測。
輸出範例
分析是使用已編碼單位進行的。
產量 的估計迴歸係數
            係數  係數標準誤差        T      P
常數       87.2167      0.6218  140.271  0.000
集區        0.9286      0.4070    2.281  0.057
時間       -1.3837      0.5385   -2.570  0.037
溫度        0.3620      0.5385    0.672  0.523
時間*時間  -2.0646      0.5605   -3.684  0.008
溫度*溫度  -3.0146      0.5605   -5.379  0.001
時間*溫度  -4.8750      0.7615   -6.402  0.000
S = 1.52302    PRESS = 126.335
R-Sq = 93.00%  R-Sq(預測) = 45.50%  R-Sq(調整) = 86.99%
解釋
對於催化反應資料,其迴歸方程式為:
產量 = 87.2167 + 0.9286 (集區) - 1.3837 (時間) + 0.3620 (溫度) - 2.0646 (時間)  - 3.0146 (溫度) - 4.8750(時間*溫度)

分析反應曲面設計 > 迴歸表 - R 平方  
R 和調整的 R 代表了有模型解釋的反應中的變數比例。
·    R (R-Sq) 描述觀測反應中由模型解釋的變異的數量。
·    預測的 R 反映模型預測未來資料的準確程度。
·    調整的 R 表示已根據模型中的項數調整的修正 R。如果包含了不必要的項,R 會人為地變得很高。與 R 不同,調整的 R 在您向模型中增加項時可能變小。
注意
 透過在迴歸模型中包含過多的項,可使 R 人為增高。如果給模型增加不必要的預測變數,則即使沒有獲得關於反應的更多資訊,通常也會使 R 的值增大。由於調整的 R 考慮了模型中預測變數的數目,因此它比 R 更適合用來比較具有不同數目預測變數的模型。
輸出範例
分析是使用已編碼單位進行的。
產量 的估計迴歸係數
            係數  係數標準誤差        T      P
常數       87.2167      0.6218  140.271  0.000
集區        0.9286      0.4070    2.281  0.057
時間       -1.3837      0.5385   -2.570  0.037
溫度        0.3620      0.5385    0.672  0.523
時間*時間  -2.0646      0.5605   -3.684  0.008
溫度*溫度  -3.0146      0.5605   -5.379  0.001
時間*溫度  -4.8750      0.7615   -6.402  0.000
S = 1.52302    PRESS = 126.335
R-Sq = 93.00%  R-Sq(預測) = 45.50%  R-Sq(調整) = 86.99%
解釋
對於催化反應資料,產量中 93.00% 的變異由模型解釋,預測的 R 45.50%,調整的 R 86.99%

分析反應曲面設計 > 變異數分析表  
使用變異數分析表中的 p (P) 確定模型中哪些效應的統計意義顯著。通常,首先檢視模型中的交互作用效應,因為顯著的交互作用將影響解釋主要效應的方式。要使用 p 值,需要:
·    為要評估的效應確認 p 值。
·    將此 p 值與您的 a 水準進行比較。常用的 a 水準為 0.05
-    如果該 p 值小於或等於 a,則描述效應顯著。
-    如果該 p 值大於 a,則描述效應不顯著。
輸出範例
產量 的變異數分析
來源           自由度   Seq SS   Adj SS  Adj MS      F      P
集區                1   12.071   12.071  12.071   5.20  0.057
迴歸                5  203.488  203.488  40.698  17.55  0.001
  線性              2   16.366   16.366   8.183   3.53  0.087
    時間            1   15.318   15.318  15.318   6.60  0.037
    溫度            1    1.048    1.048   1.048   0.45  0.523
  平方              2   92.060   92.060  46.030  19.84  0.001
    時間*時間       1   24.951   31.477  31.477  13.57  0.008
    溫度*溫度       1   67.109   67.109  67.109  28.93  0.001
  交互作用          1   95.063   95.063  95.063  40.98  0.000
    時間*溫度       1   95.063   95.063  95.063  40.98  0.000
殘差誤差            7   16.237   16.237   2.320
  缺適性              3   10.864   10.864   3.621   2.70  0.181
  純誤差            4    5.373    5.373   1.343
合計               13  231.797
解釋
對於絕緣資料,變異數分析表顯示下列內容:
·    集區:資料是連續兩天採集的,每天都作為一個集區。
集區的 p 值為 0.057,不小於 0.05。因此,沒有顯著的集區效應。也就是說,資料在兩個集區(每個集區表示不同的一天)中採集這一事實並不對催化反應的產量有顯著效應。
·    迴歸:此項檢定模型中的項是否對反應有影響。在迴歸模型中反應是顯著的 (p = 0.001)。也就是說,迴歸方程式中至少有一項對平均值反應產生了影響。在該模型中,迴歸進一步細分為不同階的項,線性、平方和交互作用。
-    交互作用效應:時間與溫度交互作用的 p 值為 0.000,小於 0.05。因此,具有顯著的交互作用效應。換言之,時間對反應產量的效應取決於溫度。
-    平方效應:平方項用於評估反應曲面中是否存在曲率。平方效應的 p 值為 0.001,小於 0.05。因此,有證據表明存在顯著的二次效應。「時間*時間」和「溫度*溫度」的單獨 p 值分別為 0.008 0.001,表明時間與產量以及溫度與產量之間的關係呈曲線規律。
-    線性效應:存在顯著的交互作用效應和平方效應時解釋線性效應應非常謹慎。
·    殘差誤差:殘差誤差量測反應中模型無法解釋的變異量。如果以預測變數的某些設定觀測重複反應值,則未解釋變異可以分為兩部分(缺適性和純誤差)。
-    缺適性:由於模型不完備導致的變異(缺適性)。p 值為 0.181,不小於 0.05。因此,沒有證據表明該模型不能充分地解釋反應中的變異。如果存在嚴重缺適性,則可以從該模型中排除某些重要的項,否則迴歸將無法很好地解釋幾個大殘差的存在。

分析反應曲面設計 > 異常觀測值表  
Minitab 顯示的案例中,標準化殘差的絕對值大於 2。使用反應曲面模型不能很好地適配這些案例。
應該調查異常觀測值來判斷資料的記錄是否正確,資料收集製程是否受其他因子的影響。此外,應顯示殘差圖以檢查有關該迴歸模型的假設。
如果分析表明有許多異常觀測值,那麼該模型很可能會出現嚴重的缺適性。也就是說,該模型不能充分描述因子與反應變數之間的關係。
輸出範例
產量 的異常觀測值
                                適配          標準化
觀測值  標準順序    產量  適配  標準誤差    殘差    殘差
     2       2  84.500  86.195   1.271  -1.695   -2.02 R
R 表示此觀測值含有大的標準化殘差
解釋
對於催化反應資料,觀測值數值 2 的標準化殘差為 - 2.02。因此,反應曲面模型不能充分描述反應變數的觀測水準(產量 = 84.500)。

分析反應曲面設計 > 使用未編碼單位的估計係數  
如果未編碼單位和已編碼單位不同,則 Minitab 除顯示已編碼單位中的係數外,還顯示未編碼單位中的係數。
模型中的每項都有係數。使用這些係數構建表示反應與因子之間關係的方程式。
要使用此方程式,請插入未編碼(實際)因子值並計算預測的反應。由於這些係數是用未編碼單位估計的,因此將已編碼因子值插入此方程式將產生有關產量的錯誤預測。
輸出範例
產量 的估計迴歸係數,使用未編碼單位的資料
               係數
常數         -3885.70
集區         0.928571
時間          17.7154
溫度          43.8166
時間*時間  -0.0206458
溫度*溫度   -0.120583
時間*溫度  -0.0975000
解釋
對於催化反應資料,其迴歸方程式為:
產量 = -3885.70 + 0.928571(集區) + 17.7154(時間) + 43.8166(溫度) - 0.0206458(時間)- 0.120583(溫度) - 0.0975000(時間*溫度)

分析反應曲面設計 > 圖表 - 殘差的直方圖  
殘差的直方圖顯示全部觀測值的殘差異布。使用直方圖作為研究工具來瞭解資料的下列特徵:
·    典型值、波動或變異以及形狀
·    資料中的異常值
殘差的直方圖應該為鍾形。使用此圖尋找下列資訊:
此圖表趨勢...                         表明...
長尾                                        偏斜度
遠離其他長條的長條            異常值
由於直方圖的外觀會根據用於對資料進行分組的區間數而變更,因此請使用常態機率圖和適合度檢定來評定殘差是否為常態。
輸出範例
解釋
對於化學反應資料,沒有證據表明存在偏斜度或異常值。

分析反應曲面設計 > 圖表 - 殘差的常態圖  
此圖表圖示當分布為常態時的殘差及其期望值。根據分析得出的殘差應該是常態分布的。實際上,對於平衡或接近平衡的設計,或者對於具有大量觀測值的資料,略微偏離常態性不會嚴重影響結果。
殘差的常態機率圖應該大致為一條直線。使用此圖尋找下列資訊:
此圖表趨勢...         表明...
非直線                    非常態性
尾部為曲線            偏斜度
遠離直線的點        異常值
斜率不斷變化        未確定的變數
如果資料的觀測值不足 50 個,則即使殘差是常態分布的,圖也可能在尾部顯示曲率。隨著觀測值數的減少,機率圖甚至可能會顯示更大的變異和非線性。使用常態機率圖和適合度檢定來評定小資料集中殘差的常態性。
輸出範例
解釋
對於化學反應資料,殘差通常顯示為直線。沒有證據表明存在非常態性、偏斜度、異常值或未確定的變數。

分析反應曲面設計 > 圖表 - 殘差與適配  
此圖表圖示殘差與適配。殘差應該在 0 附近隨機分散。使用此圖尋找下列資訊:
此圖表趨勢...                                                 表明...
殘差相對適配呈扇形或不均勻分散            異變異數
曲線                                                                缺少高次項
遠離 0 的點                                                  異常值
x 方向遠離其他點的點                          有影響的點
輸出範例
解釋
從此圖中可以看出,殘差隨機分散在 0 附近。沒有證據表明存在異變異數、缺項、異常值或有影響的點。

分析反應曲面設計 > 圖表 - 殘差與順序  
此圖表以相應觀測值的順序圖示殘差。觀測值的順序可能影響結果時此圖會很有用,以時間順序或以某些其他順序(如地理區域)採集資料時可能影響結果。此圖在試驗未被隨機化的設計實驗中尤其有協助。
圖中的殘差應該在中心線附近隨機波動。檢查此圖以檢視相鄰誤差項之間是否存在任何相關性。殘差之間的相關性可以表示為:
·    殘差中的上升或下降趨勢
·    相鄰殘差的符號快速變化
輸出範例
解釋
對於化學反應資料,殘差隨機分散在 0 附近。沒有證據表明誤差項彼此相關。

分析反應曲面設計 > 圖表 - 殘差與變數  
此圖表圖示殘差與其他變數。殘差應該在中心線附近隨機波動。如果變數已經包含在模型中,則請使用此圖確定是否應該增加該變數的高次項。如果變數尚未包含在模型中,則請使用此圖確定變數是否系統地影響反應。
使用此圖尋找下列資訊:
此圖表趨勢...                                 表明...
殘差排欄成圖表趨勢                    變數正在系統地影響反應
點的排欄有曲率                            應該在模型中包含變數的高次項
輸出範例
解釋
對於化學反應資料,殘差不會隨機分散在 0 附近。有證據表明殘差中存在圖表趨勢或資料中存在曲率。該圖表明:
·    殘差與工具:產量使用三種不同的工具量測。殘差圖表明工具之間存在系統差異。工具 2 的殘差大多為正值。
·    殘差與溫度:根據溫度繪出的殘差看上去隨機分散在 0 附近。沒有證據表明存在曲率。

分析反應曲面設計 > 圖表 - 四合一殘差圖  
四合一殘差圖在一個圖表視窗中同時顯示四種不同的殘差圖。此版面有助於比較這些圖以確定模型是否符合分析的假設。此圖表中的殘差圖包含:
·    直方圖 - 表明資料是否偏斜或資料中是否存在異常值
·    常態機率圖 - 表明資料是否為常態分布的、其他變數是否影響反應或資料中是否存在異常值
·    殘差與適配 - 表明變異數是否恆定、是否存在非線性關係或資料中是否存在異常值
·    殘差與資料順序 - 表明資料中是否存在因時間或資料採集順序而產生的系統化影響
輸出範例
解釋
要檢視四合一圖中每個殘差圖的解釋,請參考本主題之前每種殘差圖的個別值主題。

DOE > Response Surface > Analyze Response Surface Design > more

從反應曲面模型中排除項
決定應在反應曲面模型中包含哪些項以及從中排除哪些項是非常重要的。幾個需要考慮的因素(統計及其他方面的)會影響到決策。
·    通常,排除項的第一步是觀測它的 p 值:如果 p 值小於 a 水準,那麼該項應保留在模型中。
·    即使 p 值小於 a 水準,您可能也希望排除該項。但是,首先應考慮:
-    排除該項後,調整的 R S 會如何變化。調整的 R 越高,模型越好。S 越低,模型越好。因此,如果排除該項會降低調整 R 並提高 S,那麼該項應保留在模型中。
-    排除項對缺適性的影響。缺適性意味著迴歸模型不能很好地適配資料。如果從模型中排除了重要的高次項,將會發生嚴重的缺適性。缺適性測試出現在變異數分析表中時,可以從表中的資料計算此測試。因此,在排除某項之前檢查缺適性統計量非常重要。
-    排除低次項如何影響反應曲面的層次結構。要排除模型中的高次項,必須包含低次項。範例,如果「溫度」的線性效應不顯著,但「溫度」與「時間」交互作用顯著,「溫度」的線性項就必須保留在模型中。
上述考慮因素都是統計方面的。有時,出於一些技術或科學上的考慮,可能希望在模型中包含看似不顯著的項。因此,必須綜合運用技術和統計知識來指導您的決策。

已編碼單位與未編碼單位
預設情況下,Minitab 使用已編碼單位分析反應曲面設計。不必擔心如何指定編碼,但瞭解編碼本身很重要。儘管使用未編碼單位分析資料很方便,但最好還是使用已編碼單位分析資料。編碼消除了任何由於因子量測刻度不同 -(範例,秒與度)而造成的統計結果失真。此外,使用未編碼單位通常會導致模型中的各項處在同一線上。這樣會擴大估計係數中的變異性,使其難以解釋。使用已編碼單位有助於解決此問題。
使用未編碼單位可以提供原始因子刻度的估計迴歸係數。但是,它可能會改變假設的統計測試的結果,這些結果用於確定各項是否為該反應的顯著預測變數。除非實驗人員強烈要求使用未編碼單位分析資料,否則最好使用預設編碼單位。

多元迴歸模型代表什麼?
多元迴歸模型是反應變數與若干預測變數之間關係的函數表示。
當有一個反應和一個因子時,該迴歸模型僅代表二維空間中的一條直線。當有一個反應而有兩個因子時,該迴歸模型可以用二維空間中的曲線來表示。當有一個反應和二個因子時,該迴歸模型也可以用三維空間中的曲線來表示。當有一個反應和三個或更多因子時,可視化曲面會更困難,但可以在思維上進行這種多維擴展。
在下圖中,圖示曲面對應於反應為「產量」和「因子」為「時間」與「溫度」的多元迴歸模型。

什麼是殘差?
Minitab 提供三種類型的殘差:
·    常規殘差等於觀測值和適配反應值之間的差。
·    標準化殘差是常規殘差與其標準差的比例。此類型殘差的優點是標準化消除了資料點在預測變數空間中所處位置的影響。
·    i 個資料點的 學習化已刪除殘差的表達式與標準化殘差相同。區別在於:第 i 個適配和標準差是在分析中刪除第 i 個案例之後計算得到的。與標準化殘差相比,學習化已刪除殘差在出現異常資料點時會變大。

什麼是殘差
Minitab 提供三種類型的殘差:
·    常規殘差:觀測值 - 預測值。
·    標準化殘差:常規殘差 / 常規殘差的標準差。
標準化消除了資料點位置對於預測值或因子的影響。
·    學習化已刪除殘差:對於 ith 資料點,公式遵循與標準化殘差相同的表達方式。但是,計算第i個 學習化已刪除殘差時適配和標準差都是在刪除第i個觀測後得到的。與標準化殘差相比,學習化已刪除殘差在出現異常資料點時會變大。

模型假設
迴歸和變異數分析製程關於誤差做出下列假設:
·    誤差為常態分布,且平均值為 0
·    誤差變異數不會為不同因子水準或根據預測反應的值而發生變更。
·    每種誤差都獨立於全部其他誤差。在所設計的實驗中,獲得獨立誤差的最好方式是隨機化實驗的實驗順序。
在分析中檢定這些假設的有效性。殘差是誤差的最佳估計值。因此,可以使用殘差圖以圖表方式檢查每個假設。
如果模型違反這些假設,則分析的結果可能有誤導性。範例,如果誤差相互關聯,則可能會錯誤地估計係數的標準誤差,從而導致錯誤的 t 值和 p 值。

直方圖和常態性
下列是從常態分布中抽取的九個資料集樣本。這些樣本沒有問題;但是,這些直方圖中大多數看起來不是鐘形,這描述了為什麼不應該使用直方圖來判斷資料的常態性。判斷資料是否為常態分布需要使用常態機率圖。
隨機產生樣本的直方圖
每個樣本包含常態分布中的 24 個觀測值。

轉換反應變數
殘差表示異變異數或非常態性時,必須進行轉換。
您可能還會發現在模型表現出顯著缺適性時資料轉換非常有用,而且這種轉換在反應曲面實驗的分析中尤為重要。假設在模型中包含全部顯著的交互作用和二次項,但缺適性檢定表明需要高次項。轉換可以消除缺適性。
如果資料轉換修正了此問題,使用迴歸分析比用其他可能更複雜的分析方法要好一些。迴歸分析或實驗設計分析的結果可以指導我們選擇合適的資料轉換方法解決不同的問題。
Box-Cox 轉換是最常用的變異數穩定轉換。在下面第一個圖表中,殘差表示異變異數。第二個圖表顯示變異數穩定轉換之後的殘差。適配的刻度(x 軸)變更,而變異數變為恆定。

常態機率圖中的圖表趨勢
下列圖表趨勢違反了誤差為常態分布這一假設。

非常態性的效應
迴歸和變異數分析的一個假設為殘差來自常態分布。但是,如果設計僅有固定因子,設計為平衡或接近平衡,且具有相當多的觀測值,則略微偏離常態性不會嚴重影響結果。

發現非常態圖表有趨勢時該怎麼做
可能難以正確指出常態機率圖中明顯偏離常態性的原因。可能的原因包含:
·    齊次變異數假設失敗
·    殘差異常大(異常值)
·    模型中缺少重要變數
·    資料來自非常態總體
對於完整分析,請將常態機率圖與其他診斷圖以及適合度統計量結合使用。
如果發現非常態圖表趨勢:
1    使用其他診斷圖檢視非常態性是否由非常態總體中的資料之外的因素所導致。
2    使用統計 > 基本統計 > 常態性檢定來執行常態性檢定。
3    如果確定資料來自非常態總體,則可以在繼續分析之前轉換資料。請參見轉換反應變數。
注意
 修復不等變異數問題的轉換通常也修復常態性問題。

殘差與適配圖中的圖表趨勢
下列圖表趨勢顯示異常值和對誤差為恆定這一假設的衝突。
異常值圖
右上角的殘差比圖中其他全部都大很多,因此為異常值。如果異常值過多,則模型可能不妥當。異常值可能是由於量測錯誤所導致。應該調查異常值以確定其原因。
異變異數圖
殘差的變異數隨適配增加。請注意,隨著適配的增加,殘差在零殘差線周圍分散得更廣,指明不等的(非恆定)變異數。此圖表趨勢表明誤差變異數隨平均值的增加而增加。資料的轉換會有助於穩定這些變異數。

發現圖表有趨勢時該怎麼做
如果圖顯示...                 執行此操作...
異變異數                        1    使用統計 > 變異數分析 > 變異數相等檢定來檢定相等變異數的假設。
2    如果圖或檢定表明變異數不等,則考慮轉換反應變數。
異常值或有影響的點    1    驗證觀測值不是量測或資料錄入錯誤。
2    考慮執行分析時不包含此觀測值來檢視它是否影響結果。
缺少高次項                    增加此項並重新適配模型。

殘差與順序圖中的圖表趨勢
下列圖表趨勢違反了誤差彼此獨立這一假設。


發現圖表有趨勢時該怎麼做
殘差與資料順序圖中的圖表趨勢表明誤差不是獨立的。此指示可能嚴重影響分析的結論,因此應該至少考慮下列一種補救措施:
·    由於誤差的非獨立性往往難以修正,因此如果要進行設計的實驗,應該盡量透過隨機化試驗以防止出現這種問題。
·    向模型中增加時間效應以消除誤差項的相關。範例,正在檢視幾個月期間的日收入。增加表示一周中某天的因子會消除誤差項中的非獨立性。
·    考慮時間序列製程(如 ARIMA)以解決誤差項中的自相關。

發現圖表有趨勢時該怎麼做
殘差與變數圖中的圖表趨勢表明可能未在模型中包含重要變數或未包含變數的高次項。
·    如果該變數在模型中,請為該變數增加高次項並重新適配模型。範例,曲線圖表趨勢表明應該增加平方項。
·    如果該變數不在模型中,請為該變數增加一項並重新適配模型。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

2012年10月30日 星期二

Minitab: 6 sigma 專業軟體 繁體中文討論-109



有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
DOE > Response Surface > Create Response Surface Design

建立反應曲面設計 > 匯總  
反應曲面方法用於檢查反應與一系列數量實驗變數或因子之間的關係。在確定了「重要少數」可控因子後並且要找到可最佳化反應的因子設定時,通常會採用這類方法。如果您對反應曲面中的曲率有所懷疑,通常要選擇此類設計。
反應曲面方法可用於:
·    找出能產生「最佳」反應的因子設定(操作條件)
·    找出能滿足操作或製程規範的因子設定
·    確定經證明能比當前條件改善產品品質的新操作條件
·    建立定量因子與反應之間關係的模型
Minitab 提供了兩種反應曲面設計:中心複合設計和 Box-Behnken 設計。
資料描述
Minitab 的「建立反應曲面設計」功能產生工作表資料,因此並非以資料集開始。StatGuide 的本節圖示為下述情況建立設計的製程。
催化反應資料
一個化工廠商正在嘗試最大限制地提高催化反應的產量。研究人員計畫使用中心複合設計來研究時間(時間)和溫度(溫度)對反應產量(產量)的影響。由於資料必須分兩天採集,因此設計包含兩個集區。

建立反應曲面設計 > 匯總表  
預設情況下,Minitab 為已經建立的設計顯示匯總表格。使用此匯總表格驗證是否已經建立預期的設計。
輸出範例
中心複合設計
因子:       2     複製:         1
基礎次數:  14     總試探數:    14
基礎集區:   2     合計集區數:   2
兩水準因子:全因子
立方點:          4
立方的中心點:  3
軸點:            4
軸點的中心點:    3
Alpha: 1.41421
解釋
對於催化反應實驗,研究人員建立了具有下列特徵的中心複合設計:
·    2 個因子。這兩個因子是「時間」和「溫度」。
·    14 個實驗。此設計中有 14 個設計點。
·    2 個集區。資料分兩天收集,每天為一個集區。
·    6 個中心點(設計的立方部分中的 3 個點和設計的軸線(也稱作星形)部分中的 3 個點。)
·    a 值為 1.414 的軸點。此 a 值表示此設計中軸點或「星形」點的位置,以編碼單位表示。對於此設計,其預設值為 1.414Minitab 提供預設的 a 值以確保此設計能夠展示合意的正交集區的計數值,並盡可能顯示旋轉計數值。

建立反應曲面設計 > 設計表格  
您也可以顯示已建立設計的設計表。此表格顯示了每個設計點處每個因子的實驗條件和設定。
執行實驗時,請使用所顯示的順序來確定每個試驗的條件。每個試驗的因子設定均以編碼單位顯示。對於中心複合設計,Minitab 將如下表示設定:
·    -1 表示低因子水準
·    1 表示高因子水準
·    0 表示低水準和高水準之間的中點
·    -1.414 1.414 分別表示低軸點和高軸點
對於 Box-Behnken 設計,Minitab 這樣表示設定:- 對於低因子設定,0 表示中間設定,+ 表示高設定。
預設情況下,Minitab 隨機確定實驗順序,以避免反應實驗中因試驗順序而出現系統性變化。當有多個集區(此設計中有兩個集區)時,每個集區內部都會發生隨機化。
輸出範例
設計表格(隨機化)
試驗  集區         A         B
   1     1  -1.00000  -1.00000
   2     1   1.00000  -1.00000
   3     1   0.00000   0.00000
   4     1  -1.00000   1.00000
   5     1   0.00000   0.00000
   6     1   1.00000   1.00000
   7     1   0.00000   0.00000
   8     2   0.00000  -1.41421
   9     2   0.00000   0.00000
  10     2   0.00000   0.00000
  11     2   0.00000   0.00000
  12     2  -1.41421   0.00000
  13     2   0.00000   1.41421
  14     2   1.41421   0.00000
解釋
對於催化反應資料,資料是這樣收集的:
·    在資料收集的第 1 天(集區 = 1),對於第一個實驗(實驗 = 1),將因子 A(時間)和因子 B(溫度)設定為低因子點設定(-1.000)然後量測反應
·    在資料收集的第 1 天(集區 = 1),對於第二個實驗(實驗 = 2),將因子 A(時間)設定為高因子點設定(1.000),將因子 B(溫度)設定為低因子點設定(-1.000),然後量測反應
·    按照描述繼續設定因子水準並記錄反應,直至全部的實驗均執行完畢

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.