2012年9月11日 星期二

Minitab: 6 sigma 專業軟體 繁體中文討論-86



有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:


Regression > Nonlinear Regression

非線性迴歸 > 匯總  
非線性迴歸在數學上描述一個反應變數和一個或多個預測變數之間的非線性關係。反應變數必須是連續的。每個預測變數必須是一個連續變數或是一個指標變數(0 1)。您可以指定 Minitab 用於為這種關係建模的非線性預期函數。
當您不能使用線性參數很好地適配模型時,可使用非線性迴歸,而不使用普通最小平方迴歸。當模型中的各項之間是相加關係,並且每一項只包含一個與該項相乘的參數時,參數是線性的。
選擇預期函數時,通常需要依靠以往有關反應曲線形狀或系統中物理和化學計數值欄為的知識。可能的非線性形狀包含凹、凸、指數成長或衰減、S (S) 和漸近曲線。在任何一種情況下,都需要指定可同時滿足您以往知識的要求以及非線性迴歸假設的函數。
非線性迴歸用於研究反應 (Y) 和預測變數 (X) 之間的關係,並對其建模。
特別是,非線性迴歸分析可用於下列方面:
·    確定反應變數如何隨特定預測變數的變化而變化
·    預測任何預測變數值或預測變數值組合的反應變數值
資料描述
美國國家標準與技術研究院 (NIST) 的研究人員希望瞭解銅的熱膨脹係數與開爾文溫度之間的關係。此資料可從 NIST 公開取得 (Hahn, T., 1979)。先前研究表明,具有 7 個參數的非線性模型可提供充分適配。
資料: 銅膨脹率.MTW, 刨花板.MTW (在樣本資料檔案夾中)

非線性迴歸 > 迴歸表 - 方法  
方法表顯示用於估計參數值的算法設定。Minitab 會顯示算法、最大迭代次數和收斂標準。不同的選擇可以改變參數估計值或獲得收斂的能力。
輸出範例
方法
算法           Gauss-Newton
最大迭代次數            200
公差                0.00001
解釋
為了獲得銅膨脹資料,Minitab 使用 Gauss-Newton 算法,施加最多 200 次迭代並應用公差 0.00001 以獲得收斂。

非線性迴歸 > 迴歸表 - 起始值  
此表欄出了為每個參數輸入的起始值。
在非線性迴歸中,迭代算法透過使平方殘差之和 (SSE) 最小化來估計參數。必須提供算法使用的起始值來計算初始 SSE。在每次迭代時,算法會以預測應當會使 SSE 相比上一次迭代減小的一種方式,調整參數估計值。迭代將繼續,直到算法收斂於最小 SSE(在指定公差內)、出現問題阻止後續迭代的進行或 Minitab 達到最大迭代次數。
對於某些模型和資料集,起始值可以顯著影響結果。某些起始值可以導致收斂失敗或者收斂到一個局部而不是全局的最小 SSE。在一些情況下,您可能需要花費很大努力才能構建一個好的起始值。
輸出範例
參數的起始值
參數         
b1             1
b2          -0.1
b3         0.005
b4     -0.000001
b5        -0.005
b6         0.001
b7    -0.0000001
解釋
對於銅膨脹資料,Minitab 顯示全部 7 個參數的起始值。範例,b1 的起始值是 1

非線性迴歸 > 迴歸表 - 方程式  
迴歸方程式是迴歸曲線的一種代數表示形式,用於描述反應和預測變數之間的關係。與線性迴歸不同,非線性迴歸方程式可以採取許多不同形式。
線性迴歸的參數必須是線性的,這約束了方程式只能有一種形式。當模型中的各項之間是相加關係,並且每一項只包含一個與該項相乘的參數時,參數是線性的:
反應 = 常數 + 參數 * 預測變數 + …+ 參數 * 預測變數
y = bo + b1X1 + b2X2 + ...+ bkXk
然而,非線性方程式可以採取許多不同形式。下列範例描述了變異性(q 代表參數):
·    y = q1X1  (凸曲線 21 個參數、1 個預測變數)
·    y = q1 *  X1 / ( q 2+ X1 ) Michaelis-Menten 方程式、2 個參數、1 個預測變數)
·    y = q1  - q2 * ( ln ( X1  + q3 ) - ln ( X2  ))Nernst 方程式、3 個參數、2 個預測變數)
雖然可以十分靈活地指定許多不同的函數形式,但是可能需要花很多努力才能確定為資料提供最佳適配的函數形式。這通常需要額外的研究、專業領域知識和試錯分析。對於非線性方程式,在確定每個預測變數對反應的影響時可能不如線性方程式那樣直觀。
輸出範例
方程式
膨脹率 = (1.07764 - 0.122693 * 絕對溫度 + 0.00408638 * 絕對溫度 ** 2 -
     1.42627e-006 * 絕對溫度 ** 3) / (1 - 0.00576099 * 絕對溫度 + 0.000240537 *
     絕對溫度 ** 2 - 1.23144e-007 * 絕對溫度 ** 3)
解釋
對於銅膨脹資料,反應變數是膨脹量,預測變數是開爾文溫度。這個冗長的方程式描述了反應變數和預測變數之間的關係。開爾文溫度每提高一度對於銅膨脹的影響高度取決於起始溫度。如果方程式不能協助您理解其中的關係,可檢視配適線圖和其他圖表。變化的溫度對銅膨脹的影響作用不太容易總結。

非線性迴歸 > 迴歸表 - 參數估計  
參數估計表欄出了每個參數的估計值和(可選)信賴區間。
對於非線性迴歸,Minitab 不會計算參數的 p 值。對於線性迴歸,每個參數的原假設值為 0(沒有效應),而且 p 值以此值為基礎。在非線性迴歸中,每個參數的正確原假設值取決於預期函數以及參數在預期函數中的位置。Minitab 可以為每個參數估計值顯示一個信賴區間 (CI),而不顯示 p 值。
收斂並不一定能保證模型適配最佳或誤差平方和 (SSE) 最小。局部 SSE 最小或預期函數不正確都會導致在錯誤參數值的條件下收斂。因此,至關重要的是,對參數值、配適線圖和殘差圖進行檢查,確定模型是否適配且參數值是否合理。
如果參數估計值是合理值,使用信賴區間決定範圍是否排除原假設值,是則表示有顯著效應。
對於某些資料集、預期函數和信賴水準,其中一個或兩個信賴邊界可能不存在。Minitab 在作業視窗使用星號指示遺失的結果。如果信賴區間有遺失邊界,信賴水準較低時可能產生雙側區間。
輸出範例
參數估計
參數      估計  標準誤差估計值       95% 信賴區間
b1     1.07764      0.170702  ( 0.744913,  1.42486)
b2    -0.12269      0.012000  (-0.147378, -0.09951)
b3     0.00409      0.000225  ( 0.003655,  0.00455)
b4    -0.00000      0.000000  (-0.000002, -0.00000)
b5    -0.00576      0.000247  (-0.006246, -0.00527)
b6     0.00024      0.000010  ( 0.000221,  0.00026)
b7    -0.00000      0.000000  (-0.000000, -0.00000)
膨脹率 = (b1 + b2 * 絕對溫度 + b3 * 絕對溫度 ** 2 + b4 * 絕對溫度 ** 3) / (1 +
     b5 * 絕對溫度 + b6 * 絕對溫度 ** 2 + b7 * 絕對溫度 ** 3)
解釋
對於銅膨脹資料,參數 b1 的點估計值是 1.0776495% 信賴區間是 (0.744913,  1.42486)。研究人員將其視為表示顯著性的合理範圍。方程式顯示在參數估計值的下面,這樣您可以看到值與方程式的適配程度。


非線性迴歸 > 迴歸表 - 缺適性  
當您的資料包含複製和具有相同預測變數值的多個觀測值時,Minitab 顯示缺適性表。如果您的資料不包含複製,那麼不可能計算執行此檢定所需的純誤差。複製的不同反應值代表純誤差,因為只有隨機變異可以導致觀測反應值之間的差異。
如果 p 值小於您選擇的 a 水準,則有證據表明模型沒有準確適配資料。您可能需要修改模型。
輸出範例
缺適性
來源      自由度       SS         MS     F      P
誤差         229  1.53244  0.0066919
  缺適性       228  1.52583  0.0066922  1.01  0.679
  純誤差       1  0.00661  0.0066125
解釋
Minitab 自動執行缺適性檢定,因為資料包含複製。因為 p (0.679) 大於任何合理的 a 水準,所以沒有缺適性的證據。

非線性迴歸 > 迴歸表 - 模型匯總   
模型匯總表欄出了給定初始條件下模型與資料適配良好程度的幾個量測資料。
與線性迴歸相比,非線性迴歸多了一重考慮因素。在線性迴歸中,如果將相同模型適配到相同資料,將獲得相同的模型適配數值。但是,在非線性迴歸中,還必須指定算法和初始值。不同的初始條件會得到不同的結果,即使將相同模型適配到相同資料時也是如此。
使用這些模型匯總值,結合診斷圖表和學科領域知識,可以為相同模型選擇不同的模型和不同的初始條件。值越低表明適配得越好。
·    最終 SSE 是觀測反應值與其適配的變異數總和。它可以量測反應資料中不由迴歸模型中的預測變數解釋的變異數量。此值表示在給定初始條件下算法可以獲得的最小 SSE
·    S 是更直觀的值,因為它是用與反應變數相同的單位表示的。它表示觀測資料值偏離適配迴歸值的標準距離。
Minitab 不計算整個模型的 R2 p 值,因為這些值在線性模型環境外通常沒什麼意義。
輸出範例
匯總
迭代             15
最終 SSE    1.53244
DFE             229
MSE       0.0066919
S         0.0818039
解釋
對於銅膨脹資料,該算法需要進行 15 次迭代才能得到 1.53244 的最終 SSE。如果要比較模型或初始條件,則比較多個最終 SSE 值是有意義的。而個別值最終 SSE 值的意義可能就不是很直觀。
S 值解釋起來通常更直觀一些,無論單就 S 值本身而言還是與競值進行比較,因為 S 是用與反應變數(銅膨脹)相同的單位表示的。在本例中,S 0.0818039,表示觀測到的銅膨脹值與適配膨脹值的標準距離(粗略平均絕對距離)為 0.0818039 個單位。

非線性迴歸 > 預測  
當您按一定的預測變數設定請求預測新反應值時,Minitab 將顯示預測值表。
適配是在所要求的預測變數設定的組合下反應的預測(適配)值。
預測的信賴區間 (CI) 表示在指定的預測變數設定條件下,反應平均值可能位於的範圍。
預測區間表示在指定的預測變數設定條件下,個別值新觀測值可能位於的範圍。
預測區間總是要比對應的信賴區間大,這是因為在對個別值反應與反應平均值的預測中包含了更多的不確定性。
輸出範例
預測
新觀  絕對
測值  溫度      Fit  適配標準誤差     95% 信賴區間        95% 預測區間
   1   700  19.6758     0.0137843  (19.6486, 19.7030)  (19.5123, 19.8393)
解釋
對於銅膨脹資料,Minitab 在開氏溫度 700 度時計算的適配為 19.6758
信賴區間為 (19.6486, 19.7030)。您可以 95% 地確信,在開氏 700 度時得到的全部銅膨脹量測值的反應平均值將位於此範圍。
預測區間為 (19.5123, 19.8393)。您可以 95% 地確信,在開氏 700 度時得到的個別值新觀測值將位於此範圍。

非線性迴歸 > 圖表 - 配適線圖  
Minitab 顯示一個圖表,在資料上方有一條曲線描述基於預期函數的最佳適配方程式。
輸出範例














解釋
銅膨脹資料圖表明指定的有理多項式很好地適配了資料。點與曲線相當接近,緊隨曲線分布,沒有任何系統性偏離。
由於方程式太長,因此圖表中沒有顯示完整。要檢視完整的方程式,您可以對圖表進行編輯或檢視作業視窗輸出。

非線性迴歸 > 圖表 - 殘差的直方圖  
殘差的直方圖顯示全部觀測值的殘差異布。使用直方圖作為研究工具來瞭解資料的下列特徵:
·    典型值、波動或變異以及形狀
·    資料中的異常值
殘差的直方圖應該為鐘形。使用此圖尋找下列資訊:

此圖表趨勢...                表明...
長尾                                偏斜度
遠離其他長條的長條    異常值
由於直方圖的外觀會根據用於對資料進行分組的區間數而變更,因此請使用常態機率圖和適合度檢定來評定殘差是否為常態。
輸出範例

  












解釋
對於銅膨脹資料,直方圖大概遵循常態曲線分布。評估常態機率圖以評估殘差是否呈常態分布。沒有明顯的極端值或異常值。

非線性迴歸 > 圖表 - 殘差的常態機率圖  
此圖表圖示當分布為常態時的殘差及其期望值。根據分析得出的殘差應該是常態分布的。實際上,對於具有大量觀測值的資料,略微偏離常態性不會嚴重影響結果。
殘差的常態機率圖應該大致為一條直線。使用此圖尋找下列資訊:
此圖表趨勢...                 表明...
非直線非                        常態性
尾部為曲線                    偏斜度
遠離直線的點                異常值
斜率不斷變化                未確定的變數
如果資料的觀測值不足 50 個,則即使殘差是常態分布的,圖也可能在尾部顯示曲率。隨著觀測值數的減少,機率圖甚至可能會顯示更大的變異和非線性。使用常態機率圖和適合度檢定來評定小資料集中殘差的常態性。
如果資料不呈常態分布,您可能希望考慮使用 Box-Cox 轉換來轉換資料。
輸出範例

  












解釋
對於銅膨脹資料,殘差顯示為直線。沒有證據表明存在非常態性、偏斜度、異常值或未確定的變數。

非線性迴歸 > 圖表 - 殘差與適配  
此圖表圖示殘差與適配。殘差應該在 0 附近隨機分散。使用此圖尋找下列資訊:
此圖表趨勢..                                                  表明...
殘差相對適配呈扇形或不均勻分散            異變異數
偏離零的曲線或其他系統差異                    錯誤指定的預期函數
遠離 0 的點                                                  異常值
x 方向遠離其他點的點                          有影響的點
輸出範例

  












解釋
對於銅膨脹資料,殘差隨機分散在 0 附近。沒有證據表明存在異變異數、缺項、異常值或有影響的點。

非線性迴歸 > 圖表 - 殘差與順序  
此圖表以相應觀測值的順序圖示殘差。觀測值的順序可能影響結果時此圖會很有用,以時間順序或以某些其他順序(如地理區域)採集資料時可能影響結果。此圖在實驗未被隨機化的設計實驗中非常有用。
圖中的殘差應該在中心線附近隨機波動。檢查此圖以檢視相鄰誤差項之間是否存在任何相關性。殘差之間的相關性可以表示為:
·    殘差中的上升或下降趨勢
·    相鄰殘差的符號快速變化
輸出範例














 解釋
對於銅膨脹資料,殘差隨機分散在 0 附近。沒有證據表明誤差項彼此相關。

非線性迴歸 > 圖表 - 殘差與變數  
此圖表圖示殘差與其他變數。殘差應該在中心線附近隨機波動。如果變數已經包含在模型中,則請使用此圖確定是否應該修改預期函數。如果變數尚未包含在模型中,則請使用此圖確定變數是否系統地影響反應。如果是,考慮增加此變數到模型中。
使用此圖尋找下列資訊:
此圖表趨勢...                                         表明...
殘差排欄成圖表趨勢                            變數正在系統地影響反應
偏離零的點曲率或其他系統差異        錯誤指定的預期函數
輸出範例

  












解釋
對於銅膨脹資料,對應殘差來描繪作為預測變數的開爾文溫度。殘差隨機分散在 0 附近,表明模型準確涵蓋了開爾文溫度。

非線性迴歸 > 圖表 - 四合一殘差圖  
四合一殘差圖在一個圖表視窗中同時顯示四種不同的殘差圖。此版面有助於比較這些圖以確定模型是否符合分析的假設。此圖表中的殘差圖包含:
·    直方圖 - 表明資料是否偏斜或資料中是否存在異常值
·    常態機率圖 - 表明資料是否為常態分布的、其他變數是否影響反應或資料中是否存在異常值
·    殘差與適配 - 表明變異數是否恆定、是否正確指定預期函數或資料中是否存在異常值
·    殘差與資料順序 - 表明資料中是否存在因時間或資料採集順序而產生的系統化影響
輸出範例

  
















解釋
要檢視四合一圖中每個殘差圖的解釋,請參考本主題之前每種殘差圖的個別值主題。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

沒有留言:

張貼留言