2012年9月18日 星期二

Minitab: 6 sigma 專業軟體 繁體中文討論-91



有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
Regression > Nominal Logistic Regression


名義邏輯斯迴歸 > 匯總  
如果反應是名義反應,或者反應是順序反應但您不希望假定對於全部的反應類別預測變數的效應是恆定的,即不符合序數邏輯斯迴歸的要求,這時使用名義邏輯斯迴歸。
在名義邏輯斯迴歸中,適配模型包含每個反應類別(剔除對應於參考事件的反應類別)的 logit 函數。範例,如果反應具有 4 個水準,Minitab 將計算 3 logit 方程式。每個方程式都有一個唯一的常數和每個預測變數的唯一的參數。名義邏輯斯迴歸假設對於每個反應值預測變數的效應是不同的。每個 logit 函數估計共變異數對於觀測反應的參考水準和觀測反應的其他水準的可能性的影響方式。每個共變異數的斜率描述了對可能性的影響方式。
資料描述

賭馬現列的基礎是同注分彩體制,在此體制中賭家透過馬身上的賭注來確定其賭注比例。特定的一匹馬身上的賭金越多,它的賭注比例越低。理論上,賭注比例越低,馬贏得比賽的可能性越大。
您關心一匹名為 DegreesofFreedom 的馬,並且軌跡了她在 199 場職業比賽中的比賽賭注比例和名次。可以使用序數邏輯斯迴歸來根據她比賽時的賭注比例來預測 DegreesofFreedom 取得第 1 名、第 2 ...,第 8 名的機率。名義邏輯斯迴歸模型包含:
·    Finish - 反應變數。它表示您的馬在比賽中取得的名次。參考事件是第 1 名。
·    RaceOdds - 預測變數(共變異數)。它表示這匹馬在比賽中的賭注比例。
儘管反應是有順序的,但調查人員不確定預測變數的效應對於全部反應類別中是恆定的,所以他們使用名義邏輯斯迴歸。
資料: 賽馬.MTW (在樣本資料檔案夾中)

名義邏輯斯迴歸 > 反應資訊  
Minitab 顯示了反應的下列資訊:
·    變數 - 反應變數的名稱。
·    - 順序反應的水準。
·    計數 - 每個反應水準上的觀測值數。
·    參考事件 - 參考事件。
·    合計 - 非遺失觀測值數。
輸出範例
反應資訊
變數      計數
結束  1       22  (參考事件)
      8       27
      7       20
      6       28
      5       27
      4       22
      3       28
      2       25
      合計   199
解釋
對於賽馬資料,反應名為 Finish,值為 1(第一名),8(最後一名),7(第七名),..., 2(第二名),這匹馬 22 次贏得比賽(第一名),27 次為最後一名,20 次取得第七名,...25 次取得第二名,取得第一名被視為參考事件,有 199 個觀測值。

名義邏輯斯迴歸 > 邏輯斯迴歸表 - P   
P 值描述觀測的關係是否統計意義顯著。您需要:
1    找到位於迴歸表下的 p 值。透過檢定是否全部的斜率都等於 0p 值描述是否至少一個 logit 和反應之間存在存在顯著相關性。
2    將此 p 值與您的 a 水準進行比較。常用的 a 水準為 0.05
-    如果 p 值小於或等於 a 水準,那麼相關性顯著,並且可以斷定至少一個預測變數與反應顯著關聯。
-    如果 p 值大於 a 水準,那麼可以斷定不存在顯著關聯,並且解釋結束。
3    如果在步階 2 中斷定至少存在一個顯著 logit,對於每個 logit 函數,請找出模型中每一項的 p 值。這些 p 值表明,對於給定的 logit,特定的預測變數和名義反應之間是否存在統計意義顯著相關性。
4    將這些 p 值逐個與您的 a 水準進行比較:如果 p 值小於或等於所選擇的 a 水準,那麼關聯是顯著的。
輸出範例
邏輯斯 迴歸表
                                                            95% 信賴區
                                                               
自變數              係數  係數標準誤差      Z      P  優勢比  下限  上限
Logit 1:(8/1)
常數           -0.919125    0.446453  -2.06  0.040
名次            0.143745   0.0549665   2.62  0.009    1.15  1.04  1.29
Logit 2:(7/1)
常數            -2.11912    0.523139  -4.05  0.000
名次            0.184382   0.0548107   3.36  0.001    1.20  1.08  1.34
Logit 3:(6/1)
常數            -1.14562    0.451970  -2.53  0.011
名次            0.159653   0.0546516   2.92  0.003    1.17  1.05  1.31
Logit 4:(5/1)
常數           -0.839914    0.444873  -1.89  0.059
名次            0.137946   0.0551381   2.50  0.012    1.15  1.03  1.28
Logit 5:(4/1)
常數            -1.11708    0.463681  -2.41  0.016
名次            0.143264   0.0553128   2.59  0.010    1.15  1.04  1.29
Logit 6:(3/1)
常數           -0.571955    0.439702  -1.30  0.193
名次            0.117747   0.0559315   2.11  0.035    1.12  1.01  1.26
Logit 7:(2/1)
常數           -0.243669    0.453674  -0.54  0.591
名次           0.0635537   0.0612533   1.04  0.299    1.07  0.95  1.20
對數概度 = -389.629
檢定全部斜率是否為零:G = 45.535DF = 7P = 0.000
解釋
·    對於賽馬資料,檢定全部 RaceOdds 的斜率都為 0 p 值是 0.000。假定 a 水準為 0.05。因為 0.000 小於 0.05,可以斷定至少對於一個 logit 反應變數 Finish 和預測變數 RaceOdds 之間存在顯著相關性。
·    對於 logit 12345 6RaceOdds p 值分別為 0.0090.0010.0030.0120.010 0.035。因為全部的 p 值都小於 0.05,可以斷定對於這些 logit,反應變數 Finish 和預測變數 RaceOdds 之間存在顯著相關性。
·    對於 logit 7RaceOdds p 值為 0.299。因為此 p 值大於 0.05,所以沒有足夠的證據表明反應變數 Finish 和預測變數 RaceOdds 之間存在顯著相關性。

名義邏輯斯迴歸 > 邏輯斯迴歸表 - 名義邏輯斯模型  
名義邏輯斯迴歸檢查一個或多個預測變數和一個名義反應之間的關係。
名義邏輯斯迴歸方程式分別處理每個名義結果。邏輯斯迴歸方程式由多個 logit 函數組成,分別對應於除去一個後的每個反應值。對於預測變數,每個方程式都有一個唯一的斜率。這些方程式評估預測變數變更時觀測特定的名義結果的機率相對於觀測參考結果的機率的變更。
輸出範例
邏輯斯 迴歸表
                                                            95% 信賴區
                                                               
自變數              係數  係數標準誤差      Z      P  優勢比  下限  上限
Logit 1:(8/1)
常數           -0.919125    0.446453  -2.06  0.040
名次            0.143745   0.0549665   2.62  0.009    1.15  1.04  1.29
Logit 2:(7/1)
常數            -2.11912    0.523139  -4.05  0.000
名次            0.184382   0.0548107   3.36  0.001    1.20  1.08  1.34
Logit 3:(6/1)
常數            -1.14562    0.451970  -2.53  0.011
名次            0.159653   0.0546516   2.92  0.003    1.17  1.05  1.31
Logit 4:(5/1)
常數           -0.839914    0.444873  -1.89  0.059
名次            0.137946   0.0551381   2.50  0.012    1.15  1.03  1.28
Logit 5:(4/1)
常數            -1.11708    0.463681  -2.41  0.016
名次            0.143264   0.0553128   2.59  0.010    1.15  1.04  1.29
Logit 6:(3/1)
常數           -0.571955    0.439702  -1.30  0.193
名次            0.117747   0.0559315   2.11  0.035    1.12  1.01  1.26
Logit 7:(2/1)
常數           -0.243669    0.453674  -0.54  0.591
名次           0.0635537   0.0612533   1.04  0.299    1.07  0.95  1.20
對數概度 = -389.629
檢定全部斜率是否為零:G = 45.535DF = 7P = 0.000
解釋
對於賽馬資料,因為反應資訊表中有 8 個值,所以有 7 logit 方程式。
·    Logit 1 logit 方程式中的 Constant 係數 (-0.919125) Odds 係數 (0.143745) 構成。對於給定的 RaceOdds 值,此 logit 方程式比較了這匹馬取得最後一名和第一名的機率。RaceOdds 的正係數表明賭注比例越高,取得最後一名而不是第一名的機率越大。
·    Logit 2 logit 方程式中的 Constant 係數 (-2.11912) Odds 係數 (0.184382) 構成。對於給定的 RaceOdds 值,此 logit 方程式比較了這匹馬取得第七名和第一名的機率。RaceOdds 的正係數表明賭注比例越高,取得第七名而不是第一名的機率越大。
·    Logit 3 logit 方程式中的 Constant 係數 (-1.14562) Odds 係數 (0.159653) 構成。對於給定的 RaceOdds 值,此 logit 方程式比較了這匹馬取得第六名和第一名的機率。RaceOdds 的正係數表明賭注比例越高,取得第六名而不是第一名的機率越大。
·    Logit 4 logit 方程式中的 Constant 係數 (-0.839914) Odds 係數 (0.137946) 構成。對於給定的 RaceOdds 值,此 logit 方程式比較了這匹馬取得第五名和第一名的機率。RaceOdds 的正係數表明賭注比例越高,取得第五名而不是第一名的機率越大。
·    Logit 5 logit 方程式中的 Constant 係數 (-1.11708) Odds 係數 (0.143264) 構成。對於給定的 RaceOdds 值,此 logit 方程式比較了這匹馬取得第四名和第一名的機率。RaceOdds 的正係數表明賭注比例越高,取得第四名而不是第一名的機率越大。
·    Logit 6 logit 方程式中的 Constant 係數 (-0.571955) Odds 係數 (0.117747) 構成。對於給定的 RaceOdds 值,此 logit 方程式比較了這匹馬取得第三名和第一名的機率。RaceOdds 的正係數表明賭注比例越高,取得第三名而不是第一名的機率越大。
·    Logit 7 logit 方程式中的 Constant 係數 (-0.243669) Odds 係數 (0.0635537) 構成。對於給定的 RaceOdds 值,此 logit 方程式將比較這匹馬取得第二名和第一名的機率。RaceOdds 的正係數表明賭注比例越高,取得第二名而不是第一名的機率越大。

名義邏輯斯迴歸 > 迴歸表 - 優勢比  
在名義邏輯斯迴歸中,對於每個 logit 函數,都有分別對應於每個共變異數的優勢比。如果共變異數是一個類別變數,那麼有對應於剔除一個之後的每個類別的優勢比。這是因為會為每個反應值(剔除參考事件的反應值)的每個共變異數計算一個唯一的參數。
輸出範例
邏輯斯 迴歸表
                                                            95% 信賴區
                                                                
自變數              係數  係數標準誤差      Z      P  優勢比  下限  上限
Logit 1:(8/1)
常數           -0.919125    0.446453  -2.06  0.040
名次            0.143745   0.0549665   2.62  0.009    1.15  1.04  1.29
Logit 2:(7/1)
常數            -2.11912    0.523139  -4.05  0.000
名次            0.184382   0.0548107   3.36  0.001    1.20  1.08  1.34
Logit 3:(6/1)
常數            -1.14562    0.451970  -2.53  0.011
名次            0.159653   0.0546516   2.92  0.003    1.17  1.05  1.31
Logit 4:(5/1)
常數           -0.839914    0.444873  -1.89  0.059
名次            0.137946   0.0551381   2.50  0.012    1.15  1.03  1.28
Logit 5:(4/1)
常數            -1.11708    0.463681  -2.41  0.016
名次            0.143264   0.0553128   2.59  0.010    1.15  1.04  1.29
Logit 6:(3/1)
常數           -0.571955    0.439702  -1.30  0.193
名次            0.117747   0.0559315   2.11  0.035    1.12  1.01  1.26
Logit 7:(2/1)
常數           -0.243669    0.453674  -0.54  0.591
名次           0.0635537   0.0612533   1.04  0.299    1.07  0.95  1.20
對數概度 = -389.629
檢定全部斜率是否為零:G = 45.535DF = 7P = 0.000
解釋
對於賽馬資料,優勢比可以解釋為:

·    Logit 1RaceOdds 每增加一個單位,取得最後一名的機率為取得第一名的機率的 1.15 倍。

·    Logit 2RaceOdds 每增加一個單位,取得第七名的機率為取得第一名的機率的 1.20 倍。

·    Logit 3RaceOdds 每增加一個單位,取得第六名的機率為取得第一名的機率的 1.17 倍。

·    Logit 4RaceOdds 每增加一個單位,取得第五名的機率為取得第一名的機率的 1.15 倍。

·    Logit 5RaceOdds 每增加一個單位,取得第四名的機率為取得第一名的機率的 1.15 倍。

·    Logit 6RaceOdds 每增加一個單位,取得第三名的機率為取得第一名的機率的 1.12 倍。

·    Logit 7RaceOdds 每增加一個單位,取得第二名的機率為取得第一名的機率的 1.07 倍。

名義邏輯斯迴歸 > 適合度檢定  
適配名義邏輯斯模型時,您想要選擇可以良好適配資料的模型。可以使用適合度統計量來比較不同模型的適配。較低的 p 值表示預測的機率以多項分布無法預測的方式偏離觀測的機率。
Minitab 提供兩種適合度檢定:Pearson Deviance
Pearson Deviance 是邏輯斯模型的兩種類型的殘差。它們是評估所選模型適配資料的優度的有用量測。P 值越高,模型適配資料的優度越高。您可能想透過考慮其它預測變數、二次項和/或交互作用項來檢查其他模型。透過包含全部的顯著項,獲得合適的適合度 p 值的可能性較高。
輸出範例
適合度檢定
方法        卡方  自由度      P
Pearson  926.275     959  0.771
標準差     616.475     959  1.000
解釋
對於賽馬資料來說,Pearson Deviance 檢定的 p 值(分別為 0.771 1.000)比 0.05 大很多,這表明沒有足夠的證據證明模型不能很好地適配資料。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

沒有留言:

張貼留言