2012年8月20日 星期一

Minitab: 6 sigma 專業軟體 繁體中文討論-70


有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:



















Basic Statistics > Paired t

成對樣本 t > 匯總  
成對樣本 t 信賴區間和測試法用於分析配對觀測值之間的差異。這些製程用來確定總體的平均值差異是否可能與參考值(通常為零)不同。
假設您有隨機的員工工作滿意度資料的樣本,在將新的休息時間增加到這些員工的每日工作日程的前後,每位員工都填寫了一份調查表。可以使用配對的 t 製程來確定休息時間是否影響總體的滿意度。或者,您可能收集了在採用新的硬化處理之前和之後金屬零件的硬化資料。可以使用配對的 t 製程來確定該製程是否影響硬度。
分析配對觀測值與分析獨立樣本相比的優點在於可以析出因此人或對象之間的差異而導致的觀測值的變異性,從而可產生更有檢定力的檢定。
要使用成對樣本 t 製程,差異的分布應服從常態分布。如果不滿足此條件,則應考慮使用合適的非參數製程。而且,樣本必須是相關的或配對的。
資料描述
一位生理學家想確定某種類型的賽跑計畫是否對穩定心率有影響。對隨機選擇的 15 個人量測了心率。然後對其實施該賽跑計畫,並在一年後再次量測心率。因此,對每個人前後進行的兩次量測構成一個觀測值對。
資料: 賽跑.MTW (在樣本資料檔案夾中)

成對樣本 t > 差異的檢定 - 假設  
使用配對的 t 製程時,您實際上是在根據樣本資料決定哪兩個相反的假設看起來成立:
·    H0(原假設):總體中差異的平均值等於所選的參考值(通常為零)
- -
·    H1(備擇假設):總體中差異的平均值不等於所選的參考值。(預設情況下,H1 是非定向假設。但是,可以指定定向假設。)
輸出範例
之前 - 之後 的配對 T
                           平均值標
       N    平均值  標準差    準誤
之前  15  74.667   3.478   0.898
之後  15  72.333   3.200   0.826
差異  15   2.333   3.352   0.866
平均差的 95% 信賴區間: (0.477, 4.190)
平均差 = 0 ( ≠ 0) T 檢定: T = 2.70  P = 0.017
解釋
心率範例中,在練習計畫之前和之後對人員樣本的心率進行了量測,並且想瞭解下列資訊:根據樣本資料,在練習計畫之前和之後心率可能相同嗎?換句話說,量測前後的平均值差異等於零嗎?因此,您的假設為 H0,平均值差異 = 0 H1,平均值差異 ≠ 0

成對樣本 t > 差異的檢定 - 信賴區間  
信賴區間是 m D 的一系列可能值。由於您不知道 m D 的實際值,因此可以根據樣本資料透過信賴區間來猜測實際值。平均樣本差異提供 m D, 的估計值,並且使用樣本差異的標準差 (StDev) 來確定估計值的遠離程度。通常,包含 m D 的區間的比例等於 1 減去選擇的 a 水準。您可以選擇大於 0% 且小於 100% 的任意 a 水準。常用的 a 水準為 0.05
輸出範例
之前 - 之後 的配對 T
                          平均值標
       N    平均值  標準差    準誤
之前  15  74.667   3.478   0.898
之後  15  72.333   3.200   0.826
差異  15   2.333   3.352   0.866
平均差的 95% 信賴區間: (0.477, 4.190)
平均差 = 0 ( ≠ 0) T 檢定: T = 2.70  P = 0.017
解釋
由於分析心率資料時使用的 a 水準為 0.05,因此構造了 95%(或 0.95)信賴區間。此區間表明,根據樣本資料,m D 大於或等於 0.477 並且小於或等於 4.190 的信賴度為 95%
由於參考值 0 不在信賴區間內,因此可以以 95% 的信賴度否定 H0,並推斷出 m D 不等於 0

成對樣本 t > 差異的檢定 - 檢定  
t 檢定提供兩個統計量,可用來對平均值差異進行檢定:t 值 和 p 值。t 值本身並不能提供什麼資訊,但可用來確定 p 值。p 值可以指示當 H0 成立時以特定平均值和標準差獲得差異分布的可能性。
必須在進行檢定之前確定否定 H0 所需的 p 值。選擇作為標準的值稱為 a 水準。如果 p 值小於或等於 a 水準,則否定 H0 並推斷出 m 不等於參考值。
您可以選擇大於 0% 且小於 100% 的任意 a 水準。常用的 a 水準為 0.05
輸出範例
之前 - 之後 的配對 T
                          平均值標
       N    平均值  標準差    準誤
之前  15  74.667   3.478   0.898
之後  15  72.333   3.200   0.826
差異  15   2.333   3.352   0.866
平均差的 95% 信賴區間: (0.477, 4.190)
平均差 = 0 ( ≠ 0) T 檢定: T = 2.70  P = 0.017
解釋
對於心率資料,t 值為 2.70,關聯的 p 值為 0.017p 值為 0.017 表明當 m D 實際為 0 時獲得樣本差異的機會只有 1.7%

成對樣本 t > 圖表 - 差異直方圖  
直方圖圖解資料的下列計數值:
·    形狀。作為 t 製程的要求,差異應該服從常態分布,因此應確保直方圖大致對稱並呈鍾形。也可以執行常態性檢定,以確定差異是否服從常態分布。
·    平均值。直方圖下面以  記號的點表示配對觀測值之間的平均值差異,該值用作 m D 的估計值。
·    信賴區間。在平均值兩側的線和括號表示信賴區間。
·    參考值。記號 H0 的點表示在原假設中指定的 m D的值。
輸出範例














解釋
心率差異的直方圖表示這些資料大致服從常態分布。(當樣本大小很小時,很難評估常態性。)
該圖還表明,m D 很可能大於在 H0 中指定的參考值,因為此值 (0) 小於信賴區間內的值。

成對樣本 t > 圖表 - 個別值圖  
個別值圖對資料的下列計數值進行圖解:
·    離差。每個點表示一個或多個配對觀測值之間的差異。
·    平均值。圖下面以  記號的點表示配對觀測值之間的平均值差異,該值用作 m D 的估計值。
·    信賴區間。在平均值兩側的線和括號表示信賴區間。
·    參考值。記號 H0 的點表示在原假設中指定的 m D 的值。
輸出範例














解釋
心率資料的個別值圖表明,大多數差異為正,並且分布在 -3 +9 之間。該圖還表明,m D 可能大於在 H0 中指定的參考值,因為此值 (0) 小於信賴區間內的值。因此,看起來治療前的心率明顯高於治療後的心率。

成對樣本 t > 圖表 - 差異箱形圖  
箱形圖圖解資料的下列計數值:
·    形狀。箱形圖可以提供有關資料分布的許多資訊。箱表示差異的中間 50% 部分。貫穿箱的線表示中位數差異。從箱伸出的線表示差異的最上面 25% 和最下面 25% 的部分(不包含異常值)。異常值用星號 (*) 表示。
·    平均值。圖下面以  記號的點表示配對觀測值之間的平均值差異,該值用作 m D 的估計值。
·    信賴區間。在平均值兩側的線和括號表示信賴區間。(有關詳細資訊,請參見下面的「信賴區間」主題。)
·    參考值。記號 H0 的點表示在原假設中指定的 m D 的值。
輸出範例














解釋
心率資料的箱形圖表明,中位數差異與平均值 (2.333) 非常接近。中位數和平均值都明顯高於在 H0 (0) 中指定的參考值。實際上,H0 位置非常接近於箱的左邊緣。因此,樣本差異大於 0 的機率大約為 75%。這樣,m D 似乎不可能為 0
平均值差異的 95% 信賴區間也表明 mD 大於 0。由於 H0 位於信賴區間之外,可以 95% 的信賴度推斷出 m 不等於 0,而是介於 0.477 4.190 之間。

Basic Statistics > Paired t > More

假設檢定
假設檢定是統計決策中最常用的方法之一。一般而言,假設檢定是一種假定初始聲明為真,然後使用樣本資料檢定該聲明的製程。通常,初始聲明是指相關的總體參數,如總體平均值 (m)
假設檢定包含兩個假設:原假設(以 H0 表示)和備擇假設(以 H1 表示)。原假設是初始聲明,且通常使用先前的研究或常識進行指定。備擇假設是可以相信為真實或有望證明為真實的內容。備擇假設有時是指研究假設,並且可以是定向的或非定向的。
假設檢定的決策製程可以基於給定檢定的機率值(p 值)。
·    如果 p 值小於或等於預先確定的顯著性水準(a 水準),則否定原假設,轉而支援另一個假設。
·    如果 p 值大於 a 水準,則不能否定原假設,且不聲明支援備擇假設。
執行假設檢定時,有四種可能的結果。結果取決於原假設的真假以及能否否定原假設。下表中匯總了這些結果:







如果原假設為真,但否定了原假設,則發生類型 I 錯誤。發生類型 I 錯誤的機率稱為阿爾法 (a),有時也稱為顯著性水準。
如果原假設為假,但未能否定它,則發生類型 II 錯誤。發生類型 II 錯誤的機率稱為 b
原假設為假時,否定它的機率等於 1 - b。此值也稱為檢定的檢定力。

信賴區間和範圍
信賴區間 (CI) 是用於從樣本資料中估計總體參數的區間。如果備擇假設 (H1) 是非定向的,則 Minitab 同時顯示區間的上下限,如果 H1 是定向的,則只顯示一個邊界。
信賴區間由兩個基本部分構成:
·    點估計 - 從樣本資料中計算的個別值值。此值被認為是相關參數的估計值,但點估計不可能與參數相等。因此,為了考慮估計錯誤的機率,在信賴區間中包含了錯誤邊際,以提供可能的參數值的範圍。
·    錯誤邊際-透過使用機率來確定信賴區間的寬度。為了構造信賴區間,只需從點估計中加上和/或減去錯誤邊際。
對於 a 0.05,構造 95% 的信賴區間。這意味著,用於構造區間的方法產生包含相關參數的區間的機率為 0.95(即 1 - a)。因此,如果構造 100 95% 的信賴區間,則大約有 95 個區間包含該參數。換句話說,參數值位於該區間內的機率為 95%
如果備擇假設有方向,則信賴區間會在一個方向無限延伸。在此情況下,只顯示一個邊界。範例,如果執行 a 0.05 單樣本 t 檢定,並且 H1 m < 5,將顯示 95% 上限。m 的真實值小於或等於上限的信賴度為 95%

相關樣本和獨立樣本
對兩個平均值之差進行檢定時,確定兩個樣本是相關還是獨立至關重要:
·    如果一個樣本中的值影響另一個樣本中的值,則認為這兩個樣本相關。
·    如果一個樣本中的值不能揭示另一個樣本中值的任何資訊,則認為這兩個樣本是獨立的。
假設某製藥公司想要檢定一種新藥在降血壓方面的檢定力。他們可能下列欄方式之一來採集資料:
·    對同一群人抽取每個人在服藥前和服藥後的血壓樣本。因為這些樣本來自同一群人,所以將其視為相關樣本。第一個樣本中血壓最高的人很可能也是第二個樣本中血壓最高的。
·    給一組人服用該藥品,而給另一組人服用安慰劑,然後比較兩組人的血壓。因為這些量測樣本來自不同組的人,所以將其視為獨立樣本。瞭解第一個樣本中的值的分布情況對於瞭解第二個樣本中的值的分布情況並不會有任何協助。

定向和非定向假設
非定向備擇假設 (H1) 只表明原假設 (H0) 不正確。它不能預測相關參數大於還是小於在 H0 中指定的參考值。
定向的 H1 指出 H0 不正確,並且指定參數的真實值大於還是小於 H0 中指定的參考值。
範例:
·    非定向 - 研究人員具有在特定中學參加高考的學生樣本的結果。該研究人員想知道該學校的分數是否與國家平均分 850 不同。由於研究人員感興趣的是分數低於還是高於國家平均分,因此使用非定向的 H1 比較合適。(H0m = 850 H1m 不等於 850
·    定向 - 研究人員具有參加培訓課程的國家考試的學生樣本的考試結果。該研究人員想知道培訓的學生分數是否高於平均分 850。由於研究人員專門假設培訓學生的分數高於平均分,因此應使用定向的 H1。(H0m = 850 H1m > 850
使用定向假設的優點在於增加了檢測到您所感興趣的特定效果的檢定力。缺點在於沒有能力檢測正面影響。
範例,假設一位研究人員預測,培訓的學生的考試分數高於國家平均分(H1m > 850)。透過這一定向的假設,檢定更可能檢測到培訓對考試分數的正面影響。但是,該檢定根本無法檢測負面影響。如果因為某種原因,培訓使學生的考試很糟糕(即 m 實際小於 850),則該檢定無法檢測到該效果。

假設檢定和信賴區間的關係
假設您正在執行假設檢定。回想一下,否定原假設 (H0) 或無法否定該假設的決策可以基於 p 值和您選擇的顯著性水準(a 水準)。如果 p 值小於或等於 a,則否定 H0;如果 p 值大於 a,則無法否定 H0
您的決策也可以基於使用同一 a 水準構造的信賴區間(或邊界)。範例,顯著性水準為 0.05 的檢定的決策可以基於 95% 信賴區間:
·    如果在 H0 中指定的參考值位於區間之外(即小於下限或大於上限),則可否定 H0
·    如果在 H0 中指定的參考值位於區間之內(即不小於下限或大於上限),則無法否定 H0

選擇 a 水準
a 的選擇決定類型 I 錯誤的機率。此值越小,錯誤地否定原假設 (H0) 的幾率就越小。但是,a 值越小就意味著檢定力越低,並因此降低了檢測到效應(如果存在)的幾率。
按照慣例,最常用的 a 水準為 0.05a = 0.05 表示發現實際並不存在的效應的幾率僅為 5%。大多數情況下,認為這種出現錯誤的機率可允收。但是,對特定檢定選擇 a 時,可能需要考慮何種錯誤更嚴重:發現實際不存在的效應,或未發現實際存在的效應。
選擇較小的 a。有時選擇較小、較保守的 a 值更好。範例,假設要檢定新銑床中的樣本,並嘗試決定是否購買並在加工車間中安裝一批這種機器。如果新機器比當前使用的機器更精確,則會節省大量資金,因為生產的殘次品將會減少。但是,購買和安裝一批機器的成本非常高。購買前需要確信新機器更加精確。這種情況下,可能需要選擇較低的 a 值,如 0.001。這樣,如果實際上並非如此,將斷定新機器更精確的幾率也僅為 0.1%
選擇較大的 a。另一方面,有時選擇較大、較寬鬆的 a 值更好。範例,假設噴氣發動機製造商要檢定一種價格較低的新滾珠軸承的穩定性。很明顯,如果滾珠不合格,則節省的少量滾珠成本沒有潛在災難性後果的代價值得重視。因此,可能需要選擇較高的 a 值,如 0.1。儘管這意味著在不存在差異的情況下將更可能錯誤地斷定存在差異,但更重要的是更可能檢測到軸承穩定性中的差異(如果存在)。

具有合理常態分布的小樣本範例
當您需要判斷圖片時,產生對培訓眼睛沒有「問題」的多個資料集通常很有用。人們往往傾向於在實際沒有圖表趨勢的時候看到圖表趨勢。
下面是來自常態分布的九組資料,即「沒有問題」的樣本。對於未經培訓的眼睛而言,其中多數直方圖可能不呈鐘形。












詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

沒有留言:

張貼留言