2012年8月31日 星期五

Minitab: 6 sigma 專業軟體 繁體中文討論-79


有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:

Basic Statistics > Normality Test

常態性檢定 > 匯總  
許多統計製程都假定資料服從常態分布。為了驗證此假設,可對資料執行常態性檢定。
Minitab 提供三種可供選擇的常態性檢定:
·    Anderson-Darling - 此檢定具有極好的檢定力,並且在分布的高值和低值中檢測對常態性的偏離時特別有效。
·    Ryan-Joiner(與 Shapiro-Wilk 類似) - 此檢定具有極好的檢定力。它基於樣本資料與期望從常態分布中獲得資料之間的相關。
·    Kolmogorov-Smirnov - 這是常見的常態性檢定,但檢定力比其他兩種檢定要低。
每個檢定的結果都帶有常態機率圖,這有助於確定資料是否服從常態分布。
資料描述
營養學家選擇隨機的 13 瓶食用油樣本,以確定飽和脂肪的平均百分比是否不同於宣傳的 15%。以前的研究表明,總體標準差為 2.6%
使用單樣本 Z 檢定似乎很合適,但常態性假設需要進行驗證。營養學家選擇 a 水準 0.10 進行檢定。
資料: 脂肪.MTW (在樣本資料檔案夾中)

常態性檢定 > 圖表 - 機率圖  
如果資料完全呈常態分布,機率圖上的資料點將會形成一條直線。參考線是基於 Minitab 透過樣本估計的參數的適配累積分布函數。
根據您選擇的常態性檢定,機率圖並沒有什麼變化,但圖例中的檢定統計量和 p 值可能會不同。
輸出範例














解釋
食用油資料圖顯示點合理分布在參考線附近,這表明資料服從常態分布。

常態性檢定 > 圖表 - 檢定結果  
常態性檢定評估原假設 (H0),即資料服從常態分布。如果檢定的 p 值小於所選的 a 水準,則必須否定 H0 並推斷出資料不服從常態分布。
輸出範例














解釋
食用油資料的 Anderson-Darling 常態性檢定(右下角)的 p 值為 0.970。此值大於所選的 a 水準 0.10,因此營養學家將不否定 H0。沒有足夠的證據表明,資料不服從常態分布。
Ryan-Joiner Kolmogorov-Smirnov 檢定(未顯示)產生相同的結果。Ryan-Joiner 檢定產生的近似 p > 0.10Kolmogorov-Smirnov 檢定產生的近似 p > 0.15

Basic Statistics > Normality Test > more

從機率圖中評估資料的形狀
當圖中的點處於相對直線上時,常態機率圖驗證常態性的假設。如果不是這樣,則仍可取得有關資料形狀的一些資訊,具體取決於圖偏離直線的程度。
範例,下面的機率圖和直方圖來自向右傾斜的資料集。










假設檢定
假設檢定是統計決策中最常用的方法之一。一般而言,假設檢定是一種假定初始聲明為真,然後使用樣本資料檢定該聲明的製程。通常,初始聲明是指相關的總體參數,如總體平均值 (m)
假設檢定包含兩個假設:原假設(以 H0 表示)和備擇假設(以 H1 表示)。原假設是初始聲明,且通常使用先前的研究或常識進行指定。備擇假設是可以相信為真實或有望證明為真實的內容。備擇假設有時稱為研究假設。
假設檢定的決策製程可以基於給定檢定的機率值(p 值)。
·    如果 p 值小於或等於預先確定的顯著性水準(a 水準),則否定原假設,並聲明支援備擇假設。
·    如果 p 值大於 a 水準,則不能否定原假設,且不聲明支援備擇假設。
執行假設檢定時,有四種可能的結果。結果取決於原假設的真假以及能否否定原假設。下表中匯總了這些結果:








如果原假設為真,但否定了原假設,則發生類型 I 錯誤。發生類型 I 錯誤的機率稱為阿爾法 (a),有時也稱為顯著性水準。
如果原假設為假,但未能否定它,則發生類型 II 錯誤。發生類型 II 錯誤的機率稱為 b
原假設為假時,否定它的機率等於 1 - b。此值也稱為檢定的檢定力。

選擇 a 水準
a 的選擇決定類型 I 錯誤的機率。此值越小,錯誤地否定原假設 (H0) 的幾率就越小。但是,a 值越小就意味著檢定力越低,並因此降低了檢測到效應(如果存在)的幾率。
按照慣例,最常用的 a 水準為 0.05a = 0.05 表示發現實際並不存在的效應的幾率僅為 5%。大多數情況下,認為這種出現錯誤的機率可允收。但是,對特定檢定選擇 a 時,可能需要考慮何種錯誤更嚴重:發現實際不存在的效應,或未發現實際存在的效應。
選擇較小的 a。有時選擇較小、較保守的 a 值更好。範例,假設要檢定新銑床中的樣本,並嘗試決定是否購買並在加工車間中安裝一批這種機器。如果新機器比當前使用的機器更精確,則會節省大量資金,因為生產的殘次品將會減少。但是,購買和安裝一批機器的成本非常高。購買前需要確信新機器更加精確。這種情況下,可能需要選擇較低的 a 值,如 0.001。這樣,如果實際上並非如此,將斷定新機器更精確的幾率也僅為 0.1%
選擇較大的 a。另一方面,有時選擇較大、較寬鬆的 a 值更好。範例,假設噴氣發動機製造商要檢定一種價格較低的新滾珠軸承的穩定性。很明顯,如果滾珠不合格,則節省的少量滾珠成本沒有潛在災難性後果的代價值得重視。因此,可能需要選擇較高的 a 值,如 0.1。儘管這意味著在不存在差異的情況下將更可能錯誤地斷定存在差異,但更重要的是更可能檢測到軸承穩定性中的差異(如果存在)。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

2012年8月29日 星期三

Minitab: 6 sigma 專業軟體 繁體中文討論-78


有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
Basic Statistics > Covariance

共變異數 > 匯總  
與相關係數相似,共變異數是對兩個連續變數之間的線性關係的量測。但不同於關係係數的是,表示共變異數的單位隨分析的資料而有所不同。因此,很難使用共變異數統計量來評估線性關係的強度。如果這是您的目標,則應改用相關係數。
共變異數用在某些統計計算中,並且在確定線性關係的方向時很有用:
·    如果兩個變數都傾向於同時增加或減小,則係數為正。
·    如果單變數在另單變數減小時傾向於增加,則係數為負。
資料描述
鋁鑄件工廠需要評估含氫量與鋁合金鑄件的多孔性之間的關係。他們收集鑄件的隨機樣本,並量測每個鑄件的下列計數值:
·    氫含量
·    多孔性
·    強度
資料: 鋁.MTW (在樣本資料檔案夾中)

共變異數 > 共變異數矩陣  
在共變異數的對角元素上可以找到兩個變數之間的共變異數矩陣。對角元素是各變數的變異數。
要注意共變異數不隱含因果關係,這一點很重要。只有正確控制的實驗才能確定關係是否存在因果性。
輸出範例
                         孔隙率         強度
       0.00072582
孔隙率   0.00357582       0.04512967
強度    -0.00704865       -0.03710245       0.10963907
解釋
結果表明:

·    氫含量和多孔性之間的共變異數為正 (0.00357582),這表明氫含量增加時,多孔性也增加。(如果您對評估此關係的量值感興趣,則應計算相關係數。)
·    氫含量和強度之間的共變異數 (-0.00704865) 以及多孔性與強度之間的共變異數 (-0.03710245) 都為負。這表明當氫含量或多孔性增加時,強度傾向於減小。
共變異數不能證明增加氫含量會增加多孔性,或者增加多孔性允許向鋁中注入更多氫。可能這兩種現象都是由第三個變數(範例,溫度)引起的。

Basic Statistics > Covariance > more

共變異數和相關之間的關係
儘管相關係數和共變異數是線性關聯的量測,但它們在下列方面存在差異:
·    相關係數是標準化的,因此完美的線性關係將導致係數為 1
·    共變異數值是未標準化的,因此完美線性關係的值將取決於資料。
相關係數是共變異數的函數。相關係數等於共變異數除以產品的變數標準差。因此,正的共變異數總是產生正的相關性,類似地,負的共變異數總是產生負的相關性。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

Minitab: 6 sigma 專業軟體 繁體中文討論-77


有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:

Basic Statistics > Correlation

相關 > 匯總  
Pearson 相關係數量測兩個連續變數線性相關的程度。
假設您有糖果的樣本,並且要瞭解生產設備的溫度是否與巧克力塗層的厚度變化有關。或者,您可能有一個高爾夫球的樣本,並且要確定其直徑差別是否與彈性差別有關。
執行或解釋相關分析時,需要記住下列幾點:
·    相關係數只量測線性關係。即使相關係數為 0,也會存在有意義的非線性關係。
·    但根據相關性,不適合推斷出下列結論:單變數的變化會引起另單變數的變化。只有正確控制的實驗才能確定關係是否存在因果性。
·    相關係數對極值非常敏感。資料集中與其他值截然不同的個別值值會極大地改變該係數值。
資料描述
鋁鑄件工廠需要評估含氫量與鋁合金鑄件的多孔性之間的關係。他們收集鑄件的隨機樣本,並量測每個鑄件的下列計數值:
·    氫含量
·    多孔性
·    強度
資料: 鋁.MTW (在樣本資料檔案夾中)

相關 > 相關係數  
相關係數的值在 -1 +1 的範圍之間,並表明有關兩個變數之間的線性關係的兩條資訊:
·    強度 - 係數的絕對值越大,變數之間的線性關係越強。絕對值為 1 時表示完全線性相關,而值為零時則表示不存在線性關係。將中間值解釋為弱相關、中度相關還是強相關要取決於您的目標和要求。
·    方向 - 係數的符號表明關係的方向。如果兩個變數都傾向於同時增加或減小,則係數為正。如果單變數在另單變數減小時傾向於增加,則係數為負。
要注意相關性不隱含因果關係,這一點很重要。只有正確控制的實驗才能確定關係是否存在因果性。
要注意相關係數只量測線性關係,這一點很重要。即使相關係數為 0,也可能存在有意義的非線性關係。
輸出範例
              孔隙率
孔隙率   0.625
         0.017
強度    -0.790  -0.527
         0.001   0.053
儲存格內容: Pearson 相關係數
            P
解釋
結果表明:
·    氫含量和多孔性之間關係的相關係數為 0.625。這表明氫含量增加時,鋁鑄件的多孔性也傾向於增加。
·    相反,氫和強度之間的相關係數 (-0.790) 以及多孔性與強度之間的相關係數 (-0.527) 均為負。這表明當氫含量或多孔性增加時,強度傾向於減小。
相關係數不能證明增加氫含量會增加多孔性,或者增加多孔性允許向鋁中注入更多氫。範例,這兩種現象可能都是由第三個變數(範例,溫度)引起的。

相關 > P   
p 值表明相關係數是否顯著不同於 0。(係數為 0 表明不存在線性關係):
·    如果 p 值小於或等於您所選擇的 a 水準,則可推斷出相關係數不為零。
·    如果 p 值大於 a 水準,則不能推斷出相關係數不為零。
必須在執行檢定之前選擇 a 水準。您可以選擇大於 0.0 且小於 1.0 的任意值。常用的 a 水準為 0.05
輸出範例
              孔隙率
孔隙率   0.625
         0.017
強度    -0.790  -0.527
         0.001   0.053
儲存格內容: Pearson 相關係數
            P
解釋
因此,如果對於鋁鑄件分析選擇 a 水準 0.05,則可推斷出氫含量與多孔性之間的線性相關性 (p = 0.017) 以及氫含量與強度之間的線性相關性 (p = 0.001) 都不為 0。但不能斷定多孔性和強度之間存在線性關係,因為 0.053 大於 0.05

Basic Statistics > Correlation > more


線性和非線性關係圖
看圖有助於評估強度和下圖所示的變數間的線性關係的方向。可以使用開始 > 迴歸 > 配適線圖來建立類似的圖。
強正向線性關係









 
兩個變數同時增加或減小時,存在正線性關係。此圖中的點緊靠著線,表明變數之間存在強關係。此關係的相關係數為 +.921
強負向線性關係









當單變數增加而另單變數減小時,存在負向線性關係。此圖中的點緊靠著線,表明變數之間存在強關係。此關係的相關係數為 -0.934
弱線性關係









此圖中的資料點隨機分布。它們不位於線的附近,這表明如果關係存在,則存在非常弱的關係。此關係的相關係數為 +0.238
非線性關係









此圖顯示兩個變數之間存在很強的關係。但是,由於該關係不是線性的,因此相關係數僅為 +0.244。繪製資料以便檢測出資料中的非線性關係,這一點很重要。

選擇 a 水準
a 的選擇決定類型 I 錯誤的機率。此值越小,錯誤地否定原假設 (H0) 的幾率就越小。但是,a 值越小就意味著檢定力越低,並因此降低了檢測到效應(如果存在)的幾率。
按照慣例,最常用的 a 水準為 0.05a = 0.05 表示發現實際並不存在的效應的幾率僅為 5%。大多數情況下,認為這種出現錯誤的機率可允收。但是,對特定檢定選擇 a 時,可能需要考慮何種錯誤更嚴重:發現實際不存在的效應,或未發現實際存在的效應。
選擇較小的 a。有時選擇較小、較保守的 a 值更好。範例,假設要檢定新銑床中的樣本,並嘗試決定是否購買並在加工車間中安裝一批這種機器。如果新機器比當前使用的機器更精確,則會節省大量資金,因為生產的殘次品將會減少。但是,購買和安裝一批機器的成本非常高。購買前需要確信新機器更加精確。這種情況下,可能需要選擇較低的 a 值,如 0.001。這樣,如果實際上並非如此,將斷定新機器更精確的幾率也僅為 0.1%
選擇較大的 a。另一方面,有時選擇較大、較寬鬆的 a 值更好。範例,假設噴氣發動機製造商要檢定一種價格較低的新滾珠軸承的穩定性。很明顯,如果滾珠不合格,則節省的少量滾珠成本沒有潛在災難性後果的代價值得重視。因此,可能需要選擇較高的 a 值,如 0.1。儘管這意味著在不存在差異的情況下將更可能錯誤地斷定存在差異,但更重要的是更可能檢測到軸承穩定性中的差異(如果存在)。

假設檢定
假設檢定是統計決策中最常用的方法之一。一般而言,假設檢定是一種假定初始聲明為真,然後使用樣本資料檢定該聲明的製程。通常,初始聲明是指相關的總體參數,如總體平均值 (m)
假設檢定包含兩個假設:原假設(以 H0 表示)和備擇假設(以 H1 表示)。原假設是初始聲明,且通常使用先前的研究或常識進行指定。備擇假設是可以相信為真實或有望證明為真實的內容。備擇假設有時稱為研究假設。
假設檢定的決策製程可以基於給定檢定的機率值(p 值)。
·    如果 p 值小於或等於預先確定的顯著性水準(a 水準),則否定原假設,並聲明支援備擇假設。
·    如果 p 值大於 a 水準,則不能否定原假設,且不聲明支援備擇假設。
執行假設檢定時,有四種可能的結果。結果取決於原假設的真假以及能否否定原假設。下表中匯總了這些結果:







如果原假設為真,但否定了原假設,則發生類型 I 錯誤。發生類型 I 錯誤的機率稱為阿爾法 (a),有時也稱為顯著性水準。
如果原假設為假,但未能否定它,則發生類型 II 錯誤。發生類型 II 錯誤的機率稱為 b
原假設為假時,否定它的機率等於 1 - b。此值也稱為檢定的檢定力。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

2012年8月28日 星期二

Minitab: 6 sigma 專業軟體 繁體中文討論-76


有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:

Basic Statistics > Two Variances

雙變異數 > 匯總  
雙變異數信賴區間和檢定製程用於根據兩個獨立的隨機樣本中的資料對兩個總體比例之間的標準差和變異數的相等性進行推斷。Minitab 將計算兩個總體變異數和標準差之間比例的假設檢定和信賴區間;如果比例為 1,則表明兩個總體相等。
包含變異數分析在內的許多統計製程都假定不同總體具有相同的變異數。使用雙變異數可以確定相等變異數的假設是否有效。
不等變異數可能根據下列情況影響推斷:
·    模型是否包含固定或隨機因子
·    樣本大小差別大小
·    使用何種多重比較製程
資料描述
最近的研究對在兩種道路上駕駛的司機進行了比較。每位司機在兩種道路的其中一種上駕駛:一級公路 (1) 和土路 (2)。作為對駕駛性能的量測,測試人員記錄了每位司機在每種道路上所作的控制校正次數。您要測試司機的表現在兩種道路情況下是否均勻變化。
資料: 公路.MTW (在樣本資料檔案夾中)

雙變異數 > 匯總統計量與比例信賴區間  
每個樣本的標準差和變異數將被計算並作為實際總體值的點估計值。
信賴區間是實際標準差 (s) 和變異數 (s2) 比例的一系列可能值。由於您不知道 s s2 的實際值,因此信賴區間可能會根據樣本資料提供每個比例的範圍。如果範圍包含 1,則您無法拒絕兩個總體之間的值相等這一假設。
信賴區間表顯示下列資訊:
·    資料分布常態且連續(變數是連續的,但不一定常態分布)。Minitab 將計算這兩個分布的信賴區間。執行常態性檢定,以確定應使用的分布。
·    標準差比例的信賴區間  即兩個標準差之間的比例的 95.0% 信賴區間的信賴下限和上限。
·    變異數的信賴區間即兩個變異數之間的比例的 95.0% 信賴區間的信賴下限和上限。
輸出範例
統計量
方法
類型  N  標準差    變異數
1     8   4.803  23.071
2     8   5.831  34.000
標準差比 = 0.824
變異數比 = 0.679
95% 信賴區間
           標準差比信賴    變異數比信賴區
資料分布       區間            
常態      (0.369, 1.841)  (0.136, 3.389)
連續      (0.217, 2.842)  (0.047, 8.076)
解釋
對於駕車資料,兩個總體的標準差與變異數之間的樣本估計值不相等。範例,道路型 1 的標準差為 4.803,而道路型 2 的標準差為 5.831
但是,全部的信賴區間都包含 1。這表明沒有足夠的證據來否定標準差與變異數相等這一假設。範例,常態分布範圍在 0.369 1.841 之間的標準差比例的信賴區間。實際比例介於此範圍內的信賴度為 95%
由於信賴區間相當廣泛,因此您可以嘗試增加樣本大小,以縮小信賴區間範圍。Minitab 的雙變異數檢定的檢定力和樣本大小指令將協助您確定足夠的樣本大小。

雙變異數 > 假設檢定  
Minitab 顯示了用於判斷變異數是否相等的兩種檢定的結果:F 檢定和 Levene 檢定。在這兩種檢定中,原假設指明這兩個變異數(或等效的總體標準差)相等 (H0s21 / s22 = 1),與指出它們不相等的備擇假設相比 (H1:s21 / s22 ≠ 1)
檢定的選項取決於分布計數值:
·    當資料來自常態分布時使用 F 檢定。對於偏離常態性的情況,F 檢定的功能並不強大。
·    當資料來自連續但不一定常態的分布時,請使用 Levene 檢定。Levene 檢定不如 F 檢定敏感,因此當資料為常態或接近常態時,請使用 F 檢定。
Minitab 對於 F 檢定和 Levene 檢定都計算和顯示檢定統計量和 p 值。
·    p 值較高(在指定的 a 水準之上),則表明變異數之間不存在顯著差異(變異數相等或具有齊次性)。
·    p 值較低(低於指定的 a 水準),則表明變異數之間存在差異(變異數不相等)。
輸出範例
檢定
                                       檢定統
方法                         DF1  DF2    計量   P
F 檢定(常態)                 7    7    0.68  0.622
Levene 檢定(任何連續分布)    1   14    0.18  0.680
解釋
對於駕車資料,檢定的較高 p 值(0.622 0.680)表明變異數之間不存在差異。

雙變異數 > 圖表 - 直方圖  
Minitab 顯示兩個樣本分布的直方圖。使用直方圖直觀地表示樣本資料的分布。觀察分布的中心趨勢、變異和整體形狀。使用此圖尋找下列資訊:
此圖表趨勢...                         表明...
長尾                                        偏斜度
遠離其他長條的長條            異常值
儘管常態分布應呈現鐘形,但直方圖的外觀會根據區間數量和樣本大小發生變更。使用機率圖和適合度檢定可以評定資料是否為常態。
此圖表有助於直觀地瞭解資料的分布情況。但是,請在作業視窗中使用比例信賴區間或假設檢定來確定變異數是相等還是存在顯著差異。
輸出範例














解釋
直方圖顯示一級公路 (1) 的校正數少於土路 (2) 的校正數。組之間的變異性大致相等。一級公路的資料可能向右傾斜。

雙變異數 > 圖表 - 個別值圖  
Minitab 將顯示一個個別值圖,其中顯示每個樣本的原始資料。個別值圖可協助您直觀地表示樣本資料的形狀和展開、發現異常值以及比較分布:
·    尋找點密度較高和較低的區域以瞭解分布的形狀。
·    每個分布的相對高度圖示了其變異性。
·    異常值落於遠離主要點群處。

此圖表有助於直觀地瞭解資料的分布情況。但是,請在作業視窗中使用比例信賴區間或假設檢定來確定變異數是相等還是存在顯著差異。
輸出範例














解釋
個別值圖顯示一級公路 (1) 的校正數少於土路 (2) 的校正數。組之間的變異性大致相等。一級公路的資料可能向右傾斜。

雙變異數 > 圖表 - 箱形圖  
Minitab 將顯示一個箱形圖,其中顯示兩個樣本的分布。使用箱形圖來檢查和比較兩個分布的中心趨勢和變異性並確定任何異常值(以星號識別)。觀察中位數的位置、矩形箱體的長度以及須的長度,以大致瞭解每個分布的特徵。
此圖表有助於直觀地瞭解資料的分布情況。但是,請在作業視窗中使用比例信賴區間或假設檢定來確定變異數是相等還是存在顯著差異。
輸出範例














解釋
箱形圖顯示組之間的變異性大致相等。此外,一級公路 (1) 的校正數少於土路 (2) 的校正數。一級公路的資料可能向右傾斜。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

2012年8月27日 星期一

Minitab: 6 sigma 專業軟體 繁體中文討論-75


有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:



















Basic Statistics > One Variance

單變異數 > 匯總  
「單變異數」指令分析來自總體的個別值樣本,並為該總體的標準差和變異數計算信賴區間。它還以可選的假設檢定為特徵,來確定未知的總體標準差或變異數是否等於使用者指定的值。範例,此檢定在確定變異數是否不同於行業標準時很有用。
資料描述
木材廠的經理要分析鋸木機的性能。設計了一台鋸木機,以生產剛好為 100 cm 長的梁。經理決定要分析這些長度的變異數,以便更好地瞭解該設備的精度。經理取 50 個梁作為樣本,以公分為單位量測其長度,並使用單變異數檢定分析此個別值總體的變異數。
資料: 鋸木機.MTW (在樣本資料檔案夾中)

單變異數 > 敘述性統計量 - N  
此值表示樣本大小,它等於樣本中的非遺失觀測值個數。
輸出範例
方法
卡方方法僅適用於常態分布。
Bonett 方法適用於任何連續分布。
統計量
變數   N  標準差   變異數
長度  50   0.871  0.759
95% 信賴區間
               標準差信賴區
變數  方法                   變異數信賴區間
長度  卡方    (0.728, 1.085)  (0.529, 1.178)
      Bonett  (0.704, 1.121)  (0.496, 1.257)
解釋
在木材廠範例中,經理量測了 50 根梁的長度。

單變異數 > 敘述性統計量 - 標準差  
此統計量量測資料圍繞其平均值分散的範圍。標準差等於樣本變異數的平方根。
輸出範例
方法
卡方方法僅適用於常態分布。
Bonett 方法適用於任何連續分布。
統計量
變數   N  標準差   變異數
長度  50   0.871  0.759
95% 信賴區間
               標準差信賴區
變數  方法                   變異數信賴區間
長度  卡方    (0.728, 1.085)  (0.529, 1.178)
      Bonett  (0.704, 1.121)  (0.496, 1.257)
解釋
在木材場範例中,樣本中梁長度的標準差為 0.871 cm

單變異數 > 敘述性統計量 - 變異數  
此統計量量測資料圍繞其平均值分散的範圍。變異數等於標準差的平方。
輸出範例
方法
卡方方法僅適用於常態分布。
Bonett 方法適用於任何連續分布。
統計量
變數   N  標準差   變異數
長度  50   0.871  0.759
95% 信賴區間
               標準差信賴區
變數  方法                   變異數信賴區間
長度  卡方    (0.728, 1.085)  (0.529, 1.178)
      Bonett  (0.704, 1.121)  (0.496, 1.257)
解釋
在木材場範例中,樣本中梁長度的變異數為 0.759 cm

單變異數 > 信賴區間 - 卡方方法  
如果可以安全地假設樣本來自常態分布的總體,則請使用卡方方法。這些信賴區間提供了可能分別包含未知總體標準差和變異數的一系列值。
輸出範例
方法
卡方方法僅適用於常態分布。
Bonett 方法適用於任何連續分布。
統計量
變數   N  標準差   變異數
長度  50   0.871  0.759
95% 信賴區間
               標準差信賴區
變數  方法                   變異數信賴區間
長度  卡方    (0.728, 1.085)  (0.529, 1.178)
      Bonett  (0.704, 1.121)  (0.496, 1.257)
解釋
在木材廠範例中,如果資料服從常態分布,則該木材廠中全部梁長度的標準差可能介於 0.728 cm 1.085 cm 之間。長度的變異數可能介於 0.529 cm 1.178 cm 之間。

單變異數 > 信賴區間 - Bonett 方法  
如果您的樣本資料連續但不來自常態分布的總體,則請使用 Bonett 方法。這些信賴區間提供了可能分別包含未知總體標準差和變異數的一系列值。
輸出範例
方法
卡方方法僅適用於常態分布。
Bonett 方法適用於任何連續分布。
統計量
變數   N  標準差   變異數
長度  50   0.871  0.759
95% 信賴區間
               標準差信賴區
變數  方法                   變異數信賴區間
長度  卡方    (0.728, 1.085)  (0.529, 1.178)
      Bonett  (0.704, 1.121)  (0.496, 1.257)
解釋
在木材廠範例中,如果資料不服從常態分布,則該木材廠中全部梁長度的標準差可能介於 0.704 cm 1.121 cm 之間。長度的變異數可能介於 0.496 cm 1.257 cm 之間。

Basic Statistics > One Variance > More

卡方方法和 Bonett 方法的比較
Minitab 將兩種計算信賴區間的方法用於標準差和變異數:卡方方法和 Bonett 方法。在確定要使用的方法時,請使用下列原則:
·    如果樣本資料來自常態分布的總體,則使用卡方方法。但是,如果您的樣本不是來自近似於常態分布的總體,則此方法將會產生不準確的結果。
·    對於偏離常態性的情況,Bonett 方法的功能非常強大。如果資料的非常態性很明顯,Bonett 方法會比卡方方法精確得多。Minitab 不能透過匯總資料計算 Bonett 方法。

信賴區間和範圍
信賴區間 (CI) 是用於從樣本資料中估計總體參數的區間。如果備擇假設 (H1) 是非定向的,則 Minitab 同時顯示區間的上下限,如果 H1 是定向的,則只顯示一個邊界。
信賴區間由兩個基本部分構成:
·    點估計 - 從樣本資料中計算的個別值值。此值被認為是相關參數的估計值,但點估計不可能與參數相等。因此,為了考慮估計錯誤的機率,在信賴區間中包含了錯誤邊際,以提供可能的參數值的範圍。
·    錯誤邊際-透過使用機率來確定信賴區間的寬度。為了構造信賴區間,只需從點估計中加上和/或減去錯誤邊際。
對於 a 0.05,構造 95% 的信賴區間。這意味著,用於構造區間的方法產生包含相關參數的區間的機率為 0.95(即 1 - a)。因此,如果構造 100 95% 的信賴區間,則大約有 95 個區間包含該參數。換句話說,參數值位於該區間內的機率為 95%

如果備擇假設有方向,則信賴區間會在一個方向無限延伸。在此情況下,只顯示一個邊界。範例,如果執行 a 0.05 單樣本 t 檢定,並且 H1 m < 5,將顯示 95% 上限。m 的真實值小於或等於上限的信賴度為 95%

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.