有學過6
sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. 宏; 變異數分析
v.s.方差分析; 進階 v.s. 高级…
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!
先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
Basic Statistics > Correlation
相關 > 匯總
Pearson 相關係數量測兩個連續變數線性相關的程度。
假設您有糖果的樣本,並且要瞭解生產設備的溫度是否與巧克力塗層的厚度變化有關。或者,您可能有一個高爾夫球的樣本,並且要確定其直徑差別是否與彈性差別有關。
執行或解釋相關分析時,需要記住下列幾點:
· 相關係數只量測線性關係。即使相關係數為 0,也會存在有意義的非線性關係。
· 但根據相關性,不適合推斷出下列結論:單變數的變化會引起另單變數的變化。只有正確控制的實驗才能確定關係是否存在因果性。
· 相關係數對極值非常敏感。資料集中與其他值截然不同的個別值值會極大地改變該係數值。
資料描述
鋁鑄件工廠需要評估含氫量與鋁合金鑄件的多孔性之間的關係。他們收集鑄件的隨機樣本,並量測每個鑄件的下列計數值:
· 氫含量
· 多孔性
· 強度
資料:
鋁.MTW (在樣本資料檔案夾中)
相關 > 相關係數
相關係數的值在 -1 到 +1 的範圍之間,並表明有關兩個變數之間的線性關係的兩條資訊:
· 強度
- 係數的絕對值越大,變數之間的線性關係越強。絕對值為 1 時表示完全線性相關,而值為零時則表示不存在線性關係。將中間值解釋為弱相關、中度相關還是強相關要取決於您的目標和要求。
· 方向
- 係數的符號表明關係的方向。如果兩個變數都傾向於同時增加或減小,則係數為正。如果單變數在另單變數減小時傾向於增加,則係數為負。
要注意相關性不隱含因果關係,這一點很重要。只有正確控制的實驗才能確定關係是否存在因果性。
要注意相關係數只量測線性關係,這一點很重要。即使相關係數為 0,也可能存在有意義的非線性關係。
輸出範例
氫 孔隙率
孔隙率 0.625
0.017
強度 -0.790 -0.527
0.001 0.053
儲存格內容: Pearson 相關係數
P 值
解釋
結果表明:
· 氫含量和多孔性之間關係的相關係數為 0.625。這表明氫含量增加時,鋁鑄件的多孔性也傾向於增加。
· 相反,氫和強度之間的相關係數 (-0.790) 以及多孔性與強度之間的相關係數 (-0.527) 均為負。這表明當氫含量或多孔性增加時,強度傾向於減小。
相關係數不能證明增加氫含量會增加多孔性,或者增加多孔性允許向鋁中注入更多氫。範例,這兩種現象可能都是由第三個變數(範例,溫度)引起的。
相關 > P 值
p 值表明相關係數是否顯著不同於 0。(係數為 0 表明不存在線性關係):
· 如果
p 值小於或等於您所選擇的 a 水準,則可推斷出相關係數不為零。
· 如果
p 值大於 a 水準,則不能推斷出相關係數不為零。
必須在執行檢定之前選擇 a 水準。您可以選擇大於 0.0 且小於 1.0 的任意值。常用的 a 水準為
0.05。
輸出範例
氫 孔隙率
孔隙率 0.625
0.017
強度 -0.790 -0.527
0.001 0.053
儲存格內容: Pearson 相關係數
P 值
解釋
因此,如果對於鋁鑄件分析選擇 a 水準 0.05,則可推斷出氫含量與多孔性之間的線性相關性 (p = 0.017) 以及氫含量與強度之間的線性相關性 (p = 0.001) 都不為 0。但不能斷定多孔性和強度之間存在線性關係,因為 0.053 大於 0.05。
Basic Statistics > Correlation > more
線性和非線性關係圖
看圖有助於評估強度和下圖所示的變數間的線性關係的方向。可以使用開始 > 迴歸 > 配適線圖來建立類似的圖。
強正向線性關係
兩個變數同時增加或減小時,存在正線性關係。此圖中的點緊靠著線,表明變數之間存在強關係。此關係的相關係數為 +.921。
強負向線性關係
當單變數增加而另單變數減小時,存在負向線性關係。此圖中的點緊靠著線,表明變數之間存在強關係。此關係的相關係數為 -0.934。
弱線性關係
此圖中的資料點隨機分布。它們不位於線的附近,這表明如果關係存在,則存在非常弱的關係。此關係的相關係數為 +0.238。
非線性關係
此圖顯示兩個變數之間存在很強的關係。但是,由於該關係不是線性的,因此相關係數僅為 +0.244。繪製資料以便檢測出資料中的非線性關係,這一點很重要。
選擇 a 水準
對 a 的選擇決定類型 I 錯誤的機率。此值越小,錯誤地否定原假設 (H0) 的幾率就越小。但是,a 值越小就意味著檢定力越低,並因此降低了檢測到效應(如果存在)的幾率。
按照慣例,最常用的 a 水準為 0.05。a = 0.05
表示發現實際並不存在的效應的幾率僅為 5%。大多數情況下,認為這種出現錯誤的機率可允收。但是,對特定檢定選擇 a 時,可能需要考慮何種錯誤更嚴重:發現實際不存在的效應,或未發現實際存在的效應。
選擇較小的 a。有時選擇較小、較保守的 a 值更好。範例,假設要檢定新銑床中的樣本,並嘗試決定是否購買並在加工車間中安裝一批這種機器。如果新機器比當前使用的機器更精確,則會節省大量資金,因為生產的殘次品將會減少。但是,購買和安裝一批機器的成本非常高。購買前需要確信新機器更加精確。這種情況下,可能需要選擇較低的 a 值,如 0.001。這樣,如果實際上並非如此,將斷定新機器更精確的幾率也僅為 0.1%。
選擇較大的 a。另一方面,有時選擇較大、較寬鬆的 a 值更好。範例,假設噴氣發動機製造商要檢定一種價格較低的新滾珠軸承的穩定性。很明顯,如果滾珠不合格,則節省的少量滾珠成本沒有潛在災難性後果的代價值得重視。因此,可能需要選擇較高的 a 值,如 0.1。儘管這意味著在不存在差異的情況下將更可能錯誤地斷定存在差異,但更重要的是更可能檢測到軸承穩定性中的差異(如果存在)。
假設檢定
假設檢定是統計決策中最常用的方法之一。一般而言,假設檢定是一種假定初始聲明為真,然後使用樣本資料檢定該聲明的製程。通常,初始聲明是指相關的總體參數,如總體平均值 (m)。
假設檢定包含兩個假設:原假設(以 H0 表示)和備擇假設(以 H1 表示)。原假設是初始聲明,且通常使用先前的研究或常識進行指定。備擇假設是可以相信為真實或有望證明為真實的內容。備擇假設有時稱為研究假設。
假設檢定的決策製程可以基於給定檢定的機率值(p 值)。
· 如果
p 值小於或等於預先確定的顯著性水準(a 水準),則否定原假設,並聲明支援備擇假設。
· 如果
p 值大於 a 水準,則不能否定原假設,且不聲明支援備擇假設。
執行假設檢定時,有四種可能的結果。結果取決於原假設的真假以及能否否定原假設。下表中匯總了這些結果:
如果原假設為真,但否定了原假設,則發生類型 I 錯誤。發生類型 I 錯誤的機率稱為阿爾法 (a),有時也稱為顯著性水準。
如果原假設為假,但未能否定它,則發生類型 II 錯誤。發生類型 II 錯誤的機率稱為 b。
原假設為假時,否定它的機率等於 1 - b。此值也稱為檢定的檢定力。
詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/
和 http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構…等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.
沒有留言:
張貼留言