有學過6
sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. 宏; 變異數分析
v.s.方差分析; 進階 v.s. 高级…
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!
先前談到 Tutorials 教學課程, 了解如何使用 Minitab 各項功能。而在Help 協助 > StatGuide 統計指南中, 則對於輸出的結果有詳細的解釋說明:
Basic Statistics > 2-Sample Poisson Rate
雙樣本 Poisson 率 > 匯總
雙樣本 Poisson 率製程執行假設檢定,並計算兩個 Poisson 模型的出現率之間差異的信賴區間。Poisson 製程描述某一事件在給定時間、面積、量或其他觀測值空間內的出現次數。觀測值空間的尺寸稱為觀測值長度。
範例,
· 客戶服務中心每天接聽的電話數
· 10 米長導線的缺點數
資料描述
您是郵政服務的分析員,您要對兩個郵局分支機構進行比較,以確定哪個機構的客戶每日到訪率更高。您對 40 個工作日內 (9:00 a.m.–5:00 p.m.) 進入每個分支機構的客戶數進行計數,並使用雙樣本 Poisson 率函數比較每個分支機構的客戶到訪數。
資料:
郵局.MTW (在樣本資料檔案夾中)
雙樣本 Poisson 率 > 敘述性統計量 - 合計出現數和 N
使用此資訊可以評估資料分布的基本計數值:
· 合計出現數:事件在每個樣本中的出現次數。
· N:在每個樣本中採集觀測值的次數。
輸出範例
合計出
變數 現次數 N 出現率
分局 A 9983 40
249.575
分局 B 10291 40
257.275
差異 = 比例(分局 A) - 比例(分局 B)
差異估計值: -7.7
差異的 95% 信賴區間: (-14.6768, -0.723175)
差異 = 0 (與 ≠ 0) 的檢定: Z
= -2.16 P 值 =
0.031
精確檢定: P 值 = 0.031
解釋
在比較兩個郵局分支機構的範例中,分支 A 在 40 個工作日內有 9983 人次的顧客到訪。分支 B 在 40 個工作日內有 10291
人次的顧客到訪。
雙樣本 Poisson 率 > 敘述性統計量 - 出現率
出現率是在觀測值的每個單位長度內,發生事件的平均次數。出現率等於
(合計出現數 / N) / (觀測值長度)。
輸出範例
合計出
變數 現次數 N 出現率
分局 A 9983 40
249.575
分局 B 10291 40
257.275
差異 = 比例(分局 A) - 比例(分局 B)
差異估計值: -7.7
差異的 95% 信賴區間: (-14.6768, -0.723175)
差異 = 0 (與 ≠ 0) 的檢定: Z
= -2.16 P 值 =
0.031
精確檢定: P 值 = 0.031
解釋
在郵局範例中,長度保留為預設值 1.0,並且未顯示。分支 A 每個工作日約有 249.575 位顧客,而分支 B 每個工作日約有 257.275 位顧客。
雙樣本 Poisson 率 > 敘述性統計量 - 差異估計值
差異估計值是兩個樣本的出現率之間的差異。假設檢定作用於此統計量。
輸出範例
合計出
變數 現次數 N 出現率
分局 A 9983 40
249.575
分局 B 10291 40
257.275
差異 = 比例(分局 A) - 比例(分局 B)
差異估計值: -7.7
差異的 95% 信賴區間: (-14.6768, -0.723175)
差異 = 0 (與 ≠ 0) 的檢定: Z
= -2.16 P 值 =
0.031
精確檢定: P 值 = 0.031
解釋
在郵局範例中,分支 A 和 B 的觀測到訪率之差為
-7.7。換句話說,在採樣期間,分支 B 每天大約比分支 A 多 8 位客戶。
雙樣本 Poisson 率 > 統計推斷 - 假設檢定
此輸出包含假設檢定的結果。Minitab 既執行精確檢定,也執行基於常態近似的檢定,當合計出現次數很低時,後面一種檢定可能不夠精確。
在此範例中,假設檢定使用下列假設:
H0:兩個總體具有相同的比例
H1:兩個總體具有不同的比例
輸出範例
合計出
變數 現次數 N 出現率
分局 A 9983 40
249.575
分局 B 10291 40
257.275
差異 = 比例(分局 A) - 比例(分局 B)
差異估計值: -7.7
差異的 95% 信賴區間: (-14.6768, -0.723175)
差異 = 0 (與 ≠ 0) 的檢定: Z
= -2.16 P 值 =
0.031
精確檢定: P 值 = 0.031
解釋
精確檢定和常態近似檢定的 p 值為 0.031。因此,應否定原假設,並推斷出兩個樣本來自 Poisson 出現率不同的總體。換句話說,可以斷定兩個分支的每日客戶數量不同。
雙樣本 Poisson 率 > 統計推斷 - 差異的信賴區間
信賴區間是可能包含兩個總體出現率之間差異的實際值的一系列值。
輸出範例
合計出
變數 現次數 N 出現率
分局 A 9983 40
249.575
分局 B 10291 40 257.275
差異 = 比例(分局 A) - 比例(分局 B)
差異估計值: -7.7
差異的 95% 信賴區間: (-14.6768, -0.723175)
差異 = 0 (與 ≠ 0) 的檢定: Z
= -2.16 P 值 =
0.031
精確檢定: P 值 = 0.031
解釋
對於此範例,兩個出現率之差異的實際值介於 -14.6768 與 -0.723175 之間的信賴度為 95%。在與假設檢定結合使用時,該信賴區間也很有用。該檢定否定了原假設,並且您的結論是優先使用雙側備擇檢定,其中兩個分支的客戶到訪率不同。但是,您仍不能精確確定哪個比例更高。可透過分析信賴區間來回答此問題。由於(分支 A 的比例 – 分支 B 的比例)的信賴區間只包含負數,因此應推斷出分支 B 的每日客戶到訪率更高。
Basic Statistics > 2-Sample Poisson Rate > More
假設檢定
假設檢定是統計決策中最常用的方法之一。一般而言,假設檢定是一種假定初始聲明為真,然後使用樣本資料檢定該聲明的製程。通常,初始聲明是指相關的總體參數,如總體平均值 (m)。
假設檢定包含兩個假設:原假設(以 H0 表示)和備擇假設(以 H1 表示)。原假設是初始聲明,且通常使用先前的研究或常識進行指定。備擇假設是可以相信為真實或有望證明為真實的內容。備擇假設有時是指研究假設,並且可以是定向的或非定向的。
假設檢定的決策製程可以基於給定檢定的機率值(p 值)。
· 如果
p 值小於或等於預先確定的顯著性水準(a 水準),則否定原假設,轉而支援另一個假設。
· 如果
p 值大於 a 水準,則不能否定原假設,且不聲明支援備擇假設。
執行假設檢定時,有四種可能的結果。結果取決於原假設的真假以及能否否定原假設。下表中匯總了這些結果:
如果原假設為真,但否定了原假設,則發生類型 I 錯誤。發生類型 I 錯誤的機率稱為阿爾法 (a),有時也稱為顯著性水準。
如果原假設為假,但未能否定它,則發生類型 II 錯誤。發生類型 II 錯誤的機率稱為 b。
原假設為假時,否定它的機率等於 1 - b。此值也稱為檢定的檢定力。
信賴區間和範圍
信賴區間 (CI) 是用於從樣本資料中估計總體參數的區間。如果備擇假設 (H1) 是非定向的,則 Minitab 同時顯示區間的上下限,如果 H1 是定向的,則只顯示一個邊界。
信賴區間由兩個基本部分構成:
· 點估計 - 從樣本資料中計算的個別值值。此值被認為是相關參數的估計值,但點估計不可能與參數相等。因此,為了考慮估計錯誤的機率,在信賴區間中包含了錯誤邊際,以提供可能的參數值的範圍。
· 錯誤邊際-透過使用機率來確定信賴區間的寬度。為了構造信賴區間,只需從點估計中加上和/或減去錯誤邊際。
對於 a 0.05,構造 95% 的信賴區間。這意味著,用於構造區間的方法產生包含相關參數的區間的機率為 0.95(即 1 - a)。因此,如果構造 100 個 95% 的信賴區間,則大約有 95 個區間包含該參數。換句話說,參數值位於該區間內的機率為 95%。
如果備擇假設有方向,則信賴區間會在一個方向無限延伸。在此情況下,只顯示一個邊界。範例,如果執行 a 為 0.05 單樣本 t 檢定,並且 H1 為 m < 5,將顯示
95% 上限。m 的真實值小於或等於上限的信賴度為 95%。
詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/
和 http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構…等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.
沒有留言:
張貼留言