2012年5月31日 星期四

Minitab: 6 sigma 專業軟體 繁體中文討論-16


有學過6 sigma的同學, 一定知道 Minitab這套軟體, 因為它把6 sigma實用化了. 過去 Minitab 並沒有中文版, 但對岸有人將它漢化後, 官方也出簡體中文版, 使用簡體中文版會比英文版更friendly, 但畢竟兩岸語文還是有差異, 尤其專有名詞上的差異更讓人難以適從, 例如常態分配 v.s. 正态分布; 品質 v.s. 质量; 巨集 v.s. ; 變異數分析 v.s.方差分析; 進階 v.s. 高级
官方目前沒有繁體中文版.~可惜! 希望 Minitab TWN公司能早日完成繁體中文版的 Minitab. ~期待!

        Minitab R16版新增一項功能—Assistant 助手, 對於軟體新手或統計新手來說, 是個不錯的功能. 透過它可讓您正確地使用統計工具, 而不至於不知如何下手.


 

Assistant 助手 > Hypothesis Tests... 假設檢定...






中文對照


 您的資料是連續資料或計數(屬性)資料?
首頁 
連續值   
衡量零件或製程特性, 如長度, 重量, 或溫度。這些資料通常包含分數(或小數)值。
範例
品質工程師想要確定橫跨三個不同生產班別盒裝麥片的平均重量是否有差異。工程師從每個班別抽樣盒裝麥片和紀錄它們的重量。
計數(屬性)
計數某特性或條件發生次數, 如物質特性, 缺點類型, 或評等, 如合格/不合格。計數資料為整數。
範例
製程工程師想要比較四台機器的螺釘生產製程去確定是否至少有一台機器裂痕不良螺釘的百分比有差異。他們從每一台機抽樣螺釘並紀錄檢驗螺釘數目和裂痕不良螺釘數目。 
您要比較什麼?
首頁>連續值 
兩個以上平均值   
比較兩個以上製程或兩個以上製程條件的平均值去確定平均值是否有差異。
範例
品質工程師想要檢測油漆硬度是否因摻和物不同而有所差異。他們採用數種金屬測試四種摻和物之一的樣本, 然後量測每種摻和物的硬度以檢測平均值是否有差異。
兩個以上標準差
比較兩個以上製程或兩個以上製程條件的標準差去確定標準差是否有差異。
範例
木材裁切廠想要比較三種鋸木機裁切橫樑的變異。裁切廠量測橫樑長度去檢測鋸木機之間橫樑長度一致性是否不同。      
您要比較什麼?
首頁>計數(屬性) 
兩個以上不良率   
每個項目歸類到兩個類別之一, 例如合格/不合格或不良/非不良。您計數每個樣本不良項目數量和比較樣本之間的不良百分比。
範例
工程師從四台機器抽樣螺釘檢驗造成螺釘不能使用的嚴重裂縫。工程師紀錄每一樣本檢驗螺釘數量和拒收螺釘數量。他們想要確定每台機器不良率是否有差異。
每個結果類別百分比
每一項目歸類三個或更多的結果類別之一,例如劣等, 中等, 優等和卓越。計數每個類別項目數目和比較樣本之間每個類別的百分比。
範例
財務部門分析員抽樣逾期未付發票並依照逾期天數分類: 小於等於15, 16~30, 大於等於31天。他們想要確定四個不同銷售區中的每個逾期未付發票類別百分比差異。
單因子變異數分析(ANOVA)
首頁>連續值>比較兩個以上平均值
單因子變異數分析(ANOVA)比較三個或更多樣本平均值去確定它們是否有顯著差異。
指引
l          收集三個或更多資料隨機樣本。 
n          您抽樣的每個項目產生單一量測值, 例如申貸周轉時間。為了收集資料, 您應該從相同製程在三個或更多條件下抽樣。例如您檢定三種版本的申貸並紀錄每種版本的周轉時間。或您從三個或更多不同的生產相同產品製程中取樣。例如您從三個不同銀行分支, 使用相同申請表格來收集周轉時間。要獲取代表製程或製程條件的資料, 隨機選擇每個樣本項目。
l          收集足夠資料。 
n          樣本應該夠大可以合理確定偵測製程平均值的任何重要差異。Minitab確定以您樣本偵測製程平均值有多大差異。此外, 如果您輸入對製程具有實際影響的不同的值, Minitab確定您實際上將檢測到此差異的機會。
l          輸入每個樣本在分別欄或在同一欄。 
n          您可以輸入第一個樣本在一欄, 第二個在下一欄, 像這樣下去。您也可以輸入所有樣本在同一個Y資料欄。如果您輸入所有Y資料在同一欄, 您必須有另一欄指示出哪一個樣本, 或投入(X)水準, 以對應到每個Y值。
l          依收集順序紀錄資料。 
n          Minitab依您在工作表輸入順序來繪製資料。如果您依照每個樣本收集順序輸入資料, 您可以容易地檢查出圖表中趨勢和其他模式。
l          當您收集資料時, 製程必須是穩定的。 
n          如果製程不穩定, 您可能觀察到趨勢或異常量測值, 這會影響樣本資料和造成檢定結果誤解。
l          如果樣本大小至少為1520, 這些資料不需要為常態分布。 
n          雖然檢定是基於假設資料為常態分布, 當樣本大小至少為1520, 此假設並非關鍵。如果對於達到9水準樣本大小少於15, 或對於10個及以上水準樣本大小少於20, 資料非常態分布, p值可能不準確, 而您應該謹慎解釋結果。
l          樣本不需要有相同變異數。 
n          ANOVAF檢定基於假設所有樣本群體變異性相等。然而, Minitab使用備擇檢定(Welch檢定)是不需要樣本有相同變異數。研究表示即使樣本大小不同, 不同變異數的檢定仍可執行良好。
l          檢驗異常資料點。 
n          因為異常資料點對結果有很大影響, Minitab會幫您識別這些點。您應該嘗試確定異常發生原因, 和修正任何量測或資料輸入錯誤。考慮移除與特殊原因關聯的資料再重新分析。
標準差檢定
首頁>連續值>比較兩個以上標準差
標準差檢定比較三個或更多樣本標準差去確定它們是否有顯著差異。
指引
l          收集三個或更多資料隨機樣本。 
n          您抽樣的每個項目產生單一量測值, 例如申貸周轉時間。為了收集資料, 您應該從相同製程在三個或更多條件下抽樣。例如您檢定三種版本的申貸並紀錄每種版本的周轉時間。或您從三個或更多生產相同產品的不同製程中取樣。例如您從三個不同銀行分支, 使用相同申請表格來收集周轉時間。要獲取代表製程或製程條件的資料, 隨機選擇每個樣本項目。
l          收集足夠資料。 
n          樣本應該夠大可以合理確定偵測製程標準差的任何重要差異。
l          輸入每個樣本在分別欄或在同一欄。 
n          您可以輸入第一個樣本在一欄, 第二個在下一欄, 像這樣下去。您也可以輸入所有樣本在同一個Y資料欄。如果您輸入所有Y資料在同一欄, 您必須有另一欄指示出哪一個樣本, 或投入(X)水準, 以對應到每個Y值。
l          依收集順序紀錄資料。 
n          Minitab依您在工作表輸入順序來繪製資料。如果您依照每個樣本收集順序輸入資料, 您可以容易地檢查出圖表中趨勢和其他模式。
l          當您收集資料時, 製程必須是穩定的。 
n          如果製程不穩定, 您可能觀察到趨勢或異常量測值, 這會影響樣本資料和造成檢定結果誤解。
l          如果樣本大小至少為20, 這些資料不需要為常態分布。 
n          Minitab對通常的F-檢定, Levene/Brown-Forsythe檢定來使用備擇, 不要求資料為常態分布。即使樣本大小小到20, 此檢定對常態資料與非常態資料都有不錯執行效果。
l          檢驗異常資料點。 
n          因為異常資料點對結果有很大影響, Minitab會幫您識別這些點。您應該嘗試確定異常發生原因, 和修正任何量測或資料輸入錯誤。考慮移除與特殊原因關聯的資料再重新分析。
卡方不良率檢定
首頁>計數(屬性)>比較兩個以上不良率
卡方不良率檢定確定兩個以上樣本不良率是否有顯著差異。
指引
l          對每個X變數值收集隨機樣本資料。 
n          這項檢定用於確定三個或更多製程或製程條件不良率是否有差異。為了收集資料, 您應該從三個或更多條件下的相同製程的取樣。例如, 您可以檢定機器上幾種不同速度設定來確定速度設定是否影響不良率。或者, 您可能從三個或更多不同的製程,如生產相同產品的三台機器。要獲得具有代表性的製程或製程條件的資料,隨機選擇每個樣本的項目。
l          確定樣本每個項目是不良或非不良。 
n          不良項目有一個或更多的缺點導致無法允收。如果您的量測系統僅能確定項目是不良或非不良, 請使用這項檢定。
l          樣本中的每個項目應該有同樣的不良機會。 
n          為了產生準確的結果, 樣本中的每個項目,應該與樣本中的任何其他項目有同樣的不良機會。因此, 應該在如人員, 設備, 供應商或環境等相同的投入和條件下, 收集樣本中的項目。
n          例如, 不同的機器生產油漆塗料, 可能會產生不同不良比例的塗料。因此, 您不應該把從所有機器收集樣本, 看待它們仿佛是從單一台機器取樣。您還應該避免在長時間內收集樣本, 因為這會增加製程條件會改變的可能性。
l          收集足夠的資料。 
n          樣本應該夠大可以合理確定偵測樣本中的不良率是否明顯不同。Minitab確定以您樣本偵測的不良率有多大差異。此外, 如果您輸入對製程具有實際影響的不同的值, Minitab確定您實際上將檢測到此差異的機會。
n          為確保檢定的有效性,每個樣本必須夠大,以便有足夠數量可合理機會觀察到不良和非不良。否則, 該檢定的p值可能不準確。Minitab指示每個樣本應有多大, 使得不良和非不良的預期數目夠大。
n          為確保不良率比較區間的準確性, 每個樣本中的不良和非不良的觀測數目應至少 5。當不良和非不良的數目增加時, 也增加了比較區間的準確性。如有必要, 使用診斷報告的列表來識別沒有足夠不良或非不良的樣本。
結合卡方檢定
首頁>計數(屬性)>比較每個結果類別百分比
結合卡方檢定確定兩個或以上樣本每個輸出類別的百分比是否顯著不同。
指引
l          對每個X變數水準收集隨機樣本資料。 
n          X的每個水準, 收集可代表製程的隨機樣本項目。X變數水準可能表示製程或區域差異。例如, 如果您有數個分公司處理發票, 您應該從每個分公司收集發票樣本。
l          每個樣本項目資料是屬性值或類別。 
n          為樣本中每個項目評估或分配屬性。例如, 紡織廠分類裂紋, 撕開, 不當的縫接。在某些情況下, 資料可能為已經分類聚集的量測值。例如, 財務部門追蹤是逾期發票的天數, 分為: 小於等於15, 16~30, 31~45, 或超過45天。
l          如果您有量測資料, 將每個量測歸到一個結果的類別。 
n          如果資料為量測, 透過將每個量測值只放到單一的類別, 轉換它們為分類資料。例如, 財務部門分析員基於逾期發票的天數將發票分類分成4: 小於等於15, 16~30, 31~45, 或超過45天。
l          清楚地定義沒有交疊的結果類別。 
n          對於屬性資料和量測資料, 清楚地定義類別以便每個資料值屬於哪一個類別中可以明確。例如, "", "更好", "最佳"值對屬性資料不是很有用, 除非每個類別的區別特徵非常明顯。
n          對於量測資料, 確保類別不會交疊。例如, 財務部門分析員基於每張發票已逾期的天數來分類發票。他們不應該創建類別如未滿15, 15~30, 30~45, 超過45, 因為逾期30天或45天的發票會歸類到兩類。
l          每個樣本應該夠大, 以便所有結果類別都有合理機會被觀察到。 
n          每個樣本應該夠大, 以便有合理機會觀察到在每個類別中的結果。如果預期的計數太低, 檢定的p值可能不準確。Minitab指示預期的計數是否太低, 以及每個樣本應該多大以確保檢定的有效性。
n          如果樣本不夠大, 而你無法增加樣本大小, 請考慮結合結果類別。因為你失去個別值結果的資訊, 您應該僅在必要時結合類別。如果你結合類別, 請確保類別的結合是有意義。例如, 財務部門有五種類別進行發票逾期天數的分類: 小於等於15, 16~30, 3~45, 46~60, 和超過60天。超過60天的類別預期的計數很低, 所以財務部門結合46~60天類別, 創建一個超過45天的結合類別。

詳細資訊請到官方網站進一步了解: http://www.minitab.com.tw/ http://www.minitab.com/
聲明: 本文純粹學術性研討, 內容所提及任何關於 Minitab 專有創作文字, 圖像與架構等皆屬Minitab Inc. 版權所有, 嚴禁商業上轉貼使用.

沒有留言:

張貼留言