方差分析(高等教育出版社).ppt

上傳人:za****8 文檔編號:15681728 上傳時間:2020-08-29 格式:PPT 頁數:49 大小:539KB
收藏 版權申訴 舉報 下載
方差分析(高等教育出版社).ppt_第1頁
第1頁 / 共49頁
方差分析(高等教育出版社).ppt_第2頁
第2頁 / 共49頁
方差分析(高等教育出版社).ppt_第3頁
第3頁 / 共49頁

下載文檔到電腦,查找使用更方便

9.9 積分

下載資源

還剩頁未讀,繼續(xù)閱讀

資源描述:

《方差分析(高等教育出版社).ppt》由會員分享,可在線閱讀,更多相關《方差分析(高等教育出版社).ppt(49頁珍藏版)》請在裝配圖網上搜索。

1、第 6 章 方差分析與試驗設計,統(tǒng)計學是有關收集和分析帶有隨機性誤差的數據的科學和藝術。,第 6 章 方差分析與試驗設計,6.1 方差分析引論 6.2 單因素方差分析 6.3 雙因素方差分析 6.4 試驗設計初步,我看出來了:方差分析提高了檢驗的效率,也增加了分析的可靠性。,學習目標,掌握單因素方差分析的方法及應用 理解多重比較的意義 解釋方差分析的概念 掌握雙因素方差分析的方法及應用 掌握試驗設計的基本原理和方法 解釋方差分析的基本思想和原理,6.1 方差分析引論,一、方差分析及其有關術語 二、方差分析的基本思想和原理 三、方差分析的基本假定 四、問題的一般提法,一、方差分析及其有關術語,(

2、一)什么是方差分析?,1. 檢驗多個總體均值是否相等 通過分析數據的誤差判斷各總體均值是否相等 2. 研究分類型自變量對數值型因變量的影響 一個或多個分類尺度的自變量 兩個或多個 (k 個) 處理水平或分類 一個間隔或比率尺度的因變量 3. 有單因素方差分析和雙因素方差分析 單因素方差分析:涉及一個分類的自變量 雙因素方差分析:涉及兩個分類的自變量,案例:為了對幾個行業(yè)的服務質量進行評價,消費者協(xié)會在四個行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費者對總共23家企業(yè)投訴的次數如下表:,案例分析(方差分析結論),1. 分析四個行業(yè)之間的服務質量是否有顯著差異,也就是要判斷“行業(yè)”對“投訴次數

3、”是否有顯著影響 2. 作出這種判斷最終被歸結為檢驗這四個行業(yè)被投訴次數的均值是否相等 3. 若它們的均值相等,則意味著“行業(yè)”對投訴次數是沒有影響的,即它們之間的服務質量沒有顯著差異;若均值不全相等,則意味著“行業(yè)”對投訴次數是有影響的,它們之間的服務質量有顯著差異,(二)方差分析中的有關術語,1. 因素或因子 所要檢驗的對象 要分析行業(yè)對投訴次數是否有影響,行業(yè)是要檢驗的因素或因子 2. 水平或處理 因子的不同表現 零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)就是因子的水平 3. 觀察值 在每個因素水平下得到的樣本數據 每個行業(yè)被投訴的次數就是觀察值,4. 試驗 這里只涉及一個因素,因此稱為單因素

4、四水平的試驗 5. 總體 因素的每一個水平可以看作是一個總體 比如零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)可以看作是四個總體 6. 樣本數據 被投訴次數可以看作是從這四個總體中抽取的樣本數據,二、方差分析的基本思想和原理,(一)散點圖,解讀散點圖,1. 從散點圖上可以看出 不同行業(yè)被投訴的次數是有明顯差異的 同一個行業(yè),不同企業(yè)被投訴的次數也明顯不同 家電制造被投訴的次數較高,航空公司被投訴的次數較低。 2. 行業(yè)與被投訴次數之間有一定的關系 如果行業(yè)與被投訴次數之間沒有關系,那么它們被投訴的次數應該差不多相同,在散點圖上所呈現的模式也就應該很接近,(二)誤差來源,僅從散點圖上觀察還不能提供充分的

5、證據來證明不同行業(yè)對被投訴的次數之間有顯著的差異。 隨機誤差與系統(tǒng)誤差 (1)隨機誤差:同一行業(yè)(或同一總體),樣本的觀察值是不同的。這種差異也可能是由于抽樣的隨機性所造成的。因為企業(yè)是隨機的,因此他們之間的差異可以看成是隨機因素的影響所造成的。) (2)系統(tǒng)誤差:不同行業(yè)(或不同總體),樣本的觀察值也是不同的。這種差異也可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)本身所造成的。,3. 組內誤差和組間誤差 (1)組內誤差:同一總體下各樣本數據之間的誤差。 如所抽7各零售企業(yè)被投訴次數之間的誤差。 (2)組間誤差:不同總體下各樣本數據之間的誤差。 如所抽零售業(yè)、旅游業(yè)等行業(yè)之間被投訴次數之間

6、的誤差。 (3)組內誤差和組間誤差之間的關系:組內誤差只包括隨機誤差,組間誤差既包括隨機誤差,也包括系統(tǒng)誤差。 如果不同行業(yè)對投訴次數沒有影響,此時組間誤差只包含隨機誤差,不包括系統(tǒng)誤差。這時,組間誤差和組內誤差經過平方后的數值比就應該會接近1。 反之,如果不同行業(yè)對投訴次數有影響,此時組間誤差不僅包含了隨機誤差,還會包括系統(tǒng)誤差。這時,組間誤差經過平方后的數值就會大于組內誤差經過平方后的數值,他們之間的比值就會大于1。這一比值達到某種程度時,可以說因素的不同總體之間存在著顯著差異,也就是自變量對因變量有影響。,4.方差分析:判斷行業(yè)對投訴次數是否有顯著影響,實質就是檢驗被投訴次數的差異主要是

7、由于什么原因所引起,并需要有更準確的方法來檢驗這種差異是否顯著,就需要進行方差分析。,比較兩類誤差,以檢驗均值是否相等 比較的基礎是方差比 如果系統(tǒng)(處理)誤差明顯地不同于隨機誤差,則均值就 是不相等的;反之,均值就是相等的 誤差是由各部分的誤差占總誤差的比例來測度的,(三)比較兩類誤差,隨機誤差 因素的同一水平(總體)下,樣本各觀察值之間的差異 比如,同一行業(yè)下不同企業(yè)被投訴次數是不同的 這種差異可以看成是隨機因素的影響,稱為隨機誤差 系統(tǒng)誤差 因素的不同水平(不同總體)下,各觀察值之間的差異 比如,不同行業(yè)之間的被投訴次數之間的差異 這種差異可能是由于抽樣的隨機性所造成的,也可能是由于行業(yè)

8、本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱為系統(tǒng)誤差,(四)兩類方差,數據的誤差用平方和表示,稱為方差 組內方差 因素的同一水平(同一個總體)下樣本數據的方差 比如,零售業(yè)被投訴次數的方差 組內方差只包含隨機誤差 組間方差 因素的不同水平(不同總體)下各樣本之間的方差 比如,四個行業(yè)被投訴次數之間的方差 組間方差既包括隨機誤差,也包括系統(tǒng)誤差,方差的比較:,若不同行業(yè)對投訴次數沒有影響,則組間誤差中只包含隨機誤差,沒有系統(tǒng)誤差。這時,組間誤差與組內誤差經過平均后的數值就應該很接近,它們的比值就會接近1 若不同行業(yè)對投訴次數有影響,在組間誤差中除了包含隨機誤差外,還會包含有系統(tǒng)誤差,

9、這時組間誤差平均后的數值就會大于組內誤差平均后的數值,它們之間的比值就會大于1 當這個比值大到某種程度時,就可以說不同水平之間存在著顯著差異,也就是自變量對因變量有影響 判斷行業(yè)對投訴次數是否有顯著影響,實際上也就是檢驗被投訴次數的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說明不同行業(yè)對投訴次數有顯著影響,三、方差分析的基本假定,(一)基本假定 1.每個總體都應服從正態(tài)分布 對于因素的每一個水平,其觀察值是來自服從正態(tài)分布總體的簡單隨機樣本 比如,每個行業(yè)被投訴的次數必需服從正態(tài)分布 2. 各個總體的方差必須相同 各組觀察數據是從具有相同方差的總體中抽取的 比如,四個行業(yè)被投

10、訴次數的方差都相等 3. 觀察值是獨立的 如,每個行業(yè)被投訴的次數與其他行業(yè)被投訴的次數獨立,(二)基本假定的應用描述,1. 在上述假定條件下,判斷行業(yè)對投訴次數是否有顯著影響,實際上也就是檢驗具有同方差的四個正態(tài)總體的均值是否相等 2. 如果四個總體的均值相等,可以期望四個樣本的均值也會很接近 四個樣本的均值越接近,推斷四個總體均值相等的證據也就越充分 樣本均值越不同,推斷總體均值不同的證據就越充分,案例分析1-原假設成立, 如果原假設成立,即H0 : m1 = m2 = m3 = m4 四個行業(yè)被投訴次數的均值都相等 意味著每個樣本都來自均值為、方差為 2的同一正態(tài)總體,1 2 3 4,f

11、(X),X,案例分析2被擇假設成立,若備擇假設成立,即H1 : mi (i=1,2,3,4)不全相等 至少有一個總體的均值是不同的 四個樣本分別來自均值不同的四個正態(tài)總體,四、問題的一般提法,設因素有k個水平,每個水平的均值分別用1 , 2, , k 表示 要檢驗k個水平(總體)的均值是否相等,需要提出如下假設: H0 : 1 2 k H1 : 1 , 2 , ,k 不全相等 設1為零售業(yè)被投訴次數的均值,2為旅游業(yè)被投訴次數的均值,3為航空公司被投訴次數的均值,4為家電制造業(yè)被投訴次數的均值,提出的假設為 H0 : 1 2 3 4 H1 : 1 , 2 , 3 , 4 不全相等,6.2 單因

12、素方差分析,一、數據結構 二、分析步驟 三、用Excel進行方差分析 四、方差分析中的多重比較,一、單因素方差分析的數據結構,二、分析步驟,(一)提出假設,1. 一般提法 H0 : m1 = m2 = mk 自變量對因變量沒有顯著影響 H1 : m1 ,m2 , ,mk不全相等 自變量對因變量有顯著影響 2. 注意:拒絕原假設,只表明至少有兩個總體的均值不相等,并不意味著所有的均值都不相等,(二)構造檢驗的統(tǒng)計量 1.計算水平的均值,(1)假定從第i個總體中抽取一個容量為ni的簡單隨機樣本,第i個總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個數 (2)計算公式為,式中: ni為第 i 個

13、總體的樣本觀察值個數 xij 為第 i 個總體的第 j 個觀察值,2.計算全部察值的總均值,(1)全部觀察值的總和除以觀察值的總個數 (2) 計算公式為,案例分析,(3)計算誤差平方和 1)計算總誤差平方和 SST,全部觀察值 與總平均值 的離差平方和 反映全部觀察值的離散狀況 其計算公式為,前例的計算結果: SST = (57-47.869565)2+(58-47.869565)2 =115.9295,2)計算水平項平方和 SSA,各組平均值 與總平均值 的離差平方和 反映各總體的樣本均值之間的差異程度,又稱組間平方和 該平方和既包括隨機誤差,也包括系統(tǒng)誤差 計算公式為,前例的計算結果:SS

14、A = 1456.608696,3)計算誤差項平方和 SSE,每個水平或組的各樣本數據與其組平均值的離差平方和 反映每個樣本各觀察值的離散狀況,又稱組內平方和 該平方和反映的是隨機誤差的大小 計算公式為,前例的計算結果:SSE = 2708,三個平方和的關系:,總離差平方和(SST)、誤差項離差平方和(SSE)、水平項離差平方和 (SSA) 之間的關系,SST = SSA + SSE,前例的計算結果: 4164.608696=1456.608696+2708,三個平方和的作用:,1. SST反映全部數據總的誤差程度;SSE反映隨機誤差的大?。籗SA反映隨機誤差和系統(tǒng)誤差的大小 2. 如果原假設

15、成立,則表明沒有系統(tǒng)誤差,組間平方和SSA除以自由度后的均方與組內平方和SSE和除以自由度后的均方差異就不會太大;如果組間均方顯著地大于組內均方,說明各水平(總體)之間的差異不僅有隨機誤差,還有系統(tǒng)誤差 3. 判斷因素的水平是否對其觀察值有影響,實際上就是比較組間方差與組內方差之間差異的大小,(4)構造檢驗的統(tǒng)計量(計算均方MS), 各誤差平方和的大小與觀察值的多少有關,為消除觀察值多少對誤差平方和大小的影響,需要將其平均,這就是均方,也稱為方差 計算方法是用誤差平方和除以相應的自由度 三個平方和對應的自由度分別是 SST 的自由度為n-1,其中n為全部觀察值的個數 SSA的自由度為k-1,其

16、中k為因素水平(總體)的個數 SSE 的自由度為n-k,構造檢驗的統(tǒng)計量(計算均方 MS),組間方差:SSA的均方,記為MSA,計算公式為,組內方差:SSE的均方,記為MSE,計算公式為,構造檢驗的統(tǒng)計量(計算檢驗統(tǒng)計量 F ),將MSA和MSE進行對比,即得到所需要的檢驗統(tǒng)計量F 當H0為真時,二者的比值服從分子自由度為k-1、分母自由度為 n-k 的 F 分布,即,構造檢驗的統(tǒng)計量(F分布與拒絕域),如果均值相等,F=MSA/MSE1,(三)統(tǒng)計決策, 將統(tǒng)計量的值F與給定的顯著性水平的臨界值F進行比較,作出對原假設H0的決策 根據給定的顯著性水平,在F分布表中查找與第一自由度df1k-1

17、、第二自由度df2=n-k 相應的臨界值 F 若FF ,則拒絕原假設H0 ,表明均值之間的差異是顯著的,所檢驗的因素對觀察值有顯著影響 若FF ,則不能拒絕原假設H0 ,表明所檢驗的因素對觀察值沒有顯著影響,(四)單因素方差分析表(基本結構),單因素方差分析(例題分析),三、用Excel進行方差分析,用Excel進行方差分析(Excel檢驗步驟),第1步:選擇“工具 ”下拉菜單 第2步:選擇“數據分析 ”選項 第3步:在分析工具中選擇“單因素方差分析 ” ,然后選擇“確定 ” 第4步:當對話框出現時 在“輸入區(qū)域 ”方框內鍵入數據單元格區(qū)域 在方框內鍵入0.05(可根據需要確定) 在“輸出選項

18、 ”中選擇輸出區(qū)域,用Excel進行方差分析,四、方差分析中的多重比較,(一)多重比較的意義 (二)多重比較的方法,差分析中的多重比較,可采用Fisher提出的最小顯著差異方法,簡寫為LSD LSD方法是對檢驗兩個總體均值是否相等的t檢驗方法的總體方差估計加以修正(用MSE來代替)而得到的 通過對總體均值之間的配對比較來進一步檢驗到底哪些均值之間存在差異,方差分析中的多重比較(步驟),提出假設 H0: mi = mj (第i個總體的均值等于第j個總體的均值) H1: mi mj (第i個總體的均值不等于第j個總體的均值) 計算檢驗的統(tǒng)計量: 計算LSD 決策:若 ,拒絕H0; 若 ,不拒絕H0

19、,方差分析中的多重比較(例題分析),第1步:提出假設 檢驗1: 檢驗2: 檢驗3: 檢驗4: 檢驗5: 檢驗6:,方差分析中的多重比較(例題分析),第2步:計算檢驗統(tǒng)計量 檢驗1: 檢驗2: 檢驗3: 檢驗4: 檢驗5: 檢驗6:,方差分析中的多重比較(例題分析),第3步:計算LSD 檢驗1: 檢驗2: 檢驗3: 檢驗4: 檢驗5: 檢驗6:,方差分析中的多重比較(例題分析),第4步:作出決策,零售業(yè)與旅游業(yè)均值之間沒有顯著差異,零售業(yè)與航空公司均值之間有顯著差異,零售業(yè)與家電業(yè)均值之間沒有顯著差異,旅游業(yè)與航空業(yè)均值之間沒有顯著差異,旅游業(yè)與家電業(yè)均值之間沒有顯著差異,航空業(yè)與家電業(yè)均值有顯著差異,

展開閱讀全文
溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

相關資源

更多
正為您匹配相似的精品文檔
關于我們 - 網站聲明 - 網站地圖 - 資源地圖 - 友情鏈接 - 網站客服 - 聯系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網版權所有   聯系電話:18123376007

備案號:ICP2024067431-1 川公網安備51140202000466號


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務平臺,本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對上載內容本身不做任何修改或編輯。若文檔所含內容侵犯了您的版權或隱私,請立即通知裝配圖網,我們立即給予刪除!