概率論第八章假設(shè)檢驗(yàn).ppt
《概率論第八章假設(shè)檢驗(yàn).ppt》由會員分享,可在線閱讀,更多相關(guān)《概率論第八章假設(shè)檢驗(yàn).ppt(114頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
第八章假設(shè)檢驗(yàn),8.1假設(shè)檢驗(yàn)的基本思想8.2正態(tài)總體未知參數(shù)的假設(shè)檢驗(yàn)8.3單側(cè)假設(shè)檢驗(yàn),上一章介紹了對總體中未知參數(shù)的估計(jì)方法。本章將討論統(tǒng)計(jì)推斷的另一個(gè)重要方面——統(tǒng)計(jì)假設(shè)檢驗(yàn)。出于某種需要,對未知的或不完全明確的總體給出某些假設(shè),用以說明總體可能具備的某種性質(zhì),這種假設(shè)稱為統(tǒng)計(jì)假設(shè)。如正態(tài)分布的假設(shè),總體均值的假設(shè)等。這個(gè)假設(shè)是否成立,還需要考察,這一過程稱為假設(shè)檢驗(yàn),并最終作出判斷,是接受假設(shè)還是拒絕假設(shè)。本章主要介紹假設(shè)檢驗(yàn)的基本思想和常用的檢驗(yàn)方法,重點(diǎn)解決正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)。,1假設(shè)檢驗(yàn)的基本思想,一、假設(shè)檢驗(yàn)問題的提出,二、假設(shè)檢驗(yàn)的基本思想,三、假設(shè)檢驗(yàn)中兩類錯(cuò)誤,統(tǒng)計(jì)推斷的另一個(gè)重要問題是假設(shè)檢驗(yàn)問題。在總體的分布函數(shù)未知或只知其形式,但不知其參數(shù)的情況下,為了推斷總體的某些性質(zhì),提出某些關(guān)于總體的假設(shè)。例如,提出總體服從泊松分布的假設(shè),又如,對于正態(tài)總體提出數(shù)學(xué)期望?0的假設(shè)等。,這里,先結(jié)合例子來說明假設(shè)檢驗(yàn)的基本思想和做法。,假設(shè)檢驗(yàn)就是根據(jù)樣本對所提出的假設(shè)作出判斷:是接受,還是拒絕。,例1已知某煉鐵廠的鐵水含碳量X在某種工藝條件下服從正態(tài)分布N(4.55,0.1082)?,F(xiàn)改變了工藝條件,測了五爐鐵水,其含碳量分別為:4.28,4.40,4.42,4.35,4.37根據(jù)以往的經(jīng)驗(yàn),總體的方差?2=0.1082一般不會改變。試問工藝條件改變后,鐵水含碳量的均值有無改變?,,顯然,這里需要解決的問題是,如何根據(jù)樣本判斷現(xiàn)在冶煉的鐵水的含碳量是服從?≠4.55的正態(tài)分布呢?還是與過去一樣仍然服從?=4.55的正態(tài)分布呢?若是前者,可以認(rèn)為新工藝對鐵水的含碳量有顯著的影響;若是后者,則認(rèn)為新工藝對鐵水的含碳量沒有顯著影響。通常,選擇其中之一作為假設(shè)后,再利用樣本檢驗(yàn)假設(shè)的真?zhèn)巍?,,例2某自動車床生產(chǎn)了一批鐵釘,現(xiàn)從該批鐵釘中隨機(jī)抽取了11根,測得長度(單位:mm)數(shù)據(jù)為:10.41,10.32,10.62,40.18,10.77,10.64,10.82,10.49,10.38,10.59,10.54。試問鐵釘?shù)拈L度X是否服從正態(tài)分布?,而在本例中,我們關(guān)心的問題是總體X是否服從正態(tài)分布。如同例1那樣,選擇“是”或“否”作為假設(shè),然后利用樣本對假設(shè)的真?zhèn)巫鞒雠袛唷?以上兩例都是實(shí)際問題中常見的假設(shè)檢驗(yàn)問題。我們把問題中涉及到的假設(shè)稱為原假設(shè)或稱待檢假設(shè),一般用H0表示。而把與原假設(shè)對立的斷言稱為備擇假設(shè),記為H1。如例1,若原假設(shè)為H0:?=?0=4.55,則備擇假設(shè)為H1:?≠4.55。若例2的原假設(shè)為H0:X服從正態(tài)分布,則備擇假設(shè)為H1:X不服從正態(tài)分布。,當(dāng)然,在兩個(gè)假設(shè)中用哪一個(gè)作為原假設(shè),哪一個(gè)作為備擇假設(shè),視具體問題的題設(shè)和要求而定。在許多問題中,當(dāng)總體分布的類型已知時(shí),只對其中一個(gè)或幾個(gè)未知參數(shù)作出假設(shè),這類問題通常稱之為參數(shù)假設(shè)檢驗(yàn),如例1。而在有些問題中,當(dāng)總體的分布完全不知或不確切知道,就需要對總體分布作出某種假設(shè),這種問題稱為分布假設(shè)檢驗(yàn),如例2。,接下來我們要做的事是:給出一個(gè)合理的法則,根據(jù)這一法則,利用巳知樣本做出判斷是接受假設(shè)H0,還是拒絕假設(shè)H0。,二、假設(shè)檢驗(yàn)的基本思想,假設(shè)檢驗(yàn)的一般提法是:在給定備擇假設(shè)H1下,利用樣本對原假設(shè)H0作出判斷,若拒絕原假設(shè)H0,那就意味著接受備擇假設(shè)H1,否則,就接受原假設(shè)H0。換句話說,假設(shè)檢驗(yàn)就是要在原假設(shè)H0和備擇假設(shè)H1中作出拒絕哪一個(gè)和接受哪一個(gè)的判斷。究竟如何作出判斷呢?對一個(gè)統(tǒng)計(jì)假設(shè)進(jìn)行檢驗(yàn)的依據(jù)是所謂小概率原理,即,概率很小的事件在一次試驗(yàn)中是幾乎不可能發(fā)生!,例如,在100件產(chǎn)品中,有一件次品,隨機(jī)地從中取出一個(gè)產(chǎn)品是次品的事件就是小概率事件。因?yàn)榇耸录l(fā)生的概率?=0.01很小,因此,從中任意抽一件產(chǎn)品恰好是次品的事件可認(rèn)為幾乎不可能發(fā)生的,如果確實(shí)出現(xiàn)了次品,我們就有理由懷疑這“100件產(chǎn)品中只有一件次品”的真實(shí)性。那么?取值多少才算是小概率呢?這就要視實(shí)際問題的需要而定,一般?取0.1,0.05,0.01等。,以例1為例:首先建立假設(shè):,H0:?=?0=4.55,H1:?≠4.55。,其次,從總體中作一隨機(jī)抽樣得到一樣本觀察值(x1,x2,…,xn)。,注意到是的無偏估計(jì)量。因此,若H0正確,則,與?0的偏差一般不應(yīng)太大,即,不應(yīng)太大,若過分大,我們有理由懷疑H0的正確性而拒絕H0。由于,因此,考察,的大小等價(jià)于考察,的大小,哪么如何判斷,是否偏大呢?,具體設(shè)想是,對給定的小正數(shù)?,由于事件,是概率為?的小概率事件,即,因此,當(dāng)用樣本值代入統(tǒng)計(jì)量,具體計(jì)算得到其觀察值,統(tǒng)計(jì)量稱為檢驗(yàn)統(tǒng)計(jì)量。,當(dāng)檢驗(yàn)統(tǒng)計(jì)量取某個(gè)區(qū)域C中的值時(shí),就拒絕H0,則稱C為H0的拒絕域,拒絕域的邊界點(diǎn)稱為臨界值。如例1中拒絕域?yàn)?,臨界值為和,若,即說明在一次抽樣中,小概率事件居然發(fā)生了。,因此依據(jù)小概率原理,有理由拒絕H0,接受H1;,,則沒有理由拒絕H0,只能接受H0。,若,將上述檢驗(yàn)思想歸納起來,可得參數(shù)的假設(shè)檢驗(yàn)的一般步驟:,(1)根據(jù)所討論的實(shí)際問題建立原假設(shè)H0及備擇假設(shè)H1;,(2)選擇合適的檢驗(yàn)統(tǒng)計(jì)量Z,并明確其分布;,(3)對預(yù)先給定的小概率?>0,由P{|Z|≥z?/2}=?確定臨界值z?/2;,(4)由樣本值具體計(jì)算統(tǒng)計(jì)量Z的觀察值z,并作出判斷,若|z|≥z?/2,則拒絕H0,接受H1;若|z|<z?/2,則接受H0。,現(xiàn)在,我們來解決例1提出的問題:,(1)假設(shè)H0:?=?0=4.55,H1:?≠4.55;,(2)選擇檢驗(yàn)用統(tǒng)計(jì)量,(3)對于給定小正數(shù),如?=0.05,查標(biāo)準(zhǔn)正態(tài)分表得到臨界值z?/2=z0.025=1.96;,因?yàn)閨z|=3.9>1.96,所以拒絕H0,接受H1,即認(rèn)為新工藝改變了鐵水的平均含碳量。,(4)具體計(jì)算:這里n=5,,,故Z的觀察值,三、假設(shè)檢驗(yàn)中兩類錯(cuò)誤,第Ⅰ類錯(cuò)誤,當(dāng)原假設(shè)H0為真時(shí),卻作出拒絕H0的判斷,通常稱之為棄真錯(cuò)誤,由于樣本的隨機(jī)性,犯這類錯(cuò)誤的可能性是不可避免的。若將犯這一類錯(cuò)誤的概率記為?,則有P{拒絕H0|H0為真}=?。,第Ⅱ類錯(cuò)誤,當(dāng)原假設(shè)H0不成立時(shí),卻作出接受H0的決定,這類錯(cuò)誤稱之為取偽錯(cuò)誤,這類錯(cuò)誤同樣是不可避免的。若將犯這類錯(cuò)誤的概率記為?,則有P{接受H0|H0為假}=?。,自然,我們希望一個(gè)假設(shè)檢驗(yàn)所作的判斷犯這兩類錯(cuò)誤的概率都很小。事實(shí)上,在樣本容量n固定的情況下,這一點(diǎn)是辦不到的。因?yàn)楫?dāng)?減小時(shí),?就增大;反之,當(dāng)?減小時(shí),就?增大。,那么,如何處理這一問題呢?事實(shí)上,在處理實(shí)際問題中,一般地,對原假設(shè)H0,我們都是經(jīng)過充分考慮的情況下建立的,或者認(rèn)為犯棄真錯(cuò)誤會造成嚴(yán)重的后果。,例如,原假設(shè)是前人工作的結(jié)晶,具有穩(wěn)定性,從經(jīng)驗(yàn)看,沒有條件發(fā)生變化,是不會輕易被否定的,如果因犯第Ⅰ類錯(cuò)誤而被否定,往往會造成很大的損失。因此,在H0與H1之間,我們主觀上往往傾向于保護(hù)H0,即H0確實(shí)成立時(shí),作出拒絕H0的概率應(yīng)是一個(gè)很小的正數(shù),也就是將犯棄真錯(cuò)誤的概率限制在事先給定的范圍內(nèi),這類假設(shè)檢驗(yàn)通常稱為顯著性假設(shè)檢驗(yàn),小正數(shù)?稱為檢驗(yàn)水平或稱顯著性水平。,8.2正態(tài)總體下未知參數(shù)的假設(shè)檢驗(yàn),一、單個(gè)正態(tài)總體情形,1.均值?的檢驗(yàn),原假設(shè)H0:?=?0,備擇假設(shè)H1:?≠?0。,(a)?2已知,由上節(jié)的討論可知,在H0成立的條件下,選用檢驗(yàn)統(tǒng)計(jì)量,對給定的檢驗(yàn)水平?,查正態(tài)分布表得臨界值z?/2,再由樣本值具體計(jì)算統(tǒng)計(jì)量Z的觀察值z并與z?/2比較,若|z|≥z?/2,則拒絕H0,接受H1;若|z|<z?/2,則接受H0。這種檢驗(yàn)法常稱為Z檢驗(yàn)法。,一、單個(gè)正態(tài)總體情形,例1設(shè)某車床生產(chǎn)的鈕扣的直徑X服從正態(tài)分布,根據(jù)以往的經(jīng)驗(yàn),當(dāng)車床工作正常時(shí),生產(chǎn)的鈕扣的平均直徑?0=26mm,方差?2=2.62。某天開機(jī)一段時(shí)間后,為檢驗(yàn)車床工作是否正常,隨機(jī)地從剛生產(chǎn)的鈕扣中抽檢了100粒,測得均值為26.56。假定方差沒有什么變化。試分別在?1=0.05,?2=0.01下,檢驗(yàn)該車床工作是否正常?,由?1=0.05及?2=0.01,查正態(tài)分布表,得臨界值z?1/2=z0.025=1.96,z?2/2=z0.005=2.58。而,解:原假設(shè)H0:?=?0,備擇假設(shè)H1:?≠?0。,因此,|z|=2.15>1.96,但|z|=2.15<2.58,故在檢驗(yàn)水平?1=0.05下,應(yīng)當(dāng)拒絕H0,接受H1,即認(rèn)為該天車床工作不正常;而在檢驗(yàn)水平?2=0.01下,應(yīng)當(dāng)接受H0,即認(rèn)為該天車床工作是正常的。,上例說明:1)對于同一個(gè)問題,同一個(gè)樣本,由于檢驗(yàn)水平不一樣,可能得出完全相反的結(jié)論。因此,在實(shí)際應(yīng)用中,如何合理地選擇檢驗(yàn)水平是非常重要的。,(b)?2未知,由于?2未知,因此,不能用Z作為檢驗(yàn)統(tǒng)計(jì)量,但注意到樣本方差,是?2的無偏估計(jì)量,因此,我們自然會想到用s2代替?2,而在第六章的定理3也已經(jīng)證明,在H0成立的條件下,統(tǒng)計(jì)量,于是,對給定的顯著性水平?>0,查t分布表可得臨界值t?/2,使P{|t|≥t?/2}=?成立。再由樣本值具體計(jì)算統(tǒng)計(jì)量T的觀察值t,并與t?/2比較,若|t|≥t?/2,則拒絕H0,接受H1;若|t|<t?/2,則接受H0。這種檢驗(yàn)法也稱為t檢驗(yàn)法。,例2某廠利用某種鋼生產(chǎn)鋼筋,根據(jù)長期資料的分析,知道這種鋼筋強(qiáng)度X服從正態(tài)分布,今隨機(jī)抽取六根鋼筋進(jìn)行強(qiáng)度試驗(yàn),測得強(qiáng)度X(單位:kg/mm2)為48.5,49.0,53.5,56.0,52.5,49.5。試問:能否據(jù)此認(rèn)為這種鋼筋的平均強(qiáng)度為52.0kg/mm2(?=0.05)?,解設(shè)X~N(?,?2),,依題意建立假設(shè)H0:?=?0,H1:?≠?0。,這里?2未知,故在H0成立的條件下應(yīng)選取檢驗(yàn)統(tǒng)計(jì)量,由已知?=0.05,查t分布表得臨界值t?/2=t0.025(6-1)=2.571。,又由樣本值算得,因?yàn)?,|t|≈0.41<2.571,故接受H0,即可以認(rèn)為這種鋼筋的平均強(qiáng)度為52.0kg/mm2。,2.方差的檢驗(yàn),設(shè)總體X~N(?,?2),均未知,(X1,X2,…,Xn)來自總體X的樣本,要求進(jìn)行的檢驗(yàn)(設(shè)顯著性水平為?>0)為,原假設(shè)H0:=,備擇假設(shè)H1:≠。,是的無偏估計(jì)量,因此由第六章的定理3知當(dāng)H0為真時(shí),統(tǒng)計(jì)量,因此對給定檢驗(yàn)水平?>0,由?2分布表求得臨界值(n–1)及(n–1)使,再由樣本值(x1,x2,…,xn)具體計(jì)算統(tǒng)計(jì)量?2的觀察值,判斷:,這種檢驗(yàn)法稱為?2檢驗(yàn)法。,例4某種電子元件的壽命(單位:h)X~N(?,?2),其中?,?2未知?,F(xiàn)檢測了16只電子元件,其壽命如下:159,280,101,212,224,279,179,264,222,362,168,250,149,260,485,170。試問元件壽命的方差?2是否等于1002(?=0.05)?,解依題意,假設(shè)H0:?2=1002,H1:?2≠1002,選取檢驗(yàn)統(tǒng)計(jì)量,因此對給定檢驗(yàn)水平?=0.05,由?2分布表求得臨界值,又據(jù)樣本值算得:,因?yàn)?.262<12.81<27.488,所以,應(yīng)接受H0,即可以認(rèn)為電子元件壽命的方差?2與1002無顯著差異。,例5某廠生產(chǎn)的某種型號的電池,其壽命長期以來服從方差?2=5000(小時(shí)2)的正態(tài)分布,現(xiàn)有一批這種電池,從它的生產(chǎn)情況來看,壽命的波動性有所改變,現(xiàn)隨機(jī)抽取26只電池,測出其壽命的樣本方差s2=9200(小時(shí)2)。問根據(jù)這一數(shù)據(jù)能否推斷這批電池的壽命波動性較以往有顯著改變(取?=0.02)?,所以拒絕H0,由此可以推斷這批電池的壽命波動性較以往有顯著改變。,在實(shí)際應(yīng)用中,常常遇到兩正態(tài)總體參數(shù)的比較問題,如兩個(gè)車間生產(chǎn)的燈泡壽命是否相同;兩批電子元件的電阻是否有差別;兩臺機(jī)床加工零件的精度是否有差異等等。一般都可歸納為兩正態(tài)總體參數(shù)的假設(shè)檢驗(yàn)。,因此,對給定顯著性水平?>0,可查t分布表求得臨界值t?/2(n1+n2–2)。再由樣本值具體計(jì)算統(tǒng)計(jì)量T的觀察值t,并與t?/2(n1+n2–2)比較,若|t|≥t?/2(n1+n2–2),則拒絕H0,接受H1;若|t|- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 概率論 第八 假設(shè)檢驗(yàn)
鏈接地址:http://ioszen.com/p-3248860.html