假設(shè)檢驗ppt課件
《假設(shè)檢驗ppt課件》由會員分享,可在線閱讀,更多相關(guān)《假設(shè)檢驗ppt課件(17頁珍藏版)》請在裝配圖網(wǎng)上搜索。
§5.3 假設(shè)檢驗概述目錄,,,,,§5.3.1 假設(shè)檢驗問題,§5.3.2 參數(shù)假設(shè)檢驗的思想方法,§5.3.3 參數(shù)假設(shè)檢驗的一般步驟,,,,§5.3.4 檢驗的顯著性水平與兩類錯誤,§5.3.5 檢驗的 p 值,§5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗問題,§5.3 假設(shè)檢驗概述,,統(tǒng)計推斷的另一個主要內(nèi)容是(統(tǒng)計)假設(shè)檢驗,本節(jié)主要介紹參數(shù)假設(shè)檢驗的基本概念和基本思想方法。,例5.3.1 某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有200 件產(chǎn)品準備出廠,從中隨機抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?,,§5.3.1 假設(shè)檢驗問題,為了說明什么是假設(shè)檢驗問題,先看幾個實際例子。,設(shè)這批產(chǎn)品的次品率為 p,問題就是要回答 “ p≤1% ” 是否成立。,例5.3.2 某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗,廢水中所含某種有毒物質(zhì)的濃度 X(單位:mg/kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測了9個水樣,算得樣本平均值為 ,樣本標準差為 s = 2.4 , 以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問有毒物質(zhì)的平均濃度有無顯著變化?,,X ~ N( μ,σ2) ,其中μ,σ2均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機性造成的。問題是要判定有毒物質(zhì)的平均濃度是否還是18.2 mg/kg。,例5.3.3 隨機抽測了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重 X 是否服從正態(tài)分布。,,問題是要判定 X ~ N( μ,σ2) 是否成立?,上述各例所述問題的共同點是:對總體分布的參數(shù)或總體分布的類型提出假設(shè),希望通過抽得的樣本信息對“假設(shè)是否成立”進行推斷。這類問題稱為假設(shè)檢驗問題。,,在假設(shè)檢驗問題中,通常把待檢驗的假設(shè)稱為原假設(shè)或零假設(shè),記為 H0 ,與之對應(yīng)的假設(shè)則稱為備擇假設(shè),記為 H1 。在統(tǒng)計學(xué)中這兩個假設(shè)統(tǒng)稱為統(tǒng)計假設(shè),簡稱假設(shè)。統(tǒng)計假設(shè)通常記為 H0 vs H1。,比如,例5.3.1、例5.3.2和例5.3.3的統(tǒng)計假設(shè)分別為:,例5.3.1 某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有200 件產(chǎn)品準備出廠,從中隨機抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?,,設(shè)這批產(chǎn)品的次品率為 p,問題就是要回答 “ p≤1 %” 是否成立。,統(tǒng)計假設(shè)為 H0:p≤1% vs H1:p>1%,例5.3.2 某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗,廢水中所含某種有毒物質(zhì)的濃度 X(單位:mg/kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測了9個水樣,算得樣本平均值為 ,樣本標準差為 s = 2.4 , 以往該廠廢水中有毒物質(zhì)的平均濃度為18.2,試問有毒物質(zhì)的平均濃度有無顯著變化?,,X ~ N( μ,σ2) ,其中μ,σ2均未知,直觀上看,有毒物質(zhì)的平均濃度有所降低,但這種差異也有可能是抽樣的隨機性造成的。問題是要判定有毒物質(zhì)的平均濃度是否還是18.2 mg/kg。,統(tǒng)計假設(shè)為 H0:μ = 18.2 vs H1:μ≠18.2,例5.3.3 隨機抽測了60名2015年 1 月出生的嬰兒的體重,希望確定嬰兒的體重 X 是否服從正態(tài)分布。,,問題是要判定 X ~ N( μ,σ2) 是否成立?,統(tǒng)計假設(shè)為 H0:X ~ N( μ,σ2) vs H1:X 不服從正態(tài)分布。,,在假設(shè)檢驗問題中,若總體的分布類型是已知的,未知的只是其中的一個或幾個參數(shù),統(tǒng)計假設(shè)只與這些未知參數(shù)有關(guān),我們稱為參數(shù)假設(shè),相應(yīng)的檢驗稱為參數(shù)假設(shè)檢驗。若總體的分布類型未知,統(tǒng)計假設(shè)是總體分布的類型或某些特征,我們稱此類假設(shè)為非參數(shù)假設(shè),相應(yīng)的檢驗稱為非參數(shù)假設(shè)檢驗。,進一步地,在參數(shù)假設(shè)檢驗問題中,總體中可能有多個未知的參數(shù),有時只對其中某一個參數(shù)提出假設(shè)并進行檢驗,有時需要對多個參數(shù)一起提出一個假設(shè)并進行檢驗,根據(jù)這一區(qū)別,我們可將參數(shù)假設(shè)檢驗細分為單參數(shù)假設(shè)檢驗與多參數(shù)假設(shè)檢驗。,例5.3.1 和例5.3.2 都是參數(shù)假設(shè)檢驗問題,而例 5.3.3 就是一個非參數(shù)假設(shè)檢驗問題。下面重點討論單參數(shù)假設(shè)檢驗問題。,,§5.3.2 參數(shù)假設(shè)檢驗的思想方法,例5.3.1(續(xù)) 某廠規(guī)定,產(chǎn)品的次品率不超過 1%才能出廠,現(xiàn)有 200 件產(chǎn)品準備出廠,從中隨機抽取 5 件,發(fā)現(xiàn)有次品,試問能否允許這批產(chǎn)品出廠?,解 統(tǒng)計假設(shè)為 H0:p≤1% vs H1:p>1%,仍用上面的例子來說明假設(shè)檢驗的基本思想方法:,若統(tǒng)計假設(shè) H0成立(即 p≤1 %),則事件A = “任取 5 件中有次品”發(fā)生的概率為,也就是說,如果H0成立,則任取 5 件中有次品的概率很小,現(xiàn)在這種“罕見”的情況發(fā)生了,其根源是假設(shè)了H0成立,因此我們有理由拒絕此假設(shè),并作出這批產(chǎn)品不能出廠的決定。,上述思路可歸結(jié)為:若假設(shè)H0:p≤1 %成立,看看會推出什么結(jié)果。,若假設(shè) H0 :μ = μ0= 18.2 成立(即假設(shè)有毒物質(zhì)的濃度無顯著變化),看看會推出什么結(jié)果?,例5.3.2(續(xù)) 某工廠宣稱已采取大力措施治理廢水污染,根據(jù)經(jīng)驗,廢水中所含某種有毒物質(zhì)的濃度 X(單位: mg /kg)服從正態(tài)分布?,F(xiàn)環(huán)保部門抽測了 9 個水樣,算得樣本平均值為 ,樣本標準差為 s = 2.4 , 以往該廠廢水中有毒物質(zhì)的平均濃度為 18.2 , 試問有毒物質(zhì)的平均濃度有無顯著變化?,,解 統(tǒng)計假設(shè)為 H0:μ = 18.2 vs H1:μ≠18.2,設(shè)(X1, X2, … , Xn )為正態(tài)總體的一個樣本, ( x1, x2, … , xn) 是相應(yīng)的樣本觀察值。樣本均值 是未知參數(shù) μ 的無偏估計量, 為相應(yīng)的估計值。我們也許想到用 μ 的估計值 代替μ 來檢驗H0,但由于樣本的隨機性造成的估計誤差使得 幾乎不會真正等于 μ ,所以即使 H0:μ = μ0 為真,由于估計誤差的存在, 也不會真正等于μ0。因而我們不能簡單地根據(jù)是否有 來判斷H0:μ = μ0 是否成立。,,但是,如果H0:μ = μ0 為真,那么 會以很大的概率落在 μ0 附近的一定范圍內(nèi),而遠離μ0 的概率會很小。 即,只要 d 足夠的大,則 會很小。如果 在一次觀察中出現(xiàn)了,根據(jù)小概率原理(認為小概率事件在一次試驗中不會發(fā)生),我們自然有充足的理由否定H0:μ = μ0 ;相反,如果 不成立,則沒有充足的理由否定H0: μ = μ0,也稱不能拒絕假設(shè)H0。,上面的論述事實上提供了解決例5.3.2的方法,具體解決步驟后面再作詳細論述。,從上面的討論可以看出,要實施檢驗(是否拒絕假設(shè) H0 ),首先要確定小概率的大小,這一小概率在假設(shè)檢驗中稱為檢驗的顯著性水平,通常記作α。它是根據(jù)具體問題而需要事先確定的一個很小的正數(shù),比如0.01, 0.05, 0.10等。其次,對給定的顯著性水平α ,還需要確定一個由樣本所描述的概率不超過顯著性水平α的小概率事件,這一小概率事件對應(yīng)的樣本取值區(qū)域通常稱為假設(shè)檢驗的拒絕域,簡稱拒絕域。最后看樣本觀察值是否落入拒絕域,若樣本觀察值落入拒絕域便可以拒絕H0 ;否則,就不能拒絕H0。,,§5.3.3 參數(shù)假設(shè)檢驗的一般步驟,參數(shù)假設(shè)檢驗的一般步驟可歸納為: 第一步:提出統(tǒng)計假設(shè) H0 vs H1 ; 第二步:選取θ 的一個較優(yōu)的點估計 ,并根據(jù) 給出拒絕域的形式(在 H0 成立前提下); 第三步:圍繞 構(gòu)建樞軸量并確定其分布; 第四步:對給定的顯著性水平α,確定拒絕域 C 使得 P ( ( X1, X2, … , Xn )∈C | H0)≤α; 第五步:如果( x1, x2, … , xn )∈C ,則在顯著性水平α下拒絕 H0;否則,則不能拒絕 H0。,,§5.3.4 檢驗的顯著性水平與兩類錯誤,在假設(shè)檢驗問題中,由樣本提供的信息來推斷是否 “拒絕假設(shè)H0” 時,用了“小概率原理” ,但小概率事件并非不可能事件,如果零假設(shè)H0 本為真,但因樣本值落入拒絕域而作出了拒絕,這便犯了棄真錯誤,通常稱為第一類錯誤;相反,如果零假設(shè)H0本不成立,卻因樣本值沒有落入拒絕域而作出了不能拒絕,這便犯了納偽錯誤,通常稱為第二類錯誤。,根據(jù)檢驗法則知,當 H0 成立時,拒絕 H0 的概率小于等于顯著性水平α,這表明犯第一類錯誤的概率至多為α ,從而說明檢驗的顯著性水平α是用以控制犯第一類錯誤的概率的。由此可能會產(chǎn)生一種錯覺,以為只要把顯著性水平α取得越小,假設(shè)檢驗的準確程度就會越高。事實上不然,因為顯著性水平α只是用來控制犯第一類錯誤的概率,而在假設(shè)檢驗中還存在著犯第二類錯誤的可能性。一般來說,當樣本容量 n 給定時,在降低顯著性水平α的同時,拒絕域往往也在變小,從而會增大犯第二類錯誤的可能性。通常的做法是事先給定顯著性水平α來控制犯第一類錯誤的概率,再通過選取較好的檢驗方法盡可能地減少犯第二類錯誤的概率(比如,拒絕域盡可能取大些)。,,§5.3.5 檢驗的 p 值,可以看出,顯著性水平α越小,則相應(yīng)的拒絕域就越?。划旓@著性水平α取得足夠小時,可以使得樣本值不落在相應(yīng)的拒絕域中,從而在此顯著性水平α下不能拒絕假設(shè)H0。當顯著性水平α由上述足夠小的值不斷增大時,相應(yīng)的拒絕域也就越來越大,當顯著性水平α大到一定程度時,便可以使得樣本值落入相應(yīng)的拒絕域中,從而在此顯著性水平α下可以拒絕假設(shè)H0。,也就是說,對于一個確定的樣本值,存在一個實數(shù) p(0 < p <1),在顯著性水平等于 p 下可以拒絕假設(shè)H0 ,而在小于 p的顯著性水平下不能拒絕假設(shè)H0。可見, p 是使得依據(jù)給定樣本值作出“拒絕假設(shè)H0”的最小的顯著性水平,稱之為檢驗的 p 值。,多數(shù)統(tǒng)計軟件都提供 p 值的輸出結(jié)果,人們就不必針對每個顯著性水平α查相應(yīng)分布的下側(cè)分位數(shù),只要直接比較α與 p 值即可。,,§5.3.6 多參數(shù)與非參數(shù)假設(shè)檢驗問題,前面對單參數(shù)假設(shè)檢驗問題作了比較詳盡的討論,其解決問題的基本思想方法也適用于多參數(shù)假設(shè)檢驗或非參數(shù)假設(shè)檢驗問題,只是在具體細節(jié)上作適當調(diào)整即可。為此,僅說明兩點: ⑴ 對于多參數(shù)假設(shè)檢驗問題,需尋求一個包含所有待檢驗參數(shù)的樞軸量,并使之服從或漸近地服從一個已知的確定分布; ⑵非參數(shù)假設(shè)檢驗問題可以近似地化為一個多參數(shù)假設(shè)檢驗問題來解決。,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 假設(shè)檢驗 ppt 課件
鏈接地址:http://ioszen.com/p-1249217.html