假設(shè)檢驗(yàn)的概念及t.ppt
《假設(shè)檢驗(yàn)的概念及t.ppt》由會員分享,可在線閱讀,更多相關(guān)《假設(shè)檢驗(yàn)的概念及t.ppt(40頁珍藏版)》請?jiān)谘b配圖網(wǎng)上搜索。
第八章 假設(shè)檢驗(yàn)的概念及t檢驗(yàn),統(tǒng)計(jì)推斷,統(tǒng)計(jì)推斷 statistical inference,如:樣本均數(shù) 樣本標(biāo)準(zhǔn)差S 樣本率 P,如:總體均數(shù) 總體標(biāo)準(zhǔn)差 總體率,內(nèi)容: 參數(shù)估計(jì)(estimation of parameters) 包括:點(diǎn)估計(jì)與區(qū)間估計(jì) 2. 假設(shè)檢驗(yàn)(test of hypothesis),實(shí)例,通過以往大規(guī)模調(diào)查,已知某地一般新生兒的頭圍均數(shù)為34.50cm。為研究某礦區(qū)新生兒的發(fā)育狀況,現(xiàn)從該地某礦區(qū)隨機(jī)抽取新生兒55人,測得其頭圍均數(shù)為33.89cm,問該礦區(qū)新生兒的頭圍總體均數(shù)與一般新生兒頭圍總體均數(shù)是否不同?,假設(shè)檢驗(yàn)的步驟及有關(guān)概念,總體間差異: 1. 個體差異,抽樣誤差所致; 2. 總體間固有差異 判斷差別屬于哪一種情況的統(tǒng)計(jì)學(xué)檢驗(yàn),就是假設(shè)檢驗(yàn)。 小概率思想: Pα(0.05) 樣本差別無統(tǒng)計(jì)學(xué)意義,假設(shè)檢驗(yàn)(test of hypothesis):,事先對總體的特征作出某種假設(shè),通過分析樣本數(shù)據(jù),判斷該樣本信息是否支持這種假設(shè),最后作出拒絕或不拒絕這種假設(shè)的取舍抉擇。此方法稱作假設(shè)檢驗(yàn)。,1、建立假設(shè)與確定檢驗(yàn)水準(zhǔn)(α) H0: μ1=μ2 無效假設(shè)(null hypothesis) H1: μ1≠μ2 備擇假設(shè)(alternative hypothesis) 檢驗(yàn)水準(zhǔn)(level of a test):α=0.05(雙側(cè)) 2、選定方法和計(jì)算統(tǒng)計(jì)量: 根據(jù)統(tǒng)計(jì)推斷目的、設(shè)計(jì)、資料組數(shù)、樣本含量、等選擇方法。如兩組小樣本比較用t檢驗(yàn)、大樣本比較u檢驗(yàn)、方差齊性檢驗(yàn)用F檢驗(yàn)。 3、確定P值,作出判斷 P≤α(0.05) 樣本差別有統(tǒng)計(jì)學(xué)意義; P α(0.05) 樣本差別無統(tǒng)計(jì)學(xué)意義 P值:指在H0成立的假設(shè)前提下,出現(xiàn)當(dāng)前檢驗(yàn)統(tǒng)計(jì)量以及更極端情況的概率。,假設(shè)檢驗(yàn)的步驟,,,1.差異來源 該礦區(qū)新生兒總體均數(shù)與一般新生兒頭圍總體均數(shù)相同 該礦區(qū)新生兒總體均數(shù)與一般新生兒頭圍總體均數(shù)不同 H0:μ= μ 0=34.50 , H1:μ≠ μ0=34.50 單憑一份樣本不可能證明哪一個正確,可考慮樣本資料和哪一個假設(shè)有較大的矛盾來決定拒絕哪一個假設(shè)。一般考察樣本資料是否與H0有較大的矛盾,分析思路,2. H0成立時會怎樣? 所得u值因樣本而異,但其絕對值多數(shù)情況下落在0附近。u的分布規(guī)律可由u界值表查出 3.當(dāng)前狀況如何,發(fā)生的可能性(P值)有多大? n=55, =33.89, μ0 =34.50 得u=-2.273,,拒絕域 接受域 拒絕域,,,P值系指在H0成立的假設(shè)前提下,出現(xiàn)當(dāng)前檢驗(yàn)統(tǒng)計(jì)量以及更極端情況的概率。 查u界值表,當(dāng)前u值以外的雙側(cè)尾部面積 介于0.05和0.02之間 4.決策 決策者需要事先規(guī)定一個可以忽略的小概率值α。如取0.05,那么上述P值可認(rèn)為很小。即H0成立時,幾乎不可能出現(xiàn)當(dāng)前的狀況。,于是,面臨兩種抉擇,一是認(rèn)為H0是成立的,而當(dāng)前的極端情況又恰好偶然發(fā)生了;二是懷疑H0的正確性,從而接受H1。通常選擇后者。本例,可認(rèn)為該礦區(qū)新生兒總體均數(shù)與一般新生兒頭圍總體均數(shù)不同。,例8-2:1995年,某地20歲應(yīng)征男青年平均身高為168.5cm。2003年在當(dāng)?shù)?0歲應(yīng)征男青年中隨機(jī)抽取85人,平均身高為171.2cm,標(biāo)準(zhǔn)差為5.3cm,問這兩年身高是否不同。 解:總體方差一般未知,當(dāng)樣本含量足夠大時,用S作為σ 的估計(jì)值。 1 建立假設(shè),確定檢驗(yàn)水準(zhǔn) H0:μ =168.5, H1:μ≠ 168.5 α =0.05,,2 計(jì)算統(tǒng)計(jì)量u 3 確定P值,下結(jié)論 查u界值表, 4.70 u 0.001/2=3.2905,得P 0.001,按照α =0.05水準(zhǔn),拒絕H0,接受H1,可認(rèn)為2003年20歲應(yīng)征男青年身高有變化,比1995年增高了。,,例8-3:為比較某藥治療流行性 出血熱療效,將72名患者隨機(jī)分為試驗(yàn)和對照組,結(jié)果分別為n1=32, =2.9,S1=1.9;n2=40, =5.2,S2=2.7,問試驗(yàn)組和對照組的平均退熱天數(shù)有無差別。 解:可用兩組大樣本資料的u檢驗(yàn) H0:μ1=μ2 ,H1:μ1 ≠ μ2 α =0.05,二 兩均數(shù)比較的u檢驗(yàn),u=-4.23 查u界值表,4.23 u 0.001/2=3.2905,得P 0.001,按照α =0.05水準(zhǔn),拒絕H0,接受H1,可認(rèn)為試驗(yàn)組和對照組退熱天數(shù)的總體均數(shù)不等,療效不同。試驗(yàn)組比對照組平均退熱天數(shù)短。 μ1-μ2 的95%可信區(qū)間為-3.3——-1.3天,Ⅰ型錯誤和Ⅱ型錯誤,(1-b)即把握度(power of a test):兩總體確有差別,被檢出有差別的能力 (1-a)即可信度(confidence level):重復(fù)抽樣時,樣本區(qū)間包含總體參數(shù)(m)的百分?jǐn)?shù),對于一般的假設(shè)檢驗(yàn), a定為0.05(或0.01),b的大小取決于H1。通常情況下,比較總體間有無差異并不知道,即H1不明確, b值的大小無法確定,也就是說,對于一般的假設(shè)檢驗(yàn),我們并不知道犯Ⅱ型錯誤的概率b有多大。,通常情況下Ⅱ型錯誤未知,,,a,b,減少(增加)I型錯誤,將會增加(減少)II型錯誤 增大n 同時降低a 與 b,a 與 b 間的關(guān)系,,假設(shè)檢驗(yàn)注意事項(xiàng),(1)可比性(隨機(jī)性抽樣、分組,資料具有均衡性和可比性) (2)正確選用假設(shè)檢驗(yàn)方法 (3)“差別”的實(shí)際意義(正確理解差別有統(tǒng)計(jì)學(xué)意義的涵義。有統(tǒng)計(jì)學(xué)意義指:樣本來自不同的總體,而并非指差別很大,不能說明差別的大小.當(dāng)專業(yè)上和統(tǒng)計(jì)學(xué)上都有“顯著性意義”時,才有實(shí)用價(jià)值。),假設(shè)檢驗(yàn)注意事項(xiàng),(4)判斷結(jié)論時不能絕對化(原因是存在著兩類錯誤 寫出精確P值:若對同一研究內(nèi)容,A研究的結(jié)果P=0.002,B研究的結(jié)果P=0.04,雖結(jié)果均為拒絕H0,但A結(jié)果更為可信. (5)單側(cè)檢驗(yàn)與雙側(cè)檢驗(yàn) (6)報(bào)告結(jié)果應(yīng)寫出統(tǒng)計(jì)量值、具體P值(單側(cè)時應(yīng)注明);95%CI既能說明差別的大小,也具有檢驗(yàn)的作用,建議使用。(可信區(qū)間與假設(shè)檢驗(yàn)均為統(tǒng)計(jì)推斷方法,可信區(qū)間可以檢驗(yàn)差值大小,假設(shè)檢驗(yàn)可精確表示相關(guān)事件的概率。統(tǒng)計(jì)結(jié)果同時報(bào)告檢驗(yàn)統(tǒng)計(jì)量、P值和可信區(qū)間更值得提倡。),第十章 t檢驗(yàn)(t test),t檢驗(yàn),亦稱student t檢驗(yàn)(Student’s t test),主要用于樣本含量較?。ɡ鏽30),總體標(biāo)準(zhǔn)差σ未知的正態(tài)分布資料。 一、樣本均數(shù)與總體均數(shù)的比較 二、配對資料的比較 三、兩樣本均數(shù)的比較 四、兩方差齊性檢驗(yàn),一、樣本均數(shù)與總體均數(shù)的比較,推斷樣本所代表的未知總體均數(shù)與已知總體均數(shù)0有無差別。 已知總體均數(shù)0一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。 統(tǒng)計(jì)量t的計(jì)算公式:,,實(shí) 例,,附表2 t界值表,,二、配對資料的比較,兩種情況:1.隨機(jī)配對設(shè)計(jì)(randomized paired design)是將受試對象按某些混雜因素(如性別、年齡、窩別等)配成對子,每對中的兩個個體隨機(jī)分配給兩種處理(如處理組與對照組);2.或者同一受試對象作兩次不同的處理(自身對照)。 優(yōu)點(diǎn):配對設(shè)計(jì)減少了個體差異。 特點(diǎn):資料成對,每對數(shù)據(jù)不可拆分。,表3-4 兩法測定12份尿鉛含量的結(jié)果,表3-3 兩法測定12份尿鉛含量的結(jié)果,,三、兩樣本均數(shù)的比較,完全隨機(jī)設(shè)計(jì)(completely random design) :把受試對象完全隨機(jī)分為兩組,分別給予不同處理,然后比較獨(dú)立的兩組樣本均數(shù)。各組對象數(shù)不必嚴(yán)格相同。 目的:比較兩總體均數(shù)是否相同。,條件:假定資料來自正態(tài)總體,σ12=σ22,實(shí) 例,2. 方差齊性檢驗(yàn),Y=log (X+a) Y= Y=,Y=,,方差齊性檢驗(yàn),t檢驗(yàn)的類型,樣本均數(shù)與總體均數(shù)比較的t檢驗(yàn) (單組設(shè)計(jì)) (one sample t test) 配對設(shè)計(jì)定量資料的t檢驗(yàn) (paired t-test) 成組設(shè)計(jì)定量資料的t檢驗(yàn) (two sample t test),小 結(jié),三個概念,1 獨(dú)立性 :指一批實(shí)驗(yàn)數(shù)據(jù)彼此之間是互相獨(dú)立的。例如測得不同學(xué)生的身高、不同學(xué)生的考試成績。 2 正態(tài)性:是指每個影響因素各水平組的定量資料來自于正態(tài)或近似正態(tài)分布的總體。 3 方差齊性:指每個影響因素各水平組的總體方差應(yīng)當(dāng)相等。,一 單組設(shè)計(jì)的特點(diǎn)及應(yīng)滿足的前提條件,1 設(shè)計(jì)特點(diǎn):對一組同質(zhì)的受試對象不按任何其它因素分組,直接觀測或給予一種特定處理后觀測這些受試對象某種或多種指標(biāo)的取值。 2 已知總體均數(shù)0一般為理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察所得的穩(wěn)定值。 3 前提條件:樣本數(shù)據(jù)滿足正態(tài)或近似正態(tài)分布。 4 統(tǒng)計(jì)量的計(jì)算:,二 配對設(shè)計(jì)的特點(diǎn)及應(yīng)滿足的前提條件,1 設(shè)計(jì)特點(diǎn):A 隨機(jī)配對設(shè)計(jì)(randomized paired design)是將受試對象按某些混雜因素(如性別、年齡、窩別等)配成對子,每對中的兩個個體隨機(jī)分配給兩種處理(如處理組與對照組);B.或者同一受試對象作兩次不同的處理(自身對照)。 優(yōu)點(diǎn):配對設(shè)計(jì)減少了個體差異。 資料成對,每對數(shù)據(jù)不可拆分。 2 前提條件:成對數(shù)據(jù)間的差值滿足正態(tài)或近似正態(tài)分布。 3 統(tǒng)計(jì)量的計(jì)算:,三 成組設(shè)計(jì)的特點(diǎn)及資料應(yīng)滿足的前提條件,1 設(shè)計(jì)特點(diǎn):完全隨機(jī)設(shè)計(jì)(completely random design) :把受試對象完全隨機(jī)分為兩組,分別給予不同處理,然后比較兩組樣本均數(shù)。兩組數(shù)據(jù)是獨(dú)立的,兩組對象數(shù)不必嚴(yán)格相同。 2 前提條件:兩組數(shù)據(jù)間是互相獨(dú)立的、兩組數(shù)據(jù)分別服從正態(tài)或近似正態(tài)分布、兩組資料所對應(yīng)的總體方差相等。 3 統(tǒng)計(jì)量的計(jì)算:,五、資料不滿足正態(tài)與方差齊時進(jìn)行檢驗(yàn)之對策,1 對數(shù)變換:常用于數(shù)據(jù)呈正偏態(tài)分布,較小數(shù)據(jù)多,較大數(shù)據(jù)少。 2 平方根變換:常用于服從Poisson分布的資料,算術(shù)均數(shù)=方差。 3 倒數(shù)變換:常用在數(shù)據(jù)呈極嚴(yán)重的正偏態(tài)分布,變換后可使特大數(shù)據(jù)變小,資料近似正態(tài)。,對策,五、資料不滿足正態(tài)與方差齊時進(jìn)行檢驗(yàn)之對策,平方根反正弦 常用于百分率數(shù)據(jù)(如白血病患者的淋巴細(xì)胞轉(zhuǎn)化率,腦電圖波的變化率等) 當(dāng)數(shù)據(jù)有負(fù)數(shù)時,作對數(shù)或平方根變換可對原始數(shù)據(jù)相加一個常數(shù)使其變?yōu)檎龜?shù)。 近似t檢驗(yàn)(separate variance estimation t-test) ?? t‘檢驗(yàn) 非參數(shù)檢驗(yàn)---秩和檢驗(yàn),對策,,兩 均 數(shù) 比 較,,樣本與總體,單樣本t檢驗(yàn),配對,配對t檢驗(yàn),方差齊性,變量變化,兩樣本,t`檢驗(yàn),兩樣本t檢驗(yàn),非配對,,,,,不齊,齊,,,,差值呈正態(tài),秩和檢驗(yàn),指標(biāo)呈正態(tài),分析思 路,討論題,1 要比較一組肺結(jié)核病人治療前后的淋巴細(xì)胞與白細(xì)胞總數(shù)的百分比,以評價(jià)治療效果,可用( ) A ?2檢驗(yàn) B t檢驗(yàn) C 配對?2檢驗(yàn) D 配對t檢驗(yàn) 2 對兩樣本均數(shù)進(jìn)行假設(shè)檢驗(yàn)時,P值越小,說明( ) A 兩總體均數(shù)有差別的可能性越大 B 兩總體均數(shù)有差別的可能性越小 C 兩總體均數(shù)相差越大 D 兩總體均數(shù)越小 3 兩組數(shù)據(jù)中的每個變量值減同一常數(shù)后做兩個均數(shù)差別的t 檢驗(yàn)( ) A t值不變 B t值變小 C t值變大 D t值不能確定,,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 假設(shè)檢驗(yàn) 概念
鏈接地址:http://ioszen.com/p-2816270.html