研《非參數假設檢驗》.ppt
《研《非參數假設檢驗》.ppt》由會員分享,可在線閱讀,更多相關《研《非參數假設檢驗》.ppt(82頁珍藏版)》請在裝配圖網上搜索。
常用的統(tǒng)計分析,Means過程,單一樣本均值的T檢驗,兩獨立樣本均值差的T檢驗,兩配對樣本均值的T檢驗,SPSS的非參數檢驗與參數檢驗,SPSS的相關分析與回歸分析,SPSS的主成分分析與因子分析,,,,,,,,SPSS的方差分析,,SPSS的聚類分析與判別分析,,特點:對樣本進行分組計算均值和標準差。如:,Means過程,比較不同性別同學數學成績的平均值和方差。,數學成績表,SPSS的實現過程:Analyze菜單CompareMeans項中選擇Means命令。,,非參數假設檢驗,追求,一個總體分布的非參數假設檢驗,(2)兩個總體的分布未知,它們是否相同;,非參數假設檢驗需要處理的問題:,(1)猜出總體的分布(假設),用另一組樣本檢驗。,兩個總體分布的非參數假設檢驗,內容,,多個總體分布的非參數假設檢驗,配對樣本非參數檢驗,SPSS的非參數檢驗,,,一個總體:單樣本總體分布的檢驗,兩個總體,多個總體,,,獨立樣本非參數檢驗,配對樣本非參數檢驗,獨立樣本非參數檢驗,一個總體分布的檢驗,,檢驗總體的卡方分布,檢驗總體的二項分布,,,單樣本變量值的隨機性檢驗(游程檢驗),單樣本的Kolmogorov—Smirnov檢驗,,,檢驗總體的正態(tài)分布,,P-P正態(tài)概率分布圖(GraphsP-P),,Q-Q正態(tài)概率單位分布圖(GraphsQ-Q),,,,檢驗總體的正態(tài)分布的圖示法,是根據變量的累計比例對所指定的理論分布累計比例繪制的圖形。,是根據變量分布的分位數對所指定的理論分布分位數繪制的圖形。,半正態(tài)分布(Half-normal),伽瑪分布(Gamma),指數分布(Exponential),TestDistribution提供13種概率分布:,,,,,,,,,,,,,,貝塔分布(Beta),卡方分布(Chi-square),拉普拉斯分布(Laplace),邏輯斯諦分布(Logistic),對數正態(tài)分布(Lognormal),正態(tài)分布(Normal),帕累托分布(Pareto),T分布(StudentT),威布爾分布(Weibull),均勻分布(Uniform),Blom’s方法:使用公式:,Tukey方法:使用公式:,Rankit方法:使用公式:,VanderWaerden方法:使用公式:,n:個案的數目r:從1到n的秩次,式中:,選擇比率估測的公式,每次只能選擇一項。,若與某個概率分布的統(tǒng)計圖一致,即被檢驗的數據符合所指定的分布,則代表個案的點簇在一條直線上。,總體分布的卡方檢驗的原理:如果從一個隨機變量X中隨機抽取若干個觀察樣本,這些觀察樣本落在X的K個互不相交的子集中的觀察頻數服從一個多項分布,該多項分布當K趨于無窮時,就近似服從X的總體分布。,因此,假設樣本來自的總體服從某個期望分布或理論分布,同時獲得樣本數據各子集的實際觀察頻數,則可依據下面統(tǒng)計量作出推斷:,例題,檢驗總體的卡方分布,例題:某地一周內每日患憂郁癥的人數如表所示,請檢驗一周內每日人們憂郁的數是否滿足1:1:2:2:1:1:1。,SPSS實現過程,1.定義變量;,2.變量加權;,3.進入Analyze菜單,用于選擇計算非參數檢驗統(tǒng)計量對應的P值的方法。SPSS提供了3種計算P值的方法:Asymptoticonly:漸進性的顯著性檢驗,適合于樣本服從漸進分布或較大樣本。MonteCarlo:不依賴漸進性方法估測精確顯著性,這種方法在數據不滿足漸進性分布,而且樣本數據過大以致不能計算精確顯著性時特別有效。Exact:精確計算法,即準確計算觀測結果的統(tǒng)計概率。計算量較大,適用于小樣本。,練習:賽馬比賽時,任一馬的起點位置是起跑線上所指定的標桿位置?,F有8匹馬的比賽,位置1是內側最靠近欄桿的跑道,位置8是外側離欄桿最遠的跑道,下表是某賽馬在一個月內某特定圓形跑道上的紀錄,并且按照起點的標桿位置分類。試檢驗起點標桿位置對賽馬結果的影響。,馬在8個圓形跑道的起點標桿位置上獲勝的紀錄,均勻分布檢驗,二項分布檢驗的基本思想:根據搜集到的樣本數據,推斷總體分布是否服從某個指定的二項分布。,SPSS中的二項分布檢驗,在樣本小于等于30時,按照計算二項分布概率的公式進行計算;樣本數大于30時,計算的是Z統(tǒng)計量,認為在零假設下,Z統(tǒng)計量服從正態(tài)分布。,其零假設:樣本來自的總體與所指定的某個二項分布不存在顯著的差異。,K:觀察變量取值的樣本個數,當K小于n/2時,取加號;p為檢驗概率。,練習,檢驗總體的二項分布,練習:某地某一時期內出生35名嬰兒,其中女孩兒19名(Sex=0),男孩兒16名(Sex=1)。問,該地區(qū)出生嬰兒的性別比例與通常的男女性別比例(總體概率約為0.5)是否不同?數據如下表所示:,續(xù),,35名嬰兒的性別,操作,單樣本變量值的隨機性檢驗(游程檢驗),依時間或其他順序排列的有序數列中,具有相同的事件或符號的連續(xù)部分稱為一個游程。調用Runs過程可進行游程檢驗,即用于檢驗序列中事件發(fā)生過程的隨機性分析。,單樣本變量值的隨機性檢驗是對某變量的取值出現是否隨機進行檢驗,也稱游程檢驗。,例題,例題:某村發(fā)生一種地方病,其住戶沿一條河排列,調查時對發(fā)病的住戶標記為“1”,對非發(fā)病的住戶標記為“0”,共20戶,其取值如下表所示:,續(xù),,35家住戶的發(fā)病情況,操作,單樣本的Kolmogorov—Smirnov檢驗,,單樣本K—S檢驗是一種擬合優(yōu)度的非參數檢驗,是利用樣本數據推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)性隨機變量的分布形態(tài)。進行Kolmogorov-SmirnovZ檢驗,是將一個變量的實際頻數分布與正態(tài)分布(Normal)、均勻分布(Uniform)、泊松分布(Poisson)進行比較。,SPSS實現K—S檢驗的過程如下:,(1)根據樣本數據和用戶的指定構造出理論分布,查分布表得到相應的理論累計概率分布函數。,(2)利用樣本數據計算各樣本數據點的累積概率,得到檢驗累計概率分布函數。(3)計算和在相應的變量值點X上的差,得到差值序列。單樣本K—S檢驗主要對差值序列進行研究。,例題,練習,例題:某地144個周歲兒童身的高數據如下表,問該地區(qū)周歲兒童身高頻數是否成正態(tài)分布?,,SPSS操作,,練習:某報刊亭為研究每天報刊的銷售量,為以后每天報刊進量提供依據,統(tǒng)計其在140天的銷售中,某日報的日銷售量的頻數資料如下表,問該資料的頻數是否服從正態(tài)分布?,操作,兩個總體獨立樣本的非參數檢驗,檢驗兩個總體的分布是否相同:,方差相同,分布函數形式相同,兩個總體的分布若相同,參數相同,,,均值相同,(2)兩個總體的分布未知,它們是否相同;,Wald-wolfowitzRuns游程檢驗,檢驗分布是否相同的方法,Mann-WhitneyU秩和檢驗,Kolmogorov—Smirnov檢驗,MosesExtremeReactions極端反應檢驗,,,,,SPSS實現過程,,零假設:樣本來自的兩獨立總體分布無顯著差異,K-S檢驗實現的方法:將兩組樣本數據混合并升序排列,分別計算兩組樣本秩的累計頻率和每個點上的累積頻率,然后將兩個累計頻率相減,得到差值序列數據。,K-S檢驗將關注差值序列,并計算K-S的Z統(tǒng)計量,依據正態(tài)分布表給出相應的相伴概率值。,(1)Kolmogorov—Smirnov檢驗,兩組樣本是可以各自獨立顛倒順序的,(2)Mann-WhitneyU秩和檢驗法,檢驗這兩組樣本是否來自同一個總體(或兩組樣本的總體分布是否相同)。,問題:,有兩個總體的樣本為:,與,可能,。,。,Mann-WhitneyU檢驗的統(tǒng)計量是:,式中,對給定,查值表,得,若,,則總體分布相同。,,,兩樣本Wald-wolfowitz游程檢驗中,計算游程的方法與觀察值的秩有關。首先,將兩組樣本混合并升序排列。在數據排序時,兩組樣本的每個觀察值對應的樣本組標志值序列也隨之重新排列,然后對標志值序列求游程。,如果計算出的游程數相對比較小,則說明樣本來自的兩總體分布形態(tài)存在較大差距。,SPSS將自動計算游程數得到Z統(tǒng)計量,并依據正態(tài)分布表給出對應的相伴概率值。,(3)Wald-wolfowitz游程檢驗,如果跨度或截頭跨度很小,說明兩個樣本數據無法充分混合,認為實驗樣本存在極端反應。,,兩獨立樣本的極端反應檢驗,將一個樣本作為控制樣本,另一個樣本作為實驗樣本。以控制樣本做對照,檢驗實驗樣本是否存在極端反應。,首先,將兩組樣本混合并升序排列;然后計算控制樣本最低秩和最高秩之間的觀察值個數,即:Span(跨度)。,為控制極端值對分析結果的影響,可先去掉樣本兩個最極端的觀察值后,再求跨度,這個跨度稱為截頭跨度。,零假設:樣本來自的兩獨立總體分布沒有顯著差異。,(4)Moses極端反應檢驗,兩組獨立樣本的總體分布是否相同的檢驗,點擊進入Analyze菜單的NonparametricTests子菜單,選擇2IndependentSample命令。,MosesExtremeReactions(極端檢驗):檢驗兩個獨立樣本觀察值的散布范圍是否有差異存在,以檢驗兩個樣本是否來自具有同一分布的總體。,Mann-WhitneyU:檢驗兩個獨立樣本所屬的總體均值是否相同。,Kolmogorov-SmirnovZ(K—S):推測兩個樣本是否來自具有相同分布的總體。,Wald-Wolfowitzruns(游程檢驗):考察兩個獨立樣本是否來自具有相同分布的總體。,,,,,練習,,練習:研究兩個不同廠家生產的燈泡使用壽命是否存在顯著性差異,隨機抽取兩個廠家生產的燈泡,試驗得到的使用壽命數據如下表:,,SPSS操作,兩個總體配對樣本的非參數檢驗,McNemar檢驗,Sign符號檢驗法(正負號檢驗法),Wilcoxon秩和檢驗,,,,,(1)Wilcoxon秩和檢驗法,設有兩個總體的樣本為:,把兩組樣本放在一起,按樣本觀察值,較多地集中在左段。,w太大,說明樣本較多地集中在右段。,。,兩組樣本是可以各自獨立顛倒順序的,。,可能,與,w太小,說明樣本,(秩)加總起來,記為w。如果兩個總體的分布相同,則樣本應當是均勻混合的,即w不能太小,也不能太大。,的序號,為秩。把樣本個數少的這組樣本,那么每個觀察值就有一個序號,稱,的大小重新排序,,不妨設,續(xù),顯著性水平,,則接受,由于,∴w應在某兩個數字之間:,,可以由威爾可可遜表,依據,是由,所決定的。對于給定的,查出,。,若,,或,,則拒絕,反之,若,。,,McNemar變化顯著性檢驗,以研究對象自身為對照,檢驗其兩組樣本“前后”變化是否顯著。該檢驗要求待檢驗的兩組樣本的觀察值是二值數據。即該法適用于相關的二分變量數據。,零假設:樣本來自的兩配對總體分布無顯著差異,McNemar變化顯著性檢驗基本方法:二項分布檢驗。,例題,,McNemar檢驗,例題:分析學生接受某種方法進行訓練的效果,收集到10個學生在訓練前、訓練后的成績如下表所示,問訓練前后學生的成績是否存在顯著性差異?,SPSS實現過程,,,不能各自獨立地顛倒順序。,樣本,發(fā)生的概率為,(1)符號檢驗法(正負號檢驗法)的前提:,(2)復習二項分布:,或,在,次重復努力試驗中,,事件,,,在,次試驗中出現的次數為,,,則如果隨機變量,的分布如下:,則稱,服從參數為,的二項分布,,記為,且二項分布的均值為,,,方差為,。,若隨機變量X~分布,則統(tǒng)計量,且,,定理一:,~,定理二:,函數的均值,定理三:,當充分大時,近似地服從均值、,的正態(tài)分布,即,標準差為,,,,,(3)符號檢驗法的思路:,若兩個總體的分布相同,即,,則,令:,則,設,∴,式中,用容量相同的兩個配對樣本來檢驗,即,所以問題轉化為:,求從小到大的累積概率:,(4)正負號個數檢驗法的處理,①小樣本情況下:,對,對,求從大到小的累積概率:,即,若,則接受,是拒絕的最高界限。,是拒絕的最低界限。,小樣本情況下,,大樣本情況下,S統(tǒng)計量,(0—1分布參數的假設檢驗),(0—1)分布,,一個總體,兩個總體——大樣本,,小樣本,大樣本,假設檢驗,某類個體占總體數量的比例問題,如高收入的比重問題等,類似于拋硬幣。,一個0~1分布總體的小樣本比例值的參數檢驗,是總體中某類個體的比例。由0~1分布知:,令X是比例的隨機變量,則X~分布,,E(X)=,,續(xù),足夠大了,用正態(tài)分布來近似它。,若隨機變量X~分布,則統(tǒng)計量,且,,定理一:,~,定理二:,函數的均值,定理三:,當充分大時,近似地服從均值、,的正態(tài)分布,即,標準差為,按照經驗,只要,,同時,,,就可,以認為,例題,例1某公司要招聘若干名工程師。出了10道選擇題,每題有4個備選答案,其中只有一個是正確的即正確的比率只有四分之一。問:應當答對幾道題,才能考慮錄取?(注意:這是一個總體),又∵統(tǒng)計量,。,的分布是二項分布,解:,于是應有:,計算結果如下表。,00.05631.00000.056310.18770.94370.24420.28160.75600.525630.25030.44740.775940.14600.22410.921950.05840.07810.980360.01620.01970.996570.00310.00350.999680.00040.00041.000090.00000.00001.0000100.00000.00001.0000,累積概率表,正確的次數r,向下累計概率,,,,,,,向上累計概率,由于=5000.15=75>25,已經足夠大,故由中心極限定理,近似地服從均值為、,例一個賣襯衣的郵購店從過去的經驗中得知有15%的購買者說襯衣的大小不合身,要求退貨。現這家郵購店改進了郵購定單的設計,結果在以后售出的500件襯衣中,有60件要求退貨。問:在5%的a水平上,改進后的退貨比例(母體比例)與原來的退貨比例有無顯著差異?,的正態(tài)分布。,于是,取顯著性水平,,方差為,解:,:,對于顯著性水平,假設:,(即,式中用,(即,),),絕還是接受,。,所謂“大樣本”,就是要,檢驗統(tǒng)計量為:,代替,,,得出拒,是否大于,判斷,,,同時,②大樣本情況下,正負號個數檢驗法的處理,,用兩套問卷測量20個管理人員的素質,滿分都是200分。測量結果如下表所示,問:兩套問卷有無顯著差異(本質是兩套問卷的結果的分布是否相同)?,請分別用小樣本和大樣本來檢驗兩套問卷有無顯著差異。,練習,,與可從“符號檢,在顯著性水平之下,依據,S=min(,),③處理正負號個數檢驗法的S統(tǒng)計量方法,,選統(tǒng)計量:,記,,,若,則拒絕假設,認為,則接受假設,若,,認為,。,這一檢驗法的重要的前提與前兩個方法相同,,驗表”中查出,:,與就越接近。S越小,,的差別就越大,與,即按照問題本來的屬性,天然地配對。,不能各自獨立地顛倒順序。,或,樣本,注意:,S越大,,例如,練習用兩種激勵方法,分別對同樣工種的兩個班組(每個班組7個人)進行激勵,測得激勵后業(yè)績增長(%),數據如下。問:兩種激勵方法的效果有無顯著差異(兩種激勵方法的總體分布是否相同)?,表兩種激勵方法分別實施于不同組工人的效果,激勵法A,激勵法B,,多獨立樣本的K—W檢驗,多獨立樣本的Median檢驗,多個總體獨立樣本的非參數檢驗,,,,多獨立樣本的K—T檢驗,,SPSS實現的過程中,將多組樣本數據混合并升序排列,求出混合樣本數據的中位數,并假設是共同的中位數。,如果多組獨立樣本的中位數無顯著差異,則說明多組獨立樣本有共同的中位數。如果每組中大于該中位數的中位數大致等于每組中小于該中位數的樣本數,則可以認為該多個獨立總體的中位數沒有顯著差異。,多獨立樣本的中位數檢驗,,通過對多組數據的分析,推斷多個獨立總體分布是否存在顯著差異。,零假設:樣本來自的多個獨立總體的中位數無顯著差異。,多獨立樣本的K—W檢驗,零假設:樣本來自的多個獨立總體的分布無顯著差異。,SPSS的實現,將多組樣本數據混合并升序排列,求出求出每個觀察值的秩,然后對多組樣本的值分別求平均值。如果各組樣本的平均秩大致相等,則認為多個獨立總體的分布無顯著差異。,n第i組樣本的觀察值個數;R平均秩。,例題,例題:隨機抽取3個班級學生的21個成績樣本,問3個班級學生總體成績是否存在顯著差異?,,SPSS操作,,多個總體配對樣本的非參數檢驗,多配對樣本的Friendman檢驗,多配對樣本的Kendall檢驗,多配對樣本的CochranQ檢驗,,,,多配對樣本的Friendman檢驗,要求:數據是定距的。,實現原理:以樣本為單位,將各個樣本數據按照升序排列,求各個樣本數據在各自行中的秩,然后計算個樣本的秩總和及平均秩。,如果多個配對樣本的分布存在顯著性差異,則數值普遍偏大組的秩和必然偏大,各組的秩之間就會存在顯著差異。如果個樣本的平均秩大致相當,則可以認為個組的總體分布沒有顯著差異。,例題,,例題:為了試驗某種減肥藥物的性能,測量11個人在服用該藥以前以及服用該藥1個月后、2個月后、3個月后的體重。問:在這4個時期,11個人的體重有無發(fā)生顯著的變化?,SPSS操作,多配對樣本的Kendall檢驗,主要用于分析評判者的判別標準是否一致公平。它將每個評判對象的分數都看作是來自多個配對總體的樣本。一個評判對象對不同評判對象的分數構成一個樣本,其零假設:樣本來自的多個配對總體的分布無顯著差異,即評判者的評判標準不一致。Kendall協(xié)同系數W的公式:,例題,R:第i個被評判者的秩和;,n:被評判者人數;m:評判人數。,,例題:某文藝晚會有5個節(jié)目,共有5個評委參與打分。問這5個評委的判別標準是否一致,數據如下表。注意:不是檢驗這5個節(jié)目之間實際是否存在顯著的差異。,SPSS操作,式中:K為樣本數;n為樣本容量;,多配對樣本的CochranQ檢驗,該檢驗處理的數據是二值的(0和1)。其零假設:樣本來自的多配對總體分布無顯著差異。,例題,為第j列取值為1的個數;為第i行取值為1的個數。,,例題:消費者協(xié)會調查了顧客對3種品牌電視機的滿意程度,共有10個顧客參與了滿意度的調查,數據如下表所示:,SPSS操作,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 非參數假設檢驗 參數 假設檢驗
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://ioszen.com/p-3490340.html