社會科學(xué)研究方法(全套課件)
社會科學(xué)研究方法(全套課件),社會科學(xué),研究,鉆研,方法,法子,全套,課件
實(shí)證研究方法與軟件,Chapter7 數(shù)據(jù)分析一:單變量分析,一、資料簡化的基本技術(shù) 二、集中趨勢測量 三、離散趨勢測量 四、單變量推論統(tǒng)計(jì),1、頻數(shù)分布 2、頻率分布 3、累計(jì)頻數(shù)和累計(jì)百分率 4、對比值,一、數(shù)據(jù)簡化的基本技術(shù),所謂頻數(shù)分布(Frequency Distribution),是指一組數(shù)據(jù)中取不同值的個(gè)案的次數(shù)分布情況,通常以頻數(shù)分布表的形式表達(dá)。 頻數(shù)分布表的主要作用是簡化資料,可以清楚地了解到調(diào)查數(shù)據(jù)所放映出的信息。,1、頻數(shù)分布(簡寫f),2、頻率分布(簡寫%) 所謂頻率分布(Percentages Distribution),指的就是一組數(shù)據(jù)中不同取值的頻數(shù)相對于總數(shù)的比率分布情況。 頻數(shù)分布是不同類別在總體中的絕對數(shù)量分布,而頻率分布則是不同類別在總體中的相對分布(相對比重)。 通過頻率分布,可以比較同一類別在不同整體中的分布情況的異同。,累計(jì)次數(shù)(簡寫成cf),就是把次數(shù)向上或向下逐級累加起來,向上的叫向上累計(jì)次數(shù)(cf↑),向下的叫向下累計(jì)次數(shù)(cf↓)。 累計(jì)百分率(簡寫成c%),就是把各級的百分率數(shù)值向上或向下逐級累加起來。 適用于定序、定距層次而不適用于定類層次的統(tǒng)計(jì)分析方法。,3、累計(jì)頻數(shù)和累計(jì)百分率,調(diào)查對象文化程度分布,4、對比值,所謂對比值就是兩變量值的比值。 例如某大學(xué)有男生18000人、女生6000人,則該校男生與女生的對比值就是3:1,即每有1名女生就有3名男生。 新生人口的性別比通常用對比值表示。如新生嬰兒性別比為108,即表示新生男、女嬰兒比為108 :100,亦即每出生100名女嬰,就有108名男嬰出生。,,比 例: 百分率: 千分率: 萬分率:,,,,二、 統(tǒng)計(jì)數(shù)據(jù)的表現(xiàn)形式,統(tǒng)計(jì)表 (一)統(tǒng)計(jì)表的構(gòu)成 按形式: 標(biāo)題——總標(biāo)題、橫欄標(biāo)題、 縱列標(biāo)題、 指標(biāo)數(shù)值 按內(nèi)容: 主詞 主欄 賓詞 賓欄,例2.9 中國1999年國內(nèi)生產(chǎn)總值,,,主詞,賓詞,,橫行標(biāo)題,縱行標(biāo)題,,,總標(biāo)題,(二)統(tǒng)計(jì)表的分類,按主詞是否分組及分組標(biāo)志的多少: 1、簡單表:未經(jīng)整理分組的統(tǒng)計(jì)表 2、分組表:按一個(gè)標(biāo)志分組的統(tǒng)計(jì)表 3、復(fù)合表:按兩個(gè)以上標(biāo)志分組的統(tǒng)計(jì)表,例2.10 中國1999年國內(nèi)生產(chǎn)總值,交叉分組列表是一種可以同時(shí)概括兩個(gè)變量的數(shù)據(jù)的方法。,復(fù)合表:交叉分組列表,表格的左邊和上邊分別表示: 兩個(gè)變量的分組情況。,居住狀態(tài) 口味感覺 1 長住者 味道好 2 長住者 味道好 3 長住者 味道不好 4 暫住者 味道不好 5 長住者 味道好 6 長住者 味道好 7 暫住者 味道好 8 暫住者 味道不好 9 暫住者 味道不好 10 長住者 味道好,居住狀態(tài) 口味感覺 11 暫住者 味道好 12 暫住者 味道好 13 長住者 味道好 14 長住者 味道好 15 長住者 味道不好 16 暫住者 味道不好 17 暫住者 味道好 18 暫住者 味道好 19 長住者 味道不好 20 長住者 味道不好,某飯店顧客滿意情況調(diào)查,(三)統(tǒng)計(jì)表的編制規(guī)則,1、統(tǒng)計(jì)表一般左右兩端不封閉; 2、統(tǒng)計(jì)表的標(biāo)題要力求簡明、確切; 3、內(nèi)容簡明,不要羅列太多和過于龐雜; 4、統(tǒng)計(jì)表欄數(shù)較多時(shí),須加編號; 5、數(shù)字填寫規(guī)則; 6、計(jì)量單位填寫規(guī)則; 7、應(yīng)注明注解或資料來源。,不同的刻度,圖形的改善,多余的筆墨,50年前,現(xiàn)在,A國,B國,A國,B國,驚人的人口增長,二、集中趨勢測量,所謂集中趨勢測量法,就是找出一個(gè)典型值或代表值來代表變量的分布,以反映這組數(shù)據(jù)向這個(gè)典型值集結(jié)的情況。 當(dāng)根據(jù)這個(gè)典型值來估計(jì)或預(yù)測每個(gè)研究對象(即個(gè)案)的數(shù)值時(shí),所發(fā)生的錯(cuò)誤的總和是最小的。,,1.眾數(shù)(Mode) 2.中位數(shù)(Median) 3.均值(Mean),所謂眾數(shù)(簡寫成Mo),簡單說就是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的值。 求眾數(shù)的步驟是這樣: 首先將原始數(shù)據(jù)制成頻數(shù)分布表; 然后在頻數(shù)一欄中找出最大的頻數(shù); 最后找到最大的頻數(shù)所對應(yīng)的標(biāo)志值,這一標(biāo)志值就是眾數(shù)。,1.眾數(shù)(Mode),Mo=瓦房店市,由組距分組資料求眾數(shù)的方法:組中值法 首先也通過觀察找出最高的頻數(shù); 然后根據(jù)最高的頻數(shù)找到它所對應(yīng)的組; 最后求出該組的組中值即為眾數(shù)。 眾數(shù)適合于分析定類變量,當(dāng)然也可以用來分析定序、定距變量的資料。,,Mo=7500or 公式,所謂中位數(shù)(簡寫成Md),就是在一個(gè)按值的大小順序排列的序列中位于中央位置的哪個(gè)數(shù)值。 其意義是:在整個(gè)數(shù)據(jù)中,有一半數(shù)據(jù)的值在它之上(比它大),另一半數(shù)據(jù)的值在它之下(比它小)。,2.中位數(shù)(Median),求算中位數(shù)的步驟是:先將各個(gè)數(shù)值按由小到大的順序排列起來,然后找出位于中央位置的那個(gè)值,即中位數(shù)。 某班5名學(xué)生的年齡由小到大排列如下: 16,17,18,19,20 Md位置=,(1)根據(jù)原始數(shù)據(jù)求算中位數(shù),,,某班有6名學(xué)生,其年齡由小到大分別是:16,17,18,19,20,21 則Md位置=(6+1)/2=3.5, 即中央位置位于第三學(xué)生和第四學(xué)生之間, 所以Md=(18+19)/2=18.5。,在一組數(shù)據(jù)中,可能有許多相同的數(shù)值。如果是這種情況,可以先統(tǒng)計(jì)出次數(shù)分布,然后求出中位數(shù)。 其步驟也是先求出數(shù)據(jù)序列的中間位置,然后再找出其所對應(yīng)的值即中位數(shù)。 某班有35名學(xué)生,其年齡分布在17—20歲之間,各年齡的人數(shù)如表4-8所示。求該班學(xué)生年齡分布的中位數(shù)?,某班學(xué)生年齡情況的頻數(shù)分布表,第一步是先算出中位數(shù)所在的中央位置:Md位置=(35+1)/2=18,即第18個(gè)數(shù)值所在位置。 第二步就是列出累加次數(shù),可以從上到下列出向上累加次數(shù)(如表中第三列),也可以從下往上列出向下累加次數(shù)(如表中第四列)。 第三步我們從上往下找(或從下往上找),看所計(jì)算出的中間位置最先落入哪個(gè)累加次數(shù)內(nèi),再由此找出相對應(yīng)的中位數(shù)。,具體方法是先列出累加次數(shù),然后按上述方法確定中位數(shù)所在的組,最后利用下述公式計(jì)算出中位數(shù)的值: 中位數(shù)Md= L為中位數(shù)所在組的下限值,N為全部個(gè)案數(shù)目, 為中位數(shù)所在組的頻數(shù), 為中位數(shù)所在組前一組的累計(jì)次數(shù),w為中位數(shù)所在組的組距。,(2)用分組資料求算中位數(shù),,,,某系有100名學(xué)生,調(diào)查資料顯示各學(xué)生的月均生活費(fèi)在100—800元之間,以100元為間距分組統(tǒng)計(jì)結(jié)果如下表所示:,某系學(xué)生月均生活費(fèi)情況頻數(shù)分布表,,,根據(jù)上表來求中位數(shù): 第一步,列出向上累加次數(shù)(表中第四列數(shù)值),然后求出中位數(shù)的位置: Md位置=(100+1)/2=50.5 第二步,根據(jù)向上累加次數(shù)分布,第50.5個(gè)數(shù)值在第三組即300—400的組內(nèi)。 第三步,利用上述公式計(jì)算出中位數(shù)的值:,中位數(shù)=,,=391(元),均值即平均數(shù)是使用的最多的統(tǒng)計(jì)值。 定距變量數(shù)據(jù)可以做加減運(yùn)算,因此可以將變量的各個(gè)數(shù)值加起來,所得之和再除以調(diào)查對象數(shù)目,求得一個(gè)平均的數(shù)值,這就是平均數(shù)(簡寫成 )。,3.均值(Mean),,(1)根據(jù)原始數(shù)據(jù)求算平均數(shù)。這種情況下求算平均數(shù)的公式是:,,其中Σx表示各個(gè)個(gè)案數(shù)值之和,n表示全部個(gè)案數(shù)目。,某班8名學(xué)生的年齡分別是: 18、19、20、21、20、18、17 根據(jù)公式他們的平均年齡是: =(18+19+19+20+21+20+18+17)/8=19 從這個(gè)結(jié)果知這8名學(xué)生的平均年齡是19歲。,,平均數(shù)表明了資料的集中趨勢,有估計(jì)或預(yù)測作用。例如從8名學(xué)生中任意抽取一名學(xué)生,應(yīng)估計(jì)其年齡是19歲。從長遠(yuǎn)來看,用平均數(shù)來估計(jì)定距變量的資料,可能犯的錯(cuò)誤最小。,當(dāng)一組數(shù)據(jù)中出現(xiàn)很多相同的數(shù)值時(shí),則可以先統(tǒng)計(jì)出次數(shù)(f)的分布,再求取次數(shù)與相對應(yīng)標(biāo)志值之間的乘積(fx),然后用各個(gè)乘積的總和除以個(gè)案總數(shù)(即頻數(shù)之和)得出平均數(shù),其公式是:,,,可見該班學(xué)生的平均年齡是18.3歲。,某班學(xué)生年齡情況的頻數(shù)分布表,在調(diào)查收入、年齡等方面情況時(shí),常常得到組距形式的資料。這種情況下求算平均數(shù)的公式是:,(2)根據(jù)分組資料求出平均數(shù),,,其中f表示每組的次數(shù), 表示組中值,n表示個(gè)案數(shù)。,,某系學(xué)生月均生活費(fèi)情況頻數(shù)分布表,,,小結(jié):,總的來說,如果對調(diào)查資料進(jìn)行集中趨勢測量,一般情況下: 定類變量的測量可以用眾數(shù); 定序變量可以用眾數(shù),但以中位數(shù)較適宜,; 定距變量可以用眾數(shù),也可以用中位數(shù),但以平均數(shù)最適宜。,三、離散趨勢測量,所謂離散趨勢測量,就是求出特別的數(shù)值來表示一個(gè)變量的個(gè)案與個(gè)案之間的差異情況,反映這一組數(shù)據(jù)相互之間的離散程度。 這種測量方法,與集中趨勢測量法相互補(bǔ)充,從兩個(gè)不同的側(cè)面描述和揭示一組數(shù)據(jù)的分布情況,共同反映出資料分布的特征。,集中趨勢測量法所求出的是一個(gè)最能代表變量數(shù)據(jù)資料集中情況的值,但其代表性往往取決于個(gè)案之間的差異情況,即離散程度。如果個(gè)案相互之間的差異很大,那么眾數(shù)、中位數(shù)或平均數(shù)的代表性就會大打折扣。,某學(xué)校舉行智力競賽,各系選派5名學(xué)生參加。結(jié)果其中有三個(gè)系的成績分別如下: 社科系:76 78 81 82 83 數(shù)學(xué)系:62 74 80 86 98 化學(xué)系:32 78 91 99 100,,雖然這三個(gè)系參賽隊(duì)的平均成績都是80分,但顯然這個(gè)80分對社科系參賽隊(duì)選手的成績的代表性最高,而對化學(xué)系參賽隊(duì)選手的代表性最低。,離散指標(biāo),1、定類變量:異眾比率(V) 2、定序變量:四分位差(Q) 3、定距變量:全距(極差)標(biāo)準(zhǔn)差(S)(方差 S2) 4、離散系數(shù)CV,1.定類變量:異眾比率(V),所謂異眾比率(簡寫成V),就是一組數(shù)據(jù)中非眾數(shù)的次數(shù)相對于總體全部個(gè)案的比例。其計(jì)算公式是:,,N是全部個(gè)案數(shù)目, 是眾數(shù)的次數(shù),二者之差(N- )就是非眾數(shù)的次數(shù)。,,例:前述大連市公眾科學(xué)素養(yǎng)調(diào)查調(diào)查對象居住地中,Mo=瓦房店市,其異眾比率為:,,當(dāng)異眾比率越大,眾數(shù)的代表性也就越小。 當(dāng)異眾比率越小,則眾數(shù)的代表性就越大。,,,2.定序變量:四分位差(Q),所謂四分位差,就是先將一組數(shù)據(jù)由小到大排列起來,然后將其四等分(即每個(gè)等分包含25%的個(gè)案),則第一個(gè)四分位置的值(Q1)與第三個(gè)四分位置的值(Q3)的差異,就是四分位差(簡寫成Q)。,,,,,,,Q1,Q2(Md),Q3,25%,25%,25%,25%,Q=Q3-Q1,在上圖所表示的四個(gè)等分中,Q2就是中位數(shù)(Md),其兩邊各有50%的個(gè)案。而且在中位數(shù)的兩旁的Q1和Q3之間,也共有50%(25%+25%)的個(gè)案。 四分位差的意義就在于,Q1與Q3的差異越大,即四分位差越大,就表示有50%的個(gè)案分布就越遠(yuǎn)離中位數(shù),因而中位數(shù)的代表性就越小,用它來估計(jì)或預(yù)測所犯的錯(cuò)誤就會越大。,求算四分位差時(shí)。首先要求出Q1的位置和Q3的位置,公式分別是:,,然后計(jì)算出在這兩個(gè)位置上的值的差異,結(jié)果即四分位差。,例: 某甲班11名學(xué)生年齡如下:17歲、18歲、18歲、19歲、19歲、20歲、20歲、21歲、21歲、22歲、22歲, 求其四分位差。,第一步:求出Q1、Q3的位置,,,第二步:找到數(shù)值數(shù)列中Q1、Q3所對應(yīng)的數(shù)值 Q1=18 Q3=21,第三步:計(jì)算出四分位差 Q=Q3-Q1=21-18=3,3.定距變量:標(biāo)準(zhǔn)差(S)(方差 S2),對于定距變量,測量離散程度最簡單的方法是計(jì)算全距(又叫極差),即一組數(shù)據(jù)中最大值與最小值之差。 社科系:83-76=7(分) 數(shù)學(xué)系:98-62=36(分) 化學(xué)系:100-32=68(分) 由于全距只考慮兩個(gè)極端的數(shù)值,而沒有考慮到其它數(shù)值,因此代表性不高。,所謂標(biāo)準(zhǔn)差(簡寫成S),就是先將一組數(shù)據(jù)中各數(shù)據(jù)(x)與其平均數(shù)( )之差的平方和除以全部個(gè)案數(shù)目(N),再取其平方根。其計(jì)算公式為:,,,,公式中,x與 的差就表示以平均數(shù)為代表值時(shí)會引起的偏差或錯(cuò)誤。,,如果公式不開方,即方差S2,含義相同。,標(biāo)準(zhǔn)差的意義就在于,如果其值越大,即各個(gè)數(shù)值與平均數(shù)的差的總和越大,就表明變量數(shù)值的離散程度越大,而平均數(shù)的代表性就越低; 相反,標(biāo)準(zhǔn)差的值越小,就表明變量數(shù)值的離散程度越小,而平均數(shù)的代表性也就越高。,(1)根據(jù)原始數(shù)據(jù)求算標(biāo)準(zhǔn)差:直接運(yùn)用公式,,,,,,,,對于有頻數(shù)分布的資料,求算其標(biāo)準(zhǔn)差的公式稍有不同:,,,其中f是x所對應(yīng)的頻數(shù)。,某班學(xué)生年齡情況的頻數(shù)分布表,,,(2)根據(jù)組距分組資料求算標(biāo)準(zhǔn)差,這種情況下求算標(biāo)準(zhǔn)差的公式如下:,,,其中 是每一組的組中值,f是該組的次數(shù)。,,某系學(xué)生月均生活費(fèi)情況頻數(shù)分布表,,,4、離散系數(shù)CV,離散系數(shù)也稱為變差系數(shù),是一種相對的離散量數(shù)。它使我們能夠?qū)ν豢傮w中兩種不同的離散量數(shù)進(jìn)行比較,或者對兩個(gè)不同總體中的同一離散量數(shù)進(jìn)行比較。 定義(計(jì)算):標(biāo)準(zhǔn)差與平均數(shù)的比值,用百分比表示。,,例:一項(xiàng)調(diào)查結(jié)果,某市人均月收入為920元,標(biāo)準(zhǔn)差為170元;人均住房面積為12平方米,標(biāo)準(zhǔn)差為2.5平方米。試比較該市人均月收入和人均住房情況哪一個(gè)差異程度比較大。,人均月收入的離散系數(shù)為:,,人均住房面積的離散系數(shù)為:,,例:對廣州和武漢兩地居民生活質(zhì)量調(diào)查發(fā)現(xiàn),廣州居民月平均收入為2500元,標(biāo)準(zhǔn)差為450元;武漢居民平均收入為1500元,標(biāo)準(zhǔn)差為350元。試比較,廣州市和武漢市居民相互之間收入差異程度哪個(gè)更大一些。,,,案例 大學(xué)畢業(yè)生表現(xiàn),1、問題的提出 振興大學(xué)是一所綜合性大學(xué),有三個(gè)附屬學(xué)院,分別是商貿(mào)學(xué)院、生物學(xué)院和醫(yī)學(xué)院。近期該校管理層為了了解社會對本校學(xué)生的滿意程度,以此促進(jìn)本校教學(xué)改革,進(jìn)行了一項(xiàng)對本校畢業(yè)生的調(diào)查。調(diào)查者隨機(jī)抽查了48名畢業(yè)生組成樣本,要求他們所在的工作單位對其工作表現(xiàn)、專業(yè)水平和外語水平三個(gè)方面的表現(xiàn)進(jìn)行評分,評分由0到10,分值越大表明滿意程度越高。收集有關(guān)樣本數(shù)據(jù)如表3-1和表3-2。,續(xù)前表,表3-2 分學(xué)院評分匯總表,校管理層希望在調(diào)查分析報(bào)告中闡述以下幾個(gè)問題: 用人單位對該校畢業(yè)生哪個(gè)方面最為滿意?哪個(gè)方面最不滿意?應(yīng)在哪些方面做出教學(xué)改革? 用人單位對該校畢業(yè)生哪個(gè)方面的滿意程度差別最大?什么原因產(chǎn)生的? 社會對三個(gè)學(xué)院的畢業(yè)生的滿意程度是否一致?能否提出提高社會對該校畢業(yè)生的滿意程度的建議?,2、數(shù)據(jù)描述和分析,(1)從圖一可看出,隨機(jī)抽取的48名學(xué)生是由附屬商貿(mào)學(xué)院、生物學(xué)院和醫(yī)學(xué)院畢業(yè)生組成,各學(xué)院學(xué)生畢業(yè)生人數(shù)分別是17人、17人和14人,分別占樣本的35.4%、35.4%和29.2%,可見各學(xué)院抽取畢業(yè)生人數(shù)大致相同,樣本具有一定代表性。,表3-3 48名畢業(yè)生描述統(tǒng)計(jì)表,(2)從表3-3可以看出: 用人單位對振興大學(xué)畢業(yè)生的工作表現(xiàn)評估分最高,而外語水平評估分最低。兩者的平均評估分相差2.96分,由此可見用人單位最滿意該校畢業(yè)生的工作表現(xiàn),最不滿意畢業(yè)生的外語水平。這反映出畢業(yè)生適應(yīng)能力比較強(qiáng),也反映出振興大學(xué)在培養(yǎng)學(xué)生社會實(shí)踐能力方面卓有成效。從用人單位對畢業(yè)生外語水平評分普遍偏低看,反映出該校的外語教學(xué)方面存在嚴(yán)重問題,今后需要在外語方面加大力度進(jìn)行改革。,用人單位對振興大學(xué)畢業(yè)生的外語水平評估分差異最大,樣本評估分的標(biāo)準(zhǔn)差為1.77分,畢業(yè)生的外語水平評估分最高達(dá)9分,最低才2分,相差7分,這說明了振興大學(xué)畢業(yè)生外語程度相差懸殊,參差不齊,這可能是該校在招生中忽視對學(xué)生外語成績的考慮所致。,,,,商貿(mào)學(xué)院,生物學(xué)院,醫(yī)學(xué)院,表3-4,(3)用人單位對三個(gè)學(xué)院的畢業(yè)生評價(jià)是不一致的: 工作表現(xiàn)方面:三個(gè)學(xué)院畢業(yè)生在這一方面的表現(xiàn)相差不大,均達(dá)到了8分以上,受到用人單位好評。評估分最高的是醫(yī)學(xué)院的畢業(yè)生,平均分為8.14分,標(biāo)準(zhǔn)差為0.95分,是三個(gè)學(xué)院中離散程度最小的,可見該學(xué)院畢業(yè)生工作表現(xiàn)普遍較好。 專業(yè)水平方面:用人單位對三個(gè)學(xué)院畢業(yè)生專業(yè)方面的評價(jià)相差較大。評估分最高的同樣是醫(yī)學(xué)院的畢業(yè)生,平均分為7.21分,高出樣本總平均分0.83分,比生物學(xué)院高0.80分,比商貿(mào)學(xué)院則高出1.39分;商貿(mào)學(xué)院畢業(yè)生的評分最低,平均分僅為5.82分,低于樣本平均分0.56分,但該學(xué)院評估分標(biāo)準(zhǔn)差為0.95分,是三個(gè)學(xué)院中最低的,說明該院學(xué)生在專業(yè)水平上的表現(xiàn)差別不大。 外語水平方面:三個(gè)學(xué)院外語水平都較差,且學(xué)生之間差異較大。表現(xiàn)最好的是生物學(xué)院的畢業(yè)生,平均分也僅為5.29分,該學(xué)院畢業(yè)生中評估分最高達(dá)到了9分,最低是3分,相差6分;而醫(yī)學(xué)院畢業(yè)生的評估分最低,平均分僅為3.86分,比樣本平均分低1.22分,在工作表現(xiàn)及專業(yè)水平兩個(gè)方面,社會對振興大學(xué)的醫(yī)學(xué)院畢業(yè)生評估分最高,這說明該學(xué)院的工作實(shí)踐能力較強(qiáng),專業(yè)基礎(chǔ)知識扎實(shí),但學(xué)生的外語水平最差,反映出該學(xué)院在外語教學(xué)或招生工作中存在很大的問題,因此,作為校管理層應(yīng)深入調(diào)查,查明原因,盡快對該學(xué)院外語教學(xué)工作進(jìn)行改革,或在招生中把好關(guān),擇優(yōu)錄取新生,以便提高該學(xué)院學(xué)生綜合素質(zhì)。 其次商貿(mào)學(xué)院畢業(yè)生的專業(yè)水平評分最低,說明該學(xué)院專業(yè)知識的教學(xué)工作存在問題,需要盡快更新教材,加強(qiáng)對教師的培訓(xùn),注重學(xué)生經(jīng)濟(jì)理論知識的學(xué)習(xí)和擴(kuò)大學(xué)生的知識面。 同時(shí)值得注意的是,三個(gè)學(xué)院的外語水平普遍較低,這一點(diǎn)應(yīng)當(dāng)引起校方的足夠重視,采取有效措施,改變現(xiàn)狀。,綜上所述:,四、單變量推論統(tǒng)計(jì),抽樣調(diào)查的目的和作用決定了,對樣本的統(tǒng)計(jì)和描述不是最終目的,而是希望通過樣本來了解總體特征和狀況。 單變量推論統(tǒng)計(jì)就是用來解決由樣本推論總體的問題,即以樣本的統(tǒng)計(jì)值來估計(jì)總體的參數(shù)值。 主要兩種類型:點(diǎn)值估計(jì)和區(qū)間估計(jì),1、點(diǎn)值估計(jì)(point estimation),點(diǎn)值估計(jì),就是以一個(gè)適當(dāng)?shù)臉颖窘y(tǒng)計(jì)值來代表總體的參數(shù)值。 例如,大連市首次公眾科學(xué)素養(yǎng)調(diào)查得到樣本科學(xué)素養(yǎng)水平為2.5%,則認(rèn)為大連市總體公眾科學(xué)素養(yǎng)水平為2.5%。 一般說來,樣本規(guī)模愈大,且抽樣方法愈嚴(yán)謹(jǐn),這種估計(jì)方法愈可信。,不同的統(tǒng)計(jì)值在估計(jì)其總體值時(shí)所犯的偏差也不同。例如均值和比例的準(zhǔn)確程度高于標(biāo)準(zhǔn)差。,2、區(qū)間估計(jì)(interval estimation),區(qū)間估計(jì),就是在一定的可信度(置信度)下,用樣本統(tǒng)計(jì)值的某個(gè)范圍(置信區(qū)間)來估計(jì)總體的參數(shù)值。(“框”?。?范圍的大小反映的是這種估計(jì)的精確性問題,而可信度高低反映的則是這種估計(jì)的可靠性或把握性問題。,一般表述: ——我們有95%的把握認(rèn)為,全市職工的月均工資收入在920元至1050元之間; ——全省人口中,男性占50%至52%的可能性為99%。,常用的置信度分別為90%、95%和99%,與它們所對應(yīng)的允許誤差(α)則分別為10%、5%和1%。在計(jì)算中,置信度常用1- α來表示: 1-0.1~90%——標(biāo)準(zhǔn)值Z=1.65 1-0.05~95%——標(biāo)準(zhǔn)值Z=1.96 1-0.01~99%——標(biāo)準(zhǔn)值Z=2.58,(1)總體均值的區(qū)間估計(jì),總體均值的區(qū)間估計(jì)公式為:,,,,,為樣本平均數(shù),,為樣本標(biāo)準(zhǔn)差,為置信度1-α所對應(yīng)的標(biāo)準(zhǔn)值Z,為樣本規(guī)模,例:從某高校2萬名學(xué)生中按照簡單隨機(jī)抽樣方法抽取900(3600)人進(jìn)行月均消費(fèi)水平情況調(diào)查,得到月均消費(fèi)額是450元,標(biāo)準(zhǔn)差是30元,求在95%(99%)的置信度下,全校學(xué)生月均消費(fèi)水平的置信區(qū)間。,將已知數(shù)據(jù)代入公式可求得置信區(qū)間:,,,,,對這個(gè)結(jié)果的解釋是,抽樣調(diào)查的誤差范圍是1.96,根據(jù)這個(gè)樣本估計(jì)全校學(xué)生月均消費(fèi)水平在448.04元至451.96元之間,這樣估計(jì)的可靠性程度(成功的可能性)為95%,錯(cuò)誤的可能性有5%,或者說有95%的把握說,全校學(xué)生月均消費(fèi)水平在448.04元至451.96元之間。,如果置信度不是95%,而是99%,則Z=2.58,相應(yīng)地,全校學(xué)生月均消費(fèi)水平的置信區(qū)間就變?yōu)椋?如我們把樣本規(guī)模增加到3600,則95%置信度下的置信區(qū)間就會由原來的448.04~451.96元縮小為449.02~450.98元。這也告訴我們,在置信度一定的條件下,可以通過增加樣本的規(guī)模來減少抽樣誤差,增加估計(jì)的精確度。,,(2)總體百分?jǐn)?shù)的區(qū)間估計(jì),總體百分?jǐn)?shù)的區(qū)間估計(jì)公式為:,,,,為置信度1-α所對應(yīng)的標(biāo)準(zhǔn)值Z,為樣本規(guī)模,為樣本中的百分?jǐn)?shù),例:從某高校中2萬名學(xué)生中按照簡單隨機(jī)抽樣方法抽取900(3600)人調(diào)查,樣本中有60%的學(xué)生是來自農(nóng)村,求在95%(99%)的置信度下,全校學(xué)生來自農(nóng)村比例的置信區(qū)間。,對結(jié)果的解釋是:根據(jù)這個(gè)樣本估計(jì)全校學(xué)生家庭所在地是農(nóng)村的比率在56.8%至63.2%之間,這樣估計(jì)的可靠性為95%,錯(cuò)誤的可能性為5%;或者有95%的把握說,該高校學(xué)生有56.8%至63.2%的來自農(nóng)村。 如果置信度提高為99%,則估計(jì)區(qū)間變?yōu)?5.8%至64.2%之間; 如果調(diào)查對象增加為3600,則估計(jì)區(qū)間變?yōu)?8.4%至61.6%之間。,
收藏