高考數(shù)學(xué)總復(fù)習(xí) 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 理.ppt
《高考數(shù)學(xué)總復(fù)習(xí) 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 理.ppt》由會員分享,可在線閱讀,更多相關(guān)《高考數(shù)學(xué)總復(fù)習(xí) 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 理.ppt(42頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第 10 講,回歸分析與獨立性檢驗,1.會作兩個有關(guān)聯(lián)變量數(shù)據(jù)的散點圖,會利用散點圖認(rèn)識變量間的相關(guān)關(guān)系. 2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程. 3.了解下列一些常見的統(tǒng)計方法,并能應(yīng)用這些方法解決一些實際問題. (1)了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應(yīng)用. (2)了解假設(shè)檢驗的基本思想、方法及其簡單應(yīng)用. (3)了解回歸的基本思想、方法及其簡單應(yīng)用.,1.變量間的關(guān)系,(1)常見的兩變量之間的關(guān)系有兩類:一類是函數(shù)關(guān)系,另 一類是相關(guān)關(guān)系;與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種非確定性 關(guān)系.,(2)將樣本中 n 個數(shù)據(jù)點(xi,yi)(i=1,2,…,n)描在平面直 角坐標(biāo)系中,表示兩個變量關(guān)系的一組數(shù)據(jù)的圖形叫做散點圖.,(3)正相關(guān)、負(fù)相關(guān).,在散點圖中,點散布在從左下角到右上角的區(qū)域,對于兩,個變量的這種相關(guān)關(guān)系稱為正相關(guān).,在散點圖中,點散布在從左上角到右下角的區(qū)域,兩個變,量的這種相關(guān)關(guān)系稱為負(fù)相關(guān).,2.回歸分析,(1)定義:對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種,常用方法.,(2)線性相關(guān)關(guān)系:,觀察散點圖的特征,如果散點圖中點的分布從整體上看大 致在一條直線附近,我們就稱這兩個變量之間具有線性相關(guān)關(guān) 系,這條直線叫做回歸直線.,(3)回歸直線的求法:,當(dāng) r0 時,表明兩個變量________.,負(fù)相關(guān),r 的絕對值越接近于 1,表明兩個變量的線性相關(guān)性越強. r 的絕對值越接近于 0,表明兩個變量之間幾乎不存在線性相關(guān) 關(guān)系.通常|r|大于 0.75 時,認(rèn)為兩個變量有很強的線性相關(guān)性.,(5)相關(guān)指數(shù):,R2 的值越大,說明殘差平方和越小,也就是說模型的擬合 效果越好.在線性回歸模型中,R2 表示解釋變量對于預(yù)報變量 變化的貢獻率,R2 越接近于 1,表示回歸的效果越好. 3.獨立性檢驗 (1)分類變量:變量的不同“值”表示個體所屬的不同類 別,像這類變量稱為分類變量.,(2)列聯(lián)表:列出兩個分類變量的頻數(shù)表,稱為列聯(lián)表.假 設(shè)有兩個分類變量X 和Y,它們的可能取值分別為{x1,x2}和{y1, y2},其樣本頻數(shù)列聯(lián)表(稱為 22 列聯(lián)表)為,22 列聯(lián)表,a+b+c+d,(3)獨立性檢驗: 利用隨機變量 K2 來判斷“兩個分類變量有關(guān)系”的方法 稱為獨立性檢驗.,1.有關(guān)線性回歸的說法,不正確的是(,),D,A.相關(guān)關(guān)系的兩個變量是非確定關(guān)系 B.散點圖能直觀地反映數(shù)據(jù)的相關(guān)程度 C.回歸直線最能代表線性相關(guān)的兩個變量之間的關(guān)系 D.散點圖中的點越集中,兩個變量的相關(guān)性越強,2.(2013 年湖北)四名同學(xué)根據(jù)各自的樣本數(shù)據(jù)研究變量 x, y 之間的相關(guān)關(guān)系,并求得回歸直線方程,分別得到以下四個 結(jié)論:,其中一定不正確的結(jié)論的序號是(,),D,A.①②,B.②③,C.③④,D.①④,3.通過隨機詢問 110 名性別不同的大學(xué)生是否愛好某項運 動,得到如下的列聯(lián)表:,附表:,參照附表,得到的正確結(jié)論是(,),A,A.有 99%以上的把握認(rèn)為“愛好該項運動與性別有關(guān)” B.有 99%以上的把握認(rèn)為“愛好該項運動與性別無關(guān)” C.在犯錯誤的概率不超過 0.1%的前提下,認(rèn)為“愛好該 項運動與性別有關(guān)” D.在犯錯誤的概率不超過 0.1%的前提下,認(rèn)為“愛好該 項運動與性別無關(guān)”,P(K2≥k),4.(2013 年廣東江門一模)某產(chǎn)品的廣告費用 x 與銷售額 y 的統(tǒng)計數(shù)據(jù)如下表:,65.5,考點 1,線性回歸分析,例 1:已知 x 與 y 之間的幾組數(shù)據(jù)如下表:,答案:C,【互動探究】 1.(2014年湖北)根據(jù)如下樣本數(shù)據(jù):,解析:依題意,畫散點圖,如圖 D52,兩個變量負(fù)相關(guān),,圖 D52,答案:A,考點 2,獨立性檢驗,例 2:(2014 年安徽)某高校共有 15 000 人,其中男生有 10 500 人,女生有 4500 人,為調(diào)查該校學(xué)生每周平均體育運動時 間的情況,采用分層抽樣的方法,收集 300 位學(xué)生每周平均體 育運動時間的樣本數(shù)據(jù)(單位:小時). (1)應(yīng)收集多少位女生樣本數(shù)據(jù)? (2)根據(jù)這 300 個樣本數(shù)據(jù),得到學(xué)生每周平均體育運動時 間的頻率分布直方圖(如圖 9-10-1),其中樣本數(shù)據(jù)分組區(qū)間為: [0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計該校學(xué)生每周 平均體育運動時間超過 4 個小時的概率.,圖 9-10-1,(3)在樣本數(shù)據(jù)中,有 60 位女生的每周平均體育運動時間 超過 4 個小時.請完成每周平均體育運動時間與性別的列聯(lián)表, 并判斷是否有 95%的把握認(rèn)為“該校學(xué)生的每周平均體育運動 時間與性別有關(guān)”.,,解:(1)應(yīng)收集女生樣本數(shù)據(jù)為 300,4500 15 000,=90.,(2)由頻率分布直方圖,得 1-2(0.100+0.025)=0.75,所 以該校學(xué)生每周平均體育運動時間超過 4 個小時的概率為 0.75.,P(K2≥k0),(3)由(2)知,300 名學(xué)生中有 3000.75=225 名學(xué)生每周平 均體育運動時間超過 4 個小時,75 名學(xué)生每周平均體育運動時 間不超過 4 個小時,又因為該數(shù)據(jù)中有男生 210 名,女生 90 名, 根據(jù)題意列表如下:,每周平均體育運動時間與性別列聯(lián)表,因此有 95%的把握認(rèn)為“該校學(xué)生的每周平均體育運動時 間與性別有關(guān)”.,【規(guī)律方法】解決獨立性檢驗問題的一般步驟: ①制作列聯(lián)表;,要精確到小數(shù)點后三位; ③查表得出結(jié)論,要選擇滿足條件P(K2k0)=α的k0 作為拒 絕域的臨界值.,【互動探究】 2.(2014 年江西)某人研究中學(xué)生的性別與成績、視力、智 商、閱讀量這 4 個變量之間的關(guān)系,隨機抽查 52 名中學(xué)生,得 到統(tǒng)計數(shù)據(jù)如表 1 至表 4,這與性別有關(guān)聯(lián)的可能性最大的變,量是(,),A.成績,B.視力,C.智商,D.閱讀量,答案: D,考點 3,回歸分析的綜合運用,例 3:某興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少 之間的關(guān)系,他們分別到氣象局與某醫(yī)院抄錄了 1 至 6 月份每 月 10 日的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資 料:,該興趣小組確定的研究方案是:先從這六組數(shù)據(jù)中選取 2 組,用剩下的 4 組數(shù)據(jù)求線性回歸方程,再用被選取的 2 組數(shù) 據(jù)進行檢驗. (1)求選取的 2 組數(shù)據(jù)恰好是相鄰兩個月的概率; (2)若選取的是 1 月與 6 月的兩組數(shù)據(jù),請根據(jù) 2 至 5 月份 的數(shù)據(jù),求出 y 關(guān)于 x 的線性回歸方程^y=b^x+a^; (3)若由線性回歸方程得到的估計數(shù)據(jù)與所選出的檢驗數(shù) 據(jù)的誤差均不超過 2 人,則認(rèn)為得到的線性回歸方程是理想的, 試問該小組所得線性回歸方程是否理想?,(2)回歸分析是處理變量相關(guān)關(guān)系的一種數(shù)學(xué)方法.主要解 決:①確定特定量之間是否有相關(guān)關(guān)系,如果有,就找出它們 之間的數(shù)學(xué)表達(dá)式;②根據(jù)一組觀察值,預(yù)測變量的取值及判 斷變量取值的變化趨勢;③求出回歸直線方程.,【互動探究】,3.(2014年新課標(biāo)Ⅱ)某地區(qū)2007年至2013年農(nóng)村居民家庭人均收入y(單位:千元)的數(shù)據(jù)如下表:,(1)求y關(guān)于t的線性回歸方程; (2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況,并預(yù)測該地區(qū)2015年農(nóng)村居民家庭人均收入.,●易錯、易混、易漏●,⊙對回歸分析的理解,例題:(2015 年廣東廣州調(diào)研)某位同學(xué)進行寒假社會實踐 活動,為了對白天平均氣溫與某奶茶店的某種飲料銷量之間的 關(guān)系進行分析研究,他分別記錄了 1 月 11 日至 1 月 15 日的白 天平均氣溫(單位:℃)與該奶茶店的這種飲料銷量(單位:杯), 所得數(shù)據(jù)如下表:,(1)若從這 5 組數(shù)據(jù)中隨機抽出 2 組,求抽出的 2 組數(shù)據(jù)恰 好是相鄰 2 天數(shù)據(jù)的概率;,解:(1)設(shè)“選取的 2 組數(shù)據(jù)恰好是相鄰 2 天數(shù)據(jù)”為事件 A. 所有基本事件(m,n)(其中m,n 為1 月份的日期數(shù))有(11,12), (11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14), (13,15),(14,15),共 10 種.,事件 A 包括的基本事件有(11,12),(12,13),(13,14),(14,15), 共 4 種.,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 高考數(shù)學(xué)總復(fù)習(xí) 第九章 概率與統(tǒng)計 第10講 回歸分析與獨立性檢驗課件 高考 數(shù)學(xué) 復(fù)習(xí) 第九 概率 統(tǒng)計 10 回歸 分析 獨立性 檢驗 課件
鏈接地址:http://ioszen.com/p-2330817.html