《2012《新高考全案》高考數(shù)學(xué) 13-4統(tǒng)計案例獨立性試驗與線性回歸課件 人教版》由會員分享,可在線閱讀,更多相關(guān)《2012《新高考全案》高考數(shù)學(xué) 13-4統(tǒng)計案例獨立性試驗與線性回歸課件 人教版(34頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、 1回歸分析:對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法叫做 2回歸直線:由兩個變量得到的散點圖的分布如果在一條直線附近,我們稱這兩個變量之間具有 ,這條直線叫回歸直線回歸分析線性相關(guān)關(guān)系 就說 越好擬合效果 7兩個臨界值:3.841與6.635經(jīng)過對X2統(tǒng)計量的分布研究,已經(jīng)得到了兩個臨界值:,當(dāng)根據(jù)具體的數(shù)據(jù)算出的 時,有;當(dāng) 時,有,當(dāng),認(rèn)為3.841與6.635 X23.84195%的把握說事件A與B有關(guān)X26.63599%的把握說事件A與B有關(guān)X23.841事件A與B是無關(guān)的 1如果有95%的把握說事件A和B有關(guān)系,那么具體計算出的數(shù)據(jù)() AK23.841BK23.841 CK26
2、.635 DK26.635 解析比較K2的值和臨界值的大小,有95%的把握則K23.841,K26.635就約有99%的把握 答案A 2甲、乙、丙、丁四位同學(xué)各自對A、B兩變量的線性相關(guān)性作試驗,并用回歸分析方法分別求得相關(guān)系數(shù)r與殘差平方和m如下表:則哪位同學(xué)的試驗結(jié)果體現(xiàn)A、B兩變量更強的線性相關(guān)性?() A甲B乙 C丙D丁甲乙丙丁r 0.82 0.78 0.69 0.85m 106 115 124 103 解析由表可知,丁同學(xué)的相關(guān)系數(shù)r最大且殘差平方和m最小,故丁同學(xué)的試驗結(jié)果體現(xiàn)A、B兩變量更強的線性相關(guān)性 答案D 3為了解某班學(xué)生喜歡打籃球是否與性別有關(guān),對本班50人進行了問卷調(diào)查
3、得到了下表:下面的臨界值表供參考:喜愛打籃球不喜愛打籃球合計男生20 5 25女生10 15 25 合計30 20 50P(K2k) 0.15 0.10 0.05 0.025 0.010 0.005 0.001k 2.072 2.706 3.841 5.024 6.635 7.879 10.828 答案8.333;99.5 調(diào)查某醫(yī)院某段時間內(nèi)嬰兒出生的時間與性別的關(guān)系,得到如下數(shù)據(jù)試問能以多大把握認(rèn)為嬰兒的性別與出生時間有關(guān)系.出生時間性別晚上白天合計男嬰24 31 55女嬰8 26 34 點評與警示1.獨立性檢驗的關(guān)鍵是準(zhǔn)確的計算K2,在計算時,要充分利用22列聯(lián)表 2學(xué)習(xí)相關(guān)和無關(guān)的判定
4、一定要結(jié)合實際問題,從現(xiàn)實中尋找例子,從而增強學(xué)習(xí)數(shù)學(xué)的興趣 一臺機器使用時間較長,但還可以使用它按不同的轉(zhuǎn)速生產(chǎn)出來的某機械零件有一些會有缺點,每小時生產(chǎn)有缺點零件的多少,隨機器運轉(zhuǎn)的速度而變化,下表為抽樣試驗結(jié)果:轉(zhuǎn)速x(轉(zhuǎn)/秒) 16 14 12 8每小時生產(chǎn)有缺點的零件數(shù)y(件) 11 9 8 5 (1)對變量y與x進行相關(guān)性檢驗; (2)如果y與x有線性相關(guān)關(guān)系,求回歸直線方程; (3)若實際生產(chǎn)中,允許每小時的產(chǎn)品中有缺點的零件最多為10個,那么,機器的運轉(zhuǎn)速度應(yīng)控制在什么范圍內(nèi)? 分析利用相關(guān)系數(shù)r進行線性相關(guān)檢驗(也可利用散點圖)如果線性相關(guān),再求回歸直線方程并加以判斷 點評與
5、警示求回歸直線方程,一般先要考查y與x是否具有線性相關(guān)關(guān)系,可用相關(guān)系數(shù)法或散點圖法加以判斷若具有相關(guān)性,才求其回歸直線方程否則求回歸直線方程毫無意義最小二乘法和回歸直線方程 (1)最小二乘法是一種有效地求回歸方程的方法,它保證了各點與此直線在整體上最接近、最能反映樣本觀測數(shù)據(jù)的規(guī)律 (2009佛山一模)有甲乙兩個班級進行數(shù)學(xué)考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)秀統(tǒng)計成績后,得到如下的列聯(lián)表.優(yōu)秀非優(yōu)秀總計甲班10 乙班30合計105 解(1)優(yōu)秀非優(yōu)秀總計甲班10 45 55乙班20 30 50合計30 75 105 點評與警示1.在利用統(tǒng)計變量K2進行獨立檢驗時,應(yīng)該注意準(zhǔn)確代
6、數(shù)和正確計算,再把計算的結(jié)果與有關(guān)臨界值相比較,正確下結(jié)論 2獨立性檢驗的基本思想類似于反證法要確認(rèn)“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個分類變量沒有關(guān)系”成立,在該假設(shè)下構(gòu)造的隨機變量K2應(yīng)該很小如果由觀測數(shù)據(jù)計算得到的K2的觀測值k很大,則在一定程度上說明假設(shè)不合理根據(jù)隨機變量K 2的含義,可以通過概率P(K26.635)0.01評價該假設(shè)不合理的程度,由實際計算出的k6.635,說明假設(shè)不合理的程度約為99%,即“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度約為99%. 有甲乙兩個班級進行數(shù)學(xué)考試,按照大于等于85分為優(yōu)秀,85分以下為非優(yōu)秀統(tǒng)
7、計成績后,得到如下的列聯(lián)表. (1)成績與班級是否有關(guān)? (2)用假設(shè)檢驗的思想給予證明;優(yōu)秀非優(yōu)秀總計甲班10 45 55乙班20 30 50合計30 75 105 (3)若按下面的方法從甲班優(yōu)秀的學(xué)生抽取一人:把甲班優(yōu)秀的10名學(xué)生從2到11進行編號,先后兩次拋擲一枚均勻的骰子,出現(xiàn)的點數(shù)之和為被抽取人的序號試求抽到6或10號的概率 (2)證明:假設(shè)“成績與班級之間沒有關(guān)系”,由于事件AK3.8410.05,即A為小概率事件,而小概率事件發(fā)生了,進而得假設(shè)錯誤,這種推斷出錯的可能性約有5%. (3)設(shè)“抽到6或10號”為事件A,先后兩次拋擲一枚均勻的骰子,出現(xiàn)的點數(shù)為(x,y)所有的基本事
8、件有(1,1)、(1,2)、(1,3)、(6,6),共36個事件A包含的基本事件有:(1,5)、(2,4)、(3,3)、(4,2)、(5,1)、(4,6)、(5,5)、(6,4),共8個 試求y對x的回歸方程xi 0.05 0.06 0.25 0.31 0.07 0.10yi 0.10 0.14 1.00 1.12 0.23 0.37xi 0.38 0.43 0.14 0.20 0.47 點評與警示非線性回歸問題有時并不給出經(jīng)驗公式這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與必修模塊數(shù)學(xué)1中學(xué)過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、logistic模型的“S”形曲線函數(shù)等)圖象作比較,挑選一種跟這些散點擬合得最好的函數(shù),然后像本例這樣,采用適當(dāng)?shù)淖兞恐脫Q,把問題化為線性回歸分析問題,使之得到解決 1判斷兩個變量之間是否線性相關(guān),我們可以采用下列步驟: (1)畫散點圖,直觀地了解兩個變量的關(guān)系 (2)用最小二乘法求回歸直線方程 (3)分析相關(guān)指數(shù),評價回歸模型的好壞程度 (4)通過模型作出預(yù)測 2判斷兩個分類變量是否有關(guān)聯(lián)(獨立)我們可采用獨立性檢驗的思想來分析,其步驟是: (1)列出兩個分類變量的列聯(lián)表