《2020屆高考數(shù)學(xué)一輪總復(fù)習(xí) 第十單元 計數(shù)原理 、概率與統(tǒng)計 第79講 變量的相關(guān)性、回歸分析、獨立性檢驗練習(xí) 理(含解析)新人教A版》由會員分享,可在線閱讀,更多相關(guān)《2020屆高考數(shù)學(xué)一輪總復(fù)習(xí) 第十單元 計數(shù)原理 、概率與統(tǒng)計 第79講 變量的相關(guān)性、回歸分析、獨立性檢驗練習(xí) 理(含解析)新人教A版(7頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、第79講 變量的相關(guān)性、回歸分析、獨立性檢驗
1.設(shè)某大學(xué)的女生的體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系,根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i=1,2,…,n),用最小二乘法建立的回歸方程為y =0.85x-85.71,則下列結(jié)論中不正確的是(D)
A.y與x具有正的線性相關(guān)關(guān)系
B.回歸直線過樣本點的中心(,)
C.若該大學(xué)某女生的身高增加1 cm,則其體重約增加0.85 kg
D.若該大學(xué)某女生的身高為170 cm,則可斷定其體重必為58.79 kg
A、B、C均正確,是回歸方程的性質(zhì).D項是錯誤的,線性回歸方程只能預(yù)測學(xué)生的體重,選項D應(yīng)改為“若該大學(xué)
2、某女生身高為170 cm,則估計其體重大約為58.79 kg”才正確.
2.(2017·山東卷)為了研究某班學(xué)生的腳長x(單位:厘米)和身高y(單位:厘米)的關(guān)系,從該班隨機抽取10名學(xué)生,根據(jù)測量數(shù)據(jù)的散點圖可以看出y與x之間有線性相關(guān)關(guān)系.設(shè)其回歸直線方程為y =b x+a .已知i=225,i=1 600,b =4.該班某學(xué)生的腳長為24,據(jù)此估計其身高為(C)
A.160 B.163
C.166 D.170
因為i=225,所以=i=22.5.
因為i=1 600,所以=i=160.
又b =4,所以a =-b =160-4×22.5=70.
所以回歸直線方程為y
3、 =4x+70.
將x=24代入上式得y =4×24+70=166.
3.下列關(guān)于K2的說法中正確的是(C)
A.K2在任何相互獨立問題中都可以用于檢驗有關(guān)還是無關(guān)
B.K2的值越大,兩個事件的相關(guān)性就越大
C.K2是用來判斷兩個分類變量是否有關(guān)系的隨機變量,只對兩個分類變量適合
D.K2的觀測值的計算公式為
k=
4.通過隨機詢問110名性別不同的大學(xué)生是否愛好某項運動,得到如下的列聯(lián)表:
男
女
總計
愛好
40
20
60
不愛好
20
30
50
總計
60
50
110
由K2=算得,
K2=≈7.8.
附表:
P(K
4、2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
參照附表,得到的正確結(jié)論是(A)
A.有99%以上的把握認為“愛好該項運動與性別有關(guān)”
B.有99%以上的把握認為“愛好該項運動與性別無關(guān)”
C.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關(guān)”
D.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關(guān)”
解:因為7.8>6.635,所以99%以上的把握認為“愛好該項運動與性別有關(guān)”,選A.
5.對于一組數(shù)據(jù)的兩個函數(shù)模型,模型Ⅰ和模型Ⅱ的殘差平方和分別為180.2和290.7,若從中選取一個擬合
5、程度較好的函數(shù)模型,應(yīng)選 模型Ⅰ .
解:殘差平方和越小,函數(shù)模型對數(shù)據(jù)的擬合效果越好;殘差平方和越大,說明函數(shù)模型對數(shù)據(jù)的擬合效果越差.
6.已知x、y的取值如下表所示,
x
0
1
3
4
y
2.2
4.3
4.8
6.7
從所得的散點圖分析,y與x線性相關(guān),且y=0.95x+a,則a= 2.6 .
解:因為回歸直線方程必過樣本點的中心(,),
由表中數(shù)據(jù)得=2,=4.5,將(2,4.5)代入y=0.95x+a,可得a=2.6.
7.(2018·全國卷Ⅱ)下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元)的折線圖.
為了預(yù)測該地
6、區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時間變量t的兩個線性回歸模型.根據(jù)2000年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,17)建立模型①:=-30.4+13.5t;根據(jù)2010年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,…,7)建立模型②:=99+17.5t.
(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值.
(2)你認為用哪個模型得到的預(yù)測值更可靠?并說明理由.
(1)利用模型①,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值為=-30.4+13.5×19=226.1(億元).
利用模型②,可得該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資
7、額的預(yù)測值為=99+17.5×9=256.5(億元).
(2)利用模型②得到的預(yù)測值更可靠.
理由如下:
(i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應(yīng)的點沒有隨機散布在直線y=-30.4+13.5t上下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型①不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù)對應(yīng)的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數(shù)據(jù)建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎(chǔ)
8、設(shè)施投資額的變化趨勢,因此利用模型②得到的預(yù)測值更可靠.
(ii)從計算結(jié)果看,相對于2016年的環(huán)境基礎(chǔ)設(shè)施投資額220億元,由模型①得到的預(yù)測值226.1億元的增幅明顯偏低,而利用模型②得到的預(yù)測值的增幅比較合理,說明利用模型②得到的預(yù)測值更可靠.
(以上給出了2種理由,考生答出其中任意一種或其他合理理由均可得分)
8.一車間為了規(guī)定工時定額,需要確定加工零件所花費的時間,為此進行了8次試驗,收集的數(shù)據(jù)如下表:
零件數(shù)x(個)
10
20
30
40
加工時間y(min)
62
68
75
81
零件數(shù)x(個)
50
60
70
80
加工時間y(
9、min)
89
95
102
108
設(shè)回歸方程為y =bx+a,則點(a,b)在直線x+45y-10=0的(C)
A.左上方 B.左下方
C.右上方 D.右下方
解:由=45,=85,得a+45b=85,即有a+45b-10>0,故點(a,b)在直線x+45y-10=0的右上方,故選C.
9.某醫(yī)療研究所為了了解某種血清預(yù)防感冒的作用,把500名使用過這種血清的人與另外500名未使用這種血清的人一年中的感冒記錄比較,提出假設(shè)H0:“這種血清不能起到預(yù)防感冒的作用”,利用2×2列聯(lián)表計算得K2=3.918,經(jīng)查臨界值表知P(K2≥3.841)≈0.05.由下列結(jié)論中,正確
10、結(jié)論的序號是?、佟?
①有95%的把握認為“這種血清能起到預(yù)防感冒的作用”;
②若某人未使用該血清,那么他在一年中有95%的可能性得感冒;
③這種血清預(yù)防感冒的有效率為95%;
④這種血清預(yù)防感冒的有效率為5%.
解:因為K2=3.918≥3.841,而P(K2≥3.841)≈0.05,
所以有95%的把握認為“這種血清能起到預(yù)防感冒的作用”.
10.(2018·佛山一模)有甲、乙兩家公司都愿意聘用某求職者,這兩家公式的具體聘用信息如下:
甲公司 :
職位
A
B
C
D
月薪/元
6000
7000
8000
9000
獲得相應(yīng)職位概率
0.4
11、
0.3
0.2
0.1
乙公司:
職位
A
B
C
D
月薪/元
5000
7000
9000
11000
獲得相應(yīng)職位概率
0.4
0.3
0.2
0.1
(1)根據(jù)以上信息,如果你是該求職者,你會選擇哪一家公司?說明理由;
(2)某課外實習(xí)作業(yè)小組調(diào)查了1000名職場人士,就選擇這兩家公司的意愿作了統(tǒng)計,得到如下數(shù)據(jù)分布:
人員結(jié)構(gòu)
選擇意愿
40歲以上
(含40歲)
男性
40歲以上
(含40歲)
女性
40歲以下
男性
40歲以下
女性
選擇甲公司
110
120
140
80
選
12、擇乙公司
150
90
200
110
若分析選擇意愿與年齡這兩個分類變量,計算得到的K2的觀測值為k1=5.5513,測得出“選擇意愿與年齡有關(guān)系”的結(jié)論犯錯誤的概率的上限是多少?并用統(tǒng)計學(xué)知識分析,選擇意愿與年齡變量和性別變量哪一個關(guān)聯(lián)性更大?
附:K2=
P(K2≥k)
0.050
0.025
0.010
0.005
k
3.841
5.024
6.635
7.879
(1)設(shè)甲公司與乙公司的月薪分別為隨機變量X,Y,
則E(X)=6000×0.4+7000×0.3+8000×0.2+9000×0.1=7000,
E(Y)=5000×0.4+700
13、0×0.3+9000×0.2+11000×0.1=7000,
D(X)=(6000-7000)2×0.4+(7000-7000)2×0.3+(8000-7000)2×0.2+(9000-7000)2×0.1=10002,
D(Y)=(5000-7000)2×0.4+(7000-7000)2×0.3+(9000-7000)2×0.2+(11000-7000)2×0.1=20002,
則E(X)=E(Y),D(X)<D(Y),
我希望不同職位的月薪差距小一些,故選擇甲公司;
或我希望不同職位的月薪差距大一些,故選擇乙公司.
(2)因為k1=5.5513>5.024,根據(jù)表中對應(yīng)值,
得出“選擇意愿與年齡有關(guān)系”的結(jié)論犯錯的概率的上限是0.025,
由數(shù)據(jù)分布可得選擇意愿與性別兩個分類變量的2×2列聯(lián)表如下:
選擇甲公司
選擇乙公司
總計
男
250
350
600
女
200
200
400
總計
450
550
1000
計算K2==≈6.734,
且K2=6.734>6.635,
對照臨界值表得出結(jié)論“選擇意愿與性別有關(guān)”的犯錯誤的概率上限為0.01,由0.01<0.025,所以與年齡相比,選擇意愿與性別關(guān)聯(lián)性更大.
7