2019高考數學二輪復習 專題七 概率與統(tǒng)計 第三講 正態(tài)分布、統(tǒng)計與統(tǒng)計案例學案 理
第三講 正態(tài)分布、統(tǒng)計與統(tǒng)計案例
考點一 正態(tài)分布
1.正態(tài)曲線的性質
(1)曲線位于x軸上方,與x軸不相交;曲線關于直線x=μ對稱,且在x=μ處達到峰值.
(2)曲線與x軸之間的面積為1.
(3)當μ一定時,曲線的形狀由σ確定,σ越小,曲線越“瘦高”,表示總體的分布越集中;σ越大,曲線越“矮胖”,表示總體的分布越分散.
2.正態(tài)分布X~N(μ,σ2)的三個常用數據
(1)P(μ-σ<X≤μ+σ)=0.6826;
(2)P(μ-2σ<X≤μ+2σ)=0.9544;
(3)P(μ-3σ<X≤μ+3σ)=0.9974.
[解題指導]
[解] (1)抽取的一個零件的尺寸在(μ-3σ,μ+3σ)之內的概率為0.9974,從而零件的尺寸在(μ-3σ,μ+3σ)之外的概率為0.0026,故X~B(16,0.0026).
因此P(X≥1)=1-P(X=0)=1-0.997416≈0.0408.
X的數學期望為E(X)=16×0.0026=0.0416.
(2)(ⅰ)如果生產狀態(tài)正常,一個零件尺寸在(μ-3σ,μ+3σ)之外的概率只有0.0026,一天內抽取的16個零件中,出現尺寸在(μ-3σ,μ+3σ)之外的零件的概率只有0.0408,發(fā)生的概率很?。虼艘坏┌l(fā)生這種情況,就有理由認為這條生產線在這一天的生產過程可能出現了異常情況,需對當天的生產過程進行檢查,可見上述監(jiān)控生產過程的方法是合理的.
(ⅱ)由=9.97,s≈0.212,得μ的估計值為=9.97,σ的估計值為=0.212,由樣本數據可以看出有一個零件的尺寸在(-3,+3)之外,因此需對當天的生產過程進行檢查.
剔除(-3,+3)之外的數據9.22,剩下數據的平均數為
×(16×9.97-9.22)=10.02,
因此μ的估計值為10.02.
=16×0.2122+16×9.972≈1591.134,
剔除(-3,+3)之外的數據9.22,剩下數據的樣本方差為
×(1591.134-9.222-15×10.022)≈0.008,
因此σ的估計值為≈0.09.
正態(tài)分布應關注的兩點
(1)利用P(μ-σ<X≤μ+σ),P(μ-2σ<X≤μ+2σ),P(μ-3σ<X≤μ+3σ)的值直接求解.
(2)充分利用正態(tài)曲線的對稱性和曲線與x軸之間的面積為1來求解.
[對點訓練]
1.(2018·蘭州檢測)設X~N(μ1,σ),Y~N(μ2,σ),這兩個正態(tài)分布密度曲線如圖所示,下列結論中正確的是( )
A.P(Y≥μ2)≥P(Y≥μ1)
B.P(X≤σ2)≤P(X≤σ1)
C.對任意正數t,P(X≥t)≥P(Y≥t)
D.對任意正數t,P(X≤t)≥P(Y≤t)
[解析] 由題圖可知μ1<0<μ2,σ1<σ2,
∴P(Y≥μ2)<P(Y≥μ1),故A錯;
P(X≤σ2)>P(X≤σ1),故B錯;
當t為任意正數時,由題圖可知P(X≤t)≥P(Y≤t),而P(X≤t)=1-P(X≥t),P(Y≤t)=1-P(Y≥t),
∴P(X≥t)≤P(Y≥t),
故C正確,D錯.
[答案] C
2.某校組織了“2017年第15屆希望杯數學競賽(第一試)”,已知此次選拔賽的數學成績X服從正態(tài)分布N(72,121)(單位:分),此次考生共有500人,估計數學成績在72分到83分之間的人數約為(參數數據:P(μ-σ<X<μ+σ)=0.6826,P(μ-2σ<X<μ+2σ)=0.9544.)( )
A.238 B.170 C.340 D.477
[解析] 因為X~N(72,121),所以μ=72,σ=11,又P(μ-σ<X<μ+σ)=0.6826,所以P(61<X<83)=0.6826,因為該正態(tài)曲線關于直線x=72對稱,所以P(72<X<83)=P(61<X<83)=×0.6826=0.3413,所以0.3413×500=170.65,從而可得在72分到83分之間的人數約為170,故選B.
[答案] B
考點二 抽樣方法、用樣本估計總體
1.抽樣方法
抽樣方法包括簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣,三種抽樣方法都是等概率抽樣.
2.頻率分布直方圖
(1)頻率分布直方圖中橫坐標表示組距,縱坐標表示,頻率=組距×.
(2)頻率分布直方圖中各小長方形的面積之和為1.
3.方差公式
s2=[(x1-)2+(x2-)2+…+(xn-)2]
[對點訓練]
1.(2018·安徽皖南八校聯考)某校為了解1000名高一新生的健康狀況,用系統(tǒng)抽樣法(按等距的規(guī)則)抽取40名同學進行檢查,將學生從1~1000進行編號,現已知第18組抽取的號碼為443,則第一組用簡單隨機抽樣抽取的號碼為( )
A.16 B.17 C.18 D.19
[解析] 第一組用簡單隨機抽樣抽取的號碼為443-(18-1)×=18.故選C.
[答案] C
2.(2018·全國卷Ⅰ)某地區(qū)經過一年的新農村建設,農村的經濟收入增加了一倍,實現翻番.為更好地了解該地區(qū)農村的經濟收入變化情況,統(tǒng)計了該地區(qū)新農村建設前后農村的經濟收入構成比例,得到如下餅圖:
則下面結論中不正確的是( )
A.新農村建設后,種植收入減少
B.新農村建設后,其他收入增加了一倍以上
C.新農村建設后,養(yǎng)殖收入增加了一倍
D.新農村建設后,養(yǎng)殖收入與第三產業(yè)收入的總和超過了經濟收入的一半
[解析] 設建設前經濟收入為a,則建設后經濟收入為2a,由題圖可知:
種植
收入
第三產業(yè)
收入
養(yǎng)殖
收入
其他
收入
建設前
經濟收入
0.6a
0.06a
0.3a
0.04a
建設后
經濟收入
0.74a
0.56a
0.6a
0.1a
根據上表可知B、C、D結論均正確,結論A不正確,故選A.
[答案] A
3.(2018·山東臨沂一模)傳承傳統(tǒng)文化再掀熱潮,在剛剛過去的新春假期中,央視科教頻道以詩詞知識競賽為主的《中國詩詞大會》火爆熒屏,如圖的莖葉圖是兩位選手在個人追逐賽中的比賽得分,則下列說法正確的是( )
A.甲的平均數大于乙的平均數
B.甲的中位數大于乙的中位數
C.甲的方差大于乙的方差
D.甲的平均數等于乙的中位數
[解析] 由莖葉圖,知:甲=(59+45+32+38+24+26+11+12+14)=29,
乙=(51+43+30+34+20+25+27+28+12)=30,
s=[302+162+32+92+(-5)2+(-3)2+(-18)2+(-17)2+(-15)2]≈235.3,
s=[212+132+02+42+(-10)2+(-5)2+(-3)2+(-2)2+(-18)2]≈120.9,
甲的中位數為:26,乙的中位數為:28,
∴甲的方差大于乙的方差.故選C.
[答案] C
4.(2018·正定中學抽測)從某中學高一年級中隨機抽取100名同學,將他們的成績(單位:分)數據繪制成頻率分布直方圖(如圖),則這100名學生成績的平均數為________,中位數為________.
[解析] 由圖可知,平均數=105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.
中位數在120~130之間,設為x,則0.01×10+0.03×10+0.025×(x-120)=0.5,解得x=124.
[答案] 125 124
[快速審題] (1)看到系統(tǒng)抽樣,想到分段間隔.
(2)看到分層抽樣,想到抽樣比.
(3)看到頻率分布直方圖,想到頻數與頻率的區(qū)別以及計算方法和頻率分布直方圖中橫軸與豎軸中的數據的意義.
(4)看到方差,想到方差的含義及方差的計算公式.
統(tǒng)計問題應關注的3點
(1)分層抽樣的關鍵是確定抽樣比例,系統(tǒng)抽樣主要是確定分段間隔,應用等差數列計算個體號碼數.
(2)在頻率分布直方圖中,眾數為最高矩形的底邊中點的橫坐標,中位數為垂直橫軸且平分直方圖面積的直線與橫軸交點的橫坐標,平均數為每個小矩形的面積乘以相應小矩形底邊中點的橫坐標之積的和.
(3)計算方差首先要計算平均數,然后再按照方差的計算公式進行計算.方差是描述一個樣本和總體的波動大小的特征數,方差大說明波動大.
考點三 統(tǒng)計案例
1.線性回歸方程
方程=x+稱為線性回歸方程,其中=,=-;(,)稱為樣本中心點.
2.獨立性檢驗
K2=(其中n=a+b+c+d為樣本容量).角度1:線性回歸分析
【例1】 (2018·全國卷Ⅱ)下圖是某地區(qū)2000年至2016年環(huán)境基礎設施投資額y(單位:億元)的折線圖.
[解] (1)利用模型①,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為=-30.4+13.5×19=226.1(億元).
利用模型②,該地區(qū)2018年的環(huán)境基礎設施投資額的預測值為=99+17.5×9=256.5(億元).
(2)利用模型②得到的預測值更可靠.
理由如下 :
(ⅰ)從折線圖可以看出,2000年至2016年的數據對應的點沒有隨機散布在直線y=-30.4+13.5t上下,這說明利用2000年至2016年的數據建立的線性模型①不能很好地描述環(huán)境基礎設施投資額的變化趨勢.2010年相對2009年的環(huán)境基礎設施投資額有明顯增加,2010年至2016年的數據對應的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎設施投資額的變化規(guī)律呈線性增長趨勢,利用2010年至2016年的數據建立的線性模型=99+17.5t可以較好地描述2010年以后的環(huán)境基礎設施投資額的變化趨勢,因此利用模型②得到的預測值更可靠.
(ⅱ)從計算結果看,相對于2016年的環(huán)境基礎設施投資額220億元,由模型①得到的預測值226.1億元的增幅明顯偏低,而利用模型②得到的預測值的增幅比較合理,說明利用模型②得到的預測值更可靠.
(答出其中任意一種或其他合理理由均可)角度2:獨立性檢驗
【例2】 (2018·全國卷Ⅲ)某工廠為提高生產效率,開展技術創(chuàng)新活動,提出了完成某項生產任務的兩種新的生產方式.為比較兩種生產方式的效率,選取40名工人,將他們隨機分成兩組,每組20人.第一組工人用第一種生產方式,第二組工人用第二種生產方式.根據工人完成生產任務的工作時間(單位:min)繪制了如下莖葉圖:
[解題指導] →→
→
[解] (1)第二種生產方式的效率更高.
理由如下:
(ⅰ)由莖葉圖可知:用第一種生產方式的工人中,有75%的工人完成生產任務所需時間至少80分鐘,用第二種生產方式的工人中,有75%的工人完成生產任務所需時間至多79分鐘.因此第二種生產方式的效率更高.
(ⅱ)由莖葉圖可知:用第一種生產方式的工人完成生產任務所需時間的中位數為85.5分鐘,用第二種生產方式的工人完成生產任務所需時間的中位數為73.5分鐘.因此第二種生產方式的效率更高.
(ⅲ)由莖葉圖可知:用第一種生產方式的工人完成生產任務平均所需時間高于80分鐘;用第二種生產方式的工人完成生產任務平均所需時間低于80分鐘.因此第二種生產方式的效率更高.
(ⅳ)由莖葉圖可知:用第一種生產方式的工人完成生產任務所需時間分布在莖8上的最多,關于莖8大致呈對稱分布;用第二種生產方式的工人完成生產任務所需時間分布在莖7上的最多,關于莖7大致呈對稱分布.又用兩種生產方式的工人完成生產任務所需時間分布的區(qū)間相同,故可以認為用第二種生產方式完成生產任務所需的時間比用第一種生產方式完成生產任務所需的時間更少.因此第二種生產方式的效率更高.
(以上給出了4種理由,答出其中任意一種或其他合理理由均可).
(2)由莖葉圖知m==80.
列聯表如下:
超過m
不超過m
第一種生產方式
15
5
第二種生產方式
5
15
(3)由于K2==10>6.635,所以有99%的把握認為兩種生產方式的效率有差異.
(1)求回歸直線方程的關鍵
①正確理解計算,的公式和準確的計算,其中線性回歸方程必過樣本中心點(,).
②在分析兩個變量的相關關系時,可根據樣本數據作出散點圖來確定兩個變量之間是否具有相關關系,若具有線性相關關系,則可通過線性回歸方程估計和預測變量的值.
(2)獨立性檢驗的關鍵
根據2×2列聯表準確計算K2,若2×2列聯表沒有列出來,要先列出此表.K2的觀測值k越大,對應假設事件H0成立的概率越小,H0不成立的概率越大.
[對點訓練]
1.[角度1]某地隨著經濟的發(fā)展,居民收入逐年增長,該地一建設銀行連續(xù)五年的儲蓄存款(年底余額)如下表:
年份x
2011
2012
2013
2014
2015
儲蓄存款y/千億元
5
6
7
8
10
為了研究計算的方便,工作人員將上表的數據進行了處理,令t=x-2010,z=y(tǒng)-5得到下表:
時間代號t
1
2
3
4
5
z
0
1
2
3
5
(1)求z關于t的線性回歸方程;
(2)通過(1)中的方程,求出y關于x的回歸方程;
(3)用所求回歸方程預測到2020年年底,該地儲蓄存款額可達多少?
(附:對于線性回歸方程=x+,其中=,=-)
[解] (1)令z關于t的線性回歸方程為=t+,
∵=3,=2.2,izi=45,=55,
==1.2,=-=2.2-3×1.2=-1.4,
∴=1.2t-1.4.
(2)將t=x-2010,z=y(tǒng)-5,代入=1.2t-1.4,
得-5=1.2(x-2010)-1.4,即=1.2x-2408.4.
(3)∵=1.2×2020-2408.4=15.6(千億元),
∴預測到2020年年底,該地儲蓄存款額可達15.6千億元.
2.[角度2]某市調研考試后,某校對甲、乙兩個文科班的數學考試成績進行分析,規(guī)定:大于或等于120分為優(yōu)秀,120分以下為非優(yōu)秀.統(tǒng)計成績后,得到如下的列聯表,且已知在甲、乙兩個文科班全部110人中隨機抽取1人成績?yōu)閮?yōu)秀的概率為.
優(yōu)秀
非優(yōu)秀
合計
甲班
10
乙班
30
合計
110
(1)請完成上面的列聯表;
(2)根據列聯表中的數據,若按99.9%的可靠性要求,能否認為“成績是否優(yōu)秀與班級有關系”.
參考公式與臨界值表:K2=.
P(K2≥k)
0.100
0.050
0.025
0.010
0.001
k
2.706
3.841
5.024
6.635
10.828
[解] (1)
優(yōu)秀
非優(yōu)秀
合計
甲班
10
50
60
乙班
20
30
50
合計
30
80
110
(2)根據列聯表中的數據,得到
K2=≈7.486<10.828.因此按99.9%的可靠性要求,不能認為“成績是否優(yōu)秀與班級有關系”.
1.(2017·全國卷Ⅲ)某城市為了解游客人數的變化規(guī)律,提高旅游服務質量,收集并整理了2014年1月至2016年12月期間月接待游客量(單位:萬人)的數據,繪制了下面的折線圖:
根據該折線圖,下列結論錯誤的是( )
A.月接待游客量逐月增加
B.年接待游客量逐年增加
C.各年的月接待游客量高峰期大致在7,8月
D.各年1月至6月的月接待游客量相對于7月至12月,波動性更小,變化比較平穩(wěn)
[解析] 折線圖呈現出的是一個逐漸上升的趨勢,但是并不是每個月都在增加,故A說法錯誤;折線圖中按照年份進行劃分,可以看出每年的游客量都在逐年增加,故B說法正確;折線圖中每年的高峰出現在每年的7,8月,故C說法正確;每年的1月至6月相對于7月至12月的波動性更小,變化的幅度較小,說明變化比較平穩(wěn),故D說法正確.
[答案] A
2.(2017·山東卷)為了研究某班學生的腳長x(單位:厘米)和身高y(單位:厘米)的關系,從該班隨機抽取10名學生,根據測量數據的散點圖可以看出y與x之間有線性相關關系,設其回歸直線方程為=x+,已知i=225,i=1600,=4.該班某學生的腳長為24,據此估計其身高為( )
A.160 B.163 C.166 D.170
[解析] 由題意可得=22.5,=160,∴=160-4×22.5=70,即=4x+70.當x=24時,=4×24+70=166,故選C.
[答案] C
3.(2018·江蘇卷)已知5位裁判給某運動員打出的分數的莖葉圖如圖所示,那么這5位裁判打出的分數的平均數為________.
[解析] 5位裁判打出的分數分別為89,89,90,91,91,則這5位裁判打出的分數的平均數為×(89+89+90+91+91)=90.
[答案] 90
4.(2017·全國卷Ⅱ)海水養(yǎng)殖場進行某水產品的新、舊網箱養(yǎng)殖方法的產量對比,收獲時各隨機抽取了100個網箱,測量各箱水產品的產量(單位:kg),其頻率分布直方圖如下:
(1)設兩種養(yǎng)殖方法的箱產量相互獨立,記A表示事件“舊養(yǎng)殖法的箱產量低于50 kg,新養(yǎng)殖法的箱產量不低于50 kg”,估計A的概率;
(2)填寫下面列聯表,并根據列聯表判斷是否有99%的把握認為箱產量與養(yǎng)殖方法有關:
箱產量<50 kg
箱產量≥50 kg
舊養(yǎng)殖法
新養(yǎng)殖法
(3)根據箱產量的頻率分布直方圖,求新養(yǎng)殖法箱產量的中位數的估計值(精確到0.01).
附:
P(K2≥k)
0.050
0.010
0.001
k
3.841
6.635
10.828
K2=.
[解] (1)記B表示事件“舊養(yǎng)殖法的箱產量低于50 kg”,C表示事件“新養(yǎng)殖法的箱產量不低于50 kg”.
由題意知P(A)=P(BC)=P(B)P(C).
舊養(yǎng)殖法的箱產量低于50 kg的頻率為(0.012+0.014+0.024+0.034+0.040)×5=0.62,
故P(B)的估計值為0.62.
新養(yǎng)殖法的箱產量不低于50 kg的頻率為(0.068+0.046+0.010+0.008)×5=0.66,
故P(C)的估計值為0.66.
因此,事件A的概率估計值為0.62×0.66=0.4092.
(2)根據箱產量的頻率分布直方圖得列聯表
箱產量<50 kg
箱產量≥50 kg
舊養(yǎng)殖法
62
38
新養(yǎng)殖法
34
66
K2=≈15.705.
由于15.705>6.635,故有99%的把握認為箱產量與養(yǎng)殖方法有關.
(3)因為新養(yǎng)殖法的箱產量頻率分布直方圖中,箱產量低于50 kg的直方圖面積為(0.004+0.020+0.044)×5=0.34<0.5,箱產量低于55 kg的直方圖面積為(0.004+0.020+0.044+0.068)×5=0.68>0.5,故新養(yǎng)殖法箱產量的中位數的估計值為50+≈52.35(kg).
1.統(tǒng)計與統(tǒng)計案例在選擇或填空題中的命題熱點主要集中在隨機抽樣、用樣本估計總體以及變量間的相關性判斷等,難度較低,常出現在3~4題的位置.
2.統(tǒng)計的解答題多在第18或19題的位置,多以交匯性的形式考查,交匯點主要有兩種:頻率分布直方圖、莖葉圖擇一與隨機變量的分布列、數學期望、方差、正態(tài)分布相交匯考查;頻率分布直方圖、莖葉圖擇一與線性回歸或獨立性檢驗相交匯來考查,難度中等.
熱點課題19 概率與統(tǒng)計的交匯問題
[感悟體驗]
(2018·河北衡水中學調研)某同學在研究性學習中,收集到某制藥廠今年前5個月甲膠囊生產產量(單位:萬盒)的數據如下表所示:
x(月份)
1
2
3
4
5
y(萬盒)
4
4
5
6
6
(1)該同學為了求出y關于x的線性回歸方程=x+,根據表中數據已經正確計算出=0.6,試求出的值,并估計該廠6月份生產的甲膠囊產量數;
(2)若某藥店現有該制藥廠今年二月份生產的甲膠囊4盒和三月份生產的甲膠囊5盒,小紅同學從中隨機購買了3盒甲膠囊,后經了解發(fā)現該制藥廠今年二月份生產的所有甲膠囊均存在質量問題.記小紅同學所購買的3盒甲膠囊中存在質量問題的盒數為X,求X的分布列和數學期望.
[解] (1)由題可得,=(1+2+3+4+5)=3,=(4+4+5+6+6)=5.∵線性回歸方程=x+過點(,),∴=-=5-0.6×3=3.2.∴該廠6月份生產的甲膠囊的產量數為=0.6×6+3.2=6.8(萬盒).
(2)由題意知,X=0,1,2,3,
P(X=0)===,P(X=1)===,P(X=2)===,P(X=3)===,
所以X的分布列為
X
0
1
2
3
P
則E(X)=×0+×1+×2+×3=.
專題跟蹤訓練(三十)
一、選擇題
1.(2018·長春市第一次質量監(jiān)測)已知某班級部分同學一次測驗的成績統(tǒng)計如圖所示,則其中位數和眾數分別為( )
A.95,94 B.92,86
C.99,86 D.95,91
[解析] 由題中莖葉圖可知,此組數據由小到大排列依次為76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17個,故中位數為92,出現次數最多的為眾數,故眾數為86,故選B.
[答案] B
2.(2018·黔東南州第一次聯考)近年呼吁高校招生改革的呼聲越來越高,在贊成高校招生改革的市民中按年齡分組,得到樣本頻率分布直方圖如圖所示,其中年齡在區(qū)間[30,40)內的有2500人,在區(qū)間[20,30)內的有1200人,則m的值為( )
A.0.013 B.0.13 C.0.012 D.0.12
[解析] 由題意,得年齡在區(qū)間[30,40)內的頻率為0.025×10=0.25,則贊成高校招生改革的市民有=10000(人),因為年齡在區(qū)間[20,30)內的有1200人,所以m==0.012.
[答案] C
3.已知變量x與y正相關,且由觀測數據算得樣本平均數=3,=3.5,則由該觀測數據算得的線性回歸方程可能是( )
A.=0.4x+2.3 B.=2x-2.4
C.=-2x+9.5 D.=-0.3x+4.4
[解析] 變量x與y正相關,且樣本中心點為(3,3.5),應用排除法可知選項A符合要求.故選A.
[答案] A
4.(2018·太原模擬)某小區(qū)有1000戶,各戶每月的用電量近似服從正態(tài)分布N(300,102),則用電量在320度以上的戶數約為(參考數據:若隨機變量ξ服從正態(tài)分布N(μ,σ2),則P(μ-σ<ξ<μ+σ)=68.26%,P(μ-2σ<ξ<μ+2σ)=95.44%,P(μ-3σ<ξ<μ+3σ)=99.74%)( )
A.17 B.23 C.34 D.46
[解析] P(ξ>320)=×[1-P(280<ξ<320)]
=×(1-95.44%)=0.0228,
0.0228×1000=22.8≈23,
∴用電量在320度以上的戶數約為23.故選B.
[答案] B
5.(2018·廣東省百校聯盟第二次聯考)下表是我國某城市在2017年1月份至10月份期間各月最低溫度與最高溫度(單位:℃)的數據一覽表.
月份
1
2
3
4
5
6
7
8
9
10
最高溫
度/℃
5
9
9
11
17
24
27
30
31
21
最低溫
度/℃
-12
-3
1
-2
7
17
19
23
25
10
已知該城市的各月最低溫與最高溫具有相關關系,根據該一覽表,則下列結論錯誤的是( )
A.最低溫度與最高溫度為正相關
B.每月最高溫度與最低溫度的平均值在前8個月逐月增加
C.月溫差(最高溫度減最低溫度)的最大值出現在1月
D.1月至4月的月溫差(最高溫度減最低溫度)相對于7月至10月,波動性更大
[解析] 將最高溫度、最低溫度、溫差列表如下,
月份
1
2
3
4
5
6
7
8
9
10
最高溫
度/℃
5
9
9
11
17
24
27
30
31
21
最低溫
度/℃
-12
-3
1
-2
7
17
19
23
25
10
溫差
度/℃
17
12
8
13
10
7
8
7
6
11
由表格可知,最低溫度大致隨最高溫度的增大而增大,A正確;每月最高溫度與最低溫度的平均值在前8個月不是逐月增加,B錯;月溫差的最大值出現在1月,C正確;1月至4月的月溫差相對于7月至10月,波動性更大,D正確.故選B.
[答案] B
6.(2018·贛州一模)以下四個命題中是真命題的為( )
①從勻速傳遞的產品生產流水線上,質檢員每20分鐘從中抽取一件產品進行某項指標檢測,這樣的抽樣是分層抽樣;②兩個隨機變量相關性越強,則相關系數的絕對值越接近于1;③在回歸直線方程=0.2x+12中,當解釋變量x每增加一個單位時,預報變量y平均增加0.2個單位;④對分類變量X與Y,它們的隨機變量K2的觀測值k來說,k越小,“X與Y有關系”的把握程度越大.
A.①④ B.②④ C.①③ D.②③
[解析] ①為系統(tǒng)抽樣,故①不正確;②兩個隨機變量相關性越強,則相關系數的絕對值越接近于1,故②正確;③由0.2(x+1)+12-0.2x-12=0.2知③正確;④對分類變量X與Y,它們的隨機變量K2的觀測值k來說,k越大,“X與Y有關系”的把握程度越大,故④不正確.故選D.
[答案] D
二、填空題
7.(2018·懷化二模)某校高三(1)班共有48人,學號依次為1,2,3,…,48,現用系統(tǒng)抽樣的方法抽取一個容量為6的樣本,已知學號為3,11,19,35,43的同學在樣本中,則還有一個同學的學號應為________.
[解析] 根據系統(tǒng)抽樣的規(guī)則——“等距離”抽取,則抽取的號碼差相等,易知相鄰兩個學號之間的差為11-3=8,所以在19與35之間還有27.
[答案] 27
8.(2018·安徽淮北模擬)某單位員工按年齡分為A,B,C三組,其人數之比為5∶4∶1,現用分層抽樣的方法從總體中抽取一個容量為20的樣本,已知C組中甲、乙二人均被抽到的概率是,則該單位員工總數為________.
[解析] ∵員工按年齡分為A,B,C三組,其人數之比為5∶4∶1,∴從中抽取一個容量為20的樣本,則抽取的C組人數為×20=×20=2,設C組員工總數為m,則甲、乙二人均被抽到的概率為==,即m(m-1)=90,解得m=10.設員工總數為x,則由==,可得x=100.
[答案] 100
9.某公司為確定明年投入某產品的廣告支出,對近5年的年廣告支出m與年銷售額t(單位:百萬元)進行了初步統(tǒng)計,得到下列表格中的數據:
年廣告支出m
2
4
5
6
8
年銷售額t
30
40
p
50
70
經測算,年廣告支出m與年銷售額t滿足線性回歸方程=6.5m+17.5,則p=________.
[解析] 由于回歸直線過樣本點的中心,=5,=,代入=6.5m+17.5,解得p=60.
[答案] 60
三、解答題
10.(2018·河南新鄉(xiāng)一模)為了了解甲、乙兩個工廠生產的輪胎的寬度是否達標,從兩廠各隨機選取了10個輪胎,將每個輪胎的寬度(單位:mm)記錄下來并繪制出如下的折線圖:
(1)分別計算甲、乙兩廠提供的10個輪胎寬度的平均值;
(2)若輪胎的寬度在[194,196]內,則稱這個輪胎是標準輪胎.試比較甲、乙兩廠分別提供的10個輪胎中所有標準輪胎寬度的方差的大小,根據兩廠的標準輪胎寬度的平均水平及其波動情況,判斷這兩個工廠哪個的輪胎相對更好.
[解] (1)甲廠10個輪胎寬度的平均值:
甲=×(195+194+196+193+194+197+196+195+193+197)=195(mm),
乙廠10個輪胎寬度的平均值:乙=×(195+196+193+192+195+194+195+192+195+193)=194(mm).
(2)甲廠10個輪胎中寬度在[194,196]內的數據為195,194,196,194,196,195,
平均數:1=×(195+194+196+194+196+195)=195,
方差;s=×[(195-195)2+(194-195)2+(196-195)2+(194-195)2+(196-195)2+(195-195)2]=,
乙廠10個輪胎中寬度在[194,196]內的數據為195,196,195,194,195,195,
平均數:2=×(195+196+195+194+195+195)=195,
方差:s=×[(195-195)2+(196-195)2+(195-195)2+(194-195)2+(195-195)2+(195-195)2]=,
∵兩廠標準輪胎寬度的平均數相等,但乙廠的方差更小,
∴乙廠的輪胎相對更好.
11.(2018·河北石家莊二模)隨著網絡的發(fā)展,網上購物越來越受到人們的喜愛,各大購物網站為增加收入,促銷策略越來越多樣化,促銷費用也不斷增加,下表是某購物網站2017年1~8月促銷費用x(萬元)和產品銷量y(萬件)的具體數據:
月份
1
2
3
4
5
6
7
8
促銷費用x
2
3
6
10
13
21
15
18
產品銷量y
1
1
2
3
3.5
5
4
4.5
(1)根據數據可知y與x具有線性相關關系,請建立y關于x的回歸方程=x+(系數精確到0.01);
(2)已知6月份該購物網站為慶祝成立1周年,特制訂獎勵制度:用z(單位:件)表示日銷量,若z∈[1800,2000),則每位員工每日獎勵100元;若z∈[2000,2100),則每位員工每日獎勵150元;若z∈[2100,+∞),則每位員工每日獎勵200元.現已知該網站6月份日銷量z服從正態(tài)分布N(2000,10000),請你計算某位員工當月獎勵金額總數大約為多少元.(當月獎勵金額總數精確到百分位)
參考數據:xiyi=338.5,x=1308,其中xi,yi分別為第i個月的促銷費用和產品銷量,i=1,2,3,…,8.
參考公式:①對于一組數據(x1,y1),(x2,y2),…,(xn,yn),其回歸方程=x+的斜率和截距的最小二乘估計分別為=,=-.
②若隨機變量Z服從正態(tài)分布N(μ,σ2),則P(μ-σ<Z<μ+σ)=0.6827,P(μ-2σ<Z<μ+2σ)=0.9545.
[解] (1)由題意可知=×(2+3+6+10+13+21+15+18)=11,=×(1+1+2+3+3.5+5+4+4.5)=3,
∴===≈0.22,
=-=3-0.22×11=0.58,
∴y關于x的回歸方程為=0.22x+0.58.
(2)∵該網站6月份日銷量z服從正態(tài)分布N(2000,10000),
∴P(1800≤z<2000)==0.47725,
P(2000≤z<2100)==0.34135,
P(z≥2100)=0.5-0.34135=0.15865,
∴每位員工當月的獎勵金額總數為0.47725×100+0.34135×150+0.15865×200≈130.66(元).
12.(2018·西安模擬)每年的4月23日為世界讀書日,為調查某高校學生(學生很多)的讀書情況,隨機抽取了男生、女生各20人組成的一個樣本,對他們的年閱讀量(單位:本)進行了統(tǒng)計,分析得到了男生年閱讀量的頻數分布表和女生年閱讀量的頻率分布直方圖.
男生年閱讀量的頻數分布表(年閱讀量均在區(qū)間[0,60)內)
本/年
[0,10)
[10,20)
[20,30)
[30,40)
[40,50)
[50,60)
頻數
3
1
8
4
2
2
女生年閱讀量的頻率分布直方圖(年閱讀量均在區(qū)間[0,60)內)
(1)根據女生年閱讀量的頻率分布直方圖估計該校女生年閱讀量的中位數.
(2)若年閱讀量不小于40本為閱讀豐富,否則為閱讀不豐富,依據上述樣本研究年閱讀量與性別的關系,完成下列2×2列聯表,并判斷是否有99%的把握認為閱讀豐富與性別有關.
閱讀量
性別
豐富
不豐富
合計
男
女
合計
(3)在樣本中,從年閱讀量在[50,60)的學生中,隨機抽取2人參加全市的征文比賽,記這2人中男生人數為ξ,求ξ的分布列和期望.
附:K2=,其中n=a+b+c+d.
P(K2≥k0)
0.025
0.010
0.005
k0
5.024
6.635
7.879
[解] (1)∵前兩組頻率之和為0.1+0.2=0.3,前三組頻率之和為0.1+0.2+0.25=0.55,
∴中位數位于第三組.設中位數為a,由題可知,==,解得a=38.∴該校女生年閱讀量的中位數約為38.
(2)
閱讀量
性別
豐富
不豐富
合計
男
4
16
20
女
9
11
20
合計
13
27
40
K2=≈2.849<6.635,
∴沒有99%的把握認為閱讀豐富與性別有關.
(3)年閱讀量在[50,60)的學生中,男生2人,女生4人.
由題意得,ξ的可能取值為0,1,2,
P(ξ=0)==,P(ξ=1)==,P(ξ=2)==.
所以ξ的分布列為
ξ
0
1
2
P
E(ξ)=0×+1×+2×=.
27