高考
数学
专题十一 概率与统计
变量间的相关关系、统计案例
基础篇
考点一 变量间的相关关系
1.(2023届广东东莞四中月考,5)对四组数据进行统计,获得以下散点图,关
于其相关系数的比较,正确的是 ( )
<r4<0<r3<r1 <r4<0<r1<r3
<r2<0<r3<r1 <r2<0<r1<r3
答案 A
2.(多选)(2023届山东潍坊五县联考,10)下列说法正确的是 ( )
A.经验回归直线 = x+ 至少经过样本点数据中的一个点
B.若经验回归直线方程为 =-5,则当x每增大一个单位时, 增大个
单位
C.设两个变量x,y之间的线性相关系数为r,则|r|=1的充要条件是成对数据
构成的点都在经验回归直线上
D.在残差的散点图中,残差分布的水平带状区域的宽度越窄,其模型的拟
合效果越好
答案 CD
3.(2020课标Ⅰ,文5,理5,5分)某校一个课外学习小组为研究某作物种子的
发芽率y和x(单位:℃)的关系,在20个不同的件下进行种子发
芽实验,由实验数据(xi,yi)(i=1,2,…,20)得到下面的散点图:
由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为
发芽率y和x的回归方程类型的是 ( )
=a+bx =a+bx2
=a+bex =a+bln x
答案 D
4.(2017山东理,5,5分)为了研究某班学生的脚长x(单位:厘米)和身高y(单
位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以
看出y与x之间有线性相关关系,设其回归直线方程为 = x+ .已知 xi=
225, yi=1 600, =4.该班某学生的脚长为24,据此估计其身高为 ( )
答案 C
5.(多选)(2022山东济宁一中开学考试,10)给出以下四个说法,其中正确的
说法是( )
A.如果由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到经验回归方程 = x+
,
那么经验回归直线至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个
B.在回归分析中,用决定系数R2来比较两个模型拟合效果,R2越大,表示残
差平方和越小,即模型的拟合效果越好
C.在经验回归方程 =+中,当解释变量x每增加一个单位时,响应变
量 平均增加个单位
D.若变量y和x之间的相关系数为r= 2,则变量y和x之间的负线性相
关很强
答案 BD
6.(2022全国乙,理19,文19,12分)某地经过多年的环境治理,已将荒山改造
成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种
树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下
数据:
并计算得 =, = 8, xiyi= 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到
);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木
的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近
似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r= ,
≈.
解析 (1)估计该林区这种树木平均一棵的根部横截面积为 = =
(m2),
平均一棵的材积量为 = =(m3).
(2)样本相关系数r=
=
=
= = ≈ ≈.
即该林区这种树木的根部横截面积与材积量的样本相关系数约为.
(3)设这种树木的根部横截总面积为X m2,总材积量为Y m3,则 = ,则Y=
= =1 209,
所以该林区这种树木的总材积量的估计值为1 209 m3.
7.(2020课标Ⅱ,文18,理18,12分)某沙漠地区经过治理,生态系统得到很大
改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分
成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个
作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi
分别表示第i个
样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得 xi=60,
yi=1 200, (xi- )2=80, (yi- )2=9 000, (xi- )(yi- )=800.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等
于样区这种野生动物数量的平均数乘地块数);
(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代
表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为
更合理的抽样方法,并说明理由.
附:相关系数r= , ≈.
解析 (1)由已知得样本平均数 = yi=60,从而该地区这种野生动物数
量的估计值为60×200=12 000.
(2)样本(xi,yi)(i=1,2,…,20)的相关系数
r= = = ≈.
(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行
分层随机抽样.
理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的
正相关关系.由于各地块间植物覆盖面积差异很大,从而各地块间这种野
生动物数量差异也很大,采用分层随机抽样的方法较好地保持了样本结
构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种
野生动物数量更准确的估计.
考点二 独立性检验
1.(2021全国甲,文17,理17,12分)甲、乙两台机床生产同种产品,产品按质
量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床
各生产了200件产品,产品的质量情况统计如下表:
一级品 二级品 合计
甲机床 150 50 200
乙机床 120 80 200
合计 270 130 400
(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?
(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差
异?
附:K2= ,
.
解析 (1)因为甲机床生产的200件产品中有150件一级品,所以甲机床生
产的产品中一级品的频率为 = ,因为乙机床生产的200件产品中有120
件一级品,所以乙机床生产的产品中一级品的频率为 = .
(2)根据2×2列联表中的数据,得K2=
= = ≈,因为>,所以有99%的
把握认为甲机床的产品质量与乙机床的产品质量有差异.
2.(2022全国甲文,17,12分)甲、乙两城之间的长途客车均由A和B两家公
司运营.为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城
之间的500个班次,得到下面列联表:
准点班次数 未准点班次数
A 240 20
B 210 30
(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概
率;
(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车
所属公司有关?
附:K2= ,
P(K2≥k)
k
解析 (1)由题意可得A公司长途客车准点的概率P1= = ,B公司长途
客车准点的概率P2= = .
(2)因为K2= ≈>,
所以有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属
公司有关.
3.(2020新高考Ⅰ,19,12分)为加强环境保护,治理空气污染,环境监测部门某
省市空气质量进行调研,随机抽查了100天空气中的和SO2浓度(单
位:μg/m3),得下表:
SO2
[0,50] (50,150] (150,475]
[0,35] 32 18 4
(35,75] 6 8 12
(75,115] 3 7 10
(1)估计事某省市一天空气中浓度不超过75,且SO2浓度不超过
150”的概率;
(2)根据所给数据,完成下面的2×2列联表:
SO2
[0,150] (150,475]
[0,75]
(75,115]
(3)根据(2)中的列联表,判断是否有99%的把握某省市一天空气中
浓度与SO2浓度有关.
附:K2= ,
.
解析 (1)根据抽查数某省市100天的空气中浓度不超过75,且SO2浓
度不超过150的天数为32+18+6+8=64,因某省市一天空气中浓度不
超过75,且SO2浓度不超过150的概率的估计值为 =.
(2)根据抽查数据,可得2×2列联表:
SO2
[0,150] (150,475]
[0,75] 64 16
(75,115] 10 10
(3)根据(2)的列联表得
K2= ≈.
由于>,故有99%的把握某省市一天空气中浓度与SO2浓
度有关.
4.(2023届长沙一中月考二,20)某芯片制造企业使用新技术对某款芯片进
行试生产.在试产初期,该款芯片生产有四道工序,前三道工序的生产互不
影响,第四道是检测评估工序,包括智能自动检测与人工抽检.
(1)在试产初期,该款芯片的批次M生产前三道工序的次品率分别为P1=
,P2= ,P3= .
①求批次M芯片的次品率PM;
②第四道工序中智能自动检测为次品的芯片会被自动淘汰,合格的芯片
进入流水线并由工人进行抽查检验.已知批次M的芯片智能自动检测显
示合格率为98%,求工人在流水线进行人工抽检时,抽检一个芯片恰为合
格品的概率.
(2)该企业改进生产工艺后生产了批次N的芯片.某手机生产厂商获得批
次M与批次N的芯片,并在某款新型手机上使用.现对使用这款手机的用户
回访,对开机速度进行满意度调查.据统计,回访的100名用户中,安装批次
M的有40人,其中对开机速度满意的有30人;安装批次N的有60人,其中对
开机速度满意的有58人.依据α=的独立性检验,能否认为芯片批次与
用户对开机速度满意度有关?
附:χ2=
α
xα
解析 (1)①批次M芯片的次品率为
PM=1-(1-P1)(1-P2)(1-P3)=1- × × = .
②设批次M的芯片智能自动检测合格为事件A,人工抽检合格为事件B,
由已知得P(A)= ,P(AB)=1-PM=1- = ,
则工人在流水线进行人工抽检时,抽检一个芯片恰为合格品为事件B|A,
P(B|A)= = × = .
(2)零假设为H0:芯片批次与用户对开机速度满意度无关.由数据可建立2×
2列联表如下:(单位:人)
开机速度满意度 芯片批次 合计
M N
不满意 10 2 12
满意 30 58 88
合计 40 60 100
根据列联表得
χ2= = ≈>.
因此,依据α=的独立性检验,我们推断H0不成立,即能认为芯片批次
与用户对开机速度满意度有关.此推断犯错误的概率不大于.
5.(2020课标Ⅲ,18,12分)某学生兴趣小组随机调某省市100天中每天的
空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次
空气质量等级
[0,
200]
(200,
400]
(400,
600]
1(优) 2 16 25
2(良) 5 10 12
3(轻度污染) 6 7 8
4(中度污染) 7 2 0
(1)分别某省市一天的空气质量等级为1,2,3,4的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组
区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空
气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面
的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园
锻炼的人某省市当天的空气质量有关.
人次≤400 人次>400
空气质量好
空气质量不好
附:K2= ,
.
解析 (1)由所给数某省市一天的空气质量等级为1,2,3,4的概率的估计
值如表:
空气质量等级 1 2 3 4
概率的估计值
(2)一天中到该公园锻炼的平均人次的估计值为 ×(100×20+300×35+
500×45)=350.
(3)根据所给数据,可得2×2列联表:
人次≤400 人次>400
空气质量好 33 37
空气质量不好 22 8
根据列联表得K2= ≈.
由于>,故有95%的把握认为一天中到该公园锻炼的人次某省市
当天的空气质量有关.
6.(2023届河北邯郸摸底,19)暑假期间,某学校建议学生保持晨读的习惯,
开学后,该校对高二、高三随机抽取200名学生(该学校学生总数较多),调
查日均晨读时间,数据如表:
日均晨读
时间/分钟
[0,
10)
[10,
20)
[20,
30)
[30,
40)
[40,
50)
[50,
60]
人数 5 10 25 50 50 60
将学生日均晨读时间在[30,60]上的学生评价为“晨读合格”.
(1)请根据上述表格中的统计数据填写下面2×2列联表,依据α=的独立
性检验,能否认为“晨读合格”与年级有关?
晨读不合格 晨读合格 合计
高二
高三 15 100
合计
(2)将上述调查所得到的频率视为概率来估计全校的情况,现在从该校所
有学生中,随机抽取2名学生,记所抽取的2人中晨读合格的人数为随机变
量ξ,求ξ的分布列和数学期望.
参考公式:χ2= ,其中n=a+b+c+d.
临界值表:
α
xα
解析 (1)列联表如下:
晨读不合格 晨读合格 合计
高二 25 75 100
高三 15 85 100
合计 40 160 200
χ2= =<=,
所以依据α=的独立性检验,不能认为“晨读合格”与年级有关.
(2)由题意,知学生晨读合格的概率为 = ,ξ~B ,
所以P = · · = ,P = · · = ,P =
·
· = ,ξ的分布列为
ξ 0 1 2
P
所以E(ξ)=0× +1× +2× = .
综合篇
考法一 经验回归方程的求解与应用
1.(多选)(2022重庆秀山高级中学月考,10)已知变量x,y之间的经验回归方
程为 =+,且变量x,y之间的一组相关数据如表所示,则下列说法
正确的是 ( )
x 6 8 10 12
y 6 m 3 2
A.变量x,y之间成负相关关系
B.当x=20时, =
=4
D.该经验回归直线必过点(9,4)
答案 ABD
2.(2022山东潍坊摸底,14)已知关于x,y的一组数据:
x 1 m 3 4 5
y n
根据表中数据得到的经验回归方程为 =+,则的值为
.
答案
3.(2023届广东普宁华美实验学校月考,19)研究显示,越来越多的上班族下
班后通过慢跑强身健体,慢跑属于一种有氧运动,可以消耗人体大量热量,
坚持慢跑可以促进新陈代谢,增加肺活量以及增强心脏功能,提升人体免
疫力,因此深受青年人喜爱.下图统计了小明这100天每天慢跑的时间情
况(单位:分钟).
(1)求m的值.
(2)小明的同事小强本月前7次慢跑的时间情况如表.由散点图可知,小强
的慢跑次数x和慢跑时间y(单位:分钟)之间成线性相关.
次数x 1 2 3 4 5 6 7
慢跑时间y
(单位:分
钟)
15 18 27 23 20 29 36
①求y关于x的经验回归方程 = x+ ,其中 , 使用分数形式表示;
②根据①中的运算结果预测小强第9次的慢跑时间是否会超过小明这
100天慢跑的平均时间.
参考公式:在经验回归方程 = x+ 中, = , = - .
解析 (1)依题意,得(++m+++)×10=1,解得m=
.
(2)①依题意,知 = =4, = =
24,
(xi- )(yi- )=(-3)×(-9)+(-2)×(-6)+(-1)×3+1×(-4)+2×5+3×12=78,
=(-3)2+(-2)2+(-1)2+12+22+32=28,
则 = = , = - =24- ×4= ,故所求经验回归方程为
= x+ .
②小明这100天慢跑的平均时间为
5×+15×+25×+35×+45×+55×=,
将x=9代入 = x+ 中,得 = ×9+ ≈>,故可以预测小强第9
次的慢跑时间会超过小明这100天慢跑的平均时间.
4.(2023届浙江嘉兴一中期中,20)根据中国海洋生态环境状况公报,从2017
年到2021年全国直排海污染源中各年份的氨氮总量y(单位:千吨)与年份
的散点图如图.
xiyi tiyi
6 210 76 17
记年份代码为x(x=1,2,3,4,5),t= ,对数据处理后得:
(1)根据散点图判断,模型①y=bx+a与模型②y= +c哪一个适宜作为y关于
x的回归方程?(给出判断即可,不必说明理由)
(2)根据(1)的判断结果,建立y关于x的回归方程,并预测2022年全国直排海
污染源中的氨氮总量(计算结果精确到整数).
参考公式:回归方程 = x+ 中斜率和截距的最小二乘估计公式分别为 =
= , = - .
解析 (1)根据散点图的趋势,可知模型②适宜作为y关于x的回归方程.
(2)因为 = =8,且 = - =2,
所以y关于t的回归方程为 =8t+2,即y关于x的回归方程为 = +2,
2022年对应的年份代码为x=6,所以 ≈3,故预计2022年全国直排海污染
源中的氨氮总量为3千吨.
5.(2023届广州仲元中学月考,20)随着时代的不断发展,社会对高素质人才
的需求不断扩大,我国本科毕业生中考研人数也不断攀升,2020年的考研
人数是341万人,2021年的考研人数是377万某省市统某省市其中四所
大学2022年的毕业生人数及考研人数(单位:千人),得到如下表格:
大学 A大学 B大学 C大学 D大学
2022年毕业生人
数x(千人)
7 6 5 4
2022年考研人数y
(千人)
(1)已知y与x具有较强的线性相关关系,求y关于x的经验回归方程 = x+ ;
(2)某省市对选择考研的大学生每人发放万元的补贴.
某省市E大学2022年毕业生人数为8千人,某省市要发放补贴的总金
额;
②若A大学的毕业生中小浙、小江选择考研的概率分别为p,3p-某省市对
小浙、小江两人的考研补贴总金额的期望不超过万元,求p的取值范
围.
参考公式: = = , = - .
解析 (1)由题意得 = =, = =,
又 xiyi=7×+6×+5×+4×=,
∴ xiyi-4 =-4××=,
∵ =72+62+52+42=126,
∴ -4 =126-4×=5,
∴ = = =,
∴ = - =×=,
故y关于x的经验回归方程为 =.
(2)①将x=8代入 =,得 =×=,
某省市要发放补贴的总金额为×1 000×=300(万元).
②设小浙、小江两人中选择考研的人数为X,则X的所有可能值为0,1,2.
P(X=0)=(1-p)(2-3p)=3p2-5p+2,
P(X=1)=(1-p)(3p-1)+p(2-3p)=-6p2+6p-1,
P(X=2)=p(3p-1)=3p2-p,
∴E(X)=0×(3p2-5p+2)+(-6p2+6p-1)×1+(3p2-p)×2=4p-1,
∴E()=×(4p-1)≤,解得p≤ ,
又0≤3p-1≤1,
∴ ≤p≤ ,
∴ ≤p≤ ,
故p的取值范围为 .
考法二 独立性检验的应用
1.(2023届重庆质量检测,18)某大型企业组织全体员工参加体检,为了解员
工的健康状况,企业相关工作人员从中随机抽取了40人的体检报告进行
相关指标的分析,按体重“超标”和“不超标”制成2×2列联表如下:
超标 不超标 合计
男 16 20
女 15
合计
附:χ2= ,n=a+b+c+d.
α
xα
(1)完成题中的2×2列联表,并根据小概率值α=的独立性检验,能否认
为该企业员工体重是否超标与性别有关?
(2)若以样本估计总体,用频率作为相应事件的概率.现从该大型企业的
男、女员工中各随机抽取一名员工的体检报告,求抽到的两人中恰有一
人体重超标的概率.
解析 (1)零假设为H0:体重是否超标与性别无关.依题意可得2×2列联表
如下:
超标 不超标 合计
男 16 4 20
女 5 15 20
合计 21 19 40
所以χ2= ≈>=,
根据小概率值α=的独立性检验,没有充分证据推断H0成立,因此可以
认为H0不成立,即认为该企业员工体重是否超标与性别有关.
(2)由题意知,从男员工中随机抽取一人,体重超标的概率为 ,不超标的概
率为 ;
从女员工中随机抽取一人,体重超标的概率为 ,不超标的概率为 .
所以所求概率P= × + × = .
2.(2023届河北河间一中开学考,2某省市一隧道由于机动车常在隧道内变
道、超速,进而引发交通事故,交管部门在该隧道内安装了监控测速装置,
并将该隧道某日所有车辆的通行速度进行统计,如图所示.已知通过该隧
道车辆的平均速度为64 km·h-1.
(1)求a,b的值,并估计这一天通过该隧道车辆速度的中位数;
(2)为了调查在该隧道内安装监控测速装置的必要性,研究人员随机抽查
了通过该隧道的200名司机,得到的答复统计如表所示,根据小概率值α=
的独立性检验,能否认为对安装监控测速装置的态度与司机的性别相
关?
认为安装监控测速
装置十分必要
认为安装监控测速
装置没有必要
男司机 70 30
女司机 50 50
附:χ2= ,其中n=a+b+c+d.
α
xα
解析 (1)根据频率和为1可得10×(a+b++)=1,化简得a+b=,①
又45×+55×+65×10a+75×10b=64,
所以65a+75b=,②
联立①②解得,a=,b=.
因为(+)×10=<,(++)×10=>,所以所求
的中
位数为60+ ×10=65.
(2)零假设为H0:对安装监控测速装置的态度与司机的性别无关.根据表中
数据,计算χ2= ≈>=.
根据小概率值α=的独立性检验,没有充分证据推断H0成立,因此可以
认为H0不成立,即认为对安装监控测速装置的态度与司机的性别相关.
3.(2023届广东六校联考,20)足球是一项大众喜爱的运动.2022卡塔尔世界
杯揭幕战在2022年11月21日打响,决赛于12月18日晚进行,全程为期28天.
(1)为了解喜爱足球运动是否与性别有关,随机抽取了男性和女性各100名
观众进行调查,得到2×2列联表如下:
喜爱足球运动 不喜爱足球运动 合计
男性 60 40 100
女性 20 80 100
合计 80 120 200
依据小概率值α=的独立性检验,能否认为喜爱足球运动与性别有
关?
(2)校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将
球传出,每次传球时,传球者都等可能地将球传给另外三个人中的任何一
人,如此不停地传下去,且假定每次传球都能被接到.记开始传球的人为第
1次触球者,第n次触球者是甲的概率记为Pn,即P1=1.
(i)求P3(直接写出结果即可);
(ii)证明:数列 为等比数列,并比较第19次与第20次触球者是甲的
概率的大小.
附:χ2=
α
xα
解析 (1)零假设H0:喜爱足球运动与性别无关,
根据列联表数据计算得
χ2= = >=,
根据小概率值α=的独立性检验,我们推断H0不成立,即认为喜爱足球
运动与性别有关,此推断犯错误的概率不超过.
(2)(i)由题意得:第二次触球者为乙,丙,丁中的一个,第二次触球者传给包
括甲的三人中的一人,故传给甲的概率为 ,故P3= .
(ii)第n次触球者是甲的概率为Pn,则当n≥2时,第n-1次触球者是甲的概率
为Pn-1,第n-1次触球者不是甲的概率为1-Pn-1,
则Pn=Pn-1·0+(1-Pn-1)· = (1-Pn-1),
从而Pn- =- ,
又P1- = ,∴ 是以 为首项,- 为公比的等比数列.则Pn= ×
+ ,
∴P19= × + > ,P20= × + < ,
则P19>P20,故第19次触球者是甲的概率大.
一、单项选择题
专题综合检测
1.(2019课标Ⅱ,5,5分)演讲比赛共有9位评委分别给出某选手的原始评分,
评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得
到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是
( )
A.中位数 B.平均数
C.方差 D.极差
答案 A
2.(2022某省市联考,3)从装有2个红球和2个黑球的袋子内任取2个球,下
列选项中是互斥而不对立的两个事件的是 ( )
A.“至少有1个红球”与“都是黑球”
B.“恰好有1个红球”与“恰好有1个黑球”
C.“至少有1个黑球”与“至少有1个红球”
D.“都是红球”与“都是黑球”
答案 D
3.(2022重庆云阳江口中学期末,8)高三(1)班举行英语演讲比赛,共有六名
同学进入决赛,在安排出场顺序时,甲排在后三位,且丙、丁排在一起的概
率为 ( )
A. B. C. D.
答案 B
4.(202某省市级联测联考五,4)小明参加某项测试,该测试一共3道试题,
每道试题做对得5分,做错得0分,没有中间分,小明答对第1,2题的概率都
是 ,答对第3题的概率是 ,则小明答完这3道题的得分期望为 ( )
A. B. C. D.
答案 C
5.(2023届江苏常州一中检测,4)已知两个随机变量X,Y,其中X~B ,Y~
N(μ,σ2)(σ>0),若E(X)=E(Y),且P(|Y|<1)=,则P(Y>3)= ( )
答案 D
6.(2023届长沙雅礼中学月考一,6)某工厂有甲,乙两个生产车间,所生产的
同一批产品合格率分别是99%和98%,已知某批产品的60%和40%分别是
甲,乙两个车间生产,质量跟踪小组从中随机抽取一件,发现不合格,则该
产品是由甲车间生产的概率为 ( )
A. B. C. D.
答案 D
7.(2022重庆八中调研检测七,4)考察下列两个问题:①已知随机变量X~B
(n,p),且E(X)=4,D(X)=2,记P(X=1)=a;②甲、乙、丙三人随机到某3个景点
去旅游,每人只去一个景点,设A表示“甲、乙、丙所去的景点互不相
同”,B表示“有一个景点仅甲一人去旅游”,记P(A|B)=b,则 ( )
= ,b= = ,b=
= ,b= = ,b=
答案 C
8.(2022湖南三湘名校联盟联考,11)记数列{an}的前n项和为Sn,已知Sn=an2-
4an+b,在数集{-1,0,1}中随机抽取一个数作为a,在数集{-3,0,3}中随机抽
取一个数作为b.在这些不同数列中随机抽取一个数列{an},下列结论正确
的是 ( )
A.{an}是等差数列的概率为
B.{an}是递增数列的概率为
C.{an}是递减数列的概率为
≥S2(n∈N*)的概率为
答案 AB
二、多项选择题
9.(2022石家庄二中月考,10)下列命题中,正确的是 ( )
A.已知随机变量X服从二项分布B(n,p),若E(X)=30,D(X)=20,则p=
B.将一组数据中的每个数据都加上同一个常数后,方差恒不变
C.设随机变量ξ服从正态分布N(0,1),若P(ξ>1)=p,则P(-1<ξ≤0)= -p
D.某人在10次射击中,击中目标的次数为X,X~B(10,),则当X=8时概率
最大
答案 BCD
10.(202某省市实验学校期中,8)一名信息员维护甲乙两公司的5G网络,
一天内甲公司需要维护和乙公司需要维护相互独立,它们需要维护的概
率分别为和,则至少有一个公司不需要维护的概率为 .
答案
三、填空题
11.(2019课标Ⅱ理,13,5分)我国高铁发展迅速,技术先进.经统计,在经停某
站的高铁列车中,有10个车次的正点率为,有20个车次的正点率为,
有10个车次的正点率为,则经停该站高铁列车所有车次的平均正点
率的估计值为 .
答案
12.(2023届浙江嘉兴测试,15)树人中学进行篮球定点投篮测试,规则为每
人投篮三次,先在A处投一次三分球,投进得3分,未投进得0分,然后在B处
投两次两分球,每投进一次得2分,未投进得0分,测试者累计得分高于3分
即通过测试.甲同学为了通过测试,进行了五轮投篮训练,每轮在A处和B处
各投10次,统计该同学各轮三分球和两分球的投进次数如图:
若以五轮投篮训练命中频率的平均值作为其测试时每次投篮命中的概
率,则该同学通过测试的概率是 .
答案
13.(2019课标Ⅱ,18,12分)11分制乒乓球比赛,每赢一球得1分,当某局打成1
0∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、
乙两位同学进行单打比赛,假设甲发球时甲得分的概率为,乙发球时甲
得分的概率为,各球的结果相互独立.在某局双方10∶10平后,甲先发
球,两人又打了X个球该局比赛结束.
(1)求P(X=2);
(2)求事件“X=4且甲获胜”的概率.
四、解答题
解析 (1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个
球均由甲得分,或者均由乙得分.因此P(X=2)=×+()×()=.
(2)X=4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4
个球的得分情况为前两球是甲、乙各得1分,后两球均为甲得分.
因此所求概率为[×()+()×]××=.
14.(2021新高考Ⅱ,21,12分)一种微生物群体可以经过自身繁殖不断生存
下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁
殖后为第2代……该微生物每代繁殖的个数是相互独立的且有相同的分
布列,设X表示1个微生物个体繁殖下一代的个数,P(X=i)=pi(i=0,1,2,3).
(1)已知p0=,p1=,p2=,p3=,求E(X);
(2)设p表示该种微生物经过多代繁殖后临近灭绝的概率,p是关于x的方
程:p0+p1x+p2x2+p3x3=x的一个最小正实根,求证:当E(X)≤1时,p=1,当E(X)>1
时,p<1;
(3)根据你的理解说明(2)问结论的实际含义.
解析 (1)E(X)=0×+1×+2×+3×=1.
(2)证明:设f(x)=p3x3+p2x2+(p1-1)x+p0,
由题意知p3+p2+p1+p0=1,
故f(x)=p3x3+p2x2-(p2+p0+p3)x+p0,
f '(x)=3p3x2+2p2x-(p2+p0+p3),
若E(X)≤1,则p1+2p2+3p3≤1,故p2+2p3≤p0,
因为f '(0)=-(p2+p0+p3)<0,f '(1)=p2+2p3-p0≤0,
所以f '(x)有两个不同零点x1,x2,且x1<0<1≤x2,
当x∈(-∞,x1)∪(x2,+∞)时, f '(x)>0,
当x∈(x1,x2)时, f '(x)<0,
故f(x)在(-∞,x1),(x2,+∞)上为增函数,
在(x1,x2)上为减函数,
若x2=1,因为f(x)在(x2,+∞)上为增函数,在(x1,x2)上为减函数,且f(1)=0,
所以f(x)>f(x2)=f(1)=0,
故1为关于x的方程:p0+p1x+p2x2+p3x3=x的一个最小正实根,即p=1,故当E(x)
≤1时,p=1.
若x2>1,因为f(1)=0且f(x)在(0,x2)上为减函数,
故1为关于x的方程:p0+p1x+p2x2+p3x3=x的一个最小正实根.
综上,若E(X)≤1,则p=1.
若E(X)>1,则p1+2p2+3p3>1,则p2+2p3>p0,
此时f '(0)=-(p2+p0+p3)<0,f '(1)=p2+2p3-p0>0,
故f '(x)有两个不同零点x3,x4且x3<0<x4<1,
故f(x)在(-
∞,x3),(x4,+∞)上为增函数,在(x3,x4)上为减函数,而f(1)=0,故f(x4)<
0,
又f(0)=p0>0,所以f(x)在(0,x4)上存在一个零点x0,且x0<1,
所以x0为关于x的方程:p0+p1x+p2x2+p3x3=x的一个最小正根,即p<1,
故当E(X)>1时,p<1.
(3)意义:若一个该种微生物繁殖后代的平均数不超过1,则若干代后会临
近灭绝,若繁殖后代的平均数超过1,则若干代后还有继续繁殖的可能.
15.(2019课标Ⅰ,21,12分)为治疗某种疾病,研制了甲、乙两种新药,希望知
道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白
鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以
乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白
鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药
更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈
且施以乙药的白鼠未治愈,则甲药得1分,乙药得-1分;若施以乙药的白鼠
治愈且施以甲药的白鼠未治愈,则乙药得1分,甲药得-1分;若都治愈或都
未治愈,则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试
验中甲药的得分记为X.
(1)求X的分布列;
(2)若甲药、乙药在试验开始时都赋予4分,pi(i=0,1,…,8)表示“甲药的累
计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,pi=api-1+
bpi+cpi+1(i=1,2,…,7),其中a=P(X=-
1),b=P(X=0),c=P(X=1).假设α=,β=.
(i)证明:{pi+1-pi}(i=0,1,2,…,7)为等比数列;
(ii)求p4,并根据p4的值解释这种试验方案的合理性.
解析 (1)X的所有可能取值为-1,0,1.
P(X=-1)=(1-α)β,
P(X=0)=αβ+(1-α)(1-β),
P(X=1)=α(1-β).
所以X的分布列为
X -1 0 1
P (1-α)β αβ+(1-α)(1-β) α(1-β)
(2)(i)证明:由(1)得a=,b=,c=.
因此pi=-1+++1,
故(pi+1-pi)=(pi-pi-1),即pi+1-pi=4(pi-pi-1).
又因为p1-p0=p1≠0,
所以{pi+1-pi}(i=0,1,2,…,7)是公比为4,首项为p1的等比数列.
(ii)由(i)可得p8=p8-p7+p7-p6+…+p1-p0+p0=(p8-p7)+(p7-p6)+…+(p1-
p0)= p1.
由于p8=1,故p1= ,
所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)= p1= .
p4表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率
为,乙药治愈率为时,认为甲药更有效的概率为p4= ≈ 9,此时得出错误结论的概率非常小,说明这种试验方案合理.
16.(2023届重庆八中月考一,19)某国家队为了考察甲球员对球队的贡献,
现作如下数据统计:
球队胜 球队负 总计
甲参加 30 b 60
甲未参加 c 10 f
总计 60 e n
(1)根据小概率值α=的独立性检验,能否认为该球队胜利与甲球员参
赛有关联?
(2)根据以往的数据统计,甲球员能够胜任前锋、中场、后卫三个位置,且
出场率分别为,,;在甲出任前锋、中场、后卫的条件下,球队输球
的概率依次为,,,则
①当甲参加比赛时,求该球队某场比赛输球的概率;
②当甲参加比赛时,在球队输了某场比赛的条件下,求甲球员担当中场的
概率;
③如果你是教练员,应用概率统计有关知识,该如何使用甲球员?
附表及公式:
α
xα
χ2= ,n=a+b+c+d.
解析 (1)零假设为H0:球队胜利与甲球员参赛无关.依题意,知b=30,c=30,e
=40,f=40,n=100,则χ2= =>=,
根据小概率值α=的独立性检验,我们推断H0不成立,即认为该球队胜
利与甲球员参赛有关联,此推断犯错误的概率不超过.
(2)①设A1表示“甲球员担当前锋”;A2表示“甲球员担当中场”;A3表示
“甲球员担当后卫”;B表示“球队输掉某场比赛”,
有P(A1)=,P(A2)=,P(A3)=,P(B|A1)=P(B|A2)=,P(B|A3)=,
则P(B)=P(A1B)+P(A2B)+P(A3B)=P(A1)P(B|A1)+P(A2)P(B|A2)+P(A3)P(B|A3)
=×+×+×=,
所以该球队某场比赛输球的概率是.
②由①知,球队输了某场比赛的条件下,甲球员担当中场的概率P(A2|B)=
= =.
③由①知,球队输了某场比赛的条件下,甲球员担当前锋的概率P(A1|B)=
= =,
球队输了某场比赛的条件下,甲球员担当后卫的概率P(A3|B)= =
=,
结合②知,P(A1|B)∶P(A2|B)∶P(A3|B)=∶∶=1∶5∶14,
所以,应该多让甲球员担任前锋,来扩大赢球场次.