第3节 成对数据的统计分析
高 考 总复 习 优 化 设 计
GAO KAO ZONG FU XI YOU HUA SHE JI
2026
强基础•固本增分
研考点•精准突破
目 录 索 引
01
02
课 标 解 读
1.了解样本相关系数的统计含义,了解样本相关系数与标准化数据向量夹
角的关系.会通过相关系数比较成对数据的相关性.
2.了解一元线性回归模型的含义,了解模型参数的统计意义,了解最小二乘
原理,掌握一元线性回归模型参数的最小二乘估计方法.
3.针对实际问题,会用一元线性回归模型进行预测.
4.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应用.
强基础•固本增分
知识梳理
1.变量的相关关系
(1)两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个
的程度,这种关系称为相关关系. 是一种非确定的关系,不是函数关系
(2)正相关、负相关
从整体上看,当一个变量的值增加时,另一个变量的相应值也呈现
的趋势,我们就称这两个变量正相关;当一个变量的值增加时,
另一个变量的相应值呈现 的趋势,则称这两个变量负相关.
增加
减小
(3)线性相关、非线性相关
一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条
附近,我们就称这两个变量线性相关.
一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个
变量非线性相关或曲线相关.
[教材知识深化]
由散点图判断两个变量正相关、负相关的方法:当散点图中的点散布在平
面直角坐标系中从左下角到右上角的区域时,两个变量正相关;当散点图中
的点散布在平面直角坐标系中从左上角到右下角的区域时,两个变量负相
关.
直线
正相关
负相关
微思考 经验回归方程是否一定有实际意义?
提示 经验回归方程不一定都有实际意义.回归分析是对具有相关关系的两
个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的经验回归
方程才有实际意义.
4.列联表与独立性检验
(1)2×2列联表
如下表,给出成对分类变量数据的交叉分类频数的数据统计表称为2×2列
联表.
X
Y
合计
Y=0 Y=1
X=0 a b a+b
X=1 c d c+d
合计 a+c b+d a+b+c+d
α
xα
[教材知识深化]
根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两分类变
量有关的把握越大.
自主诊断
√
×
×
2.(人教B版选择性必修第二册节例1改编)咽拭子检测是一种医学检测
方法,用医用棉签从人体的咽部蘸取少量分泌物进行检测,可以了解患者病
情、口腔黏膜和咽部感染情况.某地区医院的医务人员统计了该院近五天
的棉签使用情况,具体数据如下表所示:
t(单位:天) 第1天 第2天 第3天 第4天 第5天
y(单位:袋) 15 24 36 44 56
86
二、连线高考
3.(2024·天津,3)下列图中,相关系数最大的是( )A
解析 观察4个选项可知,选项A中的散点分布比较集中,且基本接近某一条
直线,线性回归模型拟合效果比较好,呈现明显的正相关.故选A.
4.(2024·上海,19改编)为了解某地初中学生日均体育锻炼时长与学业成绩
的关系,从该地区29 000名学生中抽取580人,得到日均体育锻炼时长与学
业成绩的数据如下表所示:
时长 [0,) [,1) [1,) [,2) [2,)
优秀 5 44 42 3 1
不优秀 134 147 137 40 27
(3)
时长 [1,2) 其他 总数
优秀 45 50 95
不优秀 177 308 485
研考点•精准突破
考点一 考点二 考点三
考点一 成对数据的相关性
例1(2024·山东枣庄模拟)近年来骑行成为热门的户外运动方式之一.某同
学近来5次骑行期间的身体运动参数评分x与骑行距离y(单位:千米)的数据
统计如下表:
身体运动参数评分x 2 4 6 8 10
骑行距离y(千米) 38 37 32 33 30
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
[对点训练1]科研人员在对人体脂肪含量和年龄之间关系的研究中,获得了
一些年龄和脂肪含量的样本数据,如表:
x(年龄/岁) 26 27 39 41 49 53 56 58 60 61
y(脂肪含量/%)
考点一 考点二 考点三
考点一 考点二 考点三
考点二 回归模型(多考向探究预测)
考向1 一元线性回归模型
例2(2024·湖南长沙二模)如图是我国2015年至2023年65岁及以上老年人人
口数y(单位:亿)的折线图,
注:年份代码1~9分别对应年份2015~2023.
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
[对点训练2](2024·湖北孝感模拟)某农业大学组织部分学生进行作物栽培
试验,由于土壤相对贫瘠,前期作物生长较为缓慢,为了增加作物的生长速
度,达到预期标准,小明对自己培育的一株作物使用了营养液,现统计了使
用营养液十天之内该作物的高度变化:
天数x 1 2 3 4 5 6 7 8 9 10
作物高
度y/cm 9 10 10 11 12 13 13 14 14 14
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考向2 非线性回归模型
例3(2024·山西太原模拟)山西某地打造旅游特色村,鼓励当地村民将自己
闲置房改造成民宿出租,增加农民收入.为了解在旅游淡季民宿的出租情况
,随机选取6间民宿进行调查,统计它们在淡季的100天里的出租情况,得到
每间民宿租金x(单位:元/日)与其出租率y(出租天数/100)的对应关系表和散
点图如下:
租金x 88 128 188 288 388 488
出租
率y
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
[对点训练3](2024·陕西安康模拟)随着某著名企业互联网和直播带货技术
的发展,直播带货已经成为一种热门的销售方式,特别是商家通过展示产品
,使顾客对商品有更全面的了解.下面统计了某新手开启直播带货后从6月
份到10月份每个月的销售量yi(单位:万件)(i=1,2,3,4,5)的数据,得到如图所
示的散点图.其中6月份至10月份相应的代码为xi(i=1,2,3,4,5),如:x1表示6月
份.
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
考点三 列联表与独立性检验
例4(2024·全国甲,理17改编)某工厂进行生产线智能化升级改造.升级改造
后,从该工厂甲、乙两个车间的产品中随机抽取150件进行检验,数据如下:
车间 优级品 合格品 不合格品 合计
甲车间 26 24 0 50
乙车间 70 28 2 100
合计 96 52 2 150
考点一 考点二 考点三
(1)填写如下列联表:
车间
产品质量
优级品 非优级品
甲车间
乙车间
依据小概率值α=的χ2独立性检验,能否认为甲、乙两车间产品的优级
品率存在差异?
考点一 考点二 考点三
α
xα
考点一 考点二 考点三
解 (1)零假设为H0:两车间产品的优级品率无差异.
车间
产品质量
优级品 非优级品
甲车间 26 24
乙车间 70 30
考点一 考点二 考点三
考点一 考点二 考点三
考点一 考点二 考点三
[对点训练4](2023·全国甲,文19改编)一项试验旨在研究臭氧效应,试验方案
如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对
照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常
环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下.
对照组的小白鼠体重的增加量从小到大排序为
试验组的小白鼠体重的增加量从小到大排序为
考点一 考点二 考点三
(1)计算试验组的样本平均数.
(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m
与不小于m的数据的个数,完成如下列联表.
小组 <m ≥m
对照组
试验组
α
xα
考点一 考点二 考点三
考点一 考点二 考点三
小组 <m ≥m
对照组 6 14
试验组 14 6
考点一 考点二 考点三
更多精彩内容请登录志鸿优化网
本 课 结 束