版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第九章统计与成对数据的统计分析第3节成对数据的统计分析1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.目
录CONTENTS知识诊断自测01考点聚焦突破02课时分层精练03知识诊断自测1ZHISHIZHENDUANZICE1.变量的相关关系(1)相关关系的分类:正相关和负相关.(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在__________附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.一条直线正负[-1,1]强弱大小(2)独立性检验基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立
,可以认为X和Y独立.下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828常用结论与微点提醒×√√×解析(1)散点图是判断两个变量是否相关的一种重要方法和手段.(4)χ2的值越大,相关性越强,关系越密切.2.(选修三P139T3)根据分类变量x与y的观测数据,计算得到χ2=2.974.依据α=0.05的独立性检验,结论为(
) A.变量x与y不独立 B.变量x与y不独立,这个结论犯错误的概率不超过0.05 C.变量x与y独立 D.变量x与y独立,这个结论犯错误的概率不超过0.05D解析由χ2=2.974<3.841=x0.05,可知x,y独立,这个结论犯错误的概率不超过0.05.
3.(选修三P103T1改编)两个变量的相关关系有:①正相关;②负相关;③不相关,则下列散点图从左到右分别反映的变量间的相关关系是(
)D解析第一个图大体趋势从左向右上升,故正相关,第二个图不相关,第三个图大体趋势从左向右下降,故负相关,故选D.A.①②③ B.②③①C.②①③ D.①③②ABC相关系数r的绝对值越接近于1,表示相关程度越强,越接近于0,相关程度越弱,故C正确;用决定系数R2来刻画回归效果,R2越大,说明模型的拟合效果越好,故D错误.考点聚焦突破2KAODIANJUJIAOTUPO考点一成对数据的相关性例1(1)(2023·天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,下列说法正确的是(
)A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245C解析因为相关系数r=0.8245>0.75,所以花瓣长度和花萼长度的相关性较强,并且呈正相关,所以选项A,B错误,选项C正确;因为相关系数与样本的数据有关,所以当样本发生变化时,相关系数也会发生变化,所以选项D错误.故选C.(2)(2024·杭州质检)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D(10,2),则下列说法正确的是(
)A.相关系数r变小B.决定系数R2变小C.残差平方和变大D.解释变量x与预报变量y的相关性变强D解析可知点D偏离程度较大,去掉点D后,相关系数r变大,决定系数R2变大,残差平方和变小,解释变量x与预报变量y的相关性变强.故选D.感悟提升判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)决定系数法:利用决定系数判定,R2越接近1,模型的拟合效果越好,相关性越强.训练1(1)(2023·上海卷)已知某校50名学生的身高与体重的散点图如图所示,则下列说法正确的是(
)A.身高越高,体重越重B.身高越高,体重越轻C.身高与体重成正相关D.身高与体重成负相关C解析由题图可知,身高越高的体重不一定就越重或越轻,但总体上来说,样本学生的身高和体重之间具有明显的相关性,个子高的学生往往更重一些,所以身高与体重成正相关.故选C.A考点二回归分析角度1线性回归分析例2
为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导,根据统计,该田园综合体西红柿亩产量的增加量y(千克)与某种液体肥料每亩使用量x(千克)之间的对应数据如下:x(千克)24568y(千克)300400400400500(1)由上表数据可知,可用经验回归模型拟合y与x的关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合);感悟提升回归分析问题的类型及解题方法(1)求经验回归方程①当两个系数均未知时,可利用公式法求解;②当两个系数已知一个求另一个时,可利用经验回归直线过样本点的中心求解.(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值.(3)经验回归方程的拟合效果可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.训练2(2024·西安调研)某商业银行对存款利率与日存款总量的关系进行调研,发现存款利率每上升一定的百分点,日均存款总额就会发生一定的变化,经过统计得到下表:利率上升百分点x0.10.20.30.40.5日均存款总额
y(亿元)0.20.350.50.650.8(1)在给出的坐标系中画出上表数据的散点图;解如图所示.解由表格数据可得解设利率需上升x个百分点,由(2)得,0.625×2=1.5x+0.05,解得x=0.8,所以预测利率需上升0.8个百分点.考点三独立性检验例4(2023·全国甲卷改编)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为 15.2
18.8
20.2
21.3
22.5
23.2
25.8 26.5
27.5
30.1
32.6
34.3
34.8
35.6 35.6
35.8
36.2
37.3
40.5
43.2
试验组的小白鼠体重的增加量从小到大排序为 7.8
9.2
11.4
12.4
13.2
15.5
16.5 18.0
18.8
19.2
19.8
20.2
21.6
22.8 23.6
23.9
25.1
28.2
32.3
36.5(1)计算试验组的样本平均数;(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:
<m≥m对照组
试验组
<m≥m对照组614试验组146解零假设为H0:小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量没有差异.依据小概率值α=0.050的独立性检验,我们推断H0不成立,所以在犯错误的概率不超过0.050的前提下,即认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.感悟提升训练3
某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;解由所给数据,得该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);解根据所给数据,可得2×2列联表:
人次≤400人次>400空气质量好3337空气质量不好228零假设为H0:一天中到该公园锻炼的人次与该市当天的空气质量无关.根据小概率值α=0.050的独立性检验,可推断H0不成立,所以在犯错误的概率不超过0.050的前提下,可认为一天中到该公园锻炼的人次与该市当天的空气质量有关.课时分层精练3KESHIFENCENGJINGLIAN1.某机构为调查网游爱好者是否有性别差异,通过调研数据统计:在500名男生中有200名爱玩网游,在400名女生中有50名爱玩网游.若要确定网游爱好是否与性别有关时,用下列最适合的统计方法是(
) A.均值
B.方差 C.独立性检验 D.回归分析C解析由题意可知,“爱玩网游”与“性别”是两类变量,其是否有关,应用独立性检验判断.D解析r的绝对值越大,m越小,线性相关性越强.BC解析根据题表中的数据,由题意得AABC解析由题意可得7.(多选)为了解阅读量多少与幸福感强弱之间的关系,一个调查机构根据所得到的数据,绘制了如下所示的2×2列联表(个别数据暂用字母表示):
幸福感强幸福感弱合计阅读量多m1872阅读量少36n78合计9060150计算得:χ2≈12.981,参照下表:α0.100.050.0250.0100.0050.001xα2.7063.8415.0246.6357.87910.828对于下面的选项,正确的是(
)A.根据小概率值α=0.010的独立性检验,可以认为“阅读量多少与幸福感强弱无关”B.m=54C.根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”D.n=52BC解析∵χ2≈12.981>7.879>6.635,∴根据小概率值α=0.010的独立性检验,可以在犯错误的概率不超过1%的前提下认为“阅读量多少与幸福感强弱有关”,根据小概率值α=0.005的独立性检验,可以在犯错误的概率不超过0.5%的前提下认为“阅读量多少与幸福感强弱有关”,∴A错,C正确,∵m+36=90,18+n=60,∴m=54,n=42,∴B正确,D错.1010.一项研究同年龄段的男、女生的注意力差别的脑功能实验,其实验数据如表所示:性别注意力稳定不稳定男297女3350.538则χ2=________(精确到小数点后三位),依据概率值α=0.05的独立性检验,该实验______该年龄段的学生在注意力的稳定性上对于性别没有显著差异(填拒绝或支持).支持解析由表中数据可知a=29,b=7,c=33,d=5,n=a+b+c+d=74,所以没有充分证据认为学生在注意力的稳定性上与性别有关,即该实验支持该年龄段的学生在注意力的稳定性上对于性别没有显著差异.(2)该企业改进生产工艺后,生产了批次乙的芯片.某手机厂商获得批次甲与批次乙的芯片,并在某款手机上使用.现对使用这款手机的100名用户回访,对开机速度进行调查.据统计,安装批次甲的有40名,其中对开机速度满意的有30名;安装批次乙的有60名,其中对开机速度满意的有55名.试整理出2×2列联表(单位:名),并依据小概率值α=0.05的独立性检验,分析芯片批次是否与用户对开机速度满意有关.批次是否满意合计满意不满意甲
乙
合计
α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828解零假设为H0:芯片批次与用户对开机速
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025江苏省安全员《A证》考试题库
- 灵芝种植产业基地项目可行性研究报告-灵芝市场需求持续扩大
- 广州中医药大学《试剂生产工艺》2023-2024学年第一学期期末试卷
- 2025青海省建筑安全员-B证考试题库及答案
- 广州医科大学《哲学通论》2023-2024学年第一学期期末试卷
- 2025辽宁建筑安全员考试题库
- 2025年江苏建筑安全员考试题库及答案
- 2025年-江苏省安全员《B证》考试题库及答案
- 《FOOD中国饮食文化》课件
- 【语文课件】冀中的地道战课件
- 一年级下学期道德与法治教学工作总结
- 财税公司合同范本
- 临时用电电缆线租赁合同
- DB34T4829-2024公路工程泡沫轻质土设计与施工技术规程
- 抗肿瘤药物临床管理办法培训
- 福建省福州市2023-2024学年高一上学期1月期末地理试题(解析版)
- 各部门月度安全环保考评细则
- 预防性侵害安全教育
- 科大讯飞招聘在线测评题
- 医学文献检索复习试题和答案解析(四)
- 科学备考讲解模板
评论
0/150
提交评论