




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第3节成对数据的统计分析考试要求1.了解样本相关系数的统计含义.2.了解一元线性回归模型和2×2列联表,会运用这些方法解决简单的实际问题.【知识梳理】1.变量的相关关系(1)相关关系的分类:正相关和负相关.(2)线性相关:一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在____________附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.样本相关系数(1)相关系数r的计算变量x和变量y的样本相关系数r的计算公式如下:r=eq\f(\o(∑,\s\up12(n),\s\do11(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up12(n),\s\do11(i=1))(xi-\o(x,\s\up6(-)))2)\r(\o(∑,\s\up12(n),\s\do11(i=1))(yi-\o(y,\s\up6(-)))2)).(2)相关系数r的性质①当r>0时,称成对样本数据________相关;当r<0时,成对样本数据________相关;当r=0时,成对样本数据间没有线性相关关系.②样本相关系数r的取值范围为________.当|r|越接近1时,成对样本数据的线性相关程度越________;当|r|越接近0时,成对样本数据的线性相关程度越________.3.一元线性回归模型(1)我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,其中eq\b\lc\{(\a\vs4\al\co1(\o(b,\s\up6(^))=\f(\o(∑,\s\up12(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up12(n),\s\do10(i=1))(xi-\o(x,\s\up6(-)))2)=,,\o(a,\s\up6(^))=\o(y,\s\up6(-))-\o(b,\s\up6(^))\o(x,\s\up6(-)).))(2)决定系数R2=1-eq\f(\o(∑,\s\up12(n),\s\do10(i=1))(yi-\o(y,\s\up6(^))i)2,\o(∑,\s\up12(n),\s\do10(i=1))(yi-\o(y,\s\up6(-)))2),R2越________,即拟合效果越好,R2越________,模型拟合效果越差.4.列联表与独立性检验(1)关于分类变量X和Y的抽样数据的2×2列联表XY合计Y=0Y=1X=0aba+bX=1cdc+d合计a+cb+dn=a+b+c+d记n=a+b+c+d,则随机变量χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).(2)独立性检验基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828[常用结论与微点提醒]1.求解经验回归方程的关键是确定回归系数eq\o(a,\s\up6(^)),eq\o(b,\s\up6(^)),应充分利用回归直线过样本点的中心(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-))).2.根据χ2的值可以判断两个分类变量有关的可信程度,若χ2越大,则两个分类变量有关的把握越大.3.回归分析和独立性检验都是基于成对样本观测数据进行估计或推断,得出的结论都可能犯错误.【诊断自测】1.思考辨析(在括号内打“√”或“×”)(1)散点图无法判断两个变量是否相关.()(2)通过经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))可以估计预报变量的取值和变化趋势.()(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.()(4)事件X,Y关系越密切,则由观测数据计算得到的χ2的值越小.()2.(选修三P139T3)根据分类变量x与y的观测数据,计算得到χ2=2.974.依据α=0.05的独立性检验,结论为()A.变量x与y不独立B.变量x与y不独立,这个结论犯错误的概率不超过0.05C.变量x与y独立D.变量x与y独立,这个结论犯错误的概率不超过0.053.(选修三P103T1改编)两个变量的相关关系有:①正相关;②负相关;③不相关,则下列散点图从左到右分别反映的变量间的相关关系是()A.①②③ B.②③①C.②①③ D.①③②4.(多选)在统计中,由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)利用最小二乘法得到两个变量的经验回归方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^)),那么下列说法正确的是()A.直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必经过点(eq\o(x,\s\up6(-)),eq\o(y,\s\up6(-)))B.直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))表示最接近y与x之间真实关系的一条直线C.相关系数为r,且|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小D.用决定系数R2来刻画回归效果,R2越小说明拟合效果越好考点一成对数据的相关性例1(1)(2023·天津卷)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数r=0.8245,下列说法正确的是()A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈负相关C.花瓣长度和花萼长度呈正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245(2)(2024·杭州质检)某兴趣小组研究光照时长x(h)和向日葵种子发芽数量y(颗)之间的关系,采集5组数据,作如图所示的散点图.若去掉D(10,2),则下列说法正确的是()A.相关系数r变小 B.决定系数R2变小C.残差平方和变大 D.解释变量x与预报变量y的相关性变强__________________________________________________________________________________________________________________________________________________________________________________________________________________感悟提升判定两个变量相关性的方法(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.(2)样本相关系数:当r>0时,正相关;当r<0时,负相关;|r|越接近于1,相关性越强.(3)决定系数法:利用决定系数判定,R2越接近1,模型的拟合效果越好,相关性越强.训练1(1)(2023·上海卷)已知某校50名学生的身高与体重的散点图如图所示,则下列说法正确的是()A.身高越高,体重越重 B.身高越高,体重越轻C.身高与体重成正相关 D.身高与体重成负相关(2)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0C.-eq\f(1,2) D.1考点二回归分析角度1线性回归分析例2为实施乡村振兴,科技兴农,某村建起了田园综合体,并从省城请来专家进行技术指导,根据统计,该田园综合体西红柿亩产量的增加量y(千克)与某种液体肥料每亩使用量x(千克)之间的对应数据如下:x(千克)24568y(千克)300400400400500(1)由上表数据可知,可用经验回归模型拟合y与x的关系,请计算样本相关系数r并加以说明(若|r|>0.75,则线性相关程度很高,可用经验回归模型拟合);(2)求y关于x的经验回归方程,并预测当液体肥料每亩使用量为15千克时,西红柿亩产量的增加量约为多少千克?附:相关系数r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)·\r(\o(∑,\s\up6(n),\s\do4(i=1))(yi-\o(y,\s\up6(-)))2)),经验回归方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x的斜率和截距的最小二乘估计公式分别为eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),eq\r(10)≈3.16.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________角度2非线性回归分析例3(2024·广州质检)一企业生产某种产品,通过加大技术创新投入降低了每件产品成本.为了调查年技术创新投入x(单位:千万元)对每件产品成本y(单位:元)的影响,对近10年的年技术创新投入xi和每件产品成本yi(i=1,2,3,…,10)的数据进行分析,得到如下散点图,并计算得:eq\o(x,\s\up6(-))=6.8,eq\o(y,\s\up6(-))=70,eq\o(∑,\s\up6(10),\s\do4(i=1))eq\f(1,xi)=3,eq\o(∑,\s\up6(10),\s\do4(i=1))eq\f(1,xeq\o\al(2,i))=1.6,eq\o(∑,\s\up6(10),\s\do4(i=1))eq\f(yi,xi)=350.(1)根据散点图可知,可用函数模型y=eq\f(β,x)+α拟合y与x的关系,试建立y关于x的回归方程;(2)已知该产品的年销售额m(单位:千万元)与每件产品成本y的关系为m=-eq\f(y2,500)+eq\f(2y,25)+eq\f(200,y-10)+100.该企业的年投入成本除了年技术创新投入,还要投入其他成本10千万元,根据(1)的结果回答:当年技术创新投入x为何值时,年利润的预报值最大?(注:年利润=年销售额-年投入成本)参考公式:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为eq\o(β,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))uivi-n\o(u,\s\up6(-))\o(v,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))ueq\o\al(2,i)-n\o(u,\s\up6(-))2),eq\o(α,\s\up6(^))=eq\o(v,\s\up6(-))-eq\o(β,\s\up6(^))eq\o(u,\s\up6(-)).________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________感悟提升回归分析问题的类型及解题方法(1)求经验回归方程①当两个系数均未知时,可利用公式法求解;②当两个系数已知一个求另一个时,可利用经验回归直线过样本点的中心求解.(2)利用经验回归方程进行预测,把经验回归方程看作一次函数,求函数值.(3)经验回归方程的拟合效果可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.训练2(2024·西安调研)某商业银行对存款利率与日存款总量的关系进行调研,发现存款利率每上升一定的百分点,日均存款总额就会发生一定的变化,经过统计得到下表:利率上升百分点x0.10.20.30.40.5日均存款总额y(亿元)0.20.350.50.650.8(1)在给出的坐标系中画出上表数据的散点图;(2)根据上表提供的数据,用最小二乘法求出y关于x的经验回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^));(3)已知现行利率下的日均存款总额为0.625亿元,试根据(2)中的经验回归方程,预测日均存款总额为现行利率下的2倍时,利率需上升多少个百分点?参考公式及数据:①eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\o(x,\s\up6(-))\o(y,\s\up6(-)),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)),②eq\o(∑,\s\up6(5),\s\do4(i=1))xiyi=0.9,eq\o(∑,\s\up6(5),\s\do4(i=1))xeq\o\al(2,i)=0.55.________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________考点三独立性检验例4(2023·全国甲卷改编)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:<m≥m对照组试验组②根据①中的列联表,依据小概率值α=0.050的独立性检验,能否认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),α0.1000.0500.010xα2.7063.8416.635________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________感悟提升独立性检验的一般步骤(1)根据样本数据制成2×2列联表.(2)根据公式χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))计算.(3)比较χ2与临界值的大小关系,作统计推断.训练3某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 三农产品品牌培育方案手册
- 医疗卫生行业医疗信息化与智能诊断方案
- 医疗设备行业质量控制与监管体系方案
- 高效率日常行政事务文书指南
- 物联网行业智能家居设备互联互通方案
- 能源储存技术手册
- 餐饮企业运营管理与服务指南
- 辽宁2025年辽宁石化职业技术学院赴高校现场招聘3人笔试历年参考题库附带答案详解
- 自贡2025年第一批四川自贡市消防救援支队招录聘用制消防员25人笔试历年参考题库附带答案详解
- 绍兴浙江绍兴市急救中心招聘编外工作人员笔试历年参考题库附带答案详解
- CB/T 3155-1994带缆辅助索
- 鸟类教学讲解课件
- 斐波那契数列与黄金分割 课件
- 乙类互补推挽功率放大电路课件
- 2-管道仪表流程图PID
- 高中班会课:趣味知识竞赛课件
- 特种设备吨叉车设计计算书
- (精选word)洪恩识字-生字卡片1-200
- XX市三级公立综合医院绩效考核指标评分细则
- 监理平行检查记录表(最新全套)电子版本
- 押金收据条(通用版)
评论
0/150
提交评论