




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第65讲成对数据的统计、分析1.变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.样本相关系数(1)相关系数r的计算变量x和变量y的样本相关系数r的计算公式如下:(2)相关系数r的性质①当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.②样本相关系数r的取值范围为[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.一元线性回归模型(1)经验回归方程与最小二乘法我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估计,其中(2)利用决定系数R2刻画回归效果,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.4.列联表与独立性检验(1)2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为xy合计y=y1y=y2x=x1aba+bx=x2cdc+d合计a+cb+dn=a+b+c+d(2)临界值χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.(3)独立性检验基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828考点1成对数据的相关性[名师点睛]判断相关关系的两种方法:(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.(2)决定系数法:利用决定系数判定,R2越趋近1,拟合效果越好,相关性越强.[典例]1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图1,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图2.由这两个散点图可以判断()图1图2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关2.(多选)下列有关经验回归分析的说法中正确的有()A.经验回归直线必过点(eq\x\to(x),eq\x\to(y))B.经验回归直线就是散点图中经过样本数据点最多的那条直线C.当样本相关系数r>0时,两个变量正相关D.如果两个变量的相关性越弱,则|r|就越接近于0[举一反三]1.(2023·重庆诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系2.下列四个散点图中,变量x与y之间具有负的线性相关关系的是()3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0 C.-eq\f(1,2) D.14.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的决定系数R2如下,其中拟合效果最好的模型是()A.模型1的决定系数R2为0.98B.模型2的决定系数R2为0.80C.模型3的决定系数R2为0.50D.模型4的决定系数R2为0.25考点2回归分析[名师点睛](1)求经验回归方程:利用公式eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)求eq\o(b,\s\up6(^));利用eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))求eq\o(a,\s\up6(^)),写出经验回归方程.(2)经验回归方程的拟合效果,可以利用相关系数|r|判断,当|r|越趋近于1时,两变量的线性相关性越强.或利用决定系数R2判断,R2越大,拟合效果越好.(3)非线性经验回归方程转化为线性经验回归方程的方法①若eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))eq\r(x),设t=eq\r(x),则eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t;②若满足对数式:eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))lnx,设t=lnx,则eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t;③若满足指数式:y=c1ec2x,两边取对数解lny=lnc1+c2x,设z=lny,a=lnc1,b=c2,则z=a+bx.[典例](2023·广州模拟)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示:(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数并加以说明(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的经验回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少.附:相关系数=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)),经验回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up11(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).[举一反三]1.(2023·湖北九师联盟联考)下表是关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)的统计表.x23456y3.44.25.15.56.8由上表可得经验回归方程eq\o(y,\s\up6(^))=0.81x+eq\o(a,\s\up6(^)),若规定:维修费用y不超过10万元,一旦大于10万元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为()A.7B.8C.9D.102.用模型y=cekx拟合一组数据时,为了求出经验回归方程,设z=lny,其变换后得到经验回归方程为z=0.5x+2,则c等于()A.0.5B.e0.5C.2D.e2考点3独立性检验[名师点睛]1.在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表:(2)根据公式χ2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d))计算χ2;(3)通过比较χ2与临界值的大小关系来作统计推断.[典例](2023·全国Ⅲ卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,能否在犯错误的概率不超过0.05的前提下,认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),[举一反三]1.为了解某大学的学生是否爱好体育锻炼,用简单随机抽样方法在校园内调查了120位学生,得到如下2×2列联表:男女合计爱好ab73不爱好c25合计74则a-b-c等于()A.7B.8C.9D.102.(多选)某医疗研究机构为了了解免疫与注射疫苗的关系,进行一次抽样调查,得到数据如表1.免疫不免疫合计注射疫苗101020未注射疫苗63440合计164460(表1)α0.100.0500.0100.001xα2.7063.8416.63510.828(表2)则下列说法中正确的是()A.χ2≈8.35B.P(χ2≥6.635)≈0.001C.依据小概率值α=0.01的独立性检验,我们认为免疫与注射疫苗有关系D.依据小概率值α=0.001的独立性检验,我们认为免疫与注射疫苗有关系3.(2023·太原模拟)为进一步保护环境,加强治理空气污染,某市环保监测部门对市区空气质量进行调研,随机抽查了市区100天的空气质量等级与当天空气中SO2的浓度(单位:μg/m3),整理数据得到下表:SO2的浓度空气质量等级[0,50](50,150](150,475]1(优)28622(良)5783(轻度污染)3894(中度污染)11211若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”,根据上述数据,回答以下问题.(1)估计事件“该市一天的空气质量好,且SO2的浓度不超过150”的概率;(2)完成下面的2×2列联表,SO2的浓度空气质量[0,150](150,475]合计空气质量好空气质量不好合计(3)根据(2)中的列联表,依据小概率值α=0.01的独立性检验,能否据此推断该市一天的空气质量与当天SO2的浓度有关?第65讲成对数据的统计、分析1.变量的相关关系(1)相关关系两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.(2)相关关系的分类:正相关和负相关.(3)线性相关一般地,如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们就称这两个变量线性相关.一般地,如果两个变量具有相关性,但不是线性相关,那么我们就称这两个变量非线性相关或曲线相关.2.样本相关系数(1)相关系数r的计算变量x和变量y的样本相关系数r的计算公式如下:(2)相关系数r的性质①当r>0时,称成对样本数据正相关;当r<0时,成对样本数据负相关;当r=0时,成对样本数据间没有线性相关关系.②样本相关系数r的取值范围为[-1,1].当|r|越接近1时,成对样本数据的线性相关程度越强;当|r|越接近0时,成对样本数据的线性相关程度越弱.3.一元线性回归模型(1)经验回归方程与最小二乘法我们将eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估计,其中(2)利用决定系数R2刻画回归效果,R2越大,即拟合效果越好,R2越小,模型拟合效果越差.4.列联表与独立性检验(1)2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其2×2列联表为xy合计y=y1y=y2x=x1aba+bx=x2cdc+d合计a+cb+dn=a+b+c+d(2)临界值χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).忽略χ2的实际分布与该近似分布的误差后,对于任何小概率值α,可以找到相应的正实数xα,使得P(χ2≥xα)=α成立.我们称xα为α的临界值,这个临界值就可作为判断χ2大小的标准.(3)独立性检验基于小概率值α的检验规则是:当χ2≥xα时,我们就推断H0不成立,即认为X和Y不独立,该推断犯错误的概率不超过α;当χ2<xα时,我们没有充分证据推断H0不成立,可以认为X和Y独立.这种利用χ2的取值推断分类变量X和Y是否独立的方法称为χ2独立性检验,读作“卡方独立性检验”,简称独立性检验.下表给出了χ2独立性检验中几个常用的小概率值和相应的临界值α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828考点1成对数据的相关性[名师点睛]判断相关关系的两种方法:(1)散点图法:如果样本点的分布从整体上看大致在某一曲线附近,变量之间就有相关关系;如果样本点的分布从整体上看大致在某一直线附近,变量之间就有线性相关关系.(2)决定系数法:利用决定系数判定,R2越趋近1,拟合效果越好,相关性越强.[典例]1.对变量x,y有观测数据(xi,yi)(i=1,2,…,10),得散点图如图1,对变量u,v有观测数据(ui,vi)(i=1,2,…,10),得散点图如图2.由这两个散点图可以判断()图1图2A.变量x与y正相关,u与v正相关B.变量x与y正相关,u与v负相关C.变量x与y负相关,u与v正相关D.变量x与y负相关,u与v负相关答案C解析由题图可得两组数据均线性相关,且图1的经验回归直线的斜率为负,图2的经验回归直线的斜率为正,则由散点图可判断变量x与y负相关,u与v正相关.2.(多选)下列有关经验回归分析的说法中正确的有()A.经验回归直线必过点(eq\x\to(x),eq\x\to(y))B.经验回归直线就是散点图中经过样本数据点最多的那条直线C.当样本相关系数r>0时,两个变量正相关D.如果两个变量的相关性越弱,则|r|就越接近于0答案ACD解析对于A,经验回归直线必过点(eq\x\to(x),eq\x\to(y)),故A正确;对于B,经验回归直线在散点图中可能不经过任一样本数据点,故B不正确;对于C,当样本相关系数r>0时,则两个变量正相关,故C正确;对于D,如果两个变量的相关性越弱,则|r|就越接近于0,故D正确.[举一反三]1.(2023·重庆诊断)某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率(%)12.610.418.53.08.116.3根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系答案A解析由统计表可得利润率与人均销售额不是正比例关系,也不是反比例关系,排除C和D;其属于正相关关系,A正确,B错误.2.下列四个散点图中,变量x与y之间具有负的线性相关关系的是()答案D解析观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.3.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-eq\f(1,2)x+1上,则这组样本数据的样本相关系数为()A.-1 B.0 C.-eq\f(1,2) D.1答案A解析因为样本点在直线y=-eq\f(1,2)x+1上,呈现完全负相关,样本相关系数为-1.4.两个变量y与x的回归模型中,分别选择了4个不同模型,它们的决定系数R2如下,其中拟合效果最好的模型是()A.模型1的决定系数R2为0.98B.模型2的决定系数R2为0.80C.模型3的决定系数R2为0.50D.模型4的决定系数R2为0.25答案A解析在两个变量y与x的回归模型中,它们的决定系数R2越接近1,模型拟合效果越好,在四个选项中A的决定系数最大,所以拟合效果最好的是模型1.考点2回归分析[名师点睛](1)求经验回归方程:利用公式eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)求eq\o(b,\s\up6(^));利用eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))求eq\o(a,\s\up6(^)),写出经验回归方程.(2)经验回归方程的拟合效果,可以利用相关系数|r|判断,当|r|越趋近于1时,两变量的线性相关性越强.或利用决定系数R2判断,R2越大,拟合效果越好.(3)非线性经验回归方程转化为线性经验回归方程的方法①若eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))eq\r(x),设t=eq\r(x),则eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t;②若满足对数式:eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))lnx,设t=lnx,则eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))t;③若满足指数式:y=c1ec2x,两边取对数解lny=lnc1+c2x,设z=lny,a=lnc1,b=c2,则z=a+bx.[典例](2023·广州模拟)根据统计,某蔬菜基地西红柿亩产量的增加量y(百千克)与某种液体肥料每亩使用量x(千克)之间的对应数据的散点图如图所示:(1)依据数据的散点图可以看出,可用线性回归模型拟合y与x的关系,请计算相关系数并加以说明(若|r|>0.75,则线性相关程度很高,可用线性回归模型拟合);(2)求y关于x的经验回归方程,并预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为多少.附:相关系数=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\r(\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2)\r(\o(∑,\s\up6(n),\s\do4(i=1))yeq\o\al(2,i)-n\o(y,\s\up6(-))2)),经验回归直线eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))的斜率和截距的最小二乘估计分别为eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up11(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\a\vs4\al(\o(x,\s\up6(-)))\a\vs4\al(\o(y,\s\up6(-))),\o(∑,\s\up6(n),\s\do4(i=1))xeq\o\al(2,i)-n\o(x,\s\up6(-))2),eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-)).解(1)eq\o(x,\s\up6(-))=eq\f(2+4+5+6+8,5)=5,eq\o(y,\s\up6(-))=eq\f(3+4+5+6+7,5)=5.eq\o(∑,\s\up11(5),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))(yi-eq\o(y,\s\up6(-)))=(-3)×(-2)+(-1)×(-1)+0×0+1×1+3×2=14,eq\o(∑,\s\up11(5),\s\do4(i=1))(xi-eq\o(x,\s\up6(-)))2=(-3)2+(-1)2+02+12+32=20,eq\o(∑,\s\up11(5),\s\do4(i=1))(yi-eq\o(y,\s\up6(-)))2=(-2)2+(-1)2+02+12+22=10.=eq\f(14,\r(20)×\r(10))=eq\f(7\r(2),10)>0.75,∴可用线性回归模型拟合y与x的关系.(2)eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up11(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))(yi-\o(y,\s\up6(-))),\o(∑,\s\up6(5),\s\do4(i=1))(xi-\o(x,\s\up6(-)))2)=eq\f(14,20)=0.7,则eq\o(a,\s\up6(^))=eq\o(y,\s\up6(-))-eq\o(b,\s\up6(^))eq\o(x,\s\up6(-))=5-0.7×5=1.5,∴eq\o(y,\s\up6(^))=0.7x+1.5.当x=12时,eq\o(y,\s\up6(^))=0.7×12+1.5=9.9,∴预测液体肥料每亩使用量为12千克时,西红柿亩产量的增加量约为9.9百千克.当x=10时,eq\o(y,\s\up6(^))=39.6,则预测2025年该地区的经济收入为39.6百万元[举一反三]1.(2023·湖北九师联盟联考)下表是关于某设备的使用年限x(单位:年)和所支出的维修费用y(单位:万元)的统计表.x23456y3.44.25.15.56.8由上表可得经验回归方程eq\o(y,\s\up6(^))=0.81x+eq\o(a,\s\up6(^)),若规定:维修费用y不超过10万元,一旦大于10万元时,该设备必须报废.据此模型预测,该设备使用年限的最大值约为()A.7B.8C.9D.10答案D解析由表格,得eq\x\to(x)=eq\f(1,5)×(2+3+4+5+6)=4,eq\x\to(y)=eq\f(1,5)×(3.4+4.2+5.1+5.5+6.8)=5,因为经验回归直线恒过点(eq\x\to(x),eq\x\to(y)),所以5=0.81×4+eq\o(a,\s\up6(^)),解得eq\o(a,\s\up6(^))=1.76,所以经验回归方程为eq\o(y,\s\up6(^))=0.81x+1.76,由y≤10,得0.81x+1.76≤10,解得x≤eq\f(824,81)≈10.17,由于x∈N*,所以据此模型预测,该设备使用年限的最大值约为10.2.用模型y=cekx拟合一组数据时,为了求出经验回归方程,设z=lny,其变换后得到经验回归方程为z=0.5x+2,则c等于()A.0.5B.e0.5C.2D.e2答案D解析因为y=cekx,两边取对数得,lny=ln(cekx)=lnc+lnekx=kx+lnc,则z=kx+lnc,而z=0.5x+2,于是得lnc=2,即c=e2.考点3独立性检验[名师点睛]1.在2×2列联表中,如果两个变量没有关系,则应满足ad-bc≈0.|ad-bc|越小,说明两个变量之间关系越弱;|ad-bc|越大,说明两个变量之间关系越强.2.解决独立性检验的应用问题,一定要按照独立性检验的步骤得出结论.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表:(2)根据公式χ2=eq\f(n(ad-bc)2,(a+b)(a+c)(b+d)(c+d))计算χ2;(3)通过比较χ2与临界值的大小关系来作统计推断.[典例](2023·全国Ⅲ卷)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,能否在犯错误的概率不超过0.05的前提下,认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:χ2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),解(1)由所给数据,得该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计值为eq\f(1,100)(100×20+300×35+500×45)=350.(3)根据所给数据,可得2×2列联表:人次≤400人次>400空气质量好3337空气质量不好228零假设为H0:一天中到该公园锻炼的人次与该市当天的空气质量无关.根据列联表得χ2=eq\f(100×(33×8-22×37)2,55×45×70×30)≈5.820>3.841=xα.根据小概率值α=0.050的χ2独立性检验,可推断H0不成立,所以在犯错误的概率不超过0.05的前提下,可认为一天中到该公园锻炼的人次与该市当天的空气质量有关.[举一反三]1.为了解
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年中国木纹板市场调查研究报告
- 2025年中国无溶剂无毒防腐防渗涂料市场调查研究报告
- 2025年中国无头针自动搓牙机市场调查研究报告
- 2025至2031年中国精密陶瓷烧成窑炉材料行业投资前景及策略咨询研究报告
- 2025至2031年中国羽毛球上套机行业投资前景及策略咨询研究报告
- 中心性浆液性脉络膜视网膜病变护理业务学习课件
- 2025-2030年中国丁基内胎市场规模分析及投资风险评估报告
- 新疆建设职业技术学院《体育教材教法》2023-2024学年第二学期期末试卷
- 肇庆市实验中学高中历史三:第课汉代的思想大一统教案
- 2025至2030年中国绿化素市场分析及竞争策略研究报告
- 生产线和工艺流程管理制度
- DB45T 2155-2020 暴雨强度公式编制技术规范
- 2025届合肥市高考英语二模试卷含解析
- 《甲状腺肿》课件
- 2024华师一附中自招考试数学试题
- 【MOOC】数控技术-武汉理工大学 中国大学慕课MOOC答案
- 儿科中药熏洗治疗
- 课后服务家长满意度调查表
- 湘艺版高中音乐鉴赏教案《外国流行音乐》
- 2024年海南省高考地理试卷(含答案)
- 2024-2030年专用车产业规划及发展研究报告
评论
0/150
提交评论