回归分析和独立性检验(教师版)_第1页
回归分析和独立性检验(教师版)_第2页
回归分析和独立性检验(教师版)_第3页
回归分析和独立性检验(教师版)_第4页
回归分析和独立性检验(教师版)_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

高考理数提高班1、2班回归分析即独立性检验一、回归分析1、两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2、散点图:将样本中的个数据点描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3、如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4、回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性.回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.5、最小二乘法:记回归直线方程为:,称为变量对变量的回归直线方程,其中叫做回归系数.用最小二乘法求回归系数有如下的公式:,其中上方加“”,表示是由观察值按最小二乘法求得的(样本中心点必定落在回归直线上)例1、已知回归直线方程中斜率的估计值为1.23,样本点的中心(4,5),则回归直线方程为A.=1.23x+0.08B.=0.08x+1.23C.=1.23x+4D.=1.23x+5解析回归直线方程过样本点的中心,把点(4,5)代入A项成立.答案A例2、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据x3456y2.5344.5请画出上表数据的散点图;请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程;已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?【解析】(1)如下图(2)=32.5+43+54+64.5=66.5==4.5==3.5=+++=86故线性回归方程为y=0.7x+0.35(3)根据回归方程的预测,现在生产100吨产品消耗的标准煤的数量为0.7100+0.35=70.35故耗能减少了90-70.35=19.65(吨)练习1、某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件的个数x(个)2345加工的时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;(2)求出y关于x的线性回归方程,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?解(1)散点图如图所示.(2)由表中数据得=52.5,=3.5,=3.5,=54,∴=0.7.∴=1.05.∴=0.7x+1.05.回归直线如图中所示.(3)将x=10代入回归直线方程,得y=0.7×10+1.05=8.05(小时),∴预测加工10个零件需要8.05小时.二、独立性检验1、联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张的表,如下:合计如果有调查得来的四个数据,并希望根据这样的个数据来检验上述的两种状态与是否有关,就称之为联表的独立性检验.2、独立性检验的步骤:统计假设:;列出联表;计算统计量;查对临界值表,作出判断.3、几个临界值:.4、统计假设:如果事件与独立,这时应该有,用字母表示此式,即,称之为统计假设.5、(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为,用它的大小可以用来决定是否拒绝原来的统计假设6、统计量的临界值的作用:比如:当时,有的把握说事件与有关;当时,有的把握说事件与有关;当时,有的把握说事件与是无关的.7、独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立例、甲、乙两所学校高三年级分别有1200人、1000人,为了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校:分组[70,80)[80,90)[90,100)[100,110)频数34815分组[110,120)[120,130)[130,140)[140,150]频数15x32乙校:分组[70,80)[80,90)[90,100)[100,110)频数1289分组[110,120)[120,130)[130,140)[140,150]频数1010y3(1)计算x,y的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.甲校乙校总计优秀非优秀总计解:(1)甲校抽取110×eq\f(1200,2200)=60(人),乙校抽取110×eq\f(1000,2200)=50(人),故x=10,y=7.(2)估计甲校优秀率为eq\f(15,60)=25%,乙校优秀率为eq\f(20,50)=40%.(3)表格填写如下:甲校乙校总计优秀152035非优秀453075总计6050110K2=eq\f(11015×30-20×452,60×50×35×75)≈2.83>2.706,又因为1-0.10=0.9,故有90%的把握认为两个学校的数学成绩有差异.练习1、某校为了研究学生的性别和对待某一活动的态度(支持和不支持两种态度)的关系,运用2×2列联表进行独立性检验,经计算χ2=7.069,则所得到的统计学结论是:有()的把握认为“学生性别与支持活动有关系”.(C)A.0.1%B.1%C.99% D.99.9%2、某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.甲班(A方式)乙班(B方式)总计成绩优秀成绩不优秀总计[解析]由已知数据得甲班(A方式)乙班(B方式)总计成绩优秀156成绩不优秀191534总计202040根据列联表中数据,χ2=eq\f(40×1×15-5×192,6×34×20×20)≈3.137,由于3.137>2.706,所以有90%的把握认为“成绩优秀”与教学方式有关.回归分析和独立性检验练习题1、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这孩子10岁时的身高,则正确的叙述是(D)A.身高一定是145.83cmB.身高在145.83cm以上C.身高在145.83cm以下D.身高在145.83cm左右2、某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为(A)A.83% B.72%C.67% D.66%解析将y=7.675代入回归方程,可计算得x≈9.26,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.26≈0.83,即约为83%.3、若施化肥量x与水稻产量y的回归直线方程为=5x+250,当施化肥量为80kg时,预报水稻产量为_____________________.解析当x=80kg时,=5×80+250=650kg.答案650kg4、从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x(cm)160165170175180体重y(kg)6366707274根据上表可得回归直线方程eq\o(y,\s\up6(^))=0.56x+eq\o(a,\s\up6(^)),据此模型预报身高为172cm的高三男生的体重为(B)A.70.09kgB.70.12kgC.70.55kgD.71.05kg5、下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(t)与相应的生产能耗y(t)的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为eq\o(y,\s\up6(^))=0.7x+0.35,那么表中t的值为(A)A.3B.3.15C.3.5D.4.56、有甲、乙两个班级进行数学考试,按照大于等于85分的优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为eq\f(2,7),则下列说法正确的是(C)A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”7、某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程,其中,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于=eq\f(1,6)(8+8.2+8.4+8.6+8.8+9)=8.5,=eq\f(1,6)(90+84+83+80+75+68)=80,所以=80+20×8.5=250.从而回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20eq\b\lc\(\rc\)(\a\vs4\al\co1(x-\f(33,4)))2+361.25,当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.8、考察黄烟经过药物处理跟发生青花病的关系,得到如下数据,在试验的470珠黄烟中,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论