回归分析的基本思想及其初步应用_第1页
回归分析的基本思想及其初步应用_第2页
回归分析的基本思想及其初步应用_第3页
回归分析的基本思想及其初步应用_第4页
回归分析的基本思想及其初步应用_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

欢迎您选择新活力教育用心学习教案学生:第一章:统计案例回归分析的基本思想及其初步应用实例从某大学中随机选取8名女大学生,其身高/cm和体重/kg数据如下表所示:编号12345678身高165165157170175165155170体重4857505464614359问题:画出散点图,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重.解:由于问题中要求根据身高预报体重,因此选自变量x,为因变量.(1)做散点图:从散点图可以看出和有比较好的相关关系.(2)==所以于是得到回归直线的方程为(3)身高为172cm新知:用相关系数r可衡量两个变量之间关系.计算公式为r=r>0,相关,r<0相关;相关系数的绝对值越接近于1,两个变量的线性相关关系,它们的散点图越接近;,两个变量有关系.例1某班5名学生的数学和物理成绩如下表:学生学科ABCDE数学成绩(x)8876756462物理成绩(y)7865706260画散点图;求物理成绩y对数学成绩x的回归直线方程;该班某学生数学成绩为96,试预测其物理成绩;练习1:下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值)练.(07广东文科卷)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值)(4)求相关指数评价模型.实例一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,试建立与之间的回归方程.温度21232527293235产卵数个711212466115325(1)根据收集的数据,做散点图上图中,样本点的分布没有在某个区域,因此两变量之间不呈关系,所以不能直接用线性模型.由图,可以认为样本点分布在某一条指数函数曲线的周围(为待定系数).对上式两边去对数,得令,则变换后样本点应该分布在直线的周围.这样,就利用模型来建立y和x的非线性回归方程.x21232527293235y711212466115325作散点图(描点)由上表中的数据得到回归直线方程因此红铃虫的产卵数和温度的非线性回归方程为例1一只红铃虫的产卵数和温度有关,现收集了7组观测数据列于下表中,温度21232527293235产卵数个711212466115325(散点图如由图,可以认为样本点集中于某二次曲线的附近,其中为待定参数)试建立与之间的回归方程.练习:1.两个变量y与x的回归模型中,求得回归方程为,当预报变量时().A.解释变量B.解释变量大于C.解释变量小于D.解释变量在左右2.在回归分析中,求得相关指数,则().A.解释变量解对总效应的贡献是B.解释变量解对总效应的贡献是C.随机误差的贡献是D.随机误差的贡献是3.通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为().A.回归分析B.独立性检验分析C.残差分析D.散点图分析4.在研究两个变量的相关关系时,观察散点图发现样本点集中于某一条指数曲线的周围,令,求得回归直线方程为,则该模型的回归方程为.5.已知回归方程,则时,y的估计值为.独立性检验的基本思想及其初步应用新知2:统计量吸烟与患肺癌列联表假设:吸烟与患肺癌没关系,则在吸烟者和不吸烟者中患肺癌不患肺癌者的相应比例.即因此,越小,说明吸烟与患肺癌之间关系;反之,.=例1吸烟与患肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965求.练1.性别与喜欢数学课程列联表:喜欢数学不喜欢数学总计男3785122女35143178总计72228300求.2.独立性检验的步骤(略)及原理(与反证法类似):反证法假设检验要证明结论A备择假设H在A不成立的前提下进行推理在H不成立的条件下,即H成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H成立的小概率事件(概率不超过的事件)发生,意味着H成立的可能性(可能性为(1-))很大没有找到矛盾,不能对A下任何结论,即反证法不成功推出有利于H成立的小概率事件不发生,接受原假设某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:不健康健康总计不优秀41626667优秀37296333总计789221000求.独立性检验的基本思想及其初步应用探究任务:吸烟与患肺癌的关系第一步:提出假设检验问题H:第二步:根据公式求观测值k=(它越小,原假设“H:吸烟与患肺癌没有关系”成立的可能性越;它越大,备择假设“H:”成立的可能性越大.)第三步:查表得出结论P(k2>k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081..3232.0722.7063.845.0246.6357.87910..83※典型例题例1在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?小结:用独立性检验的思想解决问题:第一步:第二步:第三步:例2为考察高中生的性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表:喜欢数学课程不喜欢数学总计男3785122女35143178总计72228300由表中数据计算得到的观察值.在多大程度上可以认为高中生的性别与是否数学课程之间有关系?为什么?练1.某市为调查全市高中生学习状况是否对生理健康有影响,随机进行调查并得到如下的列联表:不健康健康总计不优秀41626667优秀37296333总计789221000请问有多大把握认为“高中生学习状况与生理健康有关”?练习:1.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C.若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使推断出现错误.D.以上三种说法都不对.2.下面是一个列联表不健康健康总计不优秀a2173优秀22527总计b46100则表中a,b的之分别是()A.94,96B.52,50C.52,54D.54,523.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总计玩游戏18927不玩游戏81523总计262450则认为喜欢玩游戏与认为作业量多少有关系的把握大约为()A.99%B.95%C.90%D.无充分依据4.在独立性检验中,当统计量满足时,我们有99%的把握认为这两个分类变量有关系.统计案例检测题选择题(本大题共12小题,每题4分)1、散点图在回归分析中的作用是()A.查找个体数目B.比较个体数据关系C.探究个体分类D.粗略判断变量是否呈线性关系2、对于相关系数下列描述正确的是()A.r>0表明两个变量相关B.r<0表明两个变量无关C.越接近1,表明两个变量线性相关性越强D.r越小,表明两个变量线性相关性越弱3、预报变量的值与下列哪些因素有关()A.受解释变量影响与随机误差无关B.受随机误差影响与解释变量无关C.与总偏差平方和有关与残差无关D.与解释变量和随机误差的总效应有关4、下列说法正确的是()A.任何两个变量都具有相关系B.球的体积与球的半径具有相关关系C.农作物的产量与施肥量是一种确定性关系D.某商品的产量与销售价格之间是非确定性关系5、在画两个变量的散点图时,下面哪个叙述是正确的()A.预报变量在x轴上,解释变量在y轴上B.解释变量在x轴上,预报变量在y轴上C.可以选择两个变量中任意一个变量在x轴上D.可以选择两个变量中任意一个变量在y轴上6、回归直线必过()A.B.C.D.7、三维柱形图中,主、副对角线上两个柱形高度的相差越大,要推断的论述成立的可能性就越大()A.和B.差C.积D.商8、两个变量y与x的回归模型中,求得回归方程为,当预报变量()A.解释变量B.解释变量大于C.解释变量小于D.解释变量在左右9、在回归分析中,求得相关指数,则()A.解释变量解对总效应的贡献是B.解释变量解对总效应的贡献是C.随机误差的贡献是C.随机误差的贡献是10、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若k=6.635,则有99%的把握认为吸烟与患肺病有关,那么100名吸烟者中,有99个患肺病.B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,可以说某人吸烟,那么他有99%的可能性患肺病.C.若从统计量中求出有95%的把握认为吸烟与患肺病有关,是指有5%的可能性使得推断出现错误.D.以上三种说法都不对.11、通过来判断模拟型拟合的效果,判断原始数据中是否存在可疑数据,这种分析称为()A.回归分析B.独立性检验分析C.残差分析D.散点图分析12、在独立性检验时计算的的观测值=3.99,那么我们有的把握认为这两个分类变量有关系()A.90%B.95%C.99%D.以上都不对二、填空题(本大题共4小题,每题4分)13、已知回归直线方程,则时,y的估计值为.14、如下表所示:不健康健康总计不优秀41626667优秀37296333总计789221000计算=.15、下列关系中:(1)玉米产量与施肥量的关系;(2)等边三角形的边长和周长;(3)电脑的销售量和利润的关系;(4)日光灯的产量和单位生产成本的关系.不是函数关系的是.16、在一项打鼾与患心脏病的调查中,共调查1768人,经计算的=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是的.(填“有关”“无关”)三、解答题(本大题共2小题,每题18分)18、为考察某种药物预防疾病的效果,进行动物试验,得到如下列联表患病未患病总计用药41626667不用药37296333总计789221000能以97.5%的把握认为药物有效吗?为什么?18、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(吨)与相应的生产能耗(吨标准煤)的几组对照数据(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出关于的线性回归方程;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤.试根据(2)求出的线性同归方程,预测生产100吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值)作业:一、选择题:本大题共道小题,每小题分,共分,在每小题给出的四个选项中,只有一项符合题目要求1、对于散点图下列说法中正确一个是()(A)通过散点图一定可以看出变量之间的变化规律(B)通过散点图一定不可以看出变量之间的变化规律(C)通过散点图可以看出正相关与负相关有明显区别(D)通过散点图看不出正相关与负相关有什么区别2、在画两个变量的散点图时,下面叙述正确的是()(A)预报变量在轴上,解释变量在轴上(B)解释变量在轴上,预报变量在轴上(C)可以选择两个变量中的任意一个变量在轴上(D)可以选择两个变量中的任意一个变量在轴上3、如果根据性别与是否爱好运动的列联表,得到,所以判断性别与运动有关,那么这种判断出错的可能性为()(A)(B)(C)(D)4、下列关于线性回归的说法,不正确的是()(A)变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系;(B)在平面直角坐标系中用描点法的方法得到表示具有相关关系的两个变量的一组数据的图形叫散点图;(C)线性回归直线方程最能代表观测值之间的关系;(D)任何一组观测值都能得到具有代表意义的回归直线方程;5、在两个变量与的回归模型中,分别选择了四个不同的模型,它们的相关指数如下,其中拟合效果最好的为()(A)模型①的相关指数为(B)模型②的相关指数为(C)模型③的相关指数为(D)模型④的相关指数为6、关于如何求回归直线的方程,下列说法正确的一项是()(A)先画一条,测出各点到它的距离,然后移动直线,到达一个使距离之和最小的位置,测出此时的斜率与截距,就可得到回归直线方程(B)在散点图中,选两点,画一条直线,使所画直线两侧的点数一样多或基本相同,求出此直线方程,则该方程即为所求回归方程(C)在散点图中多选几组点,分别求出各直线的斜率与截距,再求它们的平均值,就得到了回归直线的斜率与截距,即可产生回归方程(D)上述三种方法都不可行7、若对于变量与的组统计数据的回归模型中,相关指数,又知残差平方和为,那么的值为()(A)(B)(C)(D)8、右表是对与喜欢足球与否的统计列联表依据表中的数据,得到()(A)(B)(C)(D)9、某医院用光电比色计检验尿汞时,得尿汞含量与消光系数读数的结果如下:如果与之间具有线性相关关系,那么当消光系数的读数为时,()(A)汞含量约为(B)汞含量高于(C)汞含量低于(D)汞含量一定是10、由一组样本数据得到的回归直线方程,那么下面说法正确的是()(A)直线必过点(B)直线必经过一点(C)直线经过中某两个特殊点(D)直线必不过点11、根据下面的列联表得到如下中个判断:①有的把握认为患肝病与嗜酒有关;②有的把握认为患肝病与嗜酒有关;③认为患肝病与嗜酒有关的出错的可能为;④认为患肝病与嗜酒有关的出错的可能为;其中正确命题的个数为()(A)(B)(C)(D)12、对于两个变量之间的相关系数,下列说法中正确的是()(A)越大,相关程度越大(B)越小,相关程度越大(C)越大,相关程度越小;越小,相关程度越大(D)且越接近于,相关程度越大;越接近于,相关程度越小;二、填空题:本大题共小题,每小题分,共分,把答案填在题中的横线上13、下表是关于出生男婴与女婴调查的列联表那么,A=,B=,C=,D=,E=;14、如右表中给出五组数据,从中选出四组使其

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论