高中选修1-2回归分析报告和独立性检验知识总结材料与联系_第1页
高中选修1-2回归分析报告和独立性检验知识总结材料与联系_第2页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用标准选修1-2第一部分 变量间的相关关系与统计案例【基础知识】一、回归分析1. 两个变量的线性相关:判断是否线性相关 用散点图(1) 正相关:在散点图中,点散布在从左下角到右上角的区域对于两个变量的这 种相关关系,我们将它称为正相关.(2) 负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相 关关系称为负相关(3) 线性相关关系、回归直线:如果散点图中点的分布从整体上看大致在一条直 线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线 用相关系数r(3)除用散点图外,还可用样本相关系数r来衡量两个变量x ,y相关关系的强弱,r 宀nX2)& yi2 -

2、n;2)当r >0,表明两个变量正相关,当rv0,表明两个变量负相关,r的绝对值越文档大全接近于1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个 变量之间几乎不存在线性相关关系,通常|r| .0.75时,认为这两个变量具有很 强的线性相关关系.2. 回归方程:两个变量具有线性相关关系,数据收集如下:可用最小二乘法得到回归方程?bx a,其中n' xyi - nxyi =1门22二 xi -nxi dn' (Xi -x)(yi -y)i =1n' (Xi -x)2i £3回归分析的基本思想及其初步应用(1)回归分析是对具有相关关系的两个变量

3、进行统计分析的方法,其常用的 研究方法步骤是画出散点图,求出回归直线方程,并利用回归直线方程进行预报. 对n个样本数据(x1, y1)、(x2, y2)、(xn, yn) , (x,y)称为样本点的中 心.样本点中心一定落在回归直线上。4、回归效果的刻画:n送 A - yj2用相关指数R2来刻画回归的效果,公式是 R2 =1 -牛为( -y)2i =1R2的值越大,说明残差平方和越小,也就是说模型拟合效果好定文利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检脸公式K2 n(ad-bc其中" = + “具体步骤 根据实际问题的需要确定容许推断“两个分 类变量有关系“犯错误

4、概率的上界I然旨查表 确定临界值爲. 利用公式计算随机变量疋的观测值k. 如果km爲就推断”X与V有关系=这种推 断犯错误的漑率不超过心否则就认为在犯错 误的概率不超过a的前提下不能推断与Y 有关系J或者在样本数据中没有发现足够证据 支持结论"X与y有关系”.独立性检验的基本思想及其初步应用题型一相关关系的判断【例1】对四组数据进行统计,获得以F散点图,关于其相关系数比较,正 确的是()和关系数为打相关系数九刊相关系数为巧柑关系数为口A. r2<r4<0<r3<riB. r4<r2<0<ri<r3C. r4<r2<0<

5、r3<riD. r2<r4<0<r i<r3【变式1】 根据两个变量x,y之间的观测数据画成 散点图如图所示,这两个变量是否具有线性相关关系题型二线性回归方程【例2】在2013年元旦期间,某市物价部门对本市五个商场销售的某商品 一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组 数据如下表所示:价格x99.51010.511销售量y1110865通过分析,发现销售量y与商品的价格x具有线性相关关系,则销售量 y 关于商品的价格x的线性回归方程为 .(参考公式:b=,2= y b x )【变式3】为了解儿子身高与其父亲身高的关系,随机抽取 5对父

6、子的身高数据 如下:父亲身咼x/cm 1174176176176178儿子身高y/cm175175176177177则y对x的线性回归方程为().A. y = x 1B. y= x+ 11C. y = 88 + qxD. y= 176题型三独立性检验【例4】通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还男女总计走天桥402060走斑马线203050总计6050110是愿意走人行天桥进行抽样调查,得到如下的列联表:a+ bn ad de c + da+ eb+ d '2110X 40X 30 20X 2060X 50X 60 X 507.8.附表:P(心 k)0.0500.

7、0100.001k3.8416.63510.828对照附表,得到的正确结论是()A. 有99鸠上的把握认为“选择过马路的方式与性别有关”B. 有99%上的把握认为“选择过马路的方式与性别无关”C. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别有关”D. 在犯错误概率不超过0.1%的前提下,认为“选择过马路的方式与性别无关【变式2】 某企业有两个分厂生产某种零件,按规定内径尺寸 (单位:mm的值 落在29.94,30.06)的零件为优质品.从两个分厂生产的零件中各抽出了 500 件, 量其内径尺寸,得结果如下表:甲厂:分组29.86,29.90,29.94,29.98,30.

8、02,30.06,30.10,29. 90)29. 94)29. 98)30. 02)30. 06)30. 10)30. 14)频数12638618292614乙厂:分组29.86,29.90,29.94,29.98,30.02,30.06,30.10,29. 90)29. 94)29. 98)30. 02)30. 06)30. 10)30. 14)频数297185159766218(1) 试分别估计两个分厂生产零件的优质品率;(2) 由以上统计数据填下面2X 2列联表,并问是否有99%勺把握认为“两个分厂 生产的零件的质量有差异”.甲厂乙厂合计优质品非优质品合计P(k > k)0.05

9、0.01k3.8416.635错误!,巩固提高1. 下列说法: 将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; 设有一个回归方程y = 3-5X,变量x增加一个单位时,y平均增加5个单位; 线性回归方程y= bx + a必过(x , y ); 在一个2X 2列联表中,由计算得K2 13.079,则有99%勺把握确认这两个变 量间有关系;其中错误的个数是()A. 0B. 1 C. 2D. 32. 已知回归直线斜率的估计值为1.23,样本点的中心为点(4,5),则回归直线的方程为()A. y = 1.23x + 4 B. y = 1.23x + 5 C. y = 1.23x + 0.

10、08 D. y = 0.08x + 1.233. 已知x、y取值如下表:x014568y1.31.85.66.17.49.3从所得的散点图分析可知:y与x线性相关,且y= 0.95x + a,则a=()A. 1.30B. 1.45C. 1.65D. 1.804.从某高中随机选取5名高三男生,其身高和体重的数据如下表所示:身高x(cm)160165170175180体重y(kg)6366707274根据上表可得回归直线方程:y = 0.56 x + a,据此模型预报身高为172 cm的高三男生的体重为()A. 70.09 kgB. 70.12 kgC. 70.55 kgD. 71.05 kg5.

11、调查了某地若干户家庭的年收入 x(单位:万元)和年饮食支出y(单位:万元), 调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y= 0.254x + 0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加 元.6 利用独立性检验对两个分类变量是否有关系进行研究时,若在犯错误的概率 不超过0.005的前提下认为事件 A和B有关系,则具体计算出的数据应该是 ( )A. k > 6.635 B . kv 6.635 C . k > 7.879 D . kv 7.8797 某高校“统计初步”课程的教师随机调查了选该课的一些学生的情况,具

12、体 数据如下表:非统计专业统计专业男1310女720k = 50(停 2° E 7)24 84420X 30X 23X 275因为k >3.841,所以确定主修统计专为了判断主修统计专业是否与性别有关系,根据表中数据得到,业与性别有关系,那么这种判断出错的可能性为 .8、某种产品的广告费支出丄与销售额厂(单位:百万元)之间有如下对应数据:24568y3040605070(1)画出散点图;(2)求线性回归方程;(3)试预测 广告费支出为百万元时,销售额多大?9.下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.X345

13、6y:344+5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出“关于丄的线性回归方程1 =二; (3)已知该厂技改前吨甲产品的生产能耗为汇吨标准煤,试根据 求出的线性回归方程,预测生产丨;工吨甲产品的生 产能耗比技改前降低多少吨标准煤?(参考数值:)9某大学餐饮中心为了了解新生的饮食习惯,在全校一年级学生中进行了抽样 调查,调查结果如下表所示:喜欢甜品不喜欢甜品合计南方学生602080北方学生101020合计7030100(1) 根据表中数据,问是否有 95%勺把握认为“南方学生和北方学生在选用 甜品的饮食习惯方面有差异”;(2) 已知在被调查的北方学生中有5名数学

14、系学生,其中2名习惯甜品,现 在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率.10、我市某校某数学老师这学期分别用两种不同的教学方式试验高一甲、 乙两个班(人数均为60人,入学数学平均分和优 秀率都相同,勤奋程度和自觉性都一样)。现甲班乙班随机抽取甲、乙两班各20名的数学期末考试成290 15 6 8绩,并作出茎叶图(I)依茎叶图判断哪个班的平均分高?6632 180125668(U)现从甲班所抽数学成绩不低于80分的同8322173 6 8学中随机抽取两名同学,求刚好有1人在85分9&77666 7 9 9以上的概率(川)学校规定:成绩不低于甌分的为优秀, 作出分类变量成绩与教学方式的2x2列联表,5并判断“能否在犯错误的概率不超过门门負的前提下认为成绩优秀与教学方式有 关?”下面临界值表仅供参考:P(K2>k)0.150.100.050.0250.0100.0050.001K2.0722.0763+8415,0246,6357.87910.828K2 = 他 4 _ 农)2(参考公式:'''''-'其中一:一R丨汀复习专题一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论