版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、10.3独立性检验与回归分析一、知识与能力目标1、了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题2、了解独立性检验(只要求2X2列联表)的基本思想、方法及其简单应用3、了解回归的基本思想、方法及其简单应用。二、主要知识1、事件的独立性:一般地,对于两个事件A,B,如果有P(AB)=P(A)P(B),就称事件A与B相互独立,简称A与B独立。2、列联表:分类变量的汇总统计表(频数表).一般我们只研究每个分类变量只取两个值,这样的列联表称为2x2列表。3、卡方研究:两个对象I和n是否有关系。I有两类取值:类A和类b;n有两类取值:类1和类2n类1类2合计I类Aaba+h类Bcdc-d合
2、计*i+rf曰+b+4+d耳(氯一加y卡方统计量:g+s)g+d)g+G+d),其中n-aibicid为样本量。用卡方统计量研究两随机事件是否有关的问题的方法称为独立性检验。4、独立性检验的解题步骤:第一步:提出假设检验问题第二步:选择检验的指标,二:门1第三步:查表得出结论P(72>k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.845.0246.6357.87910.835、回归分析:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。注;(1)相关关系是一种
3、不确定性关系;(2)对具有相关关系的两个变量进行统计分析的方法叫回归分析。回归直线方程:直线方程y=bx+a叫做回归直线方程,相应的直线叫做回归直线,其中5txi_区)也一歹)/yjray-=0,FlMla=ybz_制y-Xx/.】Qj)称为样本点的中心对两个变量进行的线性分析叫做线性回归分析。6、相关系数X(G-牙)®7)g(啥凶_同。21*4y与x的一组观测值,把相关系数是因果统计学家皮尔逊提出的,对于变量叫做变量y与x之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相关程度。显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概率值。它必须在每
4、一次统计检验之前确定。显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著性水平一般取0.01和0.05,自由度为n-2,其中n是数据的个数,在“相关系数检验的临界值表”查出与显著性水平0.05或0.01及自由度n-2(n为观测值组数)相应的相关数临界值小手或r0.01;例如n=7时,r0.05=0.754,r0.01=0.8744求得的相关系数r和临界值r0.05比较,若r>r0.05,上面y与x是线性相关的,当wr0.05或r0.01,认为线性关系不显著。7、检验的步骤如下:(1)做统计假设:x与y不具有线性相关关系。根据小概率905与n-2在附表中查出r的一个
5、临界值4M(3)根据样本相关系数计算公式算出r的值(4)统计推断,如果为05,表明有95%把握认为x与y之间具有线性相关关系;如果,二血5,我们没有理由拒绝原来的假设,这时寻找回归直线方程是毫无意义的。三、例题分析题型1:线性相关性检验例1、一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间由如下一组数据:x1.081.121.191.281.361.481.591.681.801.871.982.07y2.252.372.402.552.642.752.923.03.143.263.363.501)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回
6、归直线方程i123456789101112xi1.081.121.191.281.361.481.591.681.801.871.982.07yi2.252.372.402.552.642.752.923.033.143.263.363.50xiyi2.432.2642.8563.2643.5904.074.6435.0905.6526.0966.6537.24518.534,173二3a3-Z乙再为工=12,J=12=2.8475,i-1=29.808,i-1=99.2081,i-1=54.243解:根据题意1)画出散点图:yi3.5丁2521.5中11.21.41.E1.322)12
7、63;xy12xy-fer-21X122-2122-2lZX-12xIyy-12yJ人ii54.243-12x18,53417x-1212*29,808-12x(萼9)(99,2081-12x(誓尸)=0.997891在相关系数检验的临界值表”查出与显著性水平0.05及自由度12-2=10相应的相关数临界值r0.05=0.576<0.997891,这说明每月产品的总成本y(万元)与该月产量x(万件)之间存在线性相关关系。3)设回归直线方程=8工+”,利用“12工号必12前七-irl产_n1.1a-y-bx计算a,b,得b=1.215,a»-“3=0.974跟踪练习1:在7块并排
8、、形状大小相同的试验田上进行施化肥量对水稻产量影响的试验,得数据如下(单位:kg)施化肥量x5102520353045水稻产量y:303453653054454504551)画出散点图;2)检验相关系数r的显著性水平;3)求月总成本y与月产量x之间的回归直线方程。题型2:独立性检验例2.为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:患慢性气管炎未患慢性气管炎合计吸烟43162205不吸烟1131121134合计_56283339试问:50岁以上的人患慢性气管炎与吸烟习惯有关吗?2339(43121-16213)解:由公式K='=7.469,因为7
9、.469>6.635,所以我们有99%的把握说:2051345628350岁以上的人患慢性气管炎与吸烟习惯有关。跟踪练习2:对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作过心脏病合计P心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别。题型3:独立的概念及应用例3.有三种产品,合格率分别是0.90,0.95和0.95,各抽取一件进行检验。(1)求恰有一件不合格的概率;(2)求至少有两件不合格的概
10、率(精确到0.001);解析:设三种产品各抽取一件,抽到合格产品的事件分别为A、B和C,(1)P(A)=0.90,P(B)=P(C)=0.95,贝UP(A)=0.10,P(B)=P(C)=0.05。因为事件A、B、C相互独立,恰有一件不合格的概率为:P(ABC)+P(ABC)+P(ABC)=P(A)P(B)P(C)+P(A)P(B)P(C)+P(A)P(B)P(C)=2X0.90X0.95X0.05+0.10X0.95X0.95=0.176答:恰有一件不合格的概率为0.176.(2)解法一:至少有两件不合格的概率为:P(AB-C)+P(ABC)+P(ABC)+P(AB-C)=0.900.050
11、.05+20.100.050.95+0.100旬50.05=0.012.答:至少有两件不合格的概率为0.012.解法二:三件产品都合格的概率为:P(ABC)=P(A)P(B)P(C)=0.90X0.95X0.950.812.由(1)知,恰有一件不合格的概率为0.176,所以,至少有两件不合格的概率为1-P(AB-C)+0.176=1-(0.812+0.176)=0.012.答:至少有两件不合格的概率为0.012.跟踪练习3:甲、乙、丙3人各进行一次射击,如果甲、乙2人击中目标的概率是0.8,丙击中目标的概率是0.6,计算:(1)3人都击中目标的概率;(2)至少有2人击中目标的概率;(3)其中恰
12、有1人击中目标的概率.四、随堂练习1 .有甲、乙两地生产某种产品,甲地的合格率为90%,乙地的合格率为92%,从两地生产的产品中各抽取1件,都抽到合格品的概率等于A、112%B、9.2%C、82.8%D、0.8%2 .从甲袋中摸出一个红球的概率是1,从乙袋中摸出1个红球的概率是1,从两袋中各摸出1个球,则|等于A、2个球不都是红球的概率B、2个球都是红球的概率C、至少有1个红球的概率D、2个球中恰好有1个红球的概率111.1.3 .三个人独立地破译一个密码,他们单独译出的概率是-,-,-,假设他们破译密码是彼此独立的,则密码被534译出的概率为A、1B、2C、3D>-555104 .已知
13、某产品的次品率是0.04,现要抽取这种产品进行检验,则要使查到的次品率达到95%以上,则至少要选只A、24B、25C、26D、275 .在一次问卷调查中,统计了订阅新民晚报的概率是0.6,订阅扬子晚报的概率是0.3,则至多订阅其中一种报纸的概率为,6 .某机械零件的加工过程由两道工序组成,第一道工序的废品率为0.015,第二道工序的废品率为0.02,假定两道工序出的废品是彼此独立的,则产品的合格率是7 .某气象站天气预报正确率达92%,则三次预报中恰有两次正确的概率是8 .电子设备的某一个部件有3个元件组成,其中任何一个元件坏了,这个部件就不能工作,假定每个元件能使用一年的概率是0.9,则这个
14、部件能工作一年的概率是。9、某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别专业非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到350x(13x20-10x7)a/0心r=-总4.84423x27x20x30因为”之3,841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为.10、在对人们的休闲方式的一次调查中,共调查了300人,其中女性178人,男性122人。女性中有143人主要的休闲方式是看电视,另外35人主要的休闲方式是运动;男性中有85人主要的休闲方式是看电视,另外37人主要的休闲方式是运动。(
15、1)根据以上数据建立一个2X2的列联表;(2)判断性别与休闲方式是否有关系。11、随机调查了某地区10个商店的建筑面积工(千平方米)与年销售额y(百万元)的样本如下:K(面积)4.06067.240920788.4黑(销售额)3.5254.83.5305124.556(1)求)关于X的回归方程;(2)若线性关系存在,那么对于一个拥有一万平方米的商店来说,它的年销售额为多少?12、有某市煤气消耗量与使用煤气户数的历史资料如下:工(年)12345678910x(户数/万户)11.21.61.822.53.244.24.5y(煤气消耗量/白方米3)679.81212.114.5202425.427.
16、5(1)画出散点图;(2)检验是否线性相关;(3)求回归方程;(4)若该市政府计划下一步再扩大5千户煤气用户,试预测该市煤气耗量将达到多少?13、为了了解某地母亲身高x与女儿身高y的相关关系,随机测得10对母女的身高如下表所示:母亲身高x(cm)159160160163159154159158159157女儿身高y(cm)158159160161161155162157162156试又x与y进行一元线性回归分析,并预测当母亲身高为161cm时女儿的身高为多少?五、习题答案跟踪练习1、解:1)画出散点图如下:VI5001450400350-«300-101520253035402)检验
17、相关系数r的显著性水平:1234567xi15202530354045yi330345365405445450455xiyi49506950912512150155751800020475777x=30,J=399.3,>-1=700035=1132725,2=87175Z西必-7市了J?一87175-7然3。乂399一3号V2v)=&Q00-7x30以1132725-7乂399,3限。7.0.05=0.754在相关系数检验的临界值表”查出与显著性水平0.05及自由度72=5相应的相关数临界值<0.9733,这说明水稻产量与施化肥量之间存在线性相关关系。Z餐¥-7
18、号建4!一产2«13)设回归直线方程利用a-y-bx历39”5计算a,b,得b=7000-7x30跟踪练习2解:由公式K2=392/(39"67一157父29)=1.78,因为1.78>3,841,所以我们没有理由说19619668324心脏搭桥手术”与又发作过心脏病”有关,可以认为病人又发作与否与其做过任何手术无关。跟踪练习3解:(1)记甲、乙、丙各射击一次,击中目标”分别为事件A、B、C彼此独立,三人都击中目标就是事件AEC发生,根据相互独立事件的概率乘法公式得:P(ABC)=P(A)P(B)P(C)=0.80.80.6=0.384(2)至少有2人击中目标包括两种
19、情况:一种是恰有2人击中,另一种是3人都击中,其中恰有2人击中,又有3种情形,即事件ABC,A-Bc,ABC分别发生,而这3种事件又互斥,故所求的概率是P(ABC)+P(ABC)+P(ABC)+P(ABC)P(A)P(B)P(C)+P(A)P(B)P(C)+P(A)p(b)P(C)+P(A)P(B)P(C)=0.80.80.4+0.80.20.6+0.20.80.6+0.8080.6=0.832恰有1人击中目标有3种情况,即事件A-BC,AbC,ABc,且事件分别互斥,故所求的概率是P(ABC)+p(AbC)+P(ABC)=P(A)P(B)p(c)+p(A)p(b)p(c)+p(A)p(B)p
20、(c)=0.8>0.2>0.4+0.2)0.8W4+0.2>0.2>0.6=0.152.随堂练习:1、C2、C3、A4、B5、0.826、0.96537、0.2038、0.729、解:根据卡方临界值表H?%尢)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.8282因为?>3,841,因此有95%的把握认为主修统计专业与性别有关系,故这种判断出错的可能性为5%。评注:卡方临界值表的正确使用.0.500.400.250.150.1
21、00.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.82810、解:(1)2X2的列联表性别休闲方式看电视运动总计女14335178男8537122总计22872300(2)假设“休闲方式与性别无关计算心4,514a_300x(37x143-85x35)3丁-178x228x122x72因为33,841,所以有理由认为假设“休闲方式与性别无关”是不合理的,即有95%的把握认为“休闲方式与性别有关”11、解:1.列表i1234567891046067.240920788.4乃3.5254.83.530
22、5124.55614150028.825.212004524031.54050.4城1636003651.84160081400496470.5612.2562523.0412.259002514420.252536x=-xl69$=16,96.v=-x99,3=9.93.1010wnioX科方=3174x;-59684X*=1322.79.i-LUIJI二产血:j=04"75口=175.,1,=10,p6.55.所以年销售额约为655万元。12、解:(1)yAC百万米3)30-.20-*'*10-o123456户中(2)列表:?玉鸣玉方婷116613621.278.421.444931.69.815.682.5696.0441.81221.63.2414452.012.124.24146.4162.51
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年采购合同:电子产品批量采购及技术支持
- 2024版特种物品运输协议3篇
- 2024年版企业租车服务协议规范化文件版B版
- 2024庆阳房屋租赁及租后维护服务合同3篇
- 2024年私募股权投资基金投融资合作协议3篇
- 2024年美甲行业劳动合同样本
- 2024年度艺术品寄卖代理委托协议(含投资咨询)3篇
- 2024年版建筑总承包协议解除条款明细一
- 2024年绵阳地区标准房屋租赁协议格式版B版
- 2025年度智能家居产品形象拍摄合作协议3篇
- 常见酸和碱说课课件
- 2023-2024学年湖北省利川市小学语文六年级期末通关测试题详细参考答案解析
- 矿大毕业设计-固定式带式输送机设计
- 高考地理一轮复习课件+湖泊的水文特征
- 热动复习题材料热力学与动力学
- GB/T 19405.1-2003表面安装技术第1部分:表面安装元器件(SMDS)规范的标准方法
- GB/T 13275-1991一般用途离心通风机技术条件
- 弹塑性力学(浙江大学课件)
- 千年菩提路解说词
- 潍柴天然气发动机维修手册
- 配气机构的设计
评论
0/150
提交评论