




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
学必求其心得,业必贵于专精学必求其心得,业必贵于专精学必求其心得,业必贵于专精学案59统计案例导学目标:1.了解回归分析的基本思想、方法及其简单应用。2.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.自主梳理1.回归分析(1)回归直线一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程的截距和斜率的最小二乘估计分别为eq\o(a,\s\up6(^))=__________________________,eq\o(b,\s\up6(^))=______________________________________,其中eq\x\to(x)=____________________,eq\x\to(y)=_____________________________________,________________称为样本点的中心.(2)相关系数r①r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\r(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2\o(∑,\s\up6(n),\s\do4(i=1))yi-\x\to(y)2));②当r>0时,表明两个变量________;当r<0时,表明两个变量________.r的绝对值越接近于1,表明两个变量的线性__________;r的绝对值越接近于0时,表明两个变量之间________________________________.通常,当r的绝对值大于________时认为两个变量有很强的线性相关关系.2.独立性检验(1)列联表:列出的两个分类变量的________,称为列联表.(2)2×2列联表:假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d构造一个随机变量K2=________________________________,其中n=__________为样本容量.(3)独立性检验利用随机变量________来判断“两个分类变量________”的方法称为独立性检验.自我检测1.对有线性相关关系的两个变量建立的回归直线方程eq\o(y,\s\up6(^))=eq\o(a,\s\up6(^))+eq\o(b,\s\up6(^))x中,回归系数eq\o(b,\s\up6(^))()A.可以小于0 B.小于0C.能等于0 D.只能等于02.(2011·天津模拟)下面是2×2列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为()A.94,72 B.52,50C.52,74 D.74,523.如果有95%的把握说事件A和B有关系,那么具体计算出的数据()A.K2>3.841 B.K2C.K2>6.635 D.K24.(2011·绍兴月考)某高校“统计初步"课程的教师随机调查了选该课的一些学生情况,具体数据如下表:专业性别非统计专业统计专业男2620女1440则可判断约有________的把握认为“主修统计专业与性别之间有关系”.探究点一独立性检验例1(2011·湛江模拟)利用统计变量K2的观测值来判断两个分类变量之间的关系的可信程度.考察小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示种子灭菌种子未灭菌合计黑穗病26184210无黑穗病50200250合计76384460试按照原试验目的作统计分析推断.变式迁移1对196个接受心脏搭桥手术的病人和196个接受血管清障手术的病人进行了3年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示:又发作过心脏病未发作心脏病合计心脏搭桥手术39157196血管清障手术29167196合计68324392试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.探究点二线性回归分析例2一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,测得的数据如下:零件数x(个)102030405060708090100加工时间y(分)626875818995102108115122(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?变式迁移2一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为抽样试验结果:转速x(转/秒)1614128每小时生产有缺点的零件数y(件)11985(1)对变量y与x进行相关性检验;(2)如果y与x有线性相关关系,求回归直线方程.探究点三综合应用例3(2010·辽宁)为了比较注射A,B两种药物后产生的皮肤疱疹的面积,选200只家兔做试验,将这200只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B。表1和表2分别是注射药物A和药物B后的试验结果.(疱疹面积单位:mm2)表1:注射药物A后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)频数30402010表2:注射药物B后皮肤疱疹面积的频数分布表疱疹面积[60,65)[65,70)[70,75)[75,80)[80,85)频数1025203015完成下面2×2列联表,并回答能否有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异".表3:疱疹面积小于70疱疹面积不小于70合计注射药物Aa=b=注射药物Bc=d=合计n=附:K2=eq\f(nad-bc2,a+bc+da+cb+d).变式迁移3某市对该市一重点中学2010年高考上线情况进行统计,随机抽查244名学生,得到如下表格:语文数学英语综合科目上线不上线上线不上线上线不上线上线不上线总分上线201人17427178231762517526总分不上线43人3013232024192617总计20440201432004420143试求各科上线与总分上线之间的关系,并求出哪一科目与总分上线关系最大?1.回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范围一般不能超过回归方程的适用范围,否则没有实用价值.2.利用图形来判断两个变量之间是否有关系,可以画出二维条形图,但从图形上只可以粗略地估计两个分类变量的关系,还要结合所求的数值来进行比较.作图应注意单位统一、图形准确,但它不能给出我们两个分类变量有关或无关的精确的可信程度,若要作出精确的判断,可以作独立性检验的有关计算.(满分:75分)一、选择题(每小题5分,共25分)1.对于独立性检验,下列说法中错误的是()A.K2的值越大,说明两事件相关程度越大B.K2的值越小,说明两事件相关程度越小C.K2≤3.841时,有95%的把握说事件A与B无关D.K2〉6。635时,有99%的把握说事件A与B有关2.下列说法中正确的有:①若r〉0,则x增大时,y也相应增大;②若r<0,则x增大时,y也相应增大;③若r=1或r=-1,则x与y的关系完全对应(有函数关系),在散点图上各个点均在一条直线上()A.①② B.②③ C.①③ D.①②③3.(2011·天津汉沽一中月考)甲、乙、丙、丁四位同学各自对A、B两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:甲乙丙丁r0.820.780.690。85m115106124103则哪位同学的试验结果体现A、B两变量更强的线性相关性?()A.甲 B.乙 C.丙 D.丁4.下列命题中正确的个数为()①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱;②残差平方和越小的模型,模型拟合的效果越好;③用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好.A.1 B.2 C.3 D.5.(2010·济南模拟)有两个分类变量x,y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表如下:y1y2总计x113218150x211436150总计24654300则两个分类变量x和y有关系的可信度为()A.95% B.97。5%C.99% D.99。5%二、填空题(每小题4分,共12分)6.为了判断高中三年级学生是否选修文科与性别有关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3。841)≈0。05,P(K2≥5.024)≈0。025.根据表中数据,得到K2=eq\f(50×13×20-10×72,23×27×20×30)≈4.844.则认为选修文科与性别有关系出错的可能性为______.7.(2011·银川模拟)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程eq\o(y,\s\up6(^))=3-5x,变量x增加一个单位时,y平均增加5个单位;③线性回归方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))必过点(eq\x\to(x),eq\x\to(y));④曲线上的点与该点的坐标之间具有相关关系;⑤在一个2×2列联表中,由计算得K2=13。079,则其两个变量间有关系的可能性是90%。其中错误的命题是________.8.若两个分类变量x和y的列联表为:y1y2x1515x24010则x与y之间有关系的概率约为________.三、解答题(共38分)9.(12分)在一次飞机航程中调查男女乘客的晕机情况,其2×2列联表如下,试判断晕机与性别是否有关?晕机不晕机合计男107080女102030合计209011010.(12分)(2011·武汉模拟)为了考察某种药物预防疾病的效果,进行动物实验,得到如下的列联表患病未患病总计服用药104555没服用药203050总计3075105请问能有多大把握认为药物有效?11.(14分)(2010·全国)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.eq\a\vs4\al(附:)K2=eq\f(nad-bc2,a+bc+da+cb+d)学案59统计案例自主梳理1.(1)eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)yi-\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))xi-\x\to(x)2)eq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))xieq\f(1,n)eq\o(∑,\s\up6(n),\s\do4(i=1))yi(eq\x\to(x),eq\x\to(y))(2)②正相关负相关相关性越强几乎不存在线性相关关系0.752.(1)频数表(2)eq\f(nad-bc2,a+bc+da+cb+d)a+b+c+d(3)K2有关系自我检测1.A[eq\o(b,\s\up6(^))=0时,得r=0,这时不具有线性相关关系,但eq\o(b,\s\up6(^))能大于0,也能小于0。]2.C[∵a+21=73,∴a=52。又a+22=b,∴b=74.]3.A[比较K2的值和临界值的大小,有95%的把握则K2〉3。841,K2〉6。635约有99%的把握.]4.99。5%解析因为K2=eq\f(100×26×40-14×202,40×60×46×54)≈9。689〉7.879,所以有99.5%的把握认为“主修统计专业与性别之间有关系”.课堂活动区例1解题导引利用已知条件来判断两个分类变量是否具有关系,可以先假设两个变量之间有关系,再计算K2的值,K2的值越大说明两个变量间有关系的可能性越大,再参考临界值,从而判断两个变量有关系的可信程度.解由列联表知:a=26,b=184,c=50,d=200。∴a+b=210,c+d=250,a+c=76,b+d=384,n=a+b+c+d=460。∴K2=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(460×26×200-184×502,210×250×76×384)≈4.804.∵K2≈4.804〉3.841.∴有95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的.变式迁移1解假设做过心脏搭桥手术与又发作心脏病没有关系.由于a=39,b=157,c=29,d=167,a+b=196,c+d=196,a+c=68,b+d=324,n=392,由公式可得K2的观测值为k=eq\f(nad-bc2,a+bc+da+cb+d)=eq\f(392×39×167-157×292,196×196×68×324)≈1。78,因为k≈1。78<2。706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系.例2解题导引这是一个回归分析问题,应先进行线性相关检验或作散点图来判断x与y是否线性相关,如果线性相关,才可以求解后面的问题,否则就使得求回归直线方程没有意义,要作相关性检验,应先利用r=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\r(\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2\o(∑,\s\up6(n),\s\do4(i=1))y\o\al(2,i)-n\x\to(y)2))求出样本相关系数r.利用当r>0时,两个变量正相关,当r<0时,两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强,r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系,通常当|r|大于0。75时,认为两个变量有很强的线性相关关系,因而求回归直线方程才有意义.解(1)列出下表i12345678910xi102030405060708090100yi626875818995102108115122xiyi62013602250324044505700714086401035012200eq\x\to(x)=55,eq\x\to(y)=91.7,eq\o(∑,\s\up6(10),\s\do4(i=1))xeq\o\al(2,i)=38500,eq\o(∑,\s\up6(10),\s\do4(i=1))yeq\o\al(2,i)=87777,eq\o(∑,\s\up6(10),\s\do4(i=1))xiyi=55950,因此r=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\x\to(x)\x\to(y),\r(\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\x\to(x)2\o(∑,\s\up6(10),\s\do4(i=1))y2i-10\x\to(y)2))=eq\f(55950-10×55×91。7,\r(38500-10×552×87777-10×91。72))≈0。9998,由于r=0。9998>0。75,因此x与y之间有很强的线性相关关系.(2)设所求的回归直线方程为eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))则有eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(10),\s\do4(i=1))xiyi-10\x\to(x)\x\to(y),\o(∑,\s\up6(10),\s\do4(i=1))x\o\al(2,i)-10\x\to(x)2)=eq\f(55950-10×55×91。7,38500-10×552)≈0.668。eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=91.7-0.668×55=54。96.因此,所求的回归直线方程为eq\o(y,\s\up6(^))=0.668x+54.96.(3)当x=200时,y的估计值为eq\o(y,\s\up6(^))=0。668×200+54.96=188。56≈189,因此,加工200个零件所用的工时约为189分.变式迁移2解(1)eq\x\to(x)=12。5,eq\x\to(y)=8.25,eq\o(∑,\s\up6(4),\s\do4(i=1))xiyi=438,4eq\x\to(x)eq\x\to(y)=412.5,eq\o(∑,\s\up6(4),\s\do4(i=1))xeq\o\al(2,i)=660,eq\o(∑,\s\up6(4),\s\do4(i=1))yeq\o\al(2,i)=291,所以r=eq\f(\o(∑,\s\up6(4),\s\do4(i=1))xiyi-4\x\to(x)\x\to(y),\r(\b\lc\(\rc\)(\a\vs4\al\co1(\o(∑,\s\up6(4),\s\do4(i=1))x\o\al(2,i)-4\x\to(x)2))\b\lc\(\rc\)(\a\vs4\al\co1(\o(∑,\s\up6(4),\s\do4(i=1))y\o\al(2,i)-4\x\to(y)2))))=eq\f(438-412.5,\r(660-625×291-272.25))=eq\f(25。5,\r(656。25))≈eq\f(25.50,25。62)≈0。9953.因为r〉0.75,所以y与x有很强的线性相关关系.(2)由(1)知:eq\o(b,\s\up6(^))=eq\f(\o(∑,\s\up6(n),\s\do4(i=1))xiyi-n\x\to(x)\x\to(y),\o(∑,\s\up6(n),\s\do4(i=1))x\o\al(2,i)-n\x\to(x)2)=eq\f(438-412.5,660-4×12.52)≈0.7286,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x)=-0.8575.∴回归直线方程为eq\o(y,\s\up6(^))=0.7286x-0。8575.例3解题导引分类变量的独立性检验是建立在2×2列联表基础之上的,因而根据题目提示的分类标准设计2×2列联表是独立性检验的关键所在.解列联表如下:疱疹面积小于70疱疹面积不小于70合计注射药物Aa=70b=30100注射药物Bc=35d=65100合计10595n=200K2=eq\f(200×70×65-35×302,100×100×105×95)≈24。56.由于K2>10。828,所以有99.9%的把握认为“注射药物A后的疱疹面积与注射药物B后的疱疹面积有差异”.变式迁移3解对于上述四个科目,分别构造四个随机变量Keq\o\al(2,1),Keq\o\al(2,2),Keq\o\al(2,3),Keq\o\al(2,4).由表中数据可以得到语文:k1=eq\f(244×174×13-27×302,201×43×204×40)≈7.294>6。635,数学:k2=eq\f(244×178×20-23×232,201×43×201×43)≈30.008〉10.828,英语:k3=eq\f(244×176×19-25×242,201×43×200×44)≈24.155〉10。828,综合科目:k4=eq\f(244×175×17-26×262,201×43×201×43)≈17.264〉10.828,所以,有99%的把握认为语文上线与总分上线有关系,有99。9%的把握认为数学、英语、综合科目上线与总分上线有关系,数学上线与总分上线关系最大.课后练习区1.C[在独立性检验中,随机变量K2的取值大小可说明两个变量关系的程度.一般地随机变量K2的值越大,两变量的相关程度越大,反之就越小.K2〉6.635说明有99%的把握认为二者有关系.]2.C[若r〉0,表示两个相关变量正相关,x增大时,y也相应增大,故①正确.r〈0,表示两个变量负相关,x增大时,y相应减小,故②错误.|r|越接近1,表示两个变量相关性越高,|r|=1表示两个变量有确定的关系(即函数关系),故③正确.]3.D[因为r〉0且丁最接近1,残差平方和最小,所以丁相关性最高.]
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 芒果供货协议书
- 道路保通协议书
- 深圳交通所合作协议书
- 签订直赔协议书
- 婚礼没登记离婚协议书
- 自用管线协议书
- 工地劳动合同和协议书
- 父母和孩子复婚协议书
- 电缆施工协议书
- 架子工承包合同协议书
- 北京市事业单位退役大学生士兵定向招聘笔试真题2024
- 品质承包合同协议书
- 2025年浙江省杭州市上城区中考数学一模试卷
- 2024-2025学年度部编版二年级语文下学期期末试卷 (含答案)
- 2025年电子工程师工作能力考试试题及答案
- 浙江省Z20联盟(浙江省名校新高考研究联盟)2025届高三第三次联考物理(含答案)
- 营业执照共用协议书范本
- 掌握纺织机械核心操作技能试题及答案
- 法律争议预测模型-全面剖析
- 校园禁烟宣传抵制烟草诱惑拒绝第一支烟课件
- 家政讲师面试题及答案
评论
0/150
提交评论