版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十二章相关与回归分析第一节变量之间的相关关系相关程度与方向•因果关系与对称关系第二节定类变量的相关双变量交互分类(列联表)•削减误差比例(PRE)•入系数与T系数第三节定序变量的相关分析同序对、异序对和同分对•Gamma系数•肯德尔等级相关系数(T系数、aTb与T系数)•萨默斯系数(d系数)•斯皮尔曼等级相关(p相关)•肯德尔bc和谐系数第四节定距变量的相关分析相关表和相关图•积差系数的导出和计算•积差系数的性质第五节回归分析线性回归•积差系数的PRE性质•相关指数R第六节曲线相关与回归可线性化的非线性函数•实例分析(二次曲线指数曲线)一、填空1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是(随机性)变量。变量间的相关程度,可以用不知Y与X有关系时预测Y的全部误差气,减去知道Y与X有关系时预测Y的联系误差E2,再将其化为比例来度量,这就是(削减误差比例)。3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y围绕每个估计值Y是服从();(2)分布中围绕每个可能的Y值的cc()是相同的。4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为(回归方程),并据以进行估计和预测。这种分析方法,通常又称为(回归分析)。6.积差系数r是(协方差)与X和Y的标准差的乘积之比。二、单项选择当x按一定数额增加时,y也近似地按一定数额随之增加,那么可以说x与y之间存在(A)关系。A直线正相关B直线负相关C曲线正相关D曲线负相关评价直线相关关系的密切程度,当r在0.5〜0.8之间时,表示(C)。A无相关B低度相关C中等相关D高度相关3.相关分析和回归分析相辅相成,又各有特点,下面正确的描述有(D)A在相关分析中,相关的两变量都不是随机的;B在回归分析中,自变量是随机的,因变量不是随机的;C在回归分析中,因变量和自变量都是随机的;D在相关分析中,相关的两变量都是随机的。4.关于相关系数,下面不正确的描述是(B)。A当0—|r|—1时,表示两变量不完全相关;B当r=0时,表示两变量间无相关;C两变量之间的相关关系是单相关;D如果自变量增长引起因变量的相应增长,就形成正相关关系。欲以图形显示两变量X和Y的关系,最好创建(D)A直方图B圆形图C柱形图D散点图两变量X和Y的相关系数为0.8,则其回归直线的判定系数为(C)A0.50B0.80C0.64D0.907.在完成了构造与评价一个回归模型后,我们可以(D)。A估计未来所需样本的容量B计算相关系数和判定系数C以给定的因变量的值估计自变量的值D以给定的自变量的值估计因变量的值8.两变量的线性相关系数为0,表明两变量之间(D)。A完全相关B无关系C不完全相关D不存在线性相关9.身高和体重之间的关系是(C)。A函数关系B无关系C共变关系D严格的依存关系10.在相关分析中,对两个变量的要求是(A)。A都是随机变量B都不是随机变量C其中一个是随机变量,一个是常数D都是常数11.在回归分析中,两个变量(D)。A都是随机变量B都不是随机变量C自变量是随机变量D因变量是随机变量12.一元线性回归模型和多元线性回归模型的区别在于只有一个(B)。A因变量B自变量C相关系数D判定系数13.以下指标恒为正的是(D)。A相关系数rB截距aC斜率bD复相关系数14.下列关系中,属于正相关关系得是(A)。A身高与体重B产品与单位成本C正常商品的价格和需求量D商品的零售额和流通费率三、多项选择1.关于积差系数,下面正确的说法是(ABCD)。A积差系数是线性相关系数B积差系数具有PRE性质C在积差系数的计算公式中,变量X和Y是对等关系
D在积差系数的计算公式中,变量X和Y都是随机的
2.关于皮尔逊相关系数,下面正确的说法是()。A皮尔逊相关系数是线性相关系数B积差系数能够解释两变量间的因果关系Cr公式中的两个变量都是随机的Dr的取值在1和0之间E皮尔逊相关系数具有PRE性质,但这要通过r加以反映3.简单线性回归分析的特点是(ABE)。A两个变量之间不是对等关系B回归系数有正负号C两个变量都是随机的D利用一个回归方程,两个变量可以互相推算E有可能求出两个回归方程4.反映某一线性回归方程y=a+bx好坏的指标有(ABD)。A相关系数B判定系数Cb的大小D估计标准误Ea的大小5.模拟回归方程进行分析适用于(ACDE)。A变量之间存在一定程度的相关系数B不存在任何关系的几个变量之间C变量之间存在线性相关D变量之间存在曲线相关E时间序列变量和时间之间6.判定系数r2=80%和含义如下(ABC)A自变量和因变量之间的相关关系的密切程度B因变量y的总变化中有80%可以由回归直线来解释和说明C总偏差中有80%可以由回归偏差来解释D相关系数一定为0.64E判定系数和相关系数无关7.回归分析和相关分析的关系是(ABE)。A回归分析可用于估计和预测B相关分析是研究变量之间的相互依存关系的密切程度C回归分析中自变量和因变量可以互相推导并进行预测D相关分析需区分自变量和因变量E相关分析是回归分析的基础
8.以下指标恒为正的是(BC)。A相关系数B判定系数C复相关系数D偏相关系数E回归方程的斜率一元线性回归分析中的回归系数b可以表示为(BC)A两个变量之间相关关系的密切程度B两个变量之间相关关系的方向C当自变量增减一个单位时,因变量平均增减的量D当因变量增减一个单位时,自变量平均增减的量E回归模型的拟合优度关于回归系数b,下面正确的说法是()。Ab也可以反映X和Y之间的关系强度。;B回归系数不解释两变量间的因果关系;Cb公式中的两个变量都是随机的;Db的取值在1和-1之间;Eb也有正负之分。四、名词解释消减误差比例变量间的相关程度,可以用不知Y与X有关系时预测Y的误差E,减去知道Y与X0有关系时预测Y的误差E,再将其化为比例来度量。将削减误差比例记为PRE。1确定性关系当一个变量值确定后,另一个变量值夜完全确定了。确定性关系往往表现成函数形式。非确定性关系在非确定性关系中,给定了一个变量值,另一个变量值还可以在一定范围内变化。因果关系变量之间的关系满足三个条件,才能断定是因果关系。1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。单相关和复相关单相关只涉及到两个变量,所以又称为二元相关。三个或三个以上的变量之间的相关关系则称为复相关,又称多元相关。正相关与负相关正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。散点图散点图:将相关表所示的各个有对应关系的数据在直角坐标系上画出来,以直观地观察X与Y的相互关系,即得相关图,又称散点图。皮尔逊相关系数r皮尔逊相关系数是协方差与两个随机变量X、Y的标准差乘积的比率。同序对在观察X序列时,如果看到X<X,在Y中看到的是Y<Y,则称这一配对是同ijij序对。异序对在观察X序列时,如果看到X<X,在Y中看到的是Y>Y,则称这一配对是异序ijij对。同分对如果在X序列中,我们观察到Xi=Xj(此时Y序列中无Y=Y),则这个配对仅是X方向而非Y方向的同分对;如果在Y序列中,我们观察到Y=Y.(此时X序列中无X.=X.),则这个配对仅是Y方向而非X方向的同分对;我们观察到X=X,也观察到Y=Y,则称ijij这个配对为X与Y同分对。五、判断题TOC\o"1-5"\h\z1.由于削减误差比例的概念不涉及变量的测量层次,因此它的优点很明显,用它来定义相关程度可适用于变量的各测量层次。(V)不管相关关系表现形式如何,当|r|=1时,变量X和变量Y都是完全相关。(V)不管相关关系表现形式如何,当r=0时,变量X和变量Y都是完全不相关。。X)通过列联表研究定类变量之间的关联性,这实际上是通过相对频数条件分布的比较进行的。而如果两变量间是相关的话,必然存在着Y的相对频数条件分布相同,且和它的相
对频数边际分布相同。(X)如果众数频数集中在条件频数分布列联表的同一行中,系数便会等于0,从而无法显示两变量之间的相关性。(V)从分析层次上讲,相关分析更深刻一些。因为相关分析具有推理的性质,而回归分析从本质上讲只是对客观事物的一种描述,知其然而不知其所以然。(X)六、计算题对某市市民按老中青进行喜欢民族音乐情况的调查,样本容量为200人,调查结果示于下表,试把该频数列联表:①转化为相对频数的联合分布列联表②转化为相对频数的条件分布列联表;③指出对于民族音乐的态度与被调查者的年岁有无关系,并说明理由。对于民族音乐的态度(Y)年岁(X)老中青喜欢383830不喜欢153346已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。身高(cm)171167177154169体重(kg)5356644955身高(cm)175163152172162体重(kg)6652475850皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X】假定有不同文化程度的35〜45岁育龄妇女100人的生育情况如下表,求文化程度与平均生育数的相关系数r。五2016五20164.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次397512810211416体质名次596712811110324斯皮尔曼相关系数:0.94,肯德尔等级相关系数:0.83】序号-一一序号-一一-二二三四育龄妇女人数20202020文化程度(年)06912平均生育数4.743.313.082.411.945.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma系数和肯德尔相关系数T文化程度婚姻美满大学中学小学美满9165一般83018不美满347【Tc=0.18】6.以下为两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员112435867910评判员212345678910斯皮尔曼相关系数:0.95】7.某原始资料为:X65739188765396678285Y571313.574.5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;Y=-0.957X+14.867】【r=0.98】(4)用积差法求相关系数。【Y=-11.48+0.27X】Y=-0.957X+14.867】【r=0.98】X24681012Y141097548.两变量X、Y之间的关系如下表,1)求回归方程;(2)求相关系数。9.试就下表所示资料,计算关于身高和体重的皮尔逊相关系数。10.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X)和综合素质(Y)进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的肯德尔等级相关系数及斯皮尔曼等级相关系数。选手名ABCDEFGHIJ演唱水平(X)12345678910综合素质(Y)31527410869【肯德尔系数:0.56,斯皮尔曼系数:0.76】青年歌手大奖赛,假设五位评委对10名决赛选手的演唱水平进行排序,他们的有关评价结果列于下表,试通过计算肯德尔和谐系数,检验专家意见的一致性和相关程度。Y=abx;(2)失业率与通货膨胀率之间的相关系数。c
失业率(%)1.01.62.02.53.13.64.04.55.15.66.06.5通胀率(%)1.61.51.11.30.60.90.80.80.70.60.60.6【y二6.717e)-o」8O3x】【相关系数0.76】13.试就下表所示资料,求算员工工作满足感高与归属感之Gamma系数,并解释Gamma系数具有削减误差比例PRE性质。工作满足感与归属感归属感(归属感(Y)工作满足感(X)低(1)中(2)高(3)低(1)843中(2)651高(3)445Fx18139F—15121340G=0.092】14.已知相关系数r14.已知相关系数r=0.6,估计标准误差S=8,样本容量为62。求:1)剩余变差值;2)剩余变差占总变差的百分比3)求总变差值。15.在相关和回归分析中,已知下列资料:S2=16,S2=25,S2=-19,a=30。XYXY要求:1)计算相关系数r,说明相关程度;2)求出直线回归方程。16.在相关和回归分析中,已知下列有关资料:16.在相关和回归分析中,已知下列有关资料:SX=5,SY=10,n=20,r=0.9工(Y-Y)2=2000。试计算:1)回归系数b;2)回归变差和剩余变差;3)估计标准误差S。yx17.根据下述假设资料求回归方程。X12X12Y23.023.43456724.125.226.126.927.318.某10户家庭样本具有下列收入(元)和食品支出(元/周)数据:收入(X)20303340151326382543支出(Y)7981154810910要求:1)写出最小平方法计算的回归直线方程;
2)在95.46%把握下,当X=45时,写出Y的预测区间。19.根据下述假设资料,试用积差法求相关系数。910811因变量与其平均数的离差平方输出X(亿元)12910811因变量与其平均数的离差平方输出Y(亿元)1286111020.对40个企业的横截面样本数据进行一元回归分析和为6000,而回归直线拟合的剩余变差为2000,求:1)变量间的相关指数R;2)该方程的估计标准误差。七、问答题1.简述积差系数的特性。2.简述回归分析和相关分析之间的密切联系。JnSX2(JnSX2(工x)2訶工y2(工y)n工xy一工x工yb=VV-=0.659nVX2一(VX)2VyVxa=-b=—54.479nny=a+bx=-54.479+0.659x斯皮尔曼相关系数编号身高(cm)次序体重(kg)次序[d2部分计算参考:(见计算题六)2.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。编号身高(cm)体重(kg)1171532167563177644154495169556175667163528152479172581016250皮尔逊相关系数与回归方程编号身高(cm)(x体重(kg)y[x2iy2xy1171532924128099063216756278893136935231776431329409611328415449237162401754651695528561302592956175663062543561155071635226569270484768152472310422097144917258295843364997610162502624425008100合计1662nVxy550-VxVy27686230600918302
11714536-24216765642431771642-114154949900516955550061752661117163752700815210471000917235830010162850800合计106工d2r二1-二0.94sn(n2-1)4.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。环境名次39751281021141体质名次59671281111032斯皮尔曼等级相关系数环境名次体质名次d35-249900761157-2412120088001011-112111111011431112-116424合计186工d2r二1-二0.94sn(n2-1)
ABCDEFGHIJK环境名次(x)39751281021141体质名次(y)59671281111032肯德尔等级相关系数L641)A:同序对ACABADAEAFAGAHAIAK9异序对AJAL22)B:同序对BCBDBGBHBIBJBKBLBEBF103)C:同序对CECFCGCHCICJCKCL8异序对CD14D:同序对DEDFDGDHDIDJDK7异序对DL15)E:同序对EGEHEIEJEKELEF76)F:同序对FGFHFIFJFKFL67)G:同序对GHGJGKGL4异序对GI18)H:同序对HIHJHKHL49)I:同序对IJIKIL310)J:同序对JKJL211)K:同序对KL1合计:同序对n=61异序对n=5sd「s_同序对n=61异序对n=5sd2n(n-1)5.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度Gamma系数和肯德尔相关系数tc。文化程度婚姻美满大学中学小学美满9165一般83018不美满347n=9X(30+18+4+7)+16X(18+7)+8X(4+7)+30X7=1229sn=5X(30+8+3+4)+18X(3+4)+16X(8+3)+30X3=617d
1
—n1
—n22d[(m-1)/m]=0.186.以下试两位评判员对10名参赛人名次的打分。试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。参赛人ABCDEFGHIJ评判员112435867910评判员212345678910参赛人评审员1评审员2d|_d_A1100B2200C4311D34-11E5500F8624G67-11H78-11I9900J101000合计86》d2r二1二0.95sn(n2-1)7.某原始资料为:X65739188765396678285Y571313.574.5156.71011要求:(1)求回归方程;(2)这是正相关还是负相关;【正相关】(3)求估计标准误差;(4)用积差法求相关系数。XYEUElxy6554225253257375329495119113828116911838813.57744182.251188767577649532534.5280920.25238.5961592162251440676.7448944.89448.982106724100820
11722592.761818n11722592.761818n工xy_工x工yn工X2_(工X)2{n工y2_(工齐工xy丄x工工X2—(工857761219
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天体物理概论课程设计
- 2024年度个人股权转让代签合同授权委托书范本3篇
- 电力综合柜员课程设计
- 熊猫施工课程设计
- 动力机械原理课程设计
- 2024年度珠宝首饰置换买卖合同3篇
- 2024年版货物销售代理协议3篇
- 2024年联合研发合同范本
- 2024年版建筑总体施工承包合同版B版
- 2024年桥架产品绿色环保认证采购合同范本3篇
- 小学少先队活动课赣教三年级上册主题一唱响嘹亮的队歌勇敢前进
- 《穿井得一人》《桑中生李》阅读练习及答案
- “大综合一体化”行政执法改革工作自查报告
- DB5110∕T 37-2021 地理标志产品 资中冬尖加工技术规范
- (3)110KV配电装置安装单位工程质量验收评定表1
- 课程设计之年产90000吨丙酮水连续精馏塔的设计
- 赞比亚矿产资源及矿业开发前景分析
- 餐饮前台餐具与杂件清单
- 河南省建设工程安全监督备案申请表
- 海拔高度与气压、空气密度、重力加速度对照表
- 道路平交口计算公式
评论
0/150
提交评论