统计学习题检验与方差分析_第1页
统计学习题检验与方差分析_第2页
统计学习题检验与方差分析_第3页
统计学习题检验与方差分析_第4页
统计学习题检验与方差分析_第5页
免费预览已结束,剩余13页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十三章 2 检验与方差分析第一节 拟合优度检验拟合优度检验(比率拟合检验)正态拟合检验第二节 无关联性检验独立性、理论频数及自由度频数比较和连续性修正关系强度的量度 第三节 方差分析总变差及其分解自由度检验统计量 Fo的计算相关比率方差分析的 几点讨论第四节 回归方程与相关系数的检验回归系数的检验积差系数的检验回归方程的区间估计一、填空1方差分析可以对多个总体()是否相等进行检验。2列联表是按()标志把两个变量的频数进行交互分类的。23在使用 2 检验法进行列联表检验所使用的自由度为 ()。224在对()的列联表进行检验时,存在着2(1) = Z2的关系。5列联表检验是通过()而不是通过相对

2、频数的比较进行的。6 方差分析是()检验的推广,一般用于处理自变量是一个(或多个)定类变量和因变量是一个定距变量之间的关系。7在对6拓的列联表进行方差分析时,与组间平方和相联系的自由度为(),与组内平方和相联系的自由度为(),与总平方和相联系的自由度为()。&方差分析中把已解释的变差对总变差的比值称为()。9检验两个总体变量(定距一定距变量)是否具有线性关系,主要是检验总体的()是否等于零。10.对于定距一定距变量计算积差系数r时,要求相关的两个变量均为()变量。在回归分析中,只有()变量才是随机的。11 在实际运用中,方差分析的结果常用一种称为()的标准形式的表格表示出来。12 .取

3、Yc ± 1Sy/x ,那么在散点图上约有()的观测点落在其间。13 .取Yc ± 2Sy/x ,那么在散点图上约有()的观测点落在其间)的观测点落在其间。14 .取Yc ± 3Sy/x,那么在散点图上约有(、单项选择221 在比率拟合优度检验中,对于选定的显著性水平a求临界值,此时的自由度是( )。A实验数据总数n 1B 变量X的取值种类数cIC 实验数据总数 n 变量 X 的取值种类数 cD实验数据总数n +变量X的取值种类数c2. 在2正态拟合优度检验中,对于选定的显著性水平a求临界值2,此时的自由度 是( )。A 数据的分组数B 数据的分组数 IC 数据的

4、分组数 2D 数据的分组数 33. 使用 2检验法对n xc列联表进行无关联性检验,与o这个检验统计量相联系的自 由度( )。A n 1B cIC n c D (n1 )x( c1 )4. 对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部分卡方0影响最大。这是利用了卡方分布的()。A 恒正性 B 方差为期望值的 2 倍 C 可加性 D 前三者5. 在方差分析中,自变量是()。A 定类变量B 定序变量C 定距变量D 定比变量6. 在直线回归分析中,相关比率PRC=0.750。那么,积差系数r=()。A 0.750B 0.5625C 1.333D 0.866三、多项选择1.

5、 可以用于拟和优度检验的方法有()。2A 检验B F 检验C 累计频数检验D 游程检验2. 方差分析法()。A 可以用于一个总体均值是否相等的检验B 可以用于两个总体均值是否相等的检验C 可以用于三个总体均值是否相等的检验D 可以用于多个总体均值是否相等的检验3. 对拟和优度推断结果,下列说法正确的是()。A 当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表 明实际情况切合零假设B 数据少如果否定了零假设,这一否定的可靠性是很大的C 规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多 大实际意义D 若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支

6、持24.使用 检验拟和优度,下列说法正确的是()。A 相对频数相同的列联表,在统计检验中其显著性相同B 相对频数相同的列联表,在统计检验中其显著性并不相同C 相对频数相同的列联表,样本容量增加 K 倍, o2 不变D 相对频数相同的列联表,样本容量增加 K 倍, o2 变也扩大 K 倍5相关比率 PRE 度量的可以是()A 定类定距变量之间的相关程度B 定距定距变量之间的相关程度C 线性相关D 非线性相关6 下列说法正确的是()。A 方差分析的优点在于,一个检验可以代替多个均值差检验B 方差分析总是优于一系列的均值差检验C 方差分析中的自变量 X 如果是二分变量,不论采用方差分析或均值差检验,

7、其 结果完全相同D 总变差分解的思想可以直接推广至多因素显著性检验 7方差分析所包含的假定包括()。A 正态分布B 独立随机样本C 等方差性D 非负性四、名词解释1拟和优度检验2列联表3理论频数4方差分析5方差分析表6总变差7组内变差8组间平方和9. 相关比率 10估计标准误差五、判断题1理论频数 fe 与观测频数 fo 越接近,经验分布与理论分布拟合程度越好。() 2对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不大。 ( ) 3规模极大的试验可把零假设有极细微的差别检测出来。( )4如何求得列联表中的理论频数就成了独立性检验的关键。( )5 2 检验法用于对交互分类

8、资料的独立性检验,有其它方法无法比拟的优点。26.检验不适用于定类变量和定序变量的相关统计。()7在2X2列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测方向的(乙/2)2来找出 2的近似值。()&相对频数相同的列联表,在统计检验中其显著性也相同。()9组内变差反映了数据的 C个“中心”的散布程度。()10 .组间平方和反映了数据围绕各“中心”的散布程度。()11 方差分析是用(可以解释的方差)/ (不能解释的方差)作为检验统计量。()12. 我们不可以从总平方和减去组间平方和来求组内平方和。()13. 2只可用于一个定类变量与一个定距变量的相关程度的测定。()14.

9、 方差分析的优点在于,一个检验可以代替多个检验。()15. 如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。()16. 拟合值 Yc上下设置一个合适区间,那么Y被估计到的可能性便会大大增加。( )六、计算题1. 一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。为此,他在某校随 机抽取了 4500个本科生,这些学生的分布是: 一年级1200人,二年级1100人,三年级1150 人,四年级1050人。试问,在给定显著性水平a为0. 05下,四个年级学生人数构成是否均匀?2 .一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规律两种粉色杂交后,后代将以白:粉:红

10、=1 : 2 : 1的比例出现。他做了一项杂交实验,植株了 100株后代,结果发现:21株白,61株粉,18株红。试问,在给定显著性水平a为 0. 05 下,是否植株后代以白:粉:红 =1 : 2 : 1的比例出现?3. 某种动物的两个品种杂交后可能出现四种特征。某种理论分析表明,可能出现的四种特征的数量将以 9 : 3 : 3 : 1的比例出现。生物学家为此做了一项实验,检查了 160个后 代,结果发现具有着四种特征的后代的数量分别是72、38、32、18。试问,在给定显著性水平a为0. 05下,是否杂交后代以 9 : 3 : 3 : 1的比例出现?4. 某公司对电视机的可靠性进行了一次调查

11、,使用100台电视机作样本,记录了在电视机出现故障之前所经历的月份。根据经历的月份(按等级划分),下表给出了出现故障的实际分布月份和故障按照正态概率分布月份:出现故障之前的月出现故障之前的实际月份出现故障之前的期望月份份(等级)17以下691720241721 232827242618252729141530以上107要求:检验故障的实际分布与正态分布是否有明显差别(a取0. 05)。5.下表是三个年龄组的100名居民对生活质量要求的分布频数(按高、中、低分类)年龄(岁)生活质量要求总计高中低17301215134011 35111311354565810720总计313831100试问,居民

12、对生活质量的要求与年龄是否有明显的关系(a取0. 05)。6下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。小于5次5 10 次5次以上合计10公里以内4231301031020公里322356020公里以上1971137合计936146200试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系? (a取0. 05)7为研究职业的代际流动问题,在某地随机抽取了160名职业区民进行调查,调查的结果如下表所示:父辈职业合计脑力劳动体力劳动农业劳动子辈脑力劳动258538职体力劳动15351060业农业劳动575062合计455065160试问,子辈职业与父辈职业之间是否存在相关关系?

13、 (a取0. 05)&某中学想知道城市学生家长和农村学生家长对延长学生在校时间是否持不同看法。研究者随机抽出来自农村和城市的两个家长样本,调查结果表明:在来自城市的200位家长中,123人支持,36人反对,41人没有看法;在来自农村的300位家长中,145人支持,85人反对,70人没有看法。试问,家长对学生延长在校时间的看法是否与其居住在城市或 农村有关? (a取 0. 01 )9某连锁商业企业在同城三个不同地点开设了三个分店,从这三家商店随机抽出5天的营业额的数据如下表所示:单位:万元第一豕分店第二家分店第三家分店第一天10714第二天12118第三天9812第四天81310第五天1

14、11011要求:(1)求三家店每天的平均每天的营业额和5天的平均每天营业额;(2) 求总变差、组内变差和组间平方和;(3) 编制方差分析表;(4) 检验三个商店的地点不同对每天的营业额是否有显著的影响(5) 计算商店的地点不同对每天的营业额之间的相关比率。10. 为了研究职业与家庭子女数之间的关系,随机地抽出了41户家庭进行了调查,调 查三种职业家庭的子女数的资料如下:工人:1 , 3, 4, 4, 6, 2, 3, 4, 3, 5, 2, 4;干部:3, 5, 0, 5, 4, 4, 2, 3, 1, 3, 2, 3 , 3 , 2 , 4 , 2 , 6 , 1;知识分子:6 , 4 ,

15、2 , 2 , 3 , 0 , 5 , 3 , 1 , 2 , 1。要求:(1)求三种职业家庭户均子女数;(2) 求总变差、组内变差和组间平方和;(3) 编制方差分析表;(4) 检验不同职业的生育观是否有显著的不同。(5) 计算职业与子女数量之间的相关比率。11. 有关雇员初始年薪和他 10年后的年薪之间的一项调查,共抽取了13名雇员。数据表明,二者之间的积差系数是0.570。现给定a =0. 05 ,试检验此相关系数是否显著。12. 1992 2003年我国城镇居民人均消费性支出和人均可支配收入的数据见下表:单位:千元年份人均可支配收入人均消费性支出19922.0271.67219932.5

16、772.11119943.4962.85119954.2833.53819964.8393.91919975.1604.18619985.4254.33219995.8544.61620006.2804.99820016.8605.30920027.7036.03020038.4726.511要求:(1)计算我国城镇居民人均消费性支出和人均可支配收入的积差系数;(2)检验所计算的积差系数的显著性;(3)建立我国居民人均消费支出依人均可支配收入的线性回归模型;(4)计算居民人均消费支出与人均可支配收入之间的相关比率,说明这一相关比率与积差系数的数量关系;(5)计算估计标准误差;(6) 已知某年我

17、国居民人均年可支配收入为8000元,试以95%的置信度预测人均年 消费性支出的估计区间。13. 某银行25家分行的不良贷款额与贷款余额调查数据如下(单位:亿元):分行编号各项贷款余额不良贷款额167.30.92111.31.131734.8480.83.25199.77.8616.22.77107.41.68185.412.5996.111072.82.61164.20.312132.241358.60.814174.63.515263.510.21679.331714.80.21873.50.41924.7120139.46.821368.211.62295.71.623109.61.224

18、196.27.225102.23.2要求:(1)计算各项贷款余额和不良贷款额的积差系数;(2)检验所计算的积差系数的显著性;(3)建立不良贷款额依各项贷款余额的线性回归模型;(4)对回归模型进行 F检验;(5)计算估计标准误差;(6)求出贷款余额为100亿元时,不良贷款 95%的置信区间.七、问答题1 对于拟合优度检验,解释统计推断的结果时,应注意些什么?2 22. 简述相关比率、积差系数之平方r和相关指数R之间的关系。参考答案一、填空1.均值 2.品质3. df(c-1)( r-1)4 . 2 X25 .频数6 .均值差74, 1 , 58.相关比率9.回归系数B 10 .随机,因11 .方

19、差分析表12. 68 2613.95. 4614. 99.73二、单项选择1 B 2. D3.D 4. C5. A 6.D三、多项选择1 AC 2. 1BCD3. ABCD4. BD5 .ABCD 6 .ACD7 .ABC四、名词解释1 拟和优度检验:是有关检定总体是否具有正态或其他分布形式的非参数统计检验。2 列联表:是按品质标志把两个变量的频数进行交互分类的统计表格。3 理论频数:是按照理论分布计算出的样本各组频数。4 方差分析:研究多个总体均值是否存在差异的统计检验方法。5方差分析表:用于表达方差分析结果的标准形式的表格。其基本形式如下:项目SS自由度MS检验统计量临界值显著性组间SS3

20、(c 1)MSbMSb / MSwF a ( c 1, nc)(待定)组内SSw(nc)MSw总SSr5 1)6 总变差:记作SST,它表示Yj对于总均值Y的偏差之平方和,即cm_SS=(Yj Y)2i 1 j 17组内变差:记作 SSw,它是各观测值 Yj对其所属类别均值 Yi的偏差的平方和,即c ni_ 2(Yj Yi)2c _Yj的变异,即ni(Yi Y)2i 1 j 1&组间平方和:记作 SS3,是自变量因素所没有解释的i 19. 相关比率:方差分析中把已解释的变差对总变差的比值称为相关比率,用符号2表示。=1SSt10. 估计标准误差:为回归剩余方差MS的平方根,即 S/x=

21、 J一(Y五、判断题1.(V)2.( X )3.(V)4.(V )5.(V)6. ( X ) 7. ( V)8.(X)9.(X)10. (X ) 11.(V)12.(X)13.(X)14. ( V ) 15.(V)16.(V)六、计算题2 21.各年级理论频数均为1125人,。=11.111 > 0.05,3=7.81,接受H仁四个年级的学生频数不构成均匀分布2 22 .白、粉、红三色花的理论频数分别是25、50和25 , o = 5.020 >0.05,2 =5.99,接受H。:植株后代以白:粉:红 =1 : 2 : 1的比例出现3. 四种特征后代的理论频数为:90、30、30、

22、10,2 = 12.267 >0.05,3 =781,接受H1:杂交后代不是以9 : 3 : 3 : 1的比例出现4. 0.05,5 = 11.712 = 7.23 ,接受H0:检验故障的实际分布与正态分布没有明显差别2 25. 0.05,4 =9.448> o = 0.16,接受H。:居民对生活质量的要求与年龄没有明显的关 系2 26. 0.01,4 =13.28> o = 12.376,接受H。:车祸事故的频数与司机单程驾车的路程相 互独立297. o = 94.79 >0.05,4 =9.49,接受H1:子辈职业与父辈职业之间是存在相关关系298. o = 9.6

23、1 >0 .01,2 =9.21,拒绝H。:家长对学生延长在校时间的看法与其居住在城市或农村无关9. (1)、(2)略;(3)见下表;(4)由于 Fo= 0.4697V F。.05 (2 , 12) = 3. 98,接受H0:三个商店的地点不同对每天的营业额没有显著的影响;(5) 0.0726SS自由度MS统计量 临界值 显著性组间4.133322.06670.46973.89组内52.800124.4000总56.9331410. ( 1)、( 2)略;(3)见下表;(4)由于 Fo= 0.72 V F。.05 (2 , 38) = 3. 24,接受Ho:不同职业的生育观没有显著的不同;(5) 0.0381SS自由度MS统计量临界值显著性组间3.593421.79670.723.24组内94.4066382.4843总98.0004011. t=2.301 >t0.025,ii=2.201,拒绝 H0: p= 012. (1 )r=0.9991 ; (2) t=

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论