




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、河南科技大学硕士研究生课程考试试题考试课程代码: 考试课程名称: 高级统计学 考试题共有8道,第6、8题每题20分,其余每题10分。要求:尽量借助统计软件进行分析,做题步骤要完整。1、某班45名学生“统计学”考试成绩从低分到高分排列如下:50 51 52 56 58 59 61 62 63 64 65 66 67 68 69 70 71 72 72 72 73 74 74 74 75 75 76 76 77 78 79 80 81 83 84 84 86 86 87 88 90 91 93 97 99。试将上述资料:(1)编成等距数列,计算组距、组中值;(2)编制频数分布表(3)绘制考试成绩直
2、方图与饼图。2、某中学校长看到一则报道:“这一城市的初中生平均每周看电视8h”。他认为他领导的学校学生看电视的时间明显小于该数字。为此,他在他的学校里随机地抽查了100个学生,看到这100个学生平均每周看电视的时间为6.5h。这一个样本的标准差为2h。讨论:(1)如果将这位校长断言的错误率控制在5%以内,那么你认为这位校长所言是否可信,为什么?(2)就本案例,在你的分析论证过程中使用了哪个重要的结论?3、某公司近年来产品质量出现了一些不稳定的情况,一般说来,有可能是操作工人的技术熟练程度的影响,也可能是生产同一产品的机器稳定性之间的差异的影响,为了找到原因,以便就存在的问题做出相应的对策,生产
3、部门进行了下列试验,试验的结果是记录了3位操作工人分别在4台不同的机器上操作3天的日产量。机器甲(操作工)乙(操作工)丙(操作工)A115 15 1719 19 1616 18 21A217 17 1715 15 1519 22 22A315 17 1718 17 1618 18 18A418 20 2015 16 1717 17 17根据上表的数据,设计一方案,判断:(1)操作工人的技术程度之间有无显著差异?(2)机器稳定性之间的差异是否显著?(3)操作工人的技术程度与机器稳定性的交互作用是否显著?(4)对于存在的问题,该公司应采取什么措施?4、随机抽查了生产同种产品的10个企业,得到它们的
4、产量和生产费用的数据:企业编号12345678910产量40424855657988100120140生产费用150140160170150162185165190185(1)建立生产费用对产量的回归方程。(2)二者的相关性如何;(3)对回归模型进行显著性检验(取a=0.05);(4)进行回归系数的显著性检验;(5)预测当产量为80千克时,该类企业平均的生产费用的置信区间。5、下表给出一个二元模型的回归结果。方差来源平方和(SS)自由度(d.f.)来自回归(ESS)65965来自残差(RSS)_总离差(TSS)6604214求:(1)样本容量是多少?RSS是多少?ESS和RSS的自由度各是多少
5、?(2)和?(3)检验假设:解释变量总体上对无影响。你用什么假设检验?为什么?(4)根据以上信息,你能确定解释变量各自对的贡献吗?6、现收集了财政收入(Y)与工业总产值(X1)、建筑业总产值(X2)19781990年数据,经分析回归方程为 Y=524.536+0.05265X1+0.454X2 T值 (7.518) (2.695) (3.214) R2=.0.990 F=246.240(1) 对所求得的方程作显著性检验,在a=0.05时,你的结论是什么?(2) 对各回归系数作显著性检验。 (a=0.05)(3) 说明回归方程的经济意义。(4)
6、160; 求出回归方程的复相关系数。(5) 若因变量Y与自变量X1,X2的偏相关系数分别为ry1;2=0.64916,ry2;1=0.71188,说明了什么?(6) 若1991年工业总产值为24502亿元,建筑业总产值为2980亿元,试求1991年财政收入的预测值与预测区间。(1-A=95%,随机误差项的标准差=121.85)(有关临界值:F0.05(2,10)=4.1,F0.05(2,13)=3.8,t0.05(10)=1.812 t0.025(10)=2.228)7、下面给出五个元素两两之间的距离,用最长距离法求出五个元素的聚类图
7、。 1 2 3 4 5 1 0 2 4 0 3 6 9 0 4 1 7 10 0 5
8、0; 6 3 5 8 0 8、下表是某年我国16个地区农民支出情况的抽样调查数据,每个地区调查了反映每人平均生活消费支出情况的六个经济指标。试通过统计分析软件分别用系统聚类法和K-均值法进行聚类分析,对两种聚类分析结果进行比较。并比较何种方法与人们观察到的实际情况较接近。地区 食品 衣着 燃料 住房 交通和 通讯 娱乐教 育文化 北京 190.33 43.77 9.73 60.54 49.01 9.04 天津 135.2 36.4 10.47 44.16 36.49 3.94 河北 95.21 22.83 9.3 22.44 22.81 2.8 山西 104.78 25.11 6.4
9、 9.89 18.17 3.25 内蒙 128.41 27.63 8.94 12.58 23.99 2.27 辽宁 145.68 32.83 17.79 27.29 39.09 3.47 吉林 159.37 33.38 18.37 11.81 25.29 5.22 黑龙江 116.22 29.57 13.24 13.76 21.75 6.04 上海 221.11 38.64 12.53 115.65 50.82 5.89 江苏 144.98 29.12 11.67 42.6 27.3 5.74 浙江 169.92 32.75 12.72 47.12 34.35 5 安徽 135.11 23.0
10、9 15.62 23.54 18.18 6.39 福建 144.92 21.26 16.96 19.52 21.75 6.73 江西 140.54 21.5 17.64 19.19 15.97 4.94 山东 115.84 30.26 12.2 33.6 33.77 3.85 河南 101.18 23.26 8.46 20.2 20.5 4.3 1.解:全距为49,假定组距为10,则组数=49/10=4.9,取整数应分为5组,各组组距与组中值见下表:考试成绩、组距、组中值、频数成绩组距组中值人数50-601055660-701065970-8010751680-901085990-100109
11、55(3)依据上表,分别画出直方图与饼形图,如下表:2.解:(1)已知u0=8,n=100,=6.5,=2,由题意知,我们关心的是城市初中生看电视的时间是否小于8小时,因此提出假设:H0:u< u0,H1:uu0由于看电视的时间服从正态分布,在H0成立时由a=0.05,查标准正态分布函数表得Za=1.645根据样本观测值计算得Z=-7.5<1.645所以接受H0,即学生看电视的时间小于8。(2)就本案例,我用了检验假设理论的右边检验,即:假设H0:u= u0,H1:u>u0或H0:u u0,H1:u>u0检验统计量拒绝域:z>za3. 解:将数据输入execl,用
12、方差分析得: A1观测数3339求和475455156平均15.666671818.3333317.33333方差1.33333336.3333334.25A2观测数3339求和514563159平均17152117.66667方差0037.75A3观测数3339求和495154154平均16.33333171817.11111方差1.333333101.111111A4观测数3339求和584851157平均19.33333161717.44444方差1.333333102.777778总计观测数121212求和205198223平均17.0833316.518.58333方差2.81060
13、62.2727274.083333方差分析差异源SSdfMSFP-valueF crit样本1.44444430.4814810.3151520.8142583.008787列27.72222213.861119.0727270.0011633.402826交互62.72222610.45376.8424240.0002522.508189内部36.66667241.527778(1) 上述结果显示:列F=9.072727>3.402826,说明操作工人间的技术程度有显著差异。(2) 上述结果显示:样本F=0.315152<3.008787,说明机器稳定性之间没有显著差异。(3)
14、上述结果显示:交互F=6.842424>20508189,说明操作工人与机器之间的交互作用显著。(4) 对于存在的问题,该公司应该加大对操作工人技术的培训,使其技术程度相一致。4. 解:将数据输入execl,进行数据整理,如图:xyxyx2y24015060001600225004214058801764196004816076802304256005517093503025289006515097504225225007916212798624126244881851628077443422510016516500100002722512019022800144003610014018
15、5259001960034225合计 777165713293870903277119所求回归方程为Y=134.79+0.3978X(2)将数据输入excel,进行数据分析,得:列 1列 2列 11列 20.8077661由此知,生产费用与产量的相关系数为0.807766,即生产费用与产量之间有高度的线性相关关系,相关的方向是正方向。(3)拟合优度检验:说明生产费用的65.2%取决于产量,这个结果说明所求方程拟合度好。回归方程的显著性检验:提出假设H0:B1=0,H1:B1不为0在H0成立时,F=1668.01*8/886.09=15.06>5.32拒绝H0,生产费用和产量有线性关系。(
16、4)回归系数显著性检验: 假设H0:B1=0,H1:B1不为0 拒绝原假设,说明生产费用与产量有线性关系。(5) 当产量为80千克时,总体均值的置信区间为:即置信区间为(158.844,174.321),说明了当企业的产量为80千克时,生产费用平均为158844元到174321元之间,其可信度为95。5.解:(1)样本容量15,RSS为77,ESS自由度为2,RSS自由度为12(2)=2175690613,=494.08(3) 用F检验,因为是对变量总体进行检验。(4)不能,因为结果数据不完整。6.解:(1)提出假设:H0:B1=B2=0,H1:B1,B2不同时为0F=F(k,n-k-1)由已
17、知得F=246.240> F0.05(2,10)=4.1拒绝H0,即有95%的把握认为Y与X1、X2有线性关系。(2)提出假设,H0:B1=0, H1: B1不等于0t1/t(n-k-1)由已知得,ti值分别为7.518,2.695,3.214,t0.025(10)=2.228因为7.518>2.228,2.695>2.228,3.214>2.228所以拒绝H0,即各回归系数对Y值均有线性影响。(3)该回归方程的意义为,除了工业总产值、建筑总产值,其它项目的财政收入为524.536,工业总产值增加一倍,财政收入增加0.05265倍,建筑总产值增加一倍,财政收入增加0.4
18、54倍。(4)由R= 得,R=0.995(5) ry1;2=0.64916表示,在其它变量不变的情况下,X1与Y的关系为:X1增加一倍,Y增加0.64916倍;ry2;1=0.71188表示,在其它变量不变时,X2与Y的关系为:X2增加一倍,Y增加0.71188倍。(6)Y1991=524.536+0.05265*24502+0.454*2980=3167.4863即1991年财政收入的预测值为3167.4863。则的预测区间为(Y1991-2,Y1991+2)=(3167.4863-2*121.85,3167.4863+2*121.85)=(2923.7863,3411.1863)即有95%
19、的把握认为Y1991在2923.7863与3411.1863之间。7. 上图中的中最小的元素是D141,于是将1和4合并成6,得到新图表:623562731095835上图中的最小元素是D25=3,于是将2和5合并成7,得到新图表:6736773109上图中的最小元素是D67=8,于是将6和7合并成8,最后与3合并1和4先组合,2和5再组合,之后1、4、2、5共同组合,最后在与3组合成一类。8.解:系统聚类法:将数据输入spss,对此进行系统聚类,结果如下: Dendrogram using Average Linkage
20、60;(Between Groups) Rescaled Distance Cluster Combine C A S E 0 &
21、#160; 5 10 15 20 25 Label Num +-+-+-+-+-+
22、60; 3 16 4 15
23、60; 2 10
24、 6 13
25、60; 14 12
26、; 5
27、0; 8
28、60;
29、60; 7
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 智慧安防:可持续发展的解决方案
- 前台礼仪规范-基础礼仪
- 财务报告中的舞弊信号试题及答案
- 【名师课件】2.4 课件:单摆-2025版高一物理必修二
- 第六章 作业13 向心加速度-2025版高一物理必修二
- 上海市徐汇区2024-2025学年高三下学期3月一模地理试题
- 科普法律小知识
- 鼾症的围手术期护理
- 教导主任个人工作总结2
- 2025届四川省德阳市高三下学期第二次特优生考试历史试题(解析版)
- 7-8宝钢湛江钢铁三高炉系统项目全厂供配电工程-测量方案-2019.7.5
- 期末培优拔高卷(试题)-2023-2024学年五年级下册数学北师大版
- 如果历史是一群喵
- 那个星期天教学课件省公开课一等奖新名师比赛一等奖课件
- 单个军人队列动作教案
- 《第3单元 角的度量:角的度量》课件
- Y -S-T 581.8-2023 氟化铝化学分析方法和物理性能测定方法 第 8 部分:硫酸根含量的测定 硫酸钡重量法 (正式版)
- 大象出版社《科学》四年级下册 第三单元 太阳、地球和月亮 影子的形成课件
- 2023北京市-实验动物上岗证培训考试题库
- 吉林省地方教材家乡小学一年级下册家乡教案
- 微塑料污染完整版本
评论
0/150
提交评论