spss-统计分析习题_第1页
spss-统计分析习题_第2页
spss-统计分析习题_第3页
spss-统计分析习题_第4页
spss-统计分析习题_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS统计分析习题1 搜集数据,用spss建立一个数据文件记录你所在班级学生下列情况:学号、姓名、年龄、籍贯、民族、家庭电话号码、出生年月日、综合测评成绩,以及评定成绩等级(优、良、中、可、差)等,给出正确的变量名、变量类型、标签及值标签、测度水平。2 下面的表,分别为某企业1991年1995年5年中各季度计划完成和实际完成的产量(单位:万吨)数据资料,试建立一个SPSS数据文件保存这两个表中的数据。年份一季度二季度三季度四季度计划数实际数计划数实际数计划数实际数计划数实际数19911992199319941995141716182012.517.216.518.420.5181820202

2、121.419.816.819.225.8181718202518.519.217.720.522.5202021222520.422.519.620.824.5然后对建立的数据文件调用分类汇总(Aggregate)命令分别按季度、年汇总各季度和各年度的计划产量和实际完成的产量、平均产量。最好能用统计图表显示。 3 某地20家企业的情况如下:编号部门所有制类型年产值(万元)职工人数(人)年工资总额(万元)1234567891011121314151617181920工业交通商业交通工业工业邮电通讯商业交通工业工业交通工业工业商业邮电通讯工业工业商业交通国有国有集体个体集体国有国有个体个体国有集

3、体个体国有集体股份制国有国有股份制国有国有2805.581265.40256.5026.88560.00800.502580.98125.45590.60950.001556.00950.00335.002455.081780.582500.00775.003305.00498.08965.58123560510520223568890651483254853541056806464853541015202246812.63435.6068.5814.00156.07256.74854.4065.16130.24268.13394.20257.9082.43639.20471.25486.98

4、272.58912.00139.20159.95根据上述资料建立数据文件,并完成下列统计整理工作,并回答有关问题:(1)调用排序个案Sort Cases命令分别对年产值、职工人数和年工资总额进行排序。许多SPSS文件中都定义一个表示观测量序号的id变量,按照自己的体会指出这个id变量的作用。(2)调用Aggregate命令分别按部门和所有制类型作分类汇总。(3)首先调用Sort Cases命令分别按部门:按所有制类型;按部门和所有制类型进行排序。再执行Analyze Descriptives Statistics Descriptives,对年产值、职工人数和年工资总额进行描述。(4)首先调用

5、Split File命令分别按部门和所有制类型将文件分组,再重复(3)的操作,比较二者的差异。4 如下图(局部)所示的文件中记录了某公司职工workage(工龄)、wage(月基本工资)、dutyday(出勤天数)、w_e_fee(应扣水电费)等项数据的资料,公司财务规定,工资按照下列原则发放:idnamesexbranchworkagewagedutydayw_e_fee11陆 玲女办公室25585.002230.6022张玉林男计划处28697.451947.4033孙兰平男财务处12429.651934.0044郭东立男总务处22526.502135.09(1)出满勤22天或以上者,按照

6、“日基本工资×出勤天数+工龄×1.8应扣水电费”计算;(2)出勤15天或以上,20天以下者,按照“日基本工资×出勤天数+工龄×1.2应扣水电费”计算;(3)出勤15天以下者,按照“日基本工资×出勤天数+工龄应扣水电费”计算。 其中“日基本工资=月基本工资22.5”,试编写一个计算输出职工当月实发工资的SPSS语法程序。5 下列表中列出某地区2004年2013年粮食产量、人口、工业总产值、国民生产总值的环比发展速度,试选用OLAP Cubs或者Case Summaries过程,分两个5年计划分别输出该地区上述各项指标的平均发展速度,以及全期的平均

7、发展速度。(提示:建立数据文件后,定义一个按5年计划分类的分类变量,在概述统计量对话框中选用Geomitric Mean。参考时间序列相关内容)年份year粮食产量环比速度(%)food_cir人口发展环比速度(%)popu_cir工业总产值环比速度(%)indu_cir国民生产总值环比速度(%)GDP_cir2004104.20102.40110.00104.80200591.34111.50114.00104.302006114.50103.40110.8099.90200799.43104.00101.60100.402008104.50100.60107.10103.702009103

8、.80113.30101.40101.502010100.40102.20101.20103.802011104.50103.30101.20101.402012100.50103.10103.50100.302013101.1097.94101.00100.00执行丁TransformCompute命令,分别计算期间各项指标的平均发展速度,以及全期的平均发展速度。6 下表所列的是某市2000年竣工的21幢商品楼所处地段(district)、标定价格(price)和最终出售价格(sale) (单位:元平方米)资料。districtpricesaledistrictpricesaledistri

9、ctpricesale城中心33003540远郊区18801750城中心30503200城中心36003500卫星城19501950远郊区16701650卫星城24002350卫星缄19001950远郊区16801650城中心35003650近郊区18501780近郊区17801680近郊区22502300近郊区17801650近郊区18501900远郊区18501780近郊区18401700卫星城20502000远郊区17601800城中心28002800卫星城20202100 试建立相应的数据文件调用OLAP Cube过程、按行概述报告过程、按列概述报告过程分别输出统计报告,概述各地段楼房

10、价格的平均(标定、实际)价格、价格标准差、最低价格、最高价格等。7 为了建立白炽灯泡的质量管理,从生产线上连续抽出32只灯泡依次贴上序号,然后作寿命试验,得到每只灯泡寿命的数据(千小时)如下:序号寿命序号寿命序号寿命序号寿命11.1191.63171.21251.3021.28102.10181.60261.5031.46111.21191.56271.2741.35121.76200.73281.5651.06132.41211.26291.1561.25142.08221.51301.9471.44151.50231.77310.8481.23161.55241.16321.14 经计算这

11、32只灯泡的平均寿命为1.435千小时,执行Transform Recode Into Different Variables命令将比平均寿命大的用“+”标记,比平均寿命小的用“”标记,使用游程检验法检验,“+”、“”号序列是否可以认为是随机的。8 甲乙两分析员同时分析某浆料中硼砂的含量,测得如下数据(%):甲13.5 12.1 15.4 10.8乙14.4 13.8 16.4 9.9 11.5 12.2 12.8 14.7 15.2建立合适的数据文件,选用秩和检验法检验二人分析的结果有无显著差异?9 调查100名健康女大学生的血清总蛋白含量(g %)如下表,试作频数表分析。7.43 7.88

12、 6.88 7.80 7.04 8.05 6.97 7.12 7.27 6.88 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.03 7.95 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.50 7.72 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 7.04 6.73 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.43 7.04 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.65 6.73 7.35 8.05

13、 7.95 7.56 7.50 7.88 7.20 7.20 7.72 7.65 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.35 6.73 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 7.27 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 7.27 8.43 10. 考虑下列 25个人的年龄:21,23,23,24,25,25,30,30,32,35,37,37,40,40,41,41,42,42,45,75,完成下列茎叶图。AGE Stem-and-Leaf PlotFr

14、equencyStem & Leaf2.3.4.Extremes Stem width: 10.00 Each leaf: 1 case(s)11 下图为从某厂全部职工中随机抽出的31名职工的年工资(元)分布的茎叶图:WAGE Stem-and-Leaf Plot Frequency Stem & Leaf 4.00 41 . 5566 5.00 42 . 23344 6.00 43 . 556668 8.00 44 . 02455688 4.00 45 . 1458 .00 46 . 3.00 47 . 356 1.00 Extremes (>=8850) Stem w

15、idth: 100.00 Each leaf: 1 case(s)(1)根据茎叶图列出这31个人的年工资额,定义变量建立数据文件,使用Compute对话框,计算年工资的Z得分;(2)建立记录工资的数据文件,输出该公司职工工资的描述性统计表。指出全厂职工年工资的均值、标准差、95置信区间等。12 试根据某个班级会计、统计、管理3门功课考试成绩的箱图(下图)回答下列问题:(1)估计该班各科考试成绩的中位数。(2)估计管理成绩的内四分位数界。(3)从会计成绩的奇异值的位置估计该学生的会计成绩。(4)哪一门功课成绩的变异程度最大?哪一门成绩的变异程度最小?13 下表是从住房和社区服务问题调查中抽出的容

16、量为18的样本,调查住户的住房购还是租用(1=“自购”,2=“租用”)以及对社区服务的满意程度(1=“不满意”,2=“满意”,3=“很满意”)personownerapprovepersonownerapprove11192122210233111121411122152213l361214l271115218111613填写如下交叉表,并调用SPSS的交叉表过程,进一步分析人们对城市服务的满意程度。 OWNER*APPROVE CrosstabulationAPPROVE123Totalowner1 Count2 CountTotal Count14 从某化工厂生产的两批瓶装无水酒精中,分别

17、抽出12瓶和14瓶进行检查,据以往经验,假定两批产品中杂质含量均服从正态分布,且两批产品杂质含量相互独立,调用SPSS的独立样本T检验过程,检验两批产品杂质含量的差异,得到如下分析表,试填写表中的空格,并对结果作出解释。Group StatisticsBATCH 批号NMeanStd. DeviationStd. Error MeanALCOHL1122.62080.4707酒精中杂质含量2142.83210.1383Independent Samples TestALCOHL酒精中杂质含量Equal variances assumedEqual variances not assumedLe

18、vene's Test for Equality of VariancesF0.005Sig0.946t-1.081-1.090df23.897t-test for Equality of MeansSig. (2-tailed)0.2900.287Mean DifferenceStd. Error Difference0.19540.193995% Confidence Interval of the DifferenceLower-0.6146-0.6116Upper0.19200.189015 教学研究人员想要检验3种不同教学方法的效果,随机地抽取16名水平相当的学生,分成3组,

19、每组用一种方法教学。一段时间后进行测验,根据测验结果作单因素差分析,得到如下方差分析表。试填写表中所缺数值,并判断3种教学方法的效果有无显著差异? (= 0.05)SCORE 成绩Sum of SquaresdfMean SquareFSig.Between Groups 2 0.025Within Groups817.63314 Total1382.2351616 为了评比某种型号的电池质量,分别从A、B、C三个工厂生产的同种型号电池中各随机地抽取5只电池为样本,经试验得到其寿命(小时)如下: 样品工厂A1 A2 A3 A4 A5ABC40 48 38 42 4536 34 30 28 32

20、39 40 43 50 50假设电池寿命服从正态分布,试在显著性水平= 0.05下,检验电池的平均寿命有无显著差异?17 将4个不同的水稻品种A1、A2、A3、A4安排在面积相同的4种不同土质的地块B1、B2、B3、B4中试种,测得各地块的产量(kg)如下: 地块品种B1 B2 B3 B4A1A2A3A4135 120 147 132154 129 125 125125 129 120 133115 124 119 123假设水稻品种与地块之间无交互作用,建立适当的数据文件,试用SPSS的Univariate命令,在显著性水平= 0.05,检验:(1)不同的品种对水稻的产量有无显著的影响? (

21、2)不同的土质对水稻的产量有无显著的影响?18 下表给出某种化工产品生产过程在3种浓度、4种温度下得率的数据:浓度(%)温度(°C)1024385224614,109,7 5,11 11,1110,8 13,1413,9 7,11 12,1310,12 6,1014,10 建立适当的数据文件,试用SPSS的Univariate命令,在显著性水平= 0.05下,检验各因子的主效应与交互作用对得率的影响。 19 在一个考察纤维弹性(spring)受收缩率(fac_a)和拉伸倍数(fac_b)的试验中,两因素各取4种水平,因素的各种搭配下分别作两次试验,根据试验结果的数据文件,执行SPSS

22、的Univariate命令得到如下的方差分析表:Tests of BetweenSubjects EffectsDependent Variable:SPRING 纤维弹性SourceType sum of SquaresdfMean SquareFSig.Corrected Model157.719 a1510.5187.8740.000Intercept174492.7811174492.781129855.0930.000FAC_A(收缩率)70.594323.53117.5120.000FAC_B(拉伸倍数)7.59432.8652.1320.136FAC_A*FAC_B79.5319

23、7.8376.5760.001Error21.500161.344Total174673.00032Corrected Total180.21931a R Squared=.881 (Adjusted R Squared =.769) 根据表中的输出结果指出:收缩率和拉伸倍数对纤维弹性有无显著影响,两因素的交互作用对纤维弹性有无显著影响,写出简单的检验报告。(检验的显著性水平= 0.05)20 下表中记录的是3名工人分别在4台不同的机器上工作3天的日产量。 机器工人A1A2A3A4甲15,15,1717,17,1715,17,1618,20,22乙19,19,1615,15,1518,17,1

24、615,16,17丙16,18,2119,22,2218,18,1817,17,17 假定各工人的日产量服从正态分布,建立适当的数据文件,使用SPSS的Univariate命令,在显著性水平= 0.05下,检验:(1)工人的操作水平之间有无显著差异?(2)不同的机器之间有无显著差异?(3)不同工人的操作水平与不同的机器之间的交互作用是否显著?21 用3种栽培技术和4种施肥方案相互搭配组成12种育苗方案作杨树育苗试验,在每一种方案下培育3株杨树苗,测得苗高的数据资料如下表所示: 施肥(B)栽培技术(A)B1B2B3B4A152,43,3948,37,2934,42,3858,45,42A253,

25、47,4150,41,3044,36,3960,46,44A338,42,4948,47,3640,32,3743,56,41设苗高服从等方差的正态分布,建立适当的数据文件,试用SPSS的Univariate命令在显著性水平= 0.05下,检验:(1)不同栽培技术对苗高有无显著影响?(2)不同施肥方案对苗高有无显著影响?(3)二者的交互作用对苗高的影响是否显著?22 下表中列出某地区九个市县社会商品零售总额(亿元)、城市居民年平均收入(元)、农民年平均收入(万元)的数据,分别记为变量retail、townsman、farmers。市县编号123456789retail58.7518.2915.

26、2912.5811.2415.6015.0914.3615.14townsman0.4680.3750.4100.3700.4300.3790.3500.3600.370farmers0.1660.1350.1510.1490.1540.1250.1040.1190.159 执行Bivariate(二元相关)命令,分析变量之间的相关关系。23 某医院研究某种代乳粉的营养价值时,用大白鼠作试验,得大白鼠进食量(克)和增加体重(克)之间的关系的原始数据如下表,用x表示大白鼠进食量和用y表示大鼠增加体重,试作x与y之间的相关分析。进食量x(克)8207807208676907879346796398

27、20增加体重y(克)16515813018013416718614512015824 下表中列出某班10名学生高一(x)和高二(y)数学期末考试的成绩。id12345678910x74717568767367757074y76727170767965797772执行Bivariate(二元相关)命令,分析变量之间的相关关系。25 4位教师对6名学生的作文竞赛评定的名次如下表。学生评定教师1234134212431332134465655124265656执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的相关关系。26 两位评酒师对20种酒的等级(110)进行评定,评定结

28、果如下表所示。drinkABdrinkAB168116924512853741342487143352315686741691079917988781846925194310432055 建立数据文件,回答下列问题:(1)执行Bivariate命令,计算斯皮尔曼和肯德尔相关系数分析评定结果之间的相关关系。(2)执行Distances命令,分析评定结果之间的相似关系。(3)执行Distances命令,计算观测量之间的欧几里得距离,分析观测量之间的亲疏关系。27 现测得变量x与y的数据如下表:i12345678910x49.250.049.349.049.049.549.849.950.250.2

29、y16.717.026.816.616.716.816.917.017.017.1(1)建立数据文件,执行二元相关命令,判断变量x与y之间是否有线性相关关系;(2)若线性相关,执行AnalyzeRegressionLinear命令分别求出y关于x和x关于y的回归方程;比较二者的不同。28 某研究所每年的净收益(income)的主要影响因素为该所每年实际研究费用(fee)和研究人员数量(invest),收集近九年来的数据资料如下:fee(万元)123.5123.8125.6126.4127.1127.3128.9130.4131.8invest(人)25425727529029529631132

30、6341income(万元)160016301660169017201750178018401870建立数据文件,求因变量income对自变量fee和invest的线性回归方程,给出分析结果报告。如设自变量fee和invest取下列各对数值时,求出income的预测值。fee :135、140、160、188、200invest :360、380、400、400、41029锡克试验阴性(%)随着年龄的增长而增高,某地区医院调查得到儿童年龄(岁)Y与锡克试验阴性率Y的资料如下:年龄X(岁)1234567锡克试验阴性率Y()57.176.090.993.096.795.696.2 建立数据文件,试

31、执行Regression Curve Estimation (曲线估计过程)命令,选用二次、三次和对数曲线模型拟合此组数据。30 研究某地区土壤中所含植物可给磷的情况,得到下列表中的数据:土壤子样序号x1x2x3y土壤子样序号x1x2x3y10.453158641010.9371117620.423163601112.6581125130.634157611211.6291739341.765123771323.1461149651.936143541423.1501347769.44446811521.644739373.11937711623.1561689584.72459541726.

32、858202168910.131117931829.95112499其中:x1为土壤中含无机磷浓度; x2为土壤中溶于K2C03溶液并受溴化物水解的无机磷浓度;x3为土壤中溶于K2C03溶液但不受溴化物水解的无机磷浓度;y为种植在20°C土壤内的玉米中的可给态磷。 建立数据文件,执行Analyze Regression Linear命令并选择逐步回归,求y关于x1、x2、x3、的线性回归方程,并给出分析报告。31 维尼纶厂生产牵切纱的工艺流程由牵切、粗纺、细纺三道工序组成,根据经验粗纱的重量不匀率Z与牵切条干不匀率x及牵切重量不匀率y有关,试验测定20个样品得到下表中的数据:序号x(

33、%)y(%)Z(%)序号x(%)y(%)Z(%)序号x(%)y(%)Z(%)115.581.951.341112.741.350.872110.811.321.35210.681.371.271211.731.331.532217.261.311.57315.622.391.561314.841.091.252314.921.421.64415.781.141.481413.731.272.472418.142.131.64513.221.851.401515.121.781.832518.151.202.34616.441.321.821617.882.522.412610.310.980.

34、65711.402.050.851713.381.431.692711.401.271.19816.171.111.401814.212.271.502812.570.872.06914.031.471.151916.801.411.192917.611.211.571015.671.381.892010.811.782.44 建立数据文件,求出Z关于x和y的回归方程,根据方程的检验结果,再选用逐步回归法求解。32 测得云杉平均树高h(米)和平均树径d(厘米)之间下列数据:d1520253035404550226065h13.917.120.022.124.025.627.028.329.43

35、0.231.4 建立数据文件并调用Curve Estimation(曲线估计过程)求平均树高h(米)和平均树径d(厘米)之间的下列曲线拟合模型:(1)二次函数;(2)幂函数;(3)指数函数;(4)对数函数; 并分析哪种曲线拟合较好?33 今搜集到20名糖尿病人的血糖(Y,mmolL)、胰岛素(X1,mUL)及生长素(X2,gL)的测量数据列于下表:序号YX1X2序号YX1X2序号YX1X2112.2115.209.51813.3210.3018.89158.4923.203.42214.5416.7011.43919.595.9013.14167.7125.007.34312.2711.907

36、.53109.0518.709.631711.3816.8012.75412.0414.0012.71116.4425.105.101810.8211.2010.8857.8819.802.33129.4516.404.531912.4913.7011.06611.1016.2013.521310.1622.002.16209.2124.409.16710.4317.0010.07148.3823.104.26试建立数据文件,试进行多元线性回归分析,求变量Y与X1、X2之间的回归方程。34 在一个正20面体的各面上标有0,1,2,9十个数字,每个数字在两个面上标出。为了检验其匀称性,今将它投掷800次,各数字朝上的次数如下:数字0123456789正面朝上的次数79928379738076757791试建立适当的数据文件,用卡方检验法检验该正20面体是否匀称?35 某炼铁厂在正常生产情况下,记录的116炉铁水中含碳量的百分比数据列于下表:4.57 4.59

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论