统计分析软件应用题库_第1页
统计分析软件应用题库_第2页
统计分析软件应用题库_第3页
统计分析软件应用题库_第4页
统计分析软件应用题库_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计分析软件应用一、判断题1.spss可以读取excle格式的数据文件和文本文件。2.当我们新建一个spss数据文件时,首先应在数据编辑器窗口中的数据视图中输入个案,然后再在变量视图中定义变量。3.Spss允许同时创建或打开多个查看器窗口。4.Spss两配对样本T检验中,两配对样本数据存放在同一个变量列上。5.如果把“年龄”变量的缺失值指定为“99”,则如果某个被调查者的年龄回答为“300”,则就用99岁来代替。6.Spss两独立样本T检验中,两个样本的样本容量是必须相同的。7.如果一次随机抽样问卷调查共收回1000份问卷,两个同学建立spss数据文件各完成了500份问卷的录入工作,为便于对这次抽样调查结果进行统计分析,首先应该将两个数据文件进行横向合并。8.Spss文件的变量名的首字符可以是汉字、字母和数字。9.当变量分布不对称时,偏度值小于0为负偏,密度函数曲线有一条长尾拖在右边。10.假设某数值变量服从正态分布,将其进行标准化处理后,如果某观测值标准化值小于-3,可认为是异常值。11.对于所选答案不需要排序的多项选择题可采用多选项分类法进行分解12.对多项选择题进行频数分析的spss操作步骤是:【分析】→【描述统计】→【频率】13方差分析中,控制变量应为分类型变量。14.pearson简单相关系数r的绝对值接近0时,说明两变量没有相关关系。15.在一元线性回归分析中,对回归方程的F检验和对回归系数的T检验的作用是相同的。二、案例分析题1.某工厂改进了技术,调查者随机抽取了15名工人,调查他们在工艺改进前后生产100件产品的时间,数据如下表,试在5%显著性水平下,检验零件加工时间是否显著减少?改进前改进后7048765458606364634856555854604565516548755666485664595070546453以下是用spss成对样本T检验的输出结果,请填写表中的空格,并根据输出结果回答零件加工时间是否显著减少。程對差異數Tdf显著性(双尾)平均數標準偏差標準錯誤平均值95%差異數的信賴區間下限上限對組1改进前-改进后10.7339.5732.4725.43216.035.0012.现有甲乙丙三个工厂分别生产某种电池,现在从每个厂家生产的电池中各抽取12个检验其寿命,在5%的显著性水平下,检验三个厂家的电池寿命是否具有显著差异。以下是spss方差分析的输出结果:變異數同質性測試电池寿命Levene統計資料df1df2顯著性.390233.680變異數分析电池寿命平方和df平均值平方F顯著性群組之間1007.0562.000在群組內428.58312.987總計1435.63935多重比較因變數:电池寿命LSD(I)企业(J)企业平均差異(I-J)標準錯誤顯著性95%信賴區間下限上限1210.917*1.471.0007.9213.913-.5831.471.694-3.582.4121-10.917*1.471.000-13.91-7.923-11.500*1.471.000-14.49-8.5131.5831.471.694-2.413.58211.500*1.471.0008.5114.49*.平均值差異在0.05層級顯著。要求填写表中空格,并根据以上输出结果回答:三个厂家生产的电池寿命是否满足方差齐性的假设,为什么?三个厂家生产的电池使用寿命是否存在显著差异,为什么?对多重比较的结果进行分析说明。3、为了研究某健身器材三个品牌(A、B、C)需求,商场对消费了该健身器材的顾客进行了随机抽样调查。调查结果的频数分析结果如下:表1统计量购买品牌N有效338缺失0均值2.2811方差0.672偏度-0.560偏度的标准误0.133峰度-1.287峰度的标准误0.265百分位数252.0000503.0000753.0000请根据频数分析结果回答:(1)该样本有无缺失值?(2)该样本的中位数为多少?该样本的分布形态如何?(分别描述分布的对称性、陡缓程度)。4、在进行某项调查时,有一栏人口统计学信息为“学历”,其频数分析结果如下:表2学历频率百分比有效百分比累积百分比有效小学或以下201.81.81.8中学或中专72365.165.166.9大专23020.720.787.6本科11810.610.698.2硕士或以上201.81.8100.0合计1111100.0100.0请根据频数分析结果,绘制频数分析的条形图。5、现对每月信用卡消费(元)做描述分析,并通过标准化过程,寻找异常值。其中Z月信用卡消费为标准化的数据。表3月信用卡消费的描述分析月信用卡消费(元)Z月信用卡消费6661.7-0.2614116762.40.202097752.6-0.211354987.2-0.338255849.2-0.2986911923.4-0.0199610.2-0.566634246.8-0.372228544.1-0.1750389975.83.561655521.8-0.313715741.9-0.303615698.3-0.305626841.7-0.253154859.2-0.34412根据描述分析结果回答:(1)请写出数据标准化的数字定义式:Z=(2)该样本中是否有异常值?哪个是异常值,为什么?【参考答案】(1)QUOTEZ=xi-x蟽(2)有异常值,为89975.8。因为如果标准化值的绝对值大于3,根据统计学经典3QUOTE蟽蟽准则,为异常值。89975.8的标准化值为3.56165,大于3,因此为异常值。6、为了研究某公司内30个员工的月基本工资,收集了30个员工的月基本工资数据,并进行了单样本T检验。表4为单个样本统计量,表5为单个样本的检验。表4单个样本统计量N均值标准差均值的标准误月基本工资306029.00001404.55257256.43504表5单个样本检验检验值=4500tdfSig.(双侧)均值差值差分的95%置信区间下限上限月基本工资5.963290.0001529.000001004.53142053.4686请根据单样本T检验的相关知识回答:(1)该检验中,原假设QUOTEH0H0是什么?(2)该检验是拒绝原假设还是不拒绝原假设?为什么?(3)该公司内员工的月基本工资在95%的置信区间内,分布在多少范围之间?【参考答案】(1)原假设(2)根据假设检验的判定标准,若p<QUOTE伪伪,则拒绝原假设;若p>QUOTE伪伪,则不能拒绝原假设。该单样本T检验的p=0.000<QUOTE,因此拒绝原假设,即:这30人员工的月基本工资平均值不为4500。(3)置信区间为(4500+1004.5314,4500+2053.4686)=(5504.5314,6553.4686)7、为了研究高校每年投入高级职称的人员数和每年发表的论文数的关系,做了如下相关分析。图1表相关性投入高级职称的人年数论文数投入高级职称的人员数Pearson相关性10.953**显著性(双侧)0.000N3131论文数Pearson相关性0.953**1显著性(双侧)0.000N3131**.在.01水平(双侧)上显著相关。请根据相关分析结果回答:(1)在相关分析中,图1的名称叫什么?它有什么作用?(2)该分析使用的是哪种相关系数?高校每年投入高级职称的人员数和每年发表的论文数的相关系数为多少?【参考答案】(1)散点图。散点图是相关分析过程中极为常用的直观分析方式,能够直观发现变量间的统计关系以及强弱程度。(2)使用的是Pearson相关系数。相关系数为0.953。8、为了测量不同种类的饲料对家畜(猪)的体重影响,对24头家畜(猪)分别进行了3种饲料的喂养。表6ANOVA喂养后体重增加平方和df均方F显著性组间①2658.792⑤0.000组内②③④总数2555.95823请根据以上信息回答:(1)该分析运用的哪种分析方法?(2)请完善表中空格部分的数据。(需列出具体计算步骤)(3)若给定显著性水平QUOTE伪=0.05伪=0.05,通过该分析,不同饲料对家畜(猪)的体重增加影响大吗?为什么?【参考答案】(1)方差分析(或单因素方差分析)(2)需列出具体计算步骤:①=1317.583;②=1238.375;③=21;④=58.970;⑤=11.172(3)该分析认为,不同饲料对家畜的体重增加影响大。原因:该方差分析的P值为0.000,小于显著性水平QUOTE伪=0.05伪=0.05,因此拒绝原假设(原假设为:不同饲料对家畜(猪)的体重增加没有影响)。9、为了研究农业劳动者人数与粮食总产量的关系,建立了一元线性回归方程模型。相关数据经过SPSS软件分析得出以下结果:表7模型汇总模型RR方调整R方标准估计的误差10.954a①0.9082350.34682a.预测变量:(常量),农业劳动者人数(百万人)。表8Anovab模型平方和df均方FSig.1回归1.866QUOTE脳109脳10②1.866QUOTE脳109脳10⑤0.000a残差1.823QUOTE脳108脳1033④总计③34a.预测变量:(常量),农业劳动者人数(百万人)。b.因变量:粮食总产量(y万吨)表9系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-9662.7371908.102-5.0640.000农业劳动者人数(百万人)129.2577.0330.95418.3780.000a.因变量:粮食总产量(y万吨)请根据一元线性回归模型的结果分析:(1)请计算并填写空白处的数据。(需列出具体计算步骤)(2)请写出一元线性回归方程模型,并解释回归系数的意义。(3)R方(QUOTER2R2)是什么?它的表达式是什么?为什么它能代表回归方程的拟合优度?(4)在显著性水平QUOTE下,检验回归系数是否显著。(5)在显著性水平QUOTE下,检验线性回归方程是否显著。【参考答案】(1)①=0.911;②=1;③=2.048QUOTE脳109脳109;④=5524130.166;⑤=(2)QUOTEy=-9662.737+129.257x1y=-9662.737+129.257x1+QUOTE蔚蔚。回归系数129.257的意义是,表示每增加1百万人的农业劳动者人数,粮食总产量增加129.257吨。(3)QUOTER2R2是判定系数,表达式为QUOTE(答对等式其中一个表达都得分)。从其表达式上看,由于QUOTER2R2能体现回归方程所能解释的变差比例,因此其值可以代表回归方程的拟合优度。QUOTER2R2越接近于1,表示拟合效果越好。(4)在显著性水平QUOTE伪=0.05伪=0.05下,回归系数的显著性检验P值为0.000<QUOTE伪=0.05伪=0.05,因此拒绝原假设(原假设为QUOTE),回归系数显著。(5)在显著性水平QUOTE伪=0.05伪=0.05下,线性回归方程的显著性检验P值为0.000<QUOTE伪=0.05伪=0.05,因此拒绝原假设(原假设为QUOTE),线性回归方程显著。10、三代同堂的家庭中,婆婆与儿媳妇关系紧张的现象并不少见,为了解住房条件对婆媳关系的影响,对600户家庭进行了调查并进行了列联分析,结果如下表所示。VAR00001*VAR00002交叉制表VAR00002合计1.002.003.00VAR000011.00计数627855195期望的计数48.868.378.0195.0总数的%10.3%13.0%9.2%32.5%2.00计数458763195期望的计数48.868.378.0195.0总数的%7.5%14.5%10.5%32.5%3.00计数4345122210期望的计数52.573.584.0210.0总数的%7.2%7.5%20.3%35.0%合计计数150210240600期望的计数150.0210.0240.0600.0总数的%25.0%35.0%40.0%100.0%卡方检验值df渐进Sig.(双侧)Pearson卡方50.061a4.000似然比50.0734.000线性和线性组合27.5791.000有效案例中的N600a.0单元格(.0%)的期望计数少于5。最小期望计数为48.75。问:(1)写出卡方检验的统计量并说明其构造基本原理。说明婆媳关系与住房条件有无联系。11.下面的表格是对某班某次考试男生和女生课程平均分是否存在显著差异的软件分析结果,根据结果分析男生和女生的平均分是否有显著差异,写出分析步骤。组统计量sexN均值标准差均值的标准误female3067.52089.083851.65848male3068.92299.851791.79868独立样本检验方差方程的Levene检验均值方程的t检验FSig.tdfSig.(双侧)均值差值标准误差值差分的95%置信区间下限上限average假设方差相等.257.614-.57358.569-1.402082.44659-6.299473.49530假设方差不相等-.57357.622.569-1.402082.44659-6.300153.49598答:可以看出男生和女生成绩平均差为1.4021在置信区间内sig值为0.307>0.05所以不能拒绝原假设(原假设u-u0=0即男生和女生成绩的平均分不存在显著差异)即认为男生和女生的平均成绩不存在显著差异。12、现对收集到的某地区若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,利用SPSS软件的回归分析功能分析了影响粮食总产量的主要因素,部分结果见下表。系数a模型非标准化系数标准系数tSig.B标准误差试用版1(常量)-25172.1085793.953-4.345.000总播种面积(万公顷)2.337.376.1346.215.000施用化肥量(kg/公顷)132.02811.386.70711.595.000风灾面积比例(%)-230.75144.888-.131-5.141.000农业劳动者人数(百万人)48.3587.719.3576.265.000a.因变量:粮食总产量(y万吨)试写出回归方程的具体形式,并对此表格所展现的结果进行进一步的分析。答:回归方程:Y=-25172.108+2.337*总播种面积+132.028*施用化肥量-230.751*风灾面积比例+48.358*农业劳动者人数影响粮食产量的主要因素:总播种面积,施用化肥量,分在面积比例和农业劳动者人数四个因素采用的是向后删除策略,但是最终的结果存在这四个变量可以认为这四个因素都是主要影响粮食产量的因素。三、简答题在定义spss数据结构时,默认变量名和变量类型是什么?如果希望增强统计分析的可读性,还需要对数据结构的那些方面进行必要的说明?答:默认变量名以var开头变量类型是数值型进行说明:变量名标签2、请简述交叉列联表卡方检验的步骤。答:第一步,建立原假设,列联表分析中卡方检验的原假设是:行变量与列变量独立。第二步,计算检验统计量。列联表分析中卡方检验的检验统计量是Pearson卡方统计量。第三步,确定显著性水平和临界值。第四步,得出结论和决策。3、请

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论