SPSS实验报告册要点(共81页)_第1页
SPSS实验报告册要点(共81页)_第2页
SPSS实验报告册要点(共81页)_第3页
SPSS实验报告册要点(共81页)_第4页
SPSS实验报告册要点(共81页)_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、精选优质文档-倾情为你奉上 SPSS统计软件应用实验报告册20 13 20 14 学年 第 一 学期班 级: 学 号: 姓 名: 实验教师: 实验学时: 实验组号: 专心-专注-专业 目录实验一 SPSS的数据管理·······1实验二 描述性统计分析········13实验三 均值检验·············

2、83;21实验四 相关分析··············27实验五 方差分析··············34实验六 绘制统计图············40实验七 因子分析··

3、3;···········44实验八 聚类分析··············48实验九 判别分析··············58实验十 回归分析·····

4、3;········67实验十一 非参数检验············75实验一 SPSS的数据管理1、 实验目的1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置;2.掌握SPSS的数据管理功能。二、实验内容及步骤: 1、定义spss数据结构。下表是某大学的一个问卷调查,要求将问卷调查结果表示成spss可识别的数据文件,利用spss软件进行分析和处理。练习:创建数据文件的结构,即数据文件

5、的变量和定义变量的属性。表1 大学教师基本情况调查表问题备选答案1姓名2 性别3年龄4学历5 工作年月6职称7本年度教学工作量(课时)4(1)专科(2)本科(3)硕士(4)博士(5)博士后6 (1)助教(2)讲师(3)副教授(4)教授7 (1)0120 (2)120240 (3)240320 (4)320480 (5) 480以上8 本年度公开发表论文数9 本年度您的科研经费总额(万元)10.您认为学校对科研人员每年的科研成果要求是否合理(1)合理 (2)不合理 (3)无所谓11 您最常用的全文期刊数据库的名称(多选,限选2个)(1)cnki (2)万方 (3)SpringerLink (4)

6、EBSCO12 您对学校科研管理部门的工作是否满意(1)非常满意 (2)满意 (3)一般 (4)不满意实验步骤:(1)打开定义变量的界面启动SPSS,进入主界面,单击图6-2所示的屏幕左下角的“Variable View”选项卡,打开定义变量的表格。(2)输入变量名,符合变量的命名规则在“Name”列的第一个单元格输入第一个变量名,如 “xm”。(3)确定变量类型,单击“Type”列的第一个单元格,如图6-3所示,SPSS的默认变量类型为数值型。单击数值型变量后的“”,弹出如图6-4所示的对话框,用户可以从该对话框中选择其他的变量类型。(4)设置字段值(5)依次按要求输入完毕即可。结果如下:2

7、 、高校提前录取名单的确定 某高校今年对部分考生采取单独出题、提前录取的招生模式。现有20名来自国内不同省市的考生报考该校,7个录取名额。见数据文件compute.sav. 该校制定了如下录取原则:(1)文化课成绩由数学、语文、英语和综合四门成绩组成。文化课成绩制定最低录取分数线:400分。(2)个人档案中若有“不良记录”,不予录取。(3)对西部考生和少数民族考生,给予加分优惠。少数民族考生加20分,西部考生加10分。(4)对参加过省以上竞赛并取得三等奖以上名次的考生,每项加10分。(5)文化课成绩和加分总和构成综合分,录取综合排名为前7名的学生。实验步骤:(1)打开数据文件compute.s

8、av.(2)计算文化课成绩,选Transform菜单的Compute命令项,在Target Variable指定一个变量(文化课成绩),在Numeric Expression框中键入运算公式(数学+语文+英语+综合),然后单击OK.(3)选Data菜单的Select Cases命令项,弹出Select Cases对话框,选中If condition is satisfied,单击if按钮,弹出Select Cases:IF对话框,输入条件文化课成绩大于等于400,单击Continue ,在弹出的Select Cases对话框中,Unselected Cases Are选择Deleted,然后单

9、击OK.(4)重复第三步,条件是“不良记录=0”(5)少数民族考生加分,选Transform菜单的Compute命令项,在Target Variable指定一个变量(少数民族加分),在Numeric Expression框中键入运算公式(民族<>1)*20,然后单击OK.(6)西部考生加分,步骤类似与5, (7)奖项加分(8)求综合成绩(9)按照升序排序,选择“DataSort Cases”命令,弹出“Sort Cases”对话框,把“综合成绩”变量选入“Sort by”中,并在Sort Order中选择“Descending(升序)”选项,将综合成绩按升序排列,如图6-15所示,

10、单击“OK”按钮。 实验结果: 选取综合成绩升序排列后的前七名即可,如图所示;录取的分别是艾甫尔513分、孙悦婷495分、张国欣471分、郭东阳462分、杨乐451分、高超438分、易仲勃434分。实验分析: 本实验,主要是按照要求一步一步来设置条件,最后边计算有点难,就是算加分,首先要解决不留空的,不然最后没法求和。根据结果选出符合要求的即可。三、实验小结:实验中遇到的问题及解决办法、心得体会等等. 本实验,第一小题,主要考察我们创建数据文件的结构,即数据文件的变量和定义变量的属性。老师上课时给我们演示很到位,在老师的详细讲解下,我熟悉了spss软件界面,以及一些主要组成部分,但是里面的一些

11、具体参数还不太清楚,不过常用主要属性都掌握了,没有太大问题。 第二小题,问题就相当大了,先是选择不小于400分的,经常排除不了,后来在同学的帮助之下,克服了。后来是加分部分比较难,最开始先符合一个加一个,但是后来发现不对,经过反复尝试,把需要加分的先列出来,最后汇总,但是没加分的,我没有计算,导致最后求和时,不能加,因为有的是空字符,而不是数字0,后来又经改进,把没有加分的同学,在相对加分位置是0表示,最后才完满完成实验。 我觉得学习还是认真听讲好,老师演示,我们听了看了记了,做起来就相对简单了。如果自己搞的话,也会做出来,但是要尝试很多次,浪费大量的时间,所以,学计算机软件,还是不能狂妄自大

12、,需要虚心求教。实验二 描述性统计分析一、 实验目的 1.利用SPSS进行描述性统计分析。要求掌握频数分析(Frequencies过程)、描述性分析(Descriptives过程)、交叉列联表分析(Crosstabs过程)二、 实验内容及步骤 1.数据文件descriptives.sav,是从某校选取的3个班级共16名学生的体检列表,要求以班级为单位列表计算年龄,体重和身高的统计量,包括极差,最小最大值,均值,标准差和方差。给出操作步骤和分析结果。实验步骤:(1)文件descriptives.sav,(2)单击分析比较均值,在弹出的对话框中,选择班级到自变量列表,选择年龄、身高、体重到因变量列

13、表。 (3)单击选项按钮,在弹出的对话框中,选择极差,最小最大值,均值,标准差和方差,单击继续按钮,然后按确定。实验结果:实验分析: 1班年龄的最大值为15,最小值为13,平均值为14.2,方差和标准差分别为0.700 和0.837,年龄的极差为2 岁;体重的最大值为50kg,最小值为38kg,平均值为44.6kg,方差和标准差分别为24.8 和4.98,体重的极差为12kg;身高的最大值为160cm,最小值为149cm,平均值为154cm,方差和标准差分别为20.5 和4.53,身高的极差为11cm。  2班年龄的最大值为17,最小值为16,

14、平均值为16.4,方差和标准差分别为0.300 和0.548,年龄的极差为1 岁;体重的最大值为65kg,最小值为50kg,平均值为58kg,方差和标准差分别为32.50 和5.70,体重的极差为15kg;身高的最大值为175cm,最小值为160cm,平均值为167cm,方差和标准差分别为32.50和5.70,身高的极差为15cm。  3班年龄的最大值为18,最小值为16,平均值为17.33,方差和标准差分别为0.667 和0.816,年龄的极差为2 岁;体重的最大值为70kg,最小值为55kg,平均值为62.83kg,方差和标准差分

15、别为34.167 和5.845,体重的极差为15kg;身高的最大值为180cm,最小值为160cm,平均值为169cm,方差和标准差分别为64.0 和8.0,身高的极差为20cm。 2、某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作对照组,问两种方法治疗效果有无差别处 理愈 合未愈合合计呋喃硝胺54862甲氰咪胍442064合 计9828126(提示:由于此处给出的直接是频数表,因此在建立数据集时可以直接输入三个变量行变量、列变量和指示每个格子中频数的变量,然后用Weight Cases对话框指定频数变量,最后调用Crosstabs过程进行X2检验。假设三个变

16、量分别名为R、C和W,则数据集结构和命令如下):R CW1.00 1.00 54.001.00 2.00 44.002.00 1.00 8.002.00 2.00 20.00实验步骤:(1)将上边给出的频数表转化为SPSS数据文件,定义三个变量yp、yh、jg,如下表:(2)输入数据:(3)选中菜单“DataWeight Cases”,在弹出的对话框中选中“Weight cases by”,选中jg进入“Frequency Variable”。(4)选中菜单“Analyze-Descriptive- Cr

17、osstabs”,将“yh”变量选入“Rows:”行变量框中,将“yp”变量选入 “Columns”列变量框中。选中Display clustered bar charts。(5)单击“Cell Display”钮,勾选Observed、Expected、Rom、Column、Total、Unstandardized、Round cell counts。(6)单击“Continue”输出实验结果。实验结果:实验分析: 1.通过上表的检验结果可知,在62 个样本中,呋喃硝胺治愈了54 人,未治愈8 人;在64 个样本中,甲氰咪胍治愈了44 人,未

18、治愈20 人。  2.在卡方检验的结果中,Pearson 卡方检验的值为6.133,连续校正值为5.118,似然比为6.304;Fisher 的精确双侧检验值为0.18,单侧检验值为0.011;线性和线性组合值为6.084,双侧检验值为0.014,有效案例中的N 为126。  3.Continuity Correction 和Pearson 卡方值处分别标注有a和b ,表格下方为相应的注解:a.只为2*2 表计算。b.0%个格子的期望频数小于5,最小的期望频数为13.78。因此,这里无

19、须校正,直接采用第一行的检验结果,即X2=6.133,三、实验小结: 1.通过本次实验,使我较好地掌握了利用SPSS 进行描述性统计分析的方法,学会了频数分析(Frequencies 过程)、描述性分析(Descriptives 过程)、交叉列联表分析(Crosstabs 过程)。  2. 频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。 3. Descriptives过程可对变量进行描述性统计分析,计算并列出一系列相应的统计指标,其功能和频数分析过程类似,主要以计算数值型单变量的统计量为

20、主。实验三 均值检验一、 实验目的1.学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。二、 实验内容及步骤 1、一个生产高性能汽车的公司生产直径为322mm的圆盘制动闸。公司的质量控制部门随机抽取不同机器生产的制动闸进行检验。共4台机器,每台机器抽取16支产品。见数据文件ttest1.sav,要求检验每个机器生产的产品均值和322在90%的置信水平下是否有显著差异。实验步骤: 1.打开数据文件ttest1.sav,选择菜单“DataSplit File”,选择“Compare groups”钮,选择“机器编号”进入“Groups Based on”,选择“sort the fil

21、e by grouping variables”钮,单击“OK”。 2.选择菜单“AnalyzeCompare MeansOne-Sample T Test”。弹出“One-Sample T Test”对话框。在对话框左侧的变量列表中选择变量“制动闸直径”进入“Test Variable(s)” 框;在“Test Value” 编辑框中输入产品均值322. 3.单击“Options”钮,设定“Confidence Interval”为90%。 4.单击“Continue”输出实验结果。实验结果:实验分析: 在90%的置信水平下,可知14 号制动闸直径的均值分别为321.9985、32

22、2.0143、321.9983、321.9954,第1 号和第3 号机器的双尾数概率大于0.05,第2 号和第4 号机器的双尾数概率小于0.05,说明第1 号和第3 号机器生产的制动闸直径均值与322 有显著差异,第2 号和第4 号机器生产的产品均值与322无显著差异。 2、在体育课上记录14名学生乒乓球得分的数据,男女各7名。数据如下:男:82.00 80.00 85.00 85.00 78.00 87.00 82.00女:75.00 76.00 80.00 77.00 80.00 77.00

23、 73.00比较在置信度为95%的情况下男女生得分是否有显著差别。实验步骤:(1)定义变量名:Gender为性别,df为得分,输入原始数据。(2)选择菜单“AnalyzeCompare MeansIndependent-samples T Test”项,弹出“Independent- samples T Test”对话框。从对话框左侧的变量列表中选择“df”进入“Test Variable(s)”框,选择变量“Gender”,进入“Grouping Variable”框,点击“Define Groups”钮弹出“Define Groups”定义框,在Gender1中输入1,在Gender 2中

24、输入2。(3) 单击“OK”,输出实验结果。试验结果:实验分析: 1.由组统计量可以看出,男、女生乒乓球得分的平均值分别为82.7143和76.8571,标准差分别为3.14718 和2.54484,均值误差分别为1.18952 和0.96186。  2.对独立样本检验的结分析:首先进行方差齐性检验, 0H  =21 =22 ,由F=0.622,相应的伴随概率为Sig.=0.445,大于显著性水平0.05,不能拒绝方差相等的假设,可以认为男、女生乒乓球得分的方差无显著差异。  3.然后就是方差相等时t&#

25、160;检验的结果, 0H : 1 - 2 =0,由t=3.829,相应的伴随概率为Sig.=0.002,小于显著性水平0.05,拒绝t 检验的原假设,可以认为在置信度为95%的情况下,男、女生乒乓球得分有显著差别。 3、 某医疗结构针对具有家族心脏病史的病人研发了一种新药。为了检验这种新药的疗效是否显著,对16位病人进行为期半年的观察测试,测试指标为使用该药之前和之后的体重以及甘油三酯的水平的变化。见数据文件ptest.sav.实验步骤:(1)打开数据文件ptest.sav.,选择菜单“AnalyzeCompar

26、e MeansPaired-samples T Test”项,弹出“Paired - samples T Test”对话框。从对话框左侧的变量列表中选择变量tg0tg1、wgtowgt1进入Variables框。 (2) 单击“OK”,输出实验结果。实验结果:实验分析: 1.由实验结果可以看出,服药前和服药后甘油三酯水平分的平均值分别为138.44 和124.38,误差均值为7.260 和7.353,服药前后体重的平均值分别为198.38 和190.31,误差均值为8.368 和8.377。  2.服药前后甘油三酯水平平均变量的相关系数为-0.

27、286,相应的P 知大于0.05,不显著,呈负相关。服药前后体重平均变量的相关系数为0.996,相应的P 知小于0.05,很显著,相关程度较高。  3.由配对样本t 检验结果表可以看出,服药前后甘油三酯水平差值序列的平均值为14.063,计算出的t 值为1.200,相应的伴随概率P(Sig.)=0.249,大于显著性水平0.05,接受t 检验的原假设,也就是服药前后甘油三酯水平没有明显变化。服药前后体重差值序列的平均值为8.063,计算出的t 值为11.175,相应的伴随概率P(Sig.)=0.000,小于显著性水平0.05

28、,不接受t 检验的原假设,也就是服药前后体重有了明显的变化。 三、实验小结: 1.学习利用SPSS进行单样本、两独立样本以及成对样本的均值检验。 2.在分析问题前要判断是单样本T测验还是双样本T测验,在第一遍的实验过程中由于我没有分清楚这个问题导致了实验结果错误。实验四 相关分析一、 实验目的1.学习利用SPSS进行相关分析、偏相关分析、距离分析。二、实验内容及实验步骤 1.打开数据文件correlate1.sav, 要求分析汽车价格和汽车的燃油效率之间是否存在线性关系。实验步骤:(1)打开数据文件correlate1.sav, 选择菜单“AnalyzeCorrelateB

29、ivariate” ,弹出“Bivariate Correlation”对话框。在对话框左侧的变量列表中选Price in thousands、Fuel efficiency使之进入“Variables”框;再在“Correlation Coefficients” 框中选择Pearson相关系数(r);在“Test of Significance”框中选相关系数的 “Two-tailed”(双侧)检验。选中复选框“Flag significant correlations”设置是否突出显示显著相关。(2)单击“Options”按钮,弹出“Bivariate Correlation: Optio

30、ns”对话框,选择“Means and standard deviations”和“Cross-product deviations and covariances”项,输出Price in thousands、Fuel efficiency的均数与标准差以及Price in thousands、Fuel efficiency交叉乘积的标准差与协方差。实验结果:实验分析: 1.由描述性统计量分析结果可知,汽车价格的均值为27.,标准差14.,燃油效率的均值为23.84,标准差为4.283。  2.通过相关性分析可知,汽车价格和汽车的燃油效率的相关系数为-0.429,相关性不显著,表明

31、汽车燃油效率提高度对汽车价格影响不大。 2、打开数据文件pcorrelation.sav,对身高、体重和肺活量进行变量距离分析。选相似性测度。进行结果解释。实验步骤:(1)打开数据文件pcorrelation.sav,择菜单“AnalyzeCorrelatePartial” ,弹出“Partial Correlations”对话框。在对话框左侧的变量列表中选变量“身高”、“肺活量” 进入Variables框,选择要控制的变量“体重”进入“Controlling for”框中,以在控制体重的影响下对变量身高与肺活量进行偏相关分析;在“Test of Significance”框中选双侧

32、检验。(2)单击“Options”按钮,弹出“Partial Correlations: Options”对话框。在“Statistics”复选框组中选择要输出的统计量。(3) 单击“OK”按钮,得到输出结果。实验结果:实验分析:通过相似性矩阵分析可以看出,身高和体重值向量间的相关性为0.735,相关程度较高;身高和肺活量值向量间的相关性为0.581,中度相关;肺活量和体重值向量间的相关性为0.611,相关性比较显著。 3、打开数据文件distance.sav, 文件是利用三种不同的仪器对飞机的10只叶片的半径分别进行了测量。要求对10只叶片进行距离分析。用Euclidean dis

33、tance。进行结果解释。实验步骤:(1)打开数据文件distance.sav(2)选择菜单“AnalyzeCorrelateDistance” ,弹出“Distance”对话框。在对话框左侧的变量列表中选变量第一次测量、第二次测量、第三次测量,进入“Variables” 框。在“Compute Distances”框中选择“Between variables”,作变量之间的距离相关分析。在“Measure”栏中选择“Similarities”。(3)单击“Measure” 按钮,系统弹出“Distance: Similarity Measure”对话框,选择“Pearson correlat

34、ion” 为测量距离。(4) 单击Continue,然后单击“OK”按钮,得到输出结果。实验结果:实验分析: 通过不相似性矩阵分析可以看出,第一次测量和第二次测量Euclidean 距离为0.750,表明这两次测量结果一致,飞机叶片的半径差别较小;第一次测量和第三次测量Euclidean距离为0.774,这两次测量结果也趋于一致,飞机叶片的半径差别较小;第二次测量和第三次测量的Euclidean 距离为1.209,这两次测量结果不一致,飞机叶片的半径差别较大。 三、 实验小结: 1.通过对这一实验的学习,我学会了利用SPSS进行相关分析、偏相关分析、距离分析。 2

35、.距离相关分析是对观测量之间或变量之间相似或不相似的程度的一种测量。距离相关分析可用于同一变量内部各个取值间,以考察其相互接近程度;也可用于变量间,以考察预测值对实际值的拟合优度。实验五 方差分析一、实验目的1、熟练使用SPSS进行单因素、双因素方差分析二、实验内容及实验步骤1、五个地区每天发生交通事故的次数如下:东部北部中部南部西部15121014131710149121413137911171510140141281000079试以=0.01的显著水平检验各地区平均每天交通事故次数是否相等。实验步骤:(1)定义变量:地区为dq,每天发生交通事故的次数为cs,dq按1=东部、2=北部、3=中

36、部、4=南部、5=西部输入。(2)选择菜单“AnalyzeCompare means One-Way ANOVA”,弹出对话框,把cs移至Dependent List,把dq移至Factor。(3)单击“Post Hoc”钮,在弹出的对话框中选中LSD,把Significance level的值改为0.01,单击“Continue”按钮,回到“One-Way ANOVA”对话框。(5)单击“Options”钮,在对话框中选中Statisticss下的“Descriptive”和“Homogeneity of variance test”以及Missing Values下的“Exclude ca

37、ses analysis by analysis”。(6) 单击“Continue”输出实验结果。实验结果:实验分析:上表中,第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。第2栏是离差平方和“Sum of Squares”,组间离差平方和19.8,组内离差平方和为670.5,总离差平方和为111.600,是组间离差平方和与组内离差平方和相加之 和。第3栏是自由度df,组间自由度为4,组内自由度为25;总自由度为29。第4栏是均方“Mean Square”,是第2栏与第3栏之比;组间均方为4.950,组内均方为26.

38、820。第5栏是F值9.125(组间均方与组内均方之比)。第6栏:F 值对应的概率值,针对假设H0:组间均值无显著性差异.从显著性慨率看,p>0.01,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。三 实验小结: 本次实验主要是学习方差分析,主要是把观测的总变异的平方和自由度分解为不同变,异来源的平方和以及自由度,把系统误差和其他随机性误差进行对比,来判断各组样本之间是否存在显著性差异,然后分析因素是否对总体存在显著性影响。这次实验我感觉收获最大的是学会了LSD方法,主要是使用t检验对组均值之间的所有成对比较,这种方法的敏感度比较高。但是在多因素方差分析中碰到了困难

39、,在因素的“两两比较”中,要成对比较确定哪些均值存在差值,包含假定方差和未假定方差齐性这里时,发现自己还没有完全理解,于是我又把课件和实验上的例题好好的看了一遍,在同学的指导下完成了本次实验。所以不懂得地方只要我们努力去学,再通过同学之间的相互学习,交流,就可以使自己得到进步。实验六 绘制统计图一、 实验目的1、学会利用SPSS绘制各种统计图形二、实验内容及步骤直条图实验内容:研究血压状态与冠心病各临床型发生情况的关系,分析资料如下所示,试绘制统计图。血压状态年龄标化发生率(1/10万)冠状动脉机能不全猝死心绞痛心肌梗塞正常临界异常8.9010.6319.8412.0018.0530.5534

40、.7146.1873.0644.0067.24116.82实验步骤:(1)建立数据文件,定义变量名:年龄标化发生率为RATE,冠心病临床型为DISEASE,血压状态为BP。RATE按原数据输入,DISEASE按冠状动脉机能不全=1、猝死=2、心绞痛=3、心肌梗塞=4输入,BP按正常=1、临界=2、异常=3输入。(2)选择菜单“GraphsBar”过程,弹出“Bar Chart”定义选项框。在定义选项框的上方选择复式直条图“Clustered”。(3)单击“Define”钮,弹出“Define Clustered Bar: Summaries for Groups of Cases”对话框,在左

41、侧的变量列表中选择变量rate,使之进入“Bars Represent”栏的“Other summary function”选项的“Variable”框,选择变量disease,使之进入“Category Axis”框,并选择变量bp进入“Define Clusters by”框。(4)单击“Titles”钮,弹出“Titles”对话框,在“Title”栏内输入“血压状态与冠心病各临床型年龄标化发生率的关系”,单击“Continue”按钮返回“Define Clustered Chart: Summaries for Groups of Cases对话框。(5)单击“OK“按钮,得到输出结果。

42、试验结果:实验分析:通过上图可以看出血压与人们的健康息息相关,当血压正常时发生机能不全、猝死、心绞痛、心肌梗塞的概率分别是8.9、12、34.71、44。当血压处于临界时发生机能不全、猝死、心绞痛、心肌梗塞的概率分别是10.63、18.05、46.18、67.24。当血压正常时发生机能不全、猝死、心绞痛、心肌梗塞的概率分别是19.84、30.55、73.06、116.82。由条形图可知血压异常时各种疾病的发生率越高,其中发生率最高的时心肌梗塞,最低的是机能不全。三 、实验小结:通过这个实验的学习我学会了利用SPSS绘制直条图,直条图是用线条的长短或高低来表现性质相近的间断性资料的特征,适用于描

43、绘分类变量的取值大小及比例。实验七 因子分析一、 实验目的1.学习利用SPSS进行因子分析。二、实验内容及步骤实验内容:1.下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。 X1X2X3X4X5X6X73.768.596.227.579.035.513.278.749.649.738.597.124.695.511.665.909.848.394.947.239.469.554.948.219.413.664.996.147.287.083.980.627.009.491.332.985.493.011.341.615.769.

44、274.924.382.307.315.354.523.086.440.541.344.527.072.591.300.443.311.031.001.173.682.171.271.571.551.512.541.031.771.044.254.502.425.115.2810.029.8412.6611.766.923.3611.6813.579.879.179.725.985.812.808.8413.6010.056.687.7912.0011.748.079.1012.509.777.502.171.794.545.337.633.5313.139.877.852.642.764.5

45、71.785.409.023.966.494.3911.582.771.793.752.4513.7410.162.732.106.227.308.844.7618.5211.069.913.433.555.382.097.5012.675.249.065.3716.183.512.104.663.104.782.131.090.821.282.408.391.122.353.702.621.192.013.433.721.971.751.432.812.272.421.051.291.720.91实验步骤:(1)建立数据文件,定义变量名:分别为X1、X2、X3、X4、X5、X6、X7,按顺序

46、输入相应数值,建立数据文件。(2)选择菜单“AnalyzeData ReductionFactor” ,弹出“Factor Analysis”对话框。在对话框左侧的变量列表中选变量X1至X7,进入“Variables”框,如图1。(3)单击“Descriptives”按钮,弹出“Factor Analysis: Descriptives”对话框,在“Statistics”中选“Univariate descriptives”项,输出各变量的均数与标准差,“在Correlation Matrix”栏内选“Coefficients”,计算相关系数矩阵,并选“KMO and Bartletts te

47、st of sphericity”项,对相关系数矩阵进行统计学检验,如图2。 图1 图2(4)单击“Extraction”按钮,弹出“Factor Analysis: Extraction”对话框,选用“Principal components”方法提取因子,如图3。图3(5)单击“Rotation”按钮,弹出“Factor Analysis: Rotation”对话框,在“Method”栏中选择“Varimax”进行因子正交旋转,如图4。 (6)单击“Scores”按钮,弹出“Factor Analysis: Scores”对话框,选择“Regression”项估计因子得分系数,如图5。(7

48、)单击“OK”钮,即可输出结果。实验结果: 图4 图5实验分析: 1.由描述统计分析得结果可知X1、X2、X3、X4、X5、X6、X7的均值分别为7.1000,4.7732,2.3488,9.1524,5.4584,7.1672,2.3460,标准差分别为2.3238,2.4178,1.6656,3.0141,3.2734,4.5582,1.6109。 2.从原始变量的相关系数矩阵可以看出,这七个变量中许多变量之间存在高度相关,能够从中提取公因子,故进行因子分析是合适的。 3.本例中 KMO检验的值为0.321,Bartlett球度检验统计量的观测值为326.285,相应的伴随概率为0.000

49、,小于显著性水平0.05,因此拒绝 Bartlett球度检验的零假设,认为相关系数矩阵与单位矩阵又显著差异。,济源右边脸适合进行因子分析。 4.通过公共因子碎石图可以看出,前 4个因子的特征变化非常明显,到底 4四个特征更以后,特征根变化趋于明显,因此提取 4个公因子是合适的,可以概括绝大部分信息。 5.由公因子方差分析可以看出,4个公因子变量共同解释了原始变量X1、X2、X3、X4、X5、X6、X7方差的97.7%,77.3%,85.9%,98.0%,98.3%,97.6%,83.4%,4个因子很好地解释了 7个原始变量,因为每个原始变量的共同度都在77%以上。 6.第一个主成分解释了 7个

50、原始变量信息的48.503%,第二个主成分解释了7个原始变量信息的40.090%,前两个主成分集中了原始 7个变量信息88.593%,说明两个主成分提供了原始变量的足够信息,主成分分析的效果比较好。三、实验小结:实验中遇到的问题及解决办法、心得体会等等. 1.通过这次因子分析实验,使我学会了 SPSS因子分析的方法。 2. 主成分析和因子分析都依赖于原始变量,变量之间越相关,因子模型的分析效果就越好。在因子分析之前需要通过变量之间的相关性分析来判断进行因子分析是否合适。 3.主成分析和因子分析的出发点是一致的,其目的都是为了降低变量的维数,在有关信息损失最小的情况下,将多个变量指标化为较少的几

51、个指标。 4. 主成分析中每个主成分对应的系数是唯一的,而因子分析中因子是不固定的,因子载荷的不唯一性有利于对公因子进行有效的解释。实验八:聚类分析一、实验目的:1.运用聚类分析方法分析数据二、实验内容及步骤 1、29名儿童的血红蛋白(g/100ml)与微量元素(g/100ml)测定结果如下表。由于微量元素的测定成本高、耗时长,故希望通过聚类分析(即R型指标聚类)筛选代表性指标,以便更经济快捷地评价儿童的营养状态。 编号N0.钙X1镁X2铁X3锰X4铜X5血红蛋白X6123456789101112131415161718192021222324252627282954.8972.49

52、53.8164.7458.8043.6754.8986.1260.3554.0461.2360.1769.6972.2855.1370.0863.0548.7552.2852.2149.7161.0253.6850.2265.3456.3966.1273.8947.3130.8642.6152.8639.1837.6726.1830.8643.7938.2034.2337.3533.6740.0140.1233.0236.8135.0730.5327.1436.1825.4329.2728.7929.1729.9929.2931.9332.9428.55448.70467.30425.6146

53、9.80456.55395.78448.70440.13394.40405.60446.00383.20416.70430.80445.80409.80384.10342.90326.29388.54331.10258.94292.80292.60312.80283.00344.20312.50294.70 0.012 0.008 0.004 0.005 0.012 0.001 0.012 0.017 0.001 0.008 0.022 0.001 0.012 0.000 0.012 0.012 0.000 0.018 0.004 0.024 0.012 0.016 0.048 0.006 0

54、.006 0.016 0.000 0.064 0.0051.0101.6401.2201.2201.0100.5941.0101.7701.1401.3001.3800.9141.3501.2000.9181.1900.8530.9240.8171.0200.8971.1901.3201.0401.0301.3500.6891.1500.83813.5013.0013.7514.0014.2512.7512.5012.2512.0011.7511.5011.2511.0010.7510.5010.2510.00 9.75 9.50 9.25 9.00 8.75 8.50 8.25 8.00 7

55、.80 7.50 7.25 7.00实验步骤:.(1)确定数据类型(Variable View)(2)输入数据(data view)并确定分析方法(3)通过分析(analyze),描述统计,打开描述分析(Descriptive) 操作界面。用箭头按钮从左边列表框中选择想要分析的变量名移动到右边,准备分析。(4)按上图表示选择完毕后要将标准化后变量值保存,单击“确定”,得到第一次分析结果如下:(5)通过分析( Analyze) 中的分类(Classify) 进行类别分析,选择系统聚类(HierarchicalCluster),弹出系统聚类分析对话框。 (6)在系统聚类分析(Hierarchical Cluster An

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论