




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGEPAGE1SPSS中判别分析的使用内容摘要:判别分析是多元统计分析中最常用的方法之一。该文结合一个语言学实验的例子对SPSS判别分析的操作步骤和输出结果作了具体的介绍,并对判别分析的不同方法在SPSS中的使用进行了区分。本文关键词语:SPSS;判别分析;语言学瞿健菊1.引言判别分析是多元统计分析中判别样本所属类型的一种常用方法。它的研究对象是训练样本,也就是说原始数据的详细分类是事先已经知道的,然后根据原始数据求出判别函数将待判样本的数据代入判别函数中判定其类型。[1]常用的判别分析方法重要有:间隔判别法、Fisher判别法和Bayes判别法。然而,在SPSS操作中只能实现Bayes判别法与Fisher判别法两种,而且这两种方法的操作是合在一起进行的,所以使用起来需要十分留意。[2]下文将结合一个语言学实验的例子对SPSS判别分析的步骤和输出结果作具体解释和说明。2.语言学实验2.1实验背景Fletcher和Peters〔1984〕研究发现,能够用语法和词汇两个维度来刻画语言受损儿童在语言表达方面的特征。被试分为两组,一组是20个正常儿童〔LN〕,另一组是用标准化测试标准在年龄和智力活动方面跟LN组相比而诊断为语言受损的9个儿童〔LI〕。在标准条件下采集他们的自觉的语言数据〔LN组的年龄均值为60.86个月,LI组的年龄均值为62.33个月〕。围绕65个语法与词汇范畴――大部分引自Crystal、Fletcher和Garman〔1976〕,每组儿童提供的样本都包含200个话语的得分。其中一个语法变量是根据无标记动词形式――既无后缀又无助动词修饰的实义动词词干――的个数来评分的。另外一个词汇范畴是动词词型,即一个儿童在样本中使用不同的实义动词的个数。[3]2.2数据录入本文使用的SPSS为20.0版本。首先建立一个数据文件linguistics.sav,将Fletcher和Peters所提供的每个被试的数据录入进去。数据文件的变量视图和数据视图分别如此图1和图2所示。在变量视图中,定义变量Y〔分类〕的值标签,-1为语言受损,1为正常。在数据视图中,共29行数据,分别为29个被试儿童在x1和x2这两个变量上的得分及所属类别。图1变量视图2.3判别分析步骤①单击“分析〞→“分类〞→“判别分析〞,从对话框左侧的变量列表中选中进行判别分析的变量“无标记动词形式[x1]〞和“动词词型[x2]〞进入“自变量〞框,作为判别分析的基础数据变量。从对话框左侧的变量列表选中“分类[Y]〞进入“分组变量〞框,并单击“定义范围〞按钮,在“定义范围〞对话框中,定义判别原始数据的类别数,在最小值处输入-1,在最大值处输入1。分析方法按默认的“一起输入自变量〞。②翻开“统计量〞对话框,在“描绘叙述性〞中,选择“单变量ANOVA〞和“Box’sM〞。在“函数系数〞中选择“Fisher〞〔注:此为Bayes选项〕和“未标准化〞〔注:此为Fisher选项〕。除此之外,“均值〞能够输出各类中各自变量的均值和标准差。“矩阵〞选项组可选择自变量的系数矩阵。③翻开“分类〞对话框,在“先验概率〞〔注:此为Bayes选项〕中,按默认选择“所有组相等〞。在“使用协方差矩阵〞中,按默认选择“在组内〞。在“输出〞〔注:此为Bayes选项〕中,选择“内容摘要表〞和“不考虑该个案时的分类〞。在“图〞〔注:此为Fisher选项〕中,选择“合并组〞、“分组〞和“区域图〞。除此之外,“个案结果〞能够输出每个观测量包含判别分数实际类预测类〔根据判别函数求得的分类结果〕和后验概率等。④翻开“保存〞对话框,选择“预测构成员〞、“判别得分〞和“构成员概率〞。全部选择完成后,单击“判别分析〞对话框中的“确认〞按钮。2.4判别分析结果①适用条件检验。在“统计量〞对话框中,选择“单变量ANOVA〞和“Box’sM〞,可分别得到下面的表1和表2。表1中的Sig值表示这两个变量均值在各组间都是有差别的,因而这两个变量对类间的判别都是有作用的。表2中的Sig值表示组间协方差齐这一假设是被回绝的。不外,协方差齐的这一要求在实际应用中往往是被忽视的。[4]②基本输出结果。表3给出了判别函数的特征根以及判别指数。本实验中只要一个判别函数,所以只要一个特征值。表4中的Sig值表示差别到达显著水平,即这个投影函数能将两组儿童区分开。从表5中,能够看出判别函数重要与“动词词型〞这个自变量相关。由于本实验只要一个判别函数和两个自变量,那么能够揣测在区分正常儿童和语言受损儿童上,“动词词型〞这个变量在判别分析中起了重要作用。表6是各组的判别函数的重心。留意此处使用的是非标准化典型判别式函数。③三种判别式。判别分析默认会给出表7的判别函数,其中的判别函数使用的是标化变量。假如在“统计量〞对话框中,选择“未标准化〞,能够得到表8的判别函数;选择“Fisher〞,能够得到表9的判别函数。留意此处“Fisher〞复选框对应的实际上是Bayes判别。标准化典型判别式为:F〔X〕=-0.684×Z无标记动词形式+0.785×Z动词词型〔变量前加Z表示标化后的数值〕未标准化典型判别式为:F〔X〕=-2.046�C0.060×无标记动词形式+0.190×动词词型Bayes判别式为:语言受损=-13.760+0.285×无标记动词形式+0.897×动词词型正常=-17.050+0.167×无标记动词形式+1.271×动词词型④图表。由于本实验只要一个判别函数,所以没有产生区域图和合并图,只要如此图3和图4所示的分组直方图,从直方图中能够大致看出各组中样本的分布情况。图3分组直方图〔语言受损〕图4分组直方图〔正常〕⑤分类结果。在“分类〞对话框中,选择了“内容摘要表〞能够得到表10中的上半部分,是采取回代法得到的判别信息,由表可见有96.6%的正确率,其中语言受损有1例错判。在“分类〞对话框中,选择了“不考虑该个案时的分类〞能够得到表10中的下半部分,是采取穿插验证法得到的判别信息,本实验中正确率为86.2%,其中语言受损有1例错判,正常有3例错判。⑥保存结果。运行判别分析后回到数据文件的数据视图,如此图5所示,生成了新的变量。在“保存〞对话框,选择“预测构成员〞,产生“Dis_1〞变量,显示的是各样本按Bayes判别所属的类别;选择“判别得分〞得到“Dis1_1〞列,是样本在Fisher投影函数下投影的坐标;选择“构成员概率〞得到“Dis1_2〞和“Disc2_2〞,为样本分别属于第1类与第2类的后验概率大小。根据表10所示,语言受损有1例错判。在图5中能够看出,语言受损儿童中错判的是第3例,由于其第2类的后验概率0.90727大于第1类的后验概率0.09273,因而判别为第2类。除此之外,“Dis1_1〞的值还能够结合表6的类中心坐标使用间隔判别法进行类别判别。3.结束语综上所述,SPSS只能完成Bayes判别与Fisher判别,无法直接完成间隔判别。SPSS判别分析是以Bayes判别为主,重要菜单与选项都是针对Bayes判别分析设置,而且最终保存的判别结果也是以Bayes判别为根据;Fisher判别操作仅给出投影表达式、各类投影中心坐标及投影分界图,最终判别结果需要自己根据各类投影中心坐标或投影分界图去做判别。[5]除此之外,由于判别
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四年级下美术教学设计-光的魅力-人教新课标
- 本土文化的地理特色试题及答案
- 咽峡炎的护理查房
- 水资源综合利用规划计划
- 行业新规对工作的影响计划
- 增加中小学生阅读活动计划
- 学校美术补习班开设方案计划
- 借助社交媒体增强品牌互动计划
- 生物学习动机的激发策略计划
- 转型升级中的生产管理挑战计划
- 2025年国家公务员录用考试公共基础知识预测押题试卷及答案(共七套)
- 2025-2030中国儿童服装行业市场发展分析及投资前景预测研究报告
- 部编版语文教材培训讲座-口语交际
- 2025年全国中小学生安全教育日专题
- 2025年工程力学笔试试题及答案
- 2025年电子设备装接工岗位职业技能资格证考试题(附答案)
- 2025年河南航空港发展投资集团有限公司社会招聘45人笔试参考题库附带答案详解
- 企业一季一课安全教育记录(2篇)
- 2025-2030年中国工业废水处理产业十三五发展规划及战略规划分析报告
- DB37T 5157-2020 住宅工程质量常见问题防控技术标准
- 烟气超低排放改造和增设脱硝项目资金申请报告写作模板定制
评论
0/150
提交评论