判别分析的SPSS实现ppt课件_第1页
判别分析的SPSS实现ppt课件_第2页
判别分析的SPSS实现ppt课件_第3页
判别分析的SPSS实现ppt课件_第4页
判别分析的SPSS实现ppt课件_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、SPSS提供的建立判别函数的方法有:提供的建立判别函数的方法有:1.全模型法:把所有的变量放入判别函数中全模型法:把所有的变量放入判别函数中2.逐步判别法逐步判别法判别分析的步骤判别分析的步骤对于分为对于分为m类的研究对象,建立类的研究对象,建立m个线性判别函数,对个线性判别函数,对测试的样本代入判别函数,得出判别得分,从而确定该测试的样本代入判别函数,得出判别得分,从而确定该样本属于哪一类。样本属于哪一类。Discriminant Discriminant对话框 Grouping Variable:已知的观测量所属类别的变量分类变量)Independents:观测量,即参与判别分析的变量。U

2、se Stepwise method :当不认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。因此根据对判别贡献的大小进行选择。Enter independent together :当所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。选择该项将不加选择地使用所有自变量进行判别分析,建立全模型。不需要进一步进行选择。 选择分类变量及其范围选择分类变量及其范围 在主对话框中左面的矩形框中选择表明已知的观测量所属类别的变量一定是离散变量,按上面一个箭头按钮,使该变量名移到箭头按钮右面,“Grouping Variable下面的矩形框此时矩形框下面的“Define range”按

3、钮加亮,按该按钮,屏幕显示一个小对话框,供指定该分类变量的数值范围。定义分类变量范围的小对话框如下图 所示。 在Minimum:后面的矩形框中输入该分类变量的最小值;在Muximurn:后面的矩形框中输入该分类变量的最大值。 分类变量范围对话框 指定判别分析的自变量指定判别分析的自变量 在主对话框的左面的变量表中选择表明观在主对话框的左面的变量表中选择表明观测量特征的变量,按下面一个箭头按钮,把测量特征的变量,按下面一个箭头按钮,把选中的变量移到选中的变量移到“Independents:”下面的矩形下面的矩形框中,作为参与判别分析的变量。框中,作为参与判别分析的变量。 Indepents对话框

4、数据变量数据变量输入框输入框数据判别分析数据判别分析 完成前面四步骤的操作即可使用各种系统默认值完成前面四步骤的操作即可使用各种系统默认值对工作数据集的数据进行判别分析了。可以使用的对工作数据集的数据进行判别分析了。可以使用的方法有两种:方法有两种: (1)直接运行:在主对话框中按用鼠标单击)直接运行:在主对话框中按用鼠标单击)Ok按钮按钮 (2)生成生成SPSS命令程序后再运行:在主对话框中按命令程序后再运行:在主对话框中按Paste按钮,激活按钮,激活Syntax窗,在该窗中按窗,在该窗中按Run按钮执行该语句窗中的程序。按钮执行该语句窗中的程序。 无论哪种方法均可在无论哪种方法均可在ou

5、tput窗中显示出分析窗中显示出分析结果。结果。 完全使用系统默认值进行判别分析,其结果有完全使用系统默认值进行判别分析,其结果有时不能令人满意,因此根据以下步骤指定选择项是时不能令人满意,因此根据以下步骤指定选择项是很有必要的。很有必要的。 选择观测量选择观测量 如果希望使用一部分观测量进行判别函数的推如果希望使用一部分观测量进行判别函数的推导,而且有一个变量的某个值可以作为某些观测导,而且有一个变量的某个值可以作为某些观测量的标识,则用量的标识,则用Select功能进行选择。操作方法是,功能进行选择。操作方法是,单击单击“Select按钮展开小选择框,在按钮展开小选择框,在“Vaiable

6、:”后面矩形框中输入该变量的变量名,在后面矩形框中输入该变量的变量名,在“Value:”后面输入标识参与分析的观测量所具有的该变量后面输入标识参与分析的观测量所具有的该变量值。一般均使用数据文件中的所有合法观测量。值。一般均使用数据文件中的所有合法观测量。此步骤可以省略。此步骤可以省略。 Select功能选择选择分析方法选择分析方法 在主对话框中自变量矩形框下面有两个选在主对话框中自变量矩形框下面有两个选择项,被选中的方法前面的圆圈中加有黑点。择项,被选中的方法前面的圆圈中加有黑点。这两个选择项是选择判别分析方法的。这两个选择项是选择判别分析方法的。(1 1Enter independent

7、together Enter independent together 当你认为所有自变量都能对观测量特性当你认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。选择该项提供丰富的信息时,使用该选择项。选择该项将不加选择地使用所有自变量进行判别分析,将不加选择地使用所有自变量进行判别分析,建立全模型。不需要进一步进行选择。建立全模型。不需要进一步进行选择。 (2Use Stepwise method 当你不认为所有自变量都能对观测量特性提供丰富的信息时,使用该选择项。因此根据对判别贡献的大小进行选择。当鼠标单击该项时,Method按钮加亮。可以进一步判别分析方法。 单击“Method

8、按钮,展开“Stepwise method对话框子对话框如下图所示。 Stepwise method对话框 选择进行逐步判别分析的方法 选择判别分析方法在Method组的矩形框中进行。可供选择的判别分析方法有: Wilkslambda 使Wilk的统计量最小化法。Unexplained variance 使各类不可解释的方差和最小化法。Mahalanobisdistance 使最近两类间的 Mahalanobis距离最大化法。 Smallest F ratio。使任何两类间的最小的F值最大化法。 Rao V 使 RaoV统计量最大化。可以对一个要加入到模型中的变量的V值指定一个最小增量。选择此

9、种方法后,应该在该项下面的V to dntce后的矩形框中输这个增量的指定值。 选择逐步判别停止的判据 选择逐步判别停止的判据在criteria组的矩形框中进行。可供选择的判据有: Use F value:使用F值,是系统默认的判据,默认值是:Entry:3.84;removal:2.71。即当被加入的变量F值=3.84时才把该变量加入到模型中,否则变量不能进入模型;或者,当要从模型中移出的变量F值=2.71时,该变量才被移出模型,否则模型中的变量不会被移出。应该使Entry值加入变量的F值)removal值移出变量的F值) Use probability of F:使用F值的概率。加入变量的

10、F值概率的默认值是0.055);移出变量的q值概率是0.1010)。removal值移出变量的正值概率)Entry值加入变量的F值概率)。 显示内容的选择 对于逐步选择变量的过程和最后结果的显示可以通过Method对话框最下面的Display矩形框中的三项进行选择: Resul at each step要求在逐步选择变量过程中的每一步之后显示每个变量的统计量。 Summary仅要求显示加入或移出模型的变量的综计量。即选择变量的小结。 F for Pairwise distances要求显示两两类之间的两两 F值矩阵。 当以上三项都给予了确定的选择后,单击continue按钮,返回主对话框。 指

11、定输出的统计量指定输出的统计量单击单击“statistics按钮,展开相应的子对话框,按钮,展开相应的子对话框,如下图所示。如下图所示。可以选择的输出统计量分为以下三类:可以选择的输出统计量分为以下三类:(1描述统计量描述统计量 在在Descriptives组的矩形框中可以选择对原组的矩形框中可以选择对原始数据的描述统计量的输出:始数据的描述统计量的输出: Means选择此项可以输出各类中各自变量选择此项可以输出各类中各自变量的均值的均值MEAN、标准差、标准差Std Dev和各自变量总样和各自变量总样本的均值和标准差。本的均值和标准差。 Univariate ANOVA对各类中同一自变量均对

12、各类中同一自变量均值都相等的假设进行检验,输出单变量的方差值都相等的假设进行检验,输出单变量的方差分析结果。分析结果。 Boxs M对每类的协方差矩阵是从同一对每类的协方差矩阵是从同一总体中采样得来的假设进行检验,输出检验结总体中采样得来的假设进行检验,输出检验结果。果。 Statistics(2判别函数系数 在Fuction coefficients组的矩形框中选择判别函数系数的输出形式: Fishers可以直接用于对新样本进行判别分类的费雪系数。 Unstandardized未经标准化处理的判别系数。可用于计算判别分数。 (3自变量的系数矩阵自变量的系数矩阵 在在Matrices组的矩形框

13、中选择要求给出的矩阵:组的矩形框中选择要求给出的矩阵: within-groups correlation matrix类内相关矩阵类内相关矩阵 within-groups covariance matrix类内协方差矩阵类内协方差矩阵 Separate-groups covariance matrices对每类输出一个类对每类输出一个类间协方差矩阵间协方差矩阵 Total covariance matrix总样本的协方差矩阵总样本的协方差矩阵 以上三项都给予了确定的选择后,单击以上三项都给予了确定的选择后,单击continue按钮,按钮,返回主对话框。返回主对话框。 指定分类参数和判别结果指

14、定分类参数和判别结果 在主对话框中单击在主对话框中单击“classifyclassify按钮,按钮,展开相应的子对话框,如下图所示。展开相应的子对话框,如下图所示。 (1 1在在Prior ProbabilitiesPrior Probabilities组的矩形框中组的矩形框中选择先验概率,两者选其一。选择先验概率,两者选其一。 All groups equalAll groups equal各类先验概率各类先验概率相等。若分为相等。若分为m m类,则各类先验概率均为类,则各类先验概率均为1 1m m。 computer from group sizescomputer from group

15、sizes由各由各类的样本量计算决定在各类的先验概率与其样本类的样本量计算决定在各类的先验概率与其样本比。比。 Classifiction对话框(2选择分类使用的协方差矩阵 在Use covariance Matrix组的矩形框中选择分析使用的协方差矩阵。两者选其一。 Within-groups指定使用组内协方差矩阵。 Seperate-groups指定使用组间协方差矩阵。 (3选择要求输出的统计图选择要求输出的统计图 在在Plots组的矩形框中选择,可以并列选择。组的矩形框中选择,可以并列选择。 combined-groups 所有类放在一张散点图中。便于比所有类放在一张散点图中。便于比较。

16、此选择项生成一张散点图。较。此选择项生成一张散点图。 Seperate-groups对每一类生成一张散点图。共分为几对每一类生成一张散点图。共分为几类就生成几张散点图。类就生成几张散点图。 Territoreal map 如果对一个观测量只能计算出一个如果对一个观测量只能计算出一个判别分数,则利用观测量的判别做作图,如果有两个以判别分数,则利用观测量的判别做作图,如果有两个以上判别分数,则用头两个判别分数作图。此种统计图力上判别分数,则用头两个判别分数作图。此种统计图力图把一张图的平面划分出与类数相同的区域。每一类占图把一张图的平面划分出与类数相同的区域。每一类占据一个区。据一个区。 (4选择

17、生成到输出窗中的分类结果选择生成到输出窗中的分类结果 在在 Displsy组的组的矩形框中选择输出项:矩形框中选择输出项: Results for each case要求输出每个观测量的分类结要求输出每个观测量的分类结果。果。 Summary table要求输出分类的小结,给出错分率。要求输出分类的小结,给出错分率。(5缺失值处理方式缺失值处理方式 在在classification子对话框的最下面有一个选择项,用以子对话框的最下面有一个选择项,用以选择对缺失值的处理方法。选择对缺失值的处理方法。 Replace missing value with mean用该变量的均值代用该变量的均值代替缺

18、失值。该选择项前面的小矩形框中出现替缺失值。该选择项前面的小矩形框中出现x时表示时表示选定所示的处理方法。选定所示的处理方法。 以上五项都给予了确定的选择以上五项都给予了确定的选择后,单击后,单击continue按钮,返回主对话框。按钮,返回主对话框。 指定生成并保存在数据文件中的新变量指定生成并保存在数据文件中的新变量 Descriminant过程可以在数据文件中建立过程可以在数据文件中建立新变量,通过新变量,通过Save New Vaiables子对话框子对话框进行选择。进行选择。 在主对话框中单击在主对话框中单击“Save按钮,展开按钮,展开“Save New Vaiables子对话框。

19、如下图所子对话框。如下图所示。示。 Save对话框 在工作数据文件中建立以下三个新变量,可以选择。 Predicted group membership要求建立一个新变量,表明预测的类成员。指定此项后,每行一次Descriminant过程,就建立一个表明使用判别函数预测的各观测量属于哪一类的新变量。第一次运行建立新变量的变量名为dis-1,如果在工作数据文件中不把前一次建立的新变删除,第n次运行Descriminant过程建立的新变量默认的变量名为dis-n。 Descriminant score要求建立表明判别分数的新变量。每次运行 Descriminant过程都给出组表明判别分数的新变量。

20、建立几个典则判别函数就有几个判别分数变量。参与分析的观测量共分为m类,则建立ml个典则判别函数,指定该选择项,就可以生成ml个表明判别数的新变量。例如,原始数据观测量共分为3类,建立两个典则判别函数。第一次运行判别过程建立的新变量名为dis1_1,dis2_1,第二次运行判别过程建立的新变量名为dis1_2,dis2_2依此类推。分别表示代入第一和第二个判别函数所得到的判别分数。 Probabilities of group membership要求建立新变量表明观测量属于某一类的概率。有m类,对一个观测量就会给出m个概率值,因此建立m个新变量。例如,原始和预测分类数是:指定该选择项,在第一次

21、运行判别过程后,给出的表明分类概率的新变量名为dis1_2,dis2_2,dis3_2. 选择了新变量类型后,按continue运行带有选择项的判别分析过程运行带有选择项的判别分析过程 运行运行Descriminant过程有两种方法:过程有两种方法: (1在主对话框中按在主对话框中按Ok按钮,直接运行按钮,直接运行Descriminant过程。过程。 (2在主对话框中按在主对话框中按Paste按钮,将以上操按钮,将以上操作结果转换成作结果转换成Descriminant过程的命令程序,显过程的命令程序,显示在示在Syntax窗中。窗中。 在在Syntax窗中可以按照窗中可以按照Descrimin

22、ant命令语命令语句格式进一步修改粘贴则窗中的各子命令语句。句格式进一步修改粘贴则窗中的各子命令语句。然后按然后按Run按钮,将窗中的程序语句提交给系按钮,将窗中的程序语句提交给系统执行。统执行。 逐步判别分析逐步判别分析 (1逐步判别分析方法与判据的选择逐步判别分析方法与判据的选择 逐步判别在操作步骤方面只有在选择逐步判别在操作步骤方面只有在选择方法方法一一点 上 与 前 面 所 叙 述 的 方 法 有 所 区 别 , 即 在点 上 与 前 面 所 叙 述 的 方 法 有 所 区 别 , 即 在Discriminant过程主对话框中应该选择过程主对话框中应该选择Use stepwise me

23、thod。当单击该选择项时,其前面的。当单击该选择项时,其前面的圆圈中出现黑点,同时圆圈中出现黑点,同时Method按钮加亮表示可按钮加亮表示可以进一步选择分析方法或判据了。以进一步选择分析方法或判据了。 单击Method按钮,展开stepwise method对话框。在对话框中显示出系统默认的逐步区别方法是Milks Lambra。其判据是:进入模型的F值为3.84;从模型中剔除变量的F值为2.71。不熟悉统计分析的用户可以不再进一步选择,直接使用系统默认的分析方法和判据. 逐步判别方法的选择逐步判别方法的选择Milks Lambra使使Milks统计量最小。是系统默认的方统计量最小。是系统

24、默认的方法。法。Unexplained variance使各类不可解释的方差和最小。使各类不可解释的方差和最小。Mahalanobis distance使最近的两组间的马哈拉诺比斯使最近的两组间的马哈拉诺比斯距离最小。距离最小。smallest F ratio。使任何两组间的最小的。使任何两组间的最小的 F值最大。值最大。 Raos V使使 Rao的的 V统计量最大。在选择并指定使用统计量最大。在选择并指定使用此种方法后,该项下面的文字加亮,可以在此种方法后,该项下面的文字加亮,可以在V to enter毫米的矩形框中输入一个变量进入模型的毫米的矩形框中输入一个变量进入模型的 V值的最小增值的

25、最小增量。量。 关于判据的选择方法关于判据的选择方法 可以从两者指定判据的方法中选择一种,并在每种方可以从两者指定判据的方法中选择一种,并在每种方法的两个矩形框中输入判据的具体数值。法的两个矩形框中输入判据的具体数值。 Use F value用用F值作判据。在该项下面的两个矩形框值作判据。在该项下面的两个矩形框中输人:中输人: Entry:后面的矩形框中输入进入模型的:后面的矩形框中输入进入模型的F值。只有值。只有变量的变量的F值大于这个指定值时,变量进入模型。值大于这个指定值时,变量进入模型。 Remove:在后面的矩形框中输入把变量移出模型的:在后面的矩形框中输入把变量移出模型的F值。当变

26、量的值。当变量的F值小于该值时,变量从模型中剔除。值小于该值时,变量从模型中剔除。 应该注意,应该注意,Entry值必须大于值必须大于Remove值,否则,模型值,否则,模型中将不会有变量。中将不会有变量。 显示内容的选择显示内容的选择 在在Stepwise MethodStepwise Method对话框的最下面一对话框的最下面一行可以选择要求显示在输出窗中的内容。对于逐行可以选择要求显示在输出窗中的内容。对于逐测分析可以选择以下输出:测分析可以选择以下输出: Results at each stepResults at each step给出每一步选择变给出每一步选择变量工作完成后各变量的

27、统计量。给出哪些统计量量工作完成后各变量的统计量。给出哪些统计量要看使用什么判据。使用要看使用什么判据。使用F F值作判据则给出各变量值作判据则给出各变量的的F F值;使用值;使用F F值的概率作判据则给出量的值的概率作判据则给出量的F F值的概值的概率。率。 Summery Summery仅对被加入或移出模型的变量给仅对被加入或移出模型的变量给出统计量。出统计量。 F for pairwise distances F for pairwise distances显示显示 F F比比值矩阵。对每两类显示一对值矩阵。对每两类显示一对F F比值。比值。 (2)逐步判别分析操作步骤 我们采用Milk

28、s Lambra方法进行逐步判别分析。使用F值作为判据统计量。当F=30时变量进入模型;当F=5时,变量从模型中移出。 操作步骤如下:操作步骤如下: 第一、从主菜单的第一、从主菜单的Statistics,经,经classify到到Discriminant Analysis逐一选择各逐一选择各菜单的菜单直到展开菜单的菜单直到展开Discriminant Analysis对对话框。话框。 第二、第二、Independents:slen、swidPlen、Pwid;Group variables:spno1,3选择变选择变量量slen、swidPlen、Pwid作为判别分析的自变作为判别分析的自变量;量;spno作为分类变量。作为分类变量。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论