试验设计与统计分析SAS实践教程课件:因子分析_第1页
试验设计与统计分析SAS实践教程课件:因子分析_第2页
试验设计与统计分析SAS实践教程课件:因子分析_第3页
试验设计与统计分析SAS实践教程课件:因子分析_第4页
试验设计与统计分析SAS实践教程课件:因子分析_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

10.1导言10.2主分量法因子分析10.3主因子法因子分析10.4最大似然法因子分析10.5最小二乘法因子分析上机目的

掌握因子分析(CommonFactorAnalysis)的原理及SAS实现方法,学会用潜在的公因子解释多变量问题,注意样本的强共线性要求。熟悉SAS的程序结构,理解过程、过程选项、语句、语句选项等概念。学以致用能解决实际问题。

上机内容

①利用factor过程进行主分量法因子分析。②利用factor过程进行最大方差正交旋转主分量法因子分析。③利用factor过程进行promax斜交旋转主分量法因子分析。④利用factor过程进行

主因子法因子分析。⑤利用factor过程进行迭代主因子法因子分析。⑥利用factor过程进行最大似然法因子分析。⑦利用factor过程进行最小二乘法因子分析。10.1导

言因子分析的数学模型如下所示:其中,X为p个原变量所构成的向量,

为p个均值所构成的向量,A为p 

 m个公因子的系数(载荷)所构成的矩阵(因子模式),F为m个公因子所构成的向量,

为p个特殊因子所构成的向量。

因子分析与回归分析不同,因子分析中的因子是一个抽象概念,而回归因子则有明确的实际意义。因子分析与主分量分析不同,因子模型需要从某些假设出发求解得到,是用假想因子及随机误差的线性组合表示原变量,而主分量模型仅是一种原变量到主分量的线性变换,即用原变量的线性组合表示主分量。

获得数据的背景可描述为这样一种过程:抽取N个样品(试验单元),选定若干个描述样品性状的数值型变量,分别测定N个样品上这些选定变量的值。试验样本包括标识样品的标签变量(字符型)和描述样品性状的属性变量(数值型)两种类型。

因子分析:选取少数(降维)几个公因子解释或描述原始变量间的协方差关系,它认为每个样品的属性变异是由潜在公因子(对所有样品均起作用)和特殊因子(只对一个样品起作用)所引起的,以因子载荷的结构说明公因子在样品上的作用,以因子得分评价公因子对样品的影响。

按照因子模型的求解方法可将因子分析划分为主分量法、主因子法、最大似然法、最小二乘法等多种类型。又可根据因子的旋转变换进一步细分为无旋转、正交旋转和斜交旋转三个子类。

10.2主分量法因子分析

【例10-1】为考察平欧杂种榛12个品系(Lines)的抗寒性,分别测定了枝条截面积(X1)、导管密度(X2)、导管截面积(X3)、木质部面积(X4)、髓部面积(X5)、韧皮部面积(X6)和射线条数(X7) 7个剖面结构参数。计算得出了导管密度与木质部面积之比(X8)、髓部面积与木质部面积之比(X9)、韧皮部面积与木质部面积之比(X10)、木质射线面积与木质部面积之比(X11) 4个结构比例参数。还分别测定了萌芽率(X12)、雄花序枯死率(X13)、抽条量(X14)、抽条率(X15) 4个表征抽条程度的参数。观测样本如表10-1所示。试通过无旋转主分量法因子分析研究平欧杂种榛的抗寒性与枝条剖面结构因子的关系,并通过排序比较选出最优的抗寒性品系(种)。

(1)将表10-1所示样本创建为SAS数据表sasuser.zhenshu01。

(2)利用factor过程进行因子分析。选项data=sasuser.zhenshu01指定因子分析针对的数据表,过程选项method=principal指定用主分量法解因子模型。过程选项out=PCP01指定输出包含因子得分的数据表,同时必须用选项nfactors=2指定因子个数。选项score指定显示标准化因子得分系数。语句var指定参与因子模型的原变量。SAS程序如下:

(3)程序输出的主要结果整理后如表10-2至表10-7所示。

枝条剖面结构问题的讨论如下所述。

(4)前5个特征根的累积比率达0.8774(>0.85),说明需要5个公因子研究问题,但5个因子太多不利于解释问题,下面用前2个因子讨论问题。如表10-2所示。

(5)考察第1因子。枝条截面积(X1)、髓部面积(X5)和射线条数(X7)在第1因子上均有绝对值较大的正载荷,抽条量(X14)和抽条率(X15)在第1因子上均有绝对值较大的负载荷。若两种参数正相关变化,则第1因子得分在0附近。若两种参数负相关变化,则剖面结构参数愈大第1因子得分愈大,而抽条程度愈大第1因子得分愈小。因此,第1因子可解释为“抽条程度与剖面结构参数相互作用因子”。如表10-3所示。

原方差总和为11,第1因子的解释方差(VarianceExplainedbyEachFactor)达3.575688,占32.51%。每个因子对原变量集的相关指数(SquaredMultipleCorrelationsoftheVariableswithEachFactor)均达1,说明公因子可代替原变量解释数据变异的全部,如表10-3所示。表10-3中的因子方差亦称做共同度。

(6)考察第2因子。导管截面积(X3)和木质部面积(X4)在第2因子上均有绝对值较大的正载荷,导管密度(X2)、韧皮部面积(X6)在第2因子上均有绝对值较大的负载荷,抽条量(X14)和抽条率(X15)的因子载荷均甚小。木质部面积愈大(持水量愈大)第2因子得分愈大,导管密度愈大(导管愈细)第2因子得分愈小。因此,第2因子可解释为“枝条剖面结构因子”。如表10-3所示。

(7)按第1因子的得分排序,品系85_73、82_7和84_254位于前三,说明这三个品系枝条截面积、髓部面积和射线条数均较大,而抽条量和抽条率均较低,其抗寒性强可能与其持水量较高有关。从三个品系的第2因子得分情况看,三个品系的得分比最低得分至少高2.02223,比最高得分至少低0.73664,说明这三个品系具有较大木质部面积和较小导管密度,剖面结构参数的构成比例较合理。如表10-4所示。

(8)前3个特征根的累积比率达0.8617(>0.85),说明需要3个公因子研究问题,3个因子不多,有利于解释问题,下面用前2个因子对问题进行讨论。如表10-5所示。

(9)考察第1因子。导管密度与木质部面积之比(X8)、髓部面积与木质部面积之比(X9)、韧皮部面积与木质部面积之比(X10)在第1因子上均有绝对值较大的正载荷,木质射线面积与木质部面积之比(X11)在第1因子上有绝对值较大的负载荷,而抽条量(X14)和抽条率(X15)在第1因子上均有绝对值较大的正载荷,雄花序枯死率(X13)在第1因子上有绝对值较大的负载荷。第1因子可解释为“抽条程度与结构比例相互作用因子”。

原方差总和为8,第1因子的解释方差达3.25987,占40.75%。每个因子对原变量集的相关指数均达1,说明公因子可代替原变量解释数据变异的全部。如表10-6所示。

(10)考察第2因子。导管密度与木质部面积之比(X8)、髓部面积与木质部面积之比(X9)、韧皮部面积与木质部面积之比(X10)和木质射线面积与木质部面积之比(X11)在第2因子上均有绝对值较大的正载荷,而抽条量(X14)和抽条率(X15)在第2因子上均有绝对值较大的负载荷。第2因子可解释为“枝条结构比例因子”。

原方差总和为8,第2因子的解释方差达2.5698,占32.12%。每个因子对原变量集的相关指数均达1,说明公因子可代替原变量解释数据变异的全部。如表10-6所示。

(11)按第2因子的得分排序,品系85_73、84_254和82_7位于前三,说明这三个品系具有结构比例参数较大和抽条程度较低的特点。如表10-7所示。

【例10-2】对于如例10-1和表10-1所述的问题,试通过最大方差正交旋转主分量法因子分析研究影响平欧杂种榛抗寒性与枝条剖面结构因子的关系,并通过排序比较选出最优的抗寒性品系(种)。

(1)引用表10-1所示的SAS数据表sasuser.zhenshu01。

(2)利用factor过程进行因子分析。选项rotate=varimax指定因子旋转采用方差最大正交旋转法。SAS程序如下:

(3)程序输出的主要结果整理后如表10-8~表10-11所示。

(4)考察枝条剖面结构问题。第1因子的模式和得分与例10-1的第1因子相近。第2因子的模式和得分与例10-1的第2因子相近。经过旋转因子模式中的分量差距拉大,更易解释问题。

(5)考察枝条结构比例问题。考察第1因子的模式和得分,该因子可被解释为“结构比例因子”。考察第2因子的模式和得分,该因子可被解释为“抽条程度木质射线因子”。经过旋转因子模式中的分量差距拉大,更易解释问题。

(6)枝条剖面结构和结构比例两种问题的研究获得相同的结论。抗寒性最强的品系(种)依次为85_76、82_7和84_254,它们具有枝条较粗大、剖面结构主要组织的面积较大、导管直径适中和结构比例参数较大等特点,由此推测这样的剖面结构有利于提高枝条持水量和保水能力。如表10-9和表10-11所示。

【例10-3】对于如例10-1和表10-1所述的问题,试通过Promax斜交旋转主分量法因子分析研究影响平欧杂种榛抗寒性与枝条剖面结构因子的关系,并通过排序比较选出最优的抗寒性品系(种)。

(1)引用表10-1所示的SAS数据表sasuser.zhenshu01。

(2)利用factor过程进行因子分析。选项rotate=promax指定因子旋转采用Promax斜交旋转法。SAS程序如下:

(3)程序输出的主要结果整理后如表10-12~表10-15所示。

(4)用例10-1和例10-2相同的方式研究问题。表10-12中的因子模式为旋转后的因子模式(StandardizedRegressionCoefficients),因子结构由每个变量与每个因子的相关系数构成(Correlations)。

10.3主因子法因子分析

【例10-4】对于如例10-1和表10-1所述的问题,试通过SAS的

主因子法因子分析研究影响平欧杂种榛抗寒性与枝条剖面结构因子的关系,并通过排序比较选出最优的抗寒性品系(种)。

(1)引用表10-1所示的SAS数据表sasuser.zhenshu01。

(2)利用factor过程进行因子分析。过程选项method=ALPHA指定用

主因子法解因子模型。SAS程序如下:

(3)程序输出的主要结果整理后如表10-16~表10-21所示。

(4)

主因子法是一种由加权约相关阵求解因子模型的方法。相关阵减去一个初始对角阵后所生成的矩阵称做约相关阵,初始对角阵元素的值均小于1。

指每个因子上的权。

试进行正交旋转或斜交旋转

主因子法因子分析。其余讨论从略。

【例10-5】对于如例10-1和表10-1所述的问题,试通过SAS的迭代主因子法因子分析研究平欧杂种榛抗寒性与枝条剖面结构因子的关系,并通过排序比较选出最优的抗寒性品系(种)。

(1)引用表10-1所示的SAS数据表sasuser.zhenshu01。

(2)利用factor过程进行因子分析。过程选项method=PRINTIT指定采用迭代主因子法求解因子模型。SAS程序如下:

(3)程序输出的主要结果整理后如表10-22~表10-27所示。

(4)迭代主因子法是一种对约相关阵迭代解算的求解因子模型的方法。 10.4最大似然法因子分析

【例10-6】对于如例10-1和表10-1所述的问题,试通过SAS的最大似然法因子分析研究平欧杂种榛抗寒性与枝条剖面结构因子的关系,并通过排序比较选出最优的抗寒性品系(种)。

(1)引用表10-1所示的SAS数据表sasuser.zhenshu01。

(2)利用factor过程进行因子分析。过程选项method=ML指定采用最大似然法求解因子模型。过程选项proportion=1.08指定最大公因子方差1.08,设置这个选项是规避公因子方差最大似然估计结果大于1时导致的程序终止。SAS程序如下:

(3)程序输出的主要结果整理后如表10-28至表10-35所示。

(4)最大似然法因子分析在求解因子模型时对公因子和特殊因子做最大似然估计。

(5)表10-29中的加权约相关阵的特征根译自EigenvaluesoftheWeightedReducedCorrelationMatrix,表10-33中的相关指数译自SquaredMultipleCorrelationsoftheVariableswithEachFactor,加权解释指因子加权的解释方差,无权解释指因子不加权的解释方差。

10.5最小二乘法因子分析

【例10-7】对于如例10-1和表10-1所述的问题,试通过SAS的最小二乘法因子分析研究平欧杂种榛抗寒性与枝条剖面结构因子的关系,并通过排序比较选出最优的抗寒性品系(种)。

(1)引用表10-1所示的SAS数据表sasuser.zhenshu01。

(2)利用factor过程进行因子分析。过程选项method=ULS指定采用最小二乘法求解问题的因子模型。SAS程序如下:

(3)程序输出的主要结果整理后如表10-36~表10-41所示。

(4)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论