多元统计分析(数学建模)市公开课一等奖省赛课获奖课件_第1页
多元统计分析(数学建模)市公开课一等奖省赛课获奖课件_第2页
多元统计分析(数学建模)市公开课一等奖省赛课获奖课件_第3页
多元统计分析(数学建模)市公开课一等奖省赛课获奖课件_第4页
多元统计分析(数学建模)市公开课一等奖省赛课获奖课件_第5页
已阅读5页,还剩181页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模讲座多元统计分析为振兴中华而读书!第1页第一部分理论分析1.1相关分析1.2路径分析1.3结构方程模型1.4聚类分析1.5因子分析第2页相关分析第3页(一)相关关系(1)函数关系:(如:销售额与销售量;圆面积和圆半径.)是事物间一个一一对应确实定性关系.即:当一个变量x取一定值时,另一变量y能够依确定关系取一个确定值(2)统计关系:(如:收入和消费;身高遗传.)事物间关系不是确定性.即:当一个变量x取一定值时,另一变量y取值可能有几个.一个变量值不能由另一个变量唯一确定第4页概述统计关系常见类型:线性相关:正线性相关、负线性相关非线性相关统计关系不象函数关系那样直接,但却普遍存在,且有强有弱.怎样测度?第5页概述(二)相关分析任务研究对象:统计关系相关分析意在测度变量间线性关系强弱程度第6页相关分析(一)目标经过样本数据,研究两变量间线性相关程度强弱.

(二)基本方法绘制散点图、计算相关系数第7页

绘制散点图(一)散点图将数据以点形式绘制在直角平面上.比较直观,能够用来发觉变量间关系和可能趋势.表达了正相关趋势第8页绘制散点图(二)基本操作步骤(1)菜单项选择项:graphs->scatter(2)选择散点图类型:simple:简单散点图(显示一对变量散点图)overlay:重合散点图(显示多对变量散点图)(3)选择x轴和y轴变量(4)选择分组变量(setmarkersby):分别以不一样颜色点表示(5)选择标识变量(labelcaseby):散点图上可带有标识变量值(如:职员号)第9页计算相关系数(一)相关系数(1)作用:以准确相关系数(r)表达两个变量间线性关系程度.r:[-1,+1];r=1:完全正相关;r=-1:完全负相关;r=0:无线性相关;|r|>0.8:强相关;|r|<0.3:弱相关第10页计算相关系数(一)相关系数(2)说明:相关系数只是很好地度量了两变量间线性相关程度,不能描述非线性关系.如:x和y取值为:(-1,-1)(-1,1)(1,-1)(1,1)

r=0但xi2+yi2=2数据中存在极端值时不好如:(1,1)(2,2)(3,3),(4,4),(5,5),(6,1)r=0.33但总体上表现出:x=y应结合散点图分析第11页计算相关系数(一)相关系数(3)种类:简单线性相关系数(Pearson):针对定距数据.

(如:身高和体重)第12页计算相关系数(一)相关系数(3)种类:Spearman相关系数:用来度量定序或定类变量间线性相关关系(如:不一样年纪段与不一样收入段,职称和受教育年份)利用秩(数据排序次序).认为:假如x与y相关,则对应秩Ui、Vi也含有同时性.首先得到两变量中各数据秩(Ui、Vi),并计算Di2统计量.计算Spearman秩相关系数,与简单相关系数形式完全相同.若两变量存在强正相关性,则Di2应较小,秩序相关系数较大.若两变量存在强负相关性,则Di2应较大,秩序相关系数为负,绝对值较大第13页计算相关系数(一)相关系数(3)种类:Kendall相关系数:度量定序定类变量间线性相关关系首先计算一致对数目(U)和非一致对数目(V)如:对x和y求秩后为:x:24351y:34152x秩按自然次序排序后:x:12345

y:23145

一致对:(2,3)(2,4)(2,5)(3,4)(3,5)(1,4)(1,5)(4,5)非一致对:(2,1)(3,1)然后计算Kendall相关系数.若两变量存在强相关性,则V较小,秩序相关系数较大;若两变量存在强负关性,则V较大,秩序相关系数为负,绝对值较大第14页计算相关系数(二)相关系数检验应对两变量来自总体是否相关进行统计推断.原因:抽样随机性、样本容量小等(1)H0:两总体零相关(2)结构统计量简单相关系数Spearman系数,大样本下,近似正态分布kendall系数,大样本下,近似正态分布第15页计算相关系数(二)相关系数检验(3)计算统计量值,并得到对应相伴概率p(4)结论:假如p<=a,则拒绝H0,两总体存在线性相关;假如p>a,不能拒绝H0.第16页计算相关系数(三)基本操作步骤(1)菜单项选择项:analyze->correlate->bivariate...(2)选择计算相关系数变量到variables框.(3)选择相关系数(correlationcoefficients).(4)显著性检验(testofsignificance)tow-tailed:输出双尾概率P.one-tailed:输出单尾概率P第17页计算相关系数(四)其它选项statistics选项:仅当计算简单相关系数时,选择输出哪些统计量.meansandstandarddeviations:均值、标准差;cross-productdeviationsandcovariances:分别输出两变量离差平方和(sumofsquare分母)、两变量差积和(cross-products分子)、协方差(covariance以上各个数据除以n-1)第18页偏相关分析(一)偏相关系数(1)含义: 在控制了其它变量影响下计算两变量相关系数。虚假相关.研究商品需求量和价格、消费者收入之间关系.因为:需求量和价格之间相关关系包含了消费者收入对商品需求量影响;收入对价格也产生影响,并经过价格变动传递到对商品需求量影响中。又如:粮食产量与平均气温、月降水量、平均日照时间、温度之间关系研究。第19页偏相关分析(2)计算方法:第20页偏相关分析(二)基本操作步骤(1).菜单项选择项:analyze->correlate->partial…(2).选择将参加计算变量到variable框.(3).选择控制变量到controllingfor框。(4)option选项:zero-ordercorrelations:输出简单相关系数矩阵第21页路径分析第22页2024/8/1823第十章路径分析

目录上页下页返回结束

20世纪初,“Pearson原理”占着生物遗传学(在过去几乎就是我们现在所称作统计学)统治地位。Pearson原理一个基本内容就是相关关系是现实生活中最基本关系,而因果关系仅仅是完全相关(理论)极限。这种理论认为没必要寻找变量之间因果关系,只需计算相关系数。然而相关分析逐步暴露出本身很多局限:一是相关分析仅仅反应变量之间线性关系;二是相关分析反应变量之间关系是对称,而很多变量之间关系是非对称;三是只有在正态假设下,相关思想才是有效。第23页2024/8/1824第十章路径分析

目录上页下页返回结束

在遗传学中,很多现象含有显著因果关系,如父代与子代基因关系,父代在前,子代在后,二者关系只能是单向,而非对称。对这种变量结构进行思索,遗传学家SewallWright于1918-1921年提出路径分析(pathanalysis),用来分析变量间因果关系。当代路径分析由生物遗传学家、心理测验学家、计量经济学家以及社会学家推进,引入隐变量(latentvariable,又称unmeasuredvariable,不可观察变量),并允许变量间含有测量误差,而且极大似然预计代替了最小二乘法,成为路径系数主流预计方法。第24页2024/8/1825第十章路径分析

目录上页下页返回结束

路径分析现在成为多元分析一个主要方法,广泛应用于遗传学、社会学、心理学、经济问题和市场调研领域。然而习惯上把基于最小二乘传统路径分析称作路径分析,而把基于极大似然路径分析称作结构方程式模型(StructuralEquationModeling,SEM)。本节主要介绍传统路径分析,不进行尤其说明,本节所提到路径分析均指基于最小二乘路径分析,结构方程式模型方在下节介绍。第25页2024/8/1826

目录上页下页返回结束

一、路径图路径分析主要工具是路径图,它采取一条带箭头线(单箭头表示变量间因果关系,双箭头表示变量间相关关系)表示变量间预先设定关系,箭头表明变量间关系是线性,很显著,箭头表示着一个因果关系发生方向。在路径图中,观察变量普通写在矩形框内,不可观察变量普通写在椭圆框内,对于简单路径模型,能够直接用字母表示变量,绘出路径图。第26页2024/8/1827

目录上页下页返回结束

图10-1是一个简单路径路,A是父亲智商,B是母亲智商,C1、C2是两个成年儿女智商,是与A,B不相关另外原因变量。普通来说,父母亲智商之间不存在关系;父母亲智商对儿女智商存在因果关系,用单箭头表示,儿女之间,存在相关关关系,用双箭头表示。箭头上字母表示路径系数,路径系数反应原因变量对结果变量相对影响大小。在路径分析中普通采取经过标准化后变量,没有尤其说明,均指经过标准化后变量。能够把图10-1写为方程式形式:(10.1)第27页2024/8/1828

目录上页下页返回结束

式(10.1)实际上是普通多元回归方程,多元回归分析是因果关系模型一个,但它是一个比较简单因果关系模型,各个自变量对因变量作用并列存在,它仅包含一个步骤因果结构。路径分析优势在于它能够容纳多步骤因果结构,经过路径图把这些因果关系很清楚地表示出来,据此进行更深层次分析,如比较各种原因之间相对主要程度,计算变量与变量之间直接与间接影响,这在后面会包括到。图10-2是相关一个消费性电子产品(如手机)路径分析例子(这里省略了路径系数),四个变量耐用性、操作简单性、通话效果和价格两两相关,决定感知价值,同时经过感知价值决定忠诚度。相对于图10-1,它含有两层因果关系。接下来主要以图10-2为例,说明路径图中一些基本概念。第28页2024/8/1829

目录上页下页返回结束

§10.1.1

路径图第29页2024/8/1830

目录上页下页返回结束

路径图上变量分为两大类:一类是外生变量(exogenousvariable,又称独立变量,源变量),它不受模型中其它变量影响,如图10-2中耐用性、操作简单性、通话效果和价格。与此相反,另一类是内生变量(endogenousvariable,又称因变量或下游变量),在路径图上最少有一个箭头指向它,它被模型中其它一些变量所决定,如图10-2中感知价值由耐用性、操作简单性、通话效果和价格四个变量和随机误差e5决定,忠诚度取决于四个外生变量、感知价值和随机误差e6。另外,我们能够将路径图中不影响其它变量内生变量称为最终止果变量(ultimateresponsevariable),最终止果变量不一定只有一个。图10-2中忠诚度是最终止果变量。第30页2024/8/1831

目录上页下页返回结束

其它变量(A)对内生变量(B)影响有两种情况:若A直接经过单向箭头对B含有因果影响,称A对B有直接作用(directeffect);若A对B作用是间接地经过其它变量(C)起作用,称A对B有间接作用(indirecteffect),称C为中间变量(mediatorvariable)。变量间间接作用经常由各种路径最终总合而成。图10-2中,四个外生变量耐用性、操作简单性、通话效果和价格既对忠诚度有直接作用,同时经过感知价值对忠诚度含有间接作用。第31页2024/8/1832

目录上页下页返回结束

假如模型中包含中间变量,首先从理论角度考虑,这个中间作用是否有理论依据,其次实际工作者会提出这么问题:“模型中中间变量中间影响显著吗?”,这些问题包括到对中间变量间接作用进行检验。Barron,R.M.&KennyD.(1986)提出了检验中间变量间接作用是否统计显著一个做法。他们利用基于普通最小二乘多元回归进行,以图10-2为例说明这种做法:第一步:用中间变量(感知价值)对外生变量耐用性、操作简单性、通话效果和价格四个变量进行回归;第二步:用内生变量(忠诚度)对第一步中四个变量进行回归;第三步:用忠诚度对第一步中四个变量以及中间变量感知价值进行回归。第32页2024/8/1833

目录上页下页返回结束

Agarwal,S.&Teas,R.K.(1997)工作表明“假如(a)在第一步预计中解释变量统计显著;(b)在第二步预计中解释变量统计显著;(c)在第三步预计中中间变量统计显著,则说明中间变量间接作用显著”.假设对图10-2进行间接作用检验,得到表10-1。第33页2024/8/1834

目录上页下页返回结束

对每一外生变量,存在三种可能中间结果:没有间接作用(nomediation),部分间接作用(partialmediation)和完全间接作用(fullmediation)。假如第一步中外生变量回归系数不是统计显著或者第三步中(中间变量)感知价值回归系数不显著,说明该外生变量不存在间接作用;假如某一外生变量(如耐用性、操作简单性和通话效果)在第一步和第三步中回归系数都是统计显著,说明该外生变量存在部分间接作用;假如某外生变量(价格)回归系数在第一步显著,而在第三步不显著,说明该外生变量存在完全间接作用。第34页2024/8/1835

目录上页下页返回结束

广义路径模型有两种基本类型:递归模型和非递归模型。两种模型在分析时有所不一样,递归模型能够直接经过最小二乘求解,而非递归模型求解比较复杂。尽管本章主要介绍基于最小二乘路径分析(即递归路径模型),但同时也要求读者能够预先正确判断一个模型所属类型,才能确保应用路径分析不会犯错。因果关系结构中全部为单向链条关系、无反馈作用模型称为递归模型(recursivemodel)。无反馈作用意味着,各内生变量与其原因变量误差项之间或各两个内生变量误差项之间必须相互独立。与递归模型相正确另一类模型称作非递归模型(nonrecursivemodel)。普通来说,非递归模型相对来说轻易判断,假如一个模型不包含非递规模型特征,它便是递归模型。第35页2024/8/1836

目录上页下页返回结束

假如一个路径模型包含以下四种情况,便是非递归模型。情况一:模型中任何两个变量之间存在直接反馈作用,在路径图上表示为双向因果关系。如图10-3(a)所表示。情况二:某变量存在本身反馈作用,即该变量存在自相关,如图10-3(b)所表示。第36页2024/8/1837

目录上页下页返回结束

情况三:变量之间即使没有直接反馈,不过存在间接反馈作用,即顺着某一变量及随即变量路径方向循序前进,经过若干变量后,又能返回这一起始变量,如图10-3(c)所表示。第37页2024/8/1838

目录上页下页返回结束

情况四:内生变量误差项与其它相关项相关,如结果变量误差项与其原因项相关(图10-3(d)),或者不一样变量之间误差项之间存在相关(图10-3(e))。第38页2024/8/1839

目录上页下页返回结束

使用最小二乘预计方法要求路径模型含有一些假设要求和限制,现在总结以下:

(1)首先要求模型中各变量函数关系为线性、可加;不然不能采取回归方法预计路径系数。假如处理变量之间交互作用,把交互项看作一个单独变量,此时它与其它变量函数关系一样满足线性、可加。

(2)模型中各变量均为等间距测度。尽管路径分析中通常会使用二分数据(dichotomiesdata)或者次序数据(ordinaldata),然而不能使用超出一个值虚拟变量,因为这会违反递归性要求。第39页2024/8/1840

目录上页下页返回结束

(3)每一内生变量误差项不得与其前置变量相关,同时也不得与其它内生变量及其误差项相关。这是对模型递归性要求。另外,模型不考虑外生变量相关性,即不对外生变量相关进行分析。(4)模型中因果关系必须为单向,不得包含各种形式反馈作用。这一样是对模型递归性要求。(5)各变量均为可观察变量,而且各变量测量不能存在误差。这两个弱点在SEM技术中得到了克服,已经发展了一套成熟处理隐变量和测量误差技术。(6)变量间多重共线性程度不能太高,不然路径系数预计值误差将会很大。(7)需要有足够样本量。Kline(1998)提议样本量个数应该是需要预计参数个数10倍(20倍愈加理想)。第40页2024/8/1841

目录上页下页返回结束

其中,(10.2)在上述假设下,采取最小二乘法能够很轻易求解各个参数值,见文件[3],而且能够单独对其中一个方程求解。上述假设条件用数学符号很轻易说明,但有些抽象。任何一个(递归)路径模型都能够用结构方程组表示,假设和分别为模型中内生和外生可观侧变量向量;是参系数矩阵,能够证实,若为路径递归模型,则总能够写为上三角矩阵。是参系数矩阵,e为内生变量所对应误差项,满足期望为零,两两不相关。则该路径模型结构方程组为:和

第41页2024/8/1842

目录上页下页返回结束

作为本节结束,我们需要提醒读者:一个好路径图并不意味着一定包含有尽可能多箭头;相反,统计学上最感兴趣情形是:应该寻找尽可能少箭头去联结尽可能少变量,而这时路径图又能对所代表样本拟合得好,即所谓模型简约性(parsimony),在后面相关模型拟合度检验中我们对这段话会有更深体会。第42页2024/8/1843

目录上页下页返回结束

路径分析技术是从分解相关系数发展出来,所以分解相关系数在路径分析中带有普通性意义,而且是路径分析中很主要一部分。经过对原因变量和结果变量相关系数分解,我们能够很清楚地看出造成相关关系各种原因。有时也包括到对回归系数分解,我们这里不进行介绍。下面以一例子说明相关系数分解过程。图10-4为一假想六个变量路径图:A,B,C为三个两两相关外生变量,A,B和残差项e4共同决定D,B,C,D和残差项e5决定E,最终,D,E和残差项e6影响最终止果变量F,共含有三层因果关系。对应于路径图,我们写出结构方程组:第43页2024/8/1844

目录上页下页返回结束

第44页2024/8/1845

目录上页下页返回结束

外生变量相关关系在图中表达,内生变量误差项之间独立,内生变量误差项与其前置变量之间独立。在式(10.3)中,假如路径系数p14,p24已知,则D方差能够从上式计算出大小。很轻易看出,对其它表示式存在一样结果,这里只是提醒读者,残差项路径系数由其它路径系数决定,而且该内生变量与其误差项相关系数即为误差项路径系数;另外,残差项路径系数可由多元回归决定系数计算出,它们之间关系为:

,详细证实可参考[8]。第45页2024/8/1846

目录上页下页返回结束

下面考虑相关系数分解,首先分解A,D之间相关系数,因为各变量均经过标准化处理,所以A,D相关系数

等于A,D乘积期望值。即(变量D用式10.3代替)第46页2024/8/1847

目录上页下页返回结束

第47页2024/8/1848

目录上页下页返回结束

第48页2024/8/1849

目录上页下页返回结束

第49页2024/8/1850

目录上页下页返回结束

第50页2024/8/1851

目录上页下页返回结束

第51页2024/8/1852

目录上页下页返回结束

经过上面对相关系数分解,我们能够总结出,相关系数分解可能产生四种类型组成部分:(1)直接作用;(2)间接作用;(3)因为原因变量相关而产生未析部分;(4)因为共同原因存在而产生伪相关部分。路径系数分解结果普通经过报表形式把各种作用展现出来,第五节实例分析会给读者提供一个报表形式。然而,假如按照上面步骤,相关系数分解将是非常繁琐。Wright提供了从路径图直接分解规则。Wright认为,对于一个递归性路径模型,任何两个变量相关系数都能够表示成连接这两点之间全部复合路径之和;而这个复合路径是按下述三个规则选取(Wright规则):第52页2024/8/1853

目录上页下页返回结束

(1)这个复合路径没有闭合环路;(2)在这个复合路径中箭头取向是不可有“先向前,再向后”,也就是说该路径链上不止两个箭头时,要“先向后”尽可能多次数,“再向前”尽可能少次数。(3)对于有多个双箭头链,只能够取最远距离一个双箭头。即一条路径中不能够包含两个双向箭头。结合Wright规则,在图10-5(a)中,若计算D和E相关系数,路径DCE是合理,而路径DCABCE则不能够(规则(1));在图10-5(b)中,若计算B和C相关系数,路径BAC是合理,而路径BDC则不能够(规则(2));在图10-5(c)中,若计算D和F相关系数,路径DACF是合理,而路径DABCF则不能够(规则(3))。第53页2024/8/1854

目录上页下页返回结束

第54页2024/8/1855

目录上页下页返回结束

第55页2024/8/1856

目录上页下页返回结束

第56页2024/8/1857

目录上页下页返回结束

路径分析流程图及SPSS指令分析流程图进行路径分析所使用SPSS指令第57页2024/8/1858

目录上页下页返回结束

分析流程图第58页2024/8/1859

目录上页下页返回结束

进行路径分析所使用SPSS指令下面以SPSSAmos模块为例说明路径分析实现过程;然而依据上面介绍,路径分析也能够利用回归分析手工完成。在AmosGraphics模块中,首先需要选择数据文件,在File菜单下,选择“DataFiles”给出需要进行分析文件名。然后绘出路径分析图:在Diagram菜单下,选择“DrawObserved”绘制观察变量;选择“DrawUnobserved”绘制不可观察变量,在路径分析中是残差项;选择“DrawPath”绘制两变量因果关系;选择“DrawCovariance”绘制两变量相关关系;然后对绘出各个变量指定变量名。第59页2024/8/1860

目录上页下页返回结束

进行路径分析所使用SPSS指令接着要指定残差项方差为1,选定某个残差项后,击右键,选择“ObjectProperties”后,在“Parameteres”下设定方差为1。并在菜单下View/Set下选择“AnalysisProperties”,在“Estimation”一项中选择预计方法为“Scale-freeleastsquare”,关闭该窗口。最终就能够点击Model-Fit菜单下选项“CalculateEstimates”计算路径系数了。能够经过三种方式察看结果:文字法,表格法和图表法。第60页2024/8/1861

目录上页下页返回结束

案例分析从对路径模型介绍能够知道,路径系数预计并不复杂,用普通多元回归方法就可实现。SPSS软件是一个能够选择软件,然而路径分析又不全部是靠软件实现,变量相关系数分解,对模型调试和检验经过手工就可完成。下面以详细实例说明路径分析整个实现过程。第61页2024/8/1862

目录上页下页返回结束

模型设定【例10.1】我们采取SPSS10.0自带数据文件Employeedata进行路径分析。该数据共有474个观察值,473个有效,标号为434出生日期缺失,在下面分析中,不考虑该样品;该数据包含10个变量:标号(id)、性别(gender)、出生日期(bdate,DateofBirth)、受教育水平(educ,EducationalLevel)、工作类别(jobcat,EmploymentCategory)、当前工资(salary,CurrentSalary)、初始工资(salbegin,BeginningSalary)、已经工作时间(jobtime,MonthssinceHire)、以前工作经验(preexp,PreviousExperience)、是否是少数民族(minority)。性别为属性变量,用“f”表示女性,“m”表示男性;受教育水平使用受教育年数衡量;工作类别分为三类:公务员(“1”),监督人(“2”)以及经理人员(“3”)。第62页2024/8/1863

目录上页下页返回结束

模型设定当前工资和初始工资以实际额为准。已经工作时间和以前工作经验均以发生月份衡量;是否是少数民族为0,1变量,1表示是少数民族,0表示非少数民族。假设数据采集时间为1997,则用1997减出生日期年份数作为年纪(age)衡量指标。比如若某人在1952年出生,则年纪测度为1997-1952=45。表10-2为样本相关系数矩阵。第63页2024/8/1864

目录上页下页返回结束

模型设定对标号、性别、民族不进行区分,关注其余7个变量之间因果关系。表10-2为这7个变量样本相关系数。依据时间和逻辑次序,我们得到几条因果路径:受教育水平影响初始工资和当前工资,因为大量统计结果表明,个人受教育水平越高,所取得工资也越高;同时也认为,一个人受教育水平越高,以前工作经验越多,他从事工作类别应该越高;另外,初始工资会影响工作类别,在相关系数矩阵中,我们已经看到二者相关系数较大;年纪影响已经工作时间以及以前工作经验,因为年纪越大,(在本职位)已经工作时间或者以前工作经验会越长;其次,年纪和受教育水平应该存在负相关,这里不关注二者因果关系,仅仅简单假设二者相关。第64页2024/8/1865

目录上页下页返回结束

模型设定最终,初始工资、工作类别、已经工作时间以及以前工作经验都影响当前工资,普通来说,初始工资越高,工作类别越高(按1,2,3次序),以前工作经验越多,时间越长,当前工资越高,这些变量间均应有正因果关系。依据这些逻辑理由,我们假设路径模型如图10-8所表示,不妨称此模型为模型1。很显然,模型1为递归路径模型,各外生变量不存在测量误差,假设各路径因果关系均为线性、可加,并深入假设各内生变量之间不存在相关关系。第65页2024/8/1866

目录上页下页返回结束

模型设定第66页2024/8/1867

目录上页下页返回结束

路径系数预计采取Amos软件对图10-8进行预计,输出结果如图10-9所表示。第67页2024/8/1868

目录上页下页返回结束

路径系数预计依据图10-9,我们发觉年纪对已经工作时间路径系数仅为0.003,为0.001,方程拟合效果不好;同时,以前工作经验对当前工资路径系数也很小。考虑删除上面两条路径以及残差项e6,并重新预计模型,结果如图10-10。第68页2024/8/18中国人民大学六西格玛质量管理研究中心69

目录上页下页返回结束

模型调试和检验假设图10-9对应模型是基准模型,图10-10对应模型为待检模型。下面分别计算基准模型和待检模型拟合指数和,对模型进行调试:

第69页2024/8/1870

目录上页下页返回结束

模型调试和检验

从而W统计量为:若基准模型正确,W服从自由度为2分布。这里Wp值为0.1891,统计不显著。能够认为图10-10对应模型正确。第70页2024/8/1871

目录上页下页返回结束

路径系数分解

表10-3是Amos软件总效应分解报表:表10-3路径系数分解报表原因变量结果变量总影响直接影响间接影响受教育水平初始工资0.5700.5700.000工作类别0.5300.1290.401当前工资0.6580.1960.462年纪以前工作经验0.8010.8010.000工作类别0.1230.0000.123当前工资0.0220.0000.022已经工作时间当前工资0.0840.0840.000以前工作经验工作类别0.1540.1540.000当前工资0.0280.0000.028初始工资工作类别0.7050.7050.000当前工资0.7690.6400.129工作类别当前工资0.1830.1830.000第71页2024/8/1872

目录上页下页返回结束

路径系数分解

能够看出,受教育水平对当前工资影响主要是经过工作类别和初始工资传递间接影响,教育水平对初始工资(工作)含有很大影响作用,但随即(直接)影响便较弱(0.196),这与我们常识相一致,初始工作可能取决于学历,然而以后主要看工作经历及个人能力了。年纪对当前工资影响主要经过工作类别和以前工作经验传递完成,它对当前工资影响为正。其它分析类似,读者不妨自己动手分析。

下面再举一个例子。第72页2024/8/1873

目录上页下页返回结束

路径系数分解

【例10.2】一家大型商业银行在多个地域设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目标贷款。今年来,该银行贷款额平稳增加,但不良贷款额也有较大百分比增加,这给银行业务发展带来较大压力。为搞清楚不良贷款形成原因,管理者希望利用银行业务相关数据做些定量分析,方便找出控制不量贷款方法。图10-11就是该银行所属25家分行年相关业务数据。第73页图10.11商业银行所属25家分行年相关业务数据2024/8/1874

目录上页下页返回结束

第74页2024/8/1875

目录上页下页返回结束

路径系数分解

注:不良贷款(y)、贷款余额(x1)、累计应收贷款(x2)、贷款项目个数(x3)和固定资产投资额(x4)依据经验可知,各项贷款余额越高则不良贷款越高,但同时,各项贷款余额也会受其它变量影响,所以综合考虑之下,本例应该建立以下路径分析模型:第75页2024/8/1876

目录上页下页返回结束

路径系数分解

下面考虑对该模型加以拟合,因为整个模型是一个递归模型,能够在SPSS中使用分别拟合回归方程方法来实现对模型中各参数预计,首先对各项贷款余额回归方程进行预计,结果见表10-4和10-5:表10-4第76页2024/8/1877

目录上页下页返回结束

路径系数分解

表10-5可见,应收贷款、贷款项目、固定资产均对各项贷款余额有影响。应收贷款、贷款项目则各项贷款余额越高。下面对第二个方程进行预计,参数结果见表10-6和表10-7:第77页2024/8/1878

目录上页下页返回结束

路径系数分解

表10-6表10-7第78页2024/8/1879

目录上页下页返回结束

路径系数分解

固定资产和各项贷款对不良贷款有影响,而应收贷款、贷款项目对其影响不显著。从上面分析可知,假如只是拟合第二个方程,则所得结果其实就是一个简单多重回归方程结果,而且可知自变量间存在共线性。显然,对于不良贷款而言,使用路径分析并不会使得模型对最终止果变量预测愈加准确。但经过对自变量间复杂关联刻画,路径分析模型能够很准确地预计出每一个自变量终究是经过那些方式来作用于最终因变量,从而使得研究者对问题了解愈加深入和全方面。经过上面分析,能够将上述模型加以简化,去除那些无统计意义变量后重新加以拟合,分析结果见表10-8和表10-9:第79页2024/8/1880

目录上页下页返回结束

路径系数分解表10-8表10-9第80页2024/8/1881

目录上页下页返回结束

路径系数分解可见方程决定系数基本未变,自变量都有统计学意义。显然,化简后路径分析模型对数据解释程度与前一个模型相比无显著差异,但愈加简练。本例所拟合路径分析模型能够使用标准化系数绘制出路径如图10-12.图10-12第81页结构方程模型第82页2024/8/1883目录上页下页返回结束结构方程模型结构方程模型SEM(structuralequationmodeling)是近二十年应用统计学领域中发展最为快速一个分支。它是一个实证分析模型,经过寻找变量间内在结构关系,去验证某种结构关系或模型假设是否合理,模型是否正确,而且假如模型存在问题,能够指出怎样加以修改。结构方程模型另一大特点是能够对隐变量(latentvariables)进行分析。多元回归分析、因子分析和路径分析等都可看成是结构方程模型一个特例。现实生活中,有许多变量诸如健康、优异、乐观、智力、满意、公正等概念即使是客观存在,但因为人认识水平或事物本身抽象性、复杂性等原因,我们是无法直接测量,我们称这么变量为隐变量。结构方程能够经过一些可观察变量对这些隐变量特征及其相互之间关系进行描述,所以,有时也称结构方程模型为隐变量分析模型。第83页2024/8/1884目录上页下页返回结束结构方程模型结构方程模型应用始见于20世纪60年代发表论文中,1987年Loehlin用路径分析模型和结构方程模型对隐变量模型作了出众介绍,两年之后Bollen提出了处理测量误差模型更专门化统计方法。到了90年代,结构方程模型得到了广泛应用。当前,结构方程模型已发展成内容非常丰富一个主要领域,在此,仅介绍结构方程模型一些基本内容,有兴趣读者能够深入参阅相关书籍。第84页2024/8/18中国人民大学六西格玛质量管理研究中心85目录上页下页返回结束结构方程模型基本思想结构方程模型是反应隐变量和显变量一组方程,其目标是经过显变量测量推断隐变量,并对假设模型正确性进行检验。结构方程模型是模型验证技术。即利用结构方程模型分析过程实际上是对假定模型验证过程。对于某个领域专业人员依据本事域知识或常识建立反应结构关系模型,因为专业人员认识水平和各种原因限制,这一模型未必是客观现实反应,有可能存在偏差和主观性,怎样发觉模型问题,怎样依据分析结果深入修正模型,这些正是结构方程模型能够处理问题。第85页2024/8/1886目录上页下页返回结束详细来说,结构方程模型分析过程是:在设定结构模型基础上,为证实模型准确性,首先要判断这些方程是否可识别模型,对于可识别模型,经过搜集显变量数据,利用最大似然预计(maximumlikelihood)或广义最小二乘预计(generalizedleastsquares)等预计方法对未知参数进行预计。对于模型结果,需要对模型与数据之间是否拟合进行评价。假如,模型与数据拟合得不好,就需要对模型进行修正,重新设定模型,一个拟合很好模型往往需要重复试验屡次。在进行模型预计之前,研究者需要依据专业知识或经验设定假设初始模型。而结构方程模型主要用途即为确定该假定模型是否合理。第86页2024/8/1887目录上页下页返回结束结构方程模型通常是借助路径图将初始模型描述出来,对于复杂模型尤其如此。这里从与结构方程结合角度,对上一章内容简单回顾一下,并在此基础上看怎样得出结构方程模型。路径图中变量能够是不一样类型,按能否被直接测量,路径图中变量能够分为显变量(manifestvariable)和隐变量(latentvariable)。通常前者是能够直接测量,在图中用方框来标识;而后者即使是客观存在,但因为人认识水平或事物本身抽象性、复杂性等原因,我们无法直接测量,通惯用椭圆形框来标识。

第87页2024/8/1888目录上页下页返回结束按照变量之间关系,又可分为外生变量(exogenousvariable)和内生变量(endogenousvariable),内生变量是由隐变量决定变量,外生变量是由显变量决定变量。变量之间关系用线条表示,能够是直接作用也能够是间接作用,当二者之间有直接联线时,称为直接作用。假如变量之间没有直接联线则是假设变量之间没有直接联络,但能够经过其它变量发生联络,称之为间接联络。线条既能够加单箭头,也能够加双箭头。单箭头表示存在因果关系,双箭头则表示含有相关关系。

第88页2024/8/1889目录上页下页返回结束下面用一个详细事例来看一下路径图,然后在此基础上写出结构方程模型。这是Wheatonetal在1977年给出一个广为人知例子。这是一个测度“神精错乱平稳性”例子,在他给出数据集中使用了Illinois农村地域932个人调查数据,调查了六个变量:y1:1967年异常程度;y2:1967年软弱程度;y3:1971年异常程度;y4:1971年软弱程度;x1:受教育情况(上年数);x2:当地社会经济指数。第89页2024/8/1890目录上页下页返回结束第90页2024/8/1891目录上页下页返回结束第91页2024/8/1892目录上页下页返回结束路径图实际上提供了一个假设模型,它表达了隐变量与隐变量之间、隐变量与显变量之间(包含内生隐变量与显变量和外生隐变量与显变量之间)可能存在关系,而且,这种关系详细程度,能够经过路径系数来反应。在这些变量中,显变量是能够观察,而每个隐变量都对应着几个显变量,如上图中隐变量“社会经济情况”就对应着两个显变量“受教育情况”和“社会经济指数”。给出路径图后,我们就能够对这些假设结构关系,利用显变量数据,经过建立结构方程模型,深入检验模型假设合理性并确定模型中路径系数。第92页2024/8/1893目录上页下页返回结束结构方程模型结构结构方程模型普通由测量方程(MeasurementEquation)和结构方程(StructuralEquation)两部分组成。测量方程描述潜变量与指标之间关系;结构方程则反应潜变量之间关系。指标含有随机误差和系统误差。前者指测量上不准确性行为,后者反应指标同时测量潜变量以外特征。随机误差和系统误差统称为测量误差,但潜变量则不含这些误差。第93页2024/8/1894目录上页下页返回结束第94页2024/8/1895目录上页下页返回结束第95页2024/8/1896目录上页下页返回结束第96页2024/8/1897目录上页下页返回结束结构方程模型优点(1)能同时处理多个因变量。结构方程模型可同时考虑并处理多个因变量。而回归分析中,只能处理一个因变量,假如有多个因变量需要处理,则需要分别计算,这么在计算一个因变量时,就忽略了其它因变量存在及影响。第97页2024/8/1898目录上页下页返回结束(2)允许自变量和因变量均包含测量误差。从测量方程中可看到,很多变量如学业成绩、社会经济地位等潜变量观察值不能用单一指标来测量,往往还包含了大量测量误差。从结构方程模型特点看出:结构方程分析允许自变量和因变量均含有测量误差。而回归分析只允许因变量存在测量误差,假定自变量没有误差。(3)预计整个模型拟和程度。在传统路径分析中,我们只预计每条路径变量间关系得强弱。在结构方程分析中,能够经过结构方程软件LISREL计算出多个拟和参数值,能够判断不一样模型对同一个样本数据整体拟和程度,从中选取最准确模型描述样本数据体展现特征。第98页2024/8/1899目录上页下页返回结束结构方程模型构建

由上一节介绍结构方程模型结构模式能够看出,结构方程模型普通由测量方程(MeasurementEquation)和结构方程(StructuralEquation)两部分组成。要很好完成这两部分结构,关键是利用结构方程模型中分析变量(包含显变量和隐变量)关系,依据相关领域专业知识和研究目标,构建出理论模型,然后用测得数据去验证这个理论模型合理性。下面以一经典实例来说明模型建立过程。第99页2024/8/18100目录上页下页返回结束第100页2024/8/18101目录上页下页返回结束结构方程模型构建

(1)结构方程建立依据模型假设条件能够建立反应隐变间关系路径图,见图11-2。第101页2024/8/18102目录上页下页返回结束结构方程模型构建

第102页2024/8/18103目录上页下页返回结束结构方程模型构建

(2)测量方程建立。依据模型假设条件能够建立反应显变量和隐变量关系路径图,如图11-3、图11-4、图11-5所表示。第103页2024/8/18104目录上页下页返回结束结构方程模型构建

第104页2024/8/18105目录上页下页返回结束结构方程模型构建

第105页2024/8/18106目录上页下页返回结束结构方程模型构建

至此,测量方程和结构方程都得到了建立,整个结构方程模型也得以建立。当然,初始建立理论模型有可能不是较理想模型,需要在数据拟合过程中重复修改,直到建立较理想模型。第106页2024/8/18107目录上页下页返回结束结构方程模型预计

第107页2024/8/18108目录上页下页返回结束结构方程模型预计最常见预计方法有没有加权最小二乘法(ULS)、广义最小二乘法(GLS)和最大似然预计(ML)。每种计算方法都是要找到参数预计使得拟合损失函数到达最小。拟合损失函数是度量观察样本协差阵和参数预计给出预测协差阵之间差异程度函数。ML方法对于多数应用问题尤其是考虑到统计问题时是首选方法。GLS通常得出与ML方法类似结论。ML和GLS这两种方法在不考虑协差阵尺度时是适用,而且需要显变量是连续和多元正态。这是因为变量偏态或高峰度会造成很差预计及其不正确标准误和较高卡方值。ULS方法适合用于仅当这些变量是可比较尺度上被测量时得到协差阵,不然ULS方法使用相关阵。若预测或观察协差阵是奇异,则不能使用ML和GLS这两种方法,这时要么去掉线性相关变量,要么用ULS方法。第108页2024/8/18109目录上页下页返回结束结构方程模型计算机实现

当前,国际上一些著名软件企业都推出了利用结构方程模型进行统计分析计算机应用软件,比如瑞典阿帕萨拉大学(TheUniversityofUppsala,Sweden)乔瑞斯考格(KarlG.Joreskog)和索尔波姆(DagSorbom)专门为进行结构方程模型分析所编写LISREL软件、以及我们所熟悉SAS软件中CALIS和SPSSAMOS等等,这么,我们就能够很方便利用结构方程模型来处理各领域问题。依据我国统计软件应用情况,在这里主要对国内比较流行SAS软件中CALIS和LISREL软件进行介绍。第109页2024/8/18110目录上页下页返回结束结构方程模型计算机实现

11.5.1结构方程模型分析流程依据前面关于结构方程模型分析过程分析,利用结构方程模型进行分析结构流程图以下,这是我们进行计算机实现基础:第110页2024/8/18111目录上页下页返回结束结构方程模型计算机实现

从这一流程图能够看出,在利用结构方程模型进行分析时,首先要对分析实际问题进行模型设定,这一模型建立好坏直接影响深入分析。要想建立一个好模型往往需要研究人员对研究对象有比较透彻了解,搞清指标之间关系,为了使模型建立更直观,并深入写出结构方程模型,往往借助路径图;接下来,就需要对建立模型进行模式识别,看建立模型属于恰好识别结构模型、识别不足结构模型还是过渡识别结构模型,只有可识别模型才能够进入下一个步骤;第111页2024/8/18112目录上页下页返回结束§11.5结构方程模型计算机实现

对于可识别模型就能够利用下面将要介绍相关软件预计结构方程模型中相关参数并给出相关检验参数;利用这些参数,就能够对模型进行评价,依据相关指标标准,评价模型是否需要深入修正;假如模型不需要修正,就能够对模型进行应用。对于需要修正模型,需要回到模型设定阶段,再按上面过程逐步进行,直到模型不需要修正、能够应用为止。第112页2024/8/18113目录上页下页返回结束结构方程模型计算机实现

SAS中CALIS过程介绍SAS/STAT软件6.06版本以后新增加了线性结构方程组协方差过程CALIS(covarianceanalysisoflinearstructuralequation),该过程能够经过协方差结构分析,来预计参数并检验结构方程正确性。在SASCALIS过程中,又提供了各种模型来建立结构方程模型,如RAM模型、LINEQS模型、LISREL模型等,在此介绍RAM模型,其它模型请参看相关书籍。

第113页2024/8/18114目录上页下页返回结束结构方程模型计算机实现

1、路径图描述CALIS中RAM语句能够方便地描述路径图,假定有n个显变量,按它们在SAS数据集中次序用整数1,2,3,…,n编号。每个箭头便可由路径图中它所连接两个变量编号所确认,RAM语句包含了路径图中全部箭头说明,说明之间用逗号隔开,每一说明项包含3或4个数字或可选择一个名字,次序以下:第114页2024/8/18115目录上页下页返回结束结构方程模型计算机实现

(1)箭头有几个;(2)箭头指向变量编号,若是双箭头则为任意变量编号;(3)箭头出发变量编号,若是双箭头则取另一变量编号;(4)箭头表示系数、(协)方差值;(5)若箭头代表参数待估,这写上名字,这时前一个数字表示参数初始值。若箭头代表一个常量,能够省略名字;若用名字,第4个数字能够省略。第115页2024/8/18116目录上页下页返回结束结构方程模型计算机实现

2、选择预计方法CALIS提供三种预计方法,能够用选项METHOD=来要求:ULS没有加权最小二乘预计GLS广义最小二乘预计ML多元正态分布最大似然预计

第116页2024/8/18117目录上页下页返回结束结构方程模型计算机实现

没有尤其要求时(即缺省时)预计方法使用METHOD=ML,因为ML对于多数统计问题是首选方法。比如,对于前面我们已经给出例子,假如选择广义最小二乘法作为预计方法时,可使用语句proccaliscovdata=wheatonmethod=glstech=lmedf=931;其中proccalis是调用SAS中CALIS过程,选项cov要求对协方差阵进行分析,没有cov选项时则计算和分析相关阵;而data=wheaton是调用我们分析所用数据库(注:这是SAS自带数据库);选项tech=lm代表是使用Levenberg-Marquandt或Newton-Raphson最优化方法,这里使用是后者;选项edf=931指明了自由度个数,即931个样本数据。

第117页2024/8/18118目录上页下页返回结束结构方程模型计算机实现

依据这些要求,表11-1语句给出了上例中“神经错乱”数据RAM结构模型(注意表11-1中第五列给出字母与图11-1中稍有不一样)。其中Vnames1F1-F3,2E1-E6D1-D3;给出了隐变量和误差变量名字。拿ram语句第一行来说明路径图描述,即该箭头为单箭头,从变量7出发,指向变量1,箭头表示系数值为1。第118页2024/8/18119目录上页下页返回结束结构方程模型计算机实现

经过运行上面程序,输出结果11-1(这里仅给出了检验结果,读者运行时还会看到反应变量关系其它结果,在此不一一列出),能够经过这一结果对模型正确性进行判断。第119页2024/8/18120目录上页下页返回结束结构方程模型计算机实现

LISREL软件介绍LISREL(linearstructuralrelations)是专门为进行结构方程分析而编写统计分析软件。与SAS软件中CALIS有所不一样是,LISREL路径图能够在输出结果中直观给出,并能够在图形窗口进行编辑和修改。LISREL能够在图形窗口进行编辑和修改路径图。用光标点击命令行pathdiagram或对应图标,即进入图形窗口。在图形窗口命令行点击model,能够选择显示不一样图形。对模板图形进行修改和变动,能够得到所需路径图。图形窗口命令行其它命令用途分别是:exit退出该窗口,kind调出其它统计结果方便对路径图进行修改,options修改统计数值得小数位显示长度,print打印路径图,zoom对路径图进行放大和缩小,re-estimate是依据统计分析结果对路径图进行修改之后再次运行预计程序。第120页2024/8/18121目录上页下页返回结束结构方程模型计算机实现

首先,需要编写并运行程序命令。LISREL程序包含一子程序PRELIS,该子程序对结构方程模型数据进行预处理。该程序包含多个指令,指示原始数据出处以及变量信息和结果存入。表11-2以程序形式简略给出了PRELIS基本指令。第121页2024/8/18122目录上页下页返回结束结构方程模型计算机实现

原始数据经过预处理能够得到其协方差矩阵。依据协方差矩阵开始编写LISREL程序。如表11-3所表示。第122页2024/8/18123目录上页下页返回结束§11.5结构方程模型计算机实现

第123页2024/8/18124目录上页下页返回结束结构方程模型计算机实现

LISREL能够提供结果路径图而且能够在图形窗口进行编辑和修改路径图。用光标点击命令行pathdiagram或对应图标,即进入图形窗口。在图形窗口命令行点击model,能够选择显示不一样图形(x模型、y模型和结构模型)。因为篇幅所限,对LISREL介绍只限于此。有兴趣读者请参阅相关LISREL软件书籍或该软件命令行中help。第124页2024/8/18125目录上页下页返回结束一个实例

为了使读者对结构方程模型实际应用过程有一个总体把握,本章引用了一个利用结构方程模型处理问题真实案例供读者参考。此案例是RichardRosenfeld;StevenFMessner;EricPBaumer等人将社会资本作为隐变量,考查社会资本(socialcapital)和社会谋杀率(homiciderate)之间结构关系。第125页2024/8/18126目录上页下页返回结束一个实例

社会资本与谋杀率之间假定关系如图11-7所表示,依据RobertPutnam对社会资本定义,社会资本指是社会组织特点,比如社会网络、社会标准、信任、为共同利益而采取行动和合作。所以Rosenfeldetal对社会资本评价着重考虑了两个方面:人与人之间信任(trust)和公众对公共事业参加(civicengagement)。为何社会资本与社会谋杀率之间存在联络呢?主要从经典犯罪学三个方面来考虑:社会控制力度(informalandformalsocialcontrol)、道德水准下降程度(anomie)和社会压力(strain)。社会资本改变对上述三个原因产生影响,从而影响了谋杀率高低。对模型中人与人之间信任和公众对公共事业参加两个外生变量数量化采取了GSS(generalsocialsurvey)数据,如表11-4所表示。第126页2024/8/18127目录上页下页返回结束一个实例

第127页2024/8/18128目录上页下页返回结束一个实例

为了得到无偏预计,影响谋杀率其它原因必须考虑在模型之内。依据以前关于谋杀率模型研究并经过主成份分析,得到了两个主要因子。第一个因子定义为“剥夺”(deprivation),对应“人口结构”(populationstructure)、年纪组成(agecomposition)、失业率(unemployment)、男性离婚率(maledivorce)和南方州(south)为其它几个因子。第128页2024/8/18129目录上页下页返回结束一个实例

依据LISREL8.14,并采取极大似然预计对上述所讨论模型进行预计。文中比较了两个模型:模型1没有将隐变量社会资本加入模型;模型2则考虑了社会资本。如表11-5所表示:第129页2024/8/18130目录上页下页返回结束一个实例

从模型2拟合指数能够看出模型拟合很好,均方根残差RMSEM也表明模型拟合很好。将社会资本加入模型提升了谋杀率解释方差。接下来做是考虑一个递归模型,即认为社会资本和谋杀率之间作用是相互,而且在新模型中对老模型作了一些修改,将不显著变量年纪组成和失业率去掉,结果如表11-6所表示。路径图如图11-8所表示。第130页2024/8/18131目录上页下页返回结束一个实例

第131页第132页聚类分析第133页聚类分析概述概念:聚类分析是统计学中研究“物以类聚”一个方法,属多元统计分析方法.比如:细分市场、消费行为划分聚类分析是建立一个分类,是将一批样本(或变量)按照在性质上“亲疏”程度,在没有先验知识情况下自动进行分类方法.其中:类内个体含有较高相同性,类间差异性较大.第134页聚类分析概述两类:(AB)(CDE)三类:(AB)(C)(DE)依据平均得分差距,差距较小为一类.分类过程中,没有事先指定分类标准.完全依据样本数据客观产生分类结果.第135页亲疏远程度衡量指标相同性:数据间相同程度度量距离:数据间差异程度度量.距离越近,越“亲密”,聚成一类;距离越远,越“疏远”,分别属于不一样类定距型个体间距离:把每个个案数据看成是n维空间上点,在点和点之间定义某种距离.普通适合用于定距数据欧氏距离(EUCLID)平方欧氏距离(SEUCLID)聚类分析概述第136页品质型个体间距离姓名讲课方式上机时间选某门课程张三1

1

1李四110王五001聚类分析概述第137页品质型个体间距离简单匹配(simplematching)系数:适用二值变量。个体j个体i101ab0cda为个体i与个体j在全部变量上同时取1个数;d为同时取0个数特点:排除同时拥有或同时不拥有某特征情况;取0和1地位等价,编码方案改变不会引发系数改变。聚类分析概述第138页品质型个体间距离简单匹配(simplematching)系数:适用二值变量。姓名讲课方式上机时间选某门课程张三1

1

1李四110王五001(张三,李四):a=2b=1c=0d=0d(x,y)=1/(1+2)=1/3(张三,王五):a=1b=2c=0d=0d(x,y)=2/(1+2)=2/3张三距李四近聚类分析概述第139页品质型个体间距离依据临床表现研究病人是否有类似病姓名性别发烧咳嗽检验1检验2检验3检验4张三男101000李四女101010王五男110000……..聚类分析概述第140页品质型个体间距离雅科比(Jaccard)系数:适用二值变量个体j个体i1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论