多元数据的数字特征与相关分析_第1页
多元数据的数字特征与相关分析_第2页
多元数据的数字特征与相关分析_第3页
多元数据的数字特征与相关分析_第4页
多元数据的数字特征与相关分析_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章第三节一、二元数据数字特性二、多元数据数字特性三、总体数字特性和有关矩阵多元数据特性与有关分析10/10/2023第1页多元数据数字特性与有关分析以上我们分析都是一元数据,但在实际中,人们更多遇到是多元数据对于多元数据,除分析各变量取值特点外,更要分析各个变量之间有关关系10/10/2023第2页二元数据数字特性及有关系数设是二元总体,从中取得观测数据

引进数据观测矩阵记10/10/2023第3页则,称为二元观测数据均值向量。记二元数据数字特性及有关系数10/10/2023第4页协方差矩阵有由Schwarz不等式因此S总是非负定,一般是正定。二元数据数字特性及有关系数10/10/2023第5页观测数据有关系数(Pearson)计算公式是

由Schwarz不等式,有

即总有二元数据数字特性及有关系数10/10/2023第6页二元数据数字特性及有关系数10/10/2023第7页设二元总体分布函数是;总体协方差是;,是X、Y方差。由于观测数据有关系数是总体有关系数相合估计,故当n充足大时,有二元数据数字特性及有关系数10/10/2023第8页由二元观测数据

能够算得有关系数,但当二元总体两个分量不有关,即时,有关系数是没有实际意义。因此,需要做假设检查:二元数据数字特性及有关系数10/10/2023第9页能够证明,当是二元正态总体,且成立时,统计量:服从自由度为分布。设由实际观测数据算得有关系数值为,又按上述公式算得到值是,则值为二元数据数字特性及有关系数10/10/2023第10页对给定显著水平,当,回绝;而当,接收。当回绝时,以为算得有关系数有实际意义。二元数据数字特性及有关系数10/10/2023第11页Spearman有关系数秩设其次序统计量是若,则称是在样本中秩,记作例:-0.8,-3.1,1.1,-5.2,4.2次序统计量是-5.2,-3.1,-0.8,1.1,4.2而秩统计量是3,2,4,1,5当观测数据中有两个观测值相等,则对应秩统计量不能唯一确定,一般对相同观测值,其秩取为他们秩平均值。10/10/2023第12页Spearman有关系数对于二元总体样本观测数据,可得各分量一元样本数据与。设秩统计量是秩统计量是当联系比较紧密时,这两组秩统计量联系也是紧密。Spearman有关系数定义为这两组秩统计量有关系数,即Spearman相关系数是10/10/2023第13页Spearman有关系数其中由秩定义可知,同理,通过某些运算,可证其中10/10/2023第14页例1某种矿石有两种有用成份A,B。取10个标本,分析每个标本中成份A含量百分数x(%)及y(%)数据如下:X(%)67547264392258434634Y(%)2415231916112016171310/10/2023第15页PROCCORRPROCCORR选项串;VAR变量名称串;WITH变量名称串;PARTIAL变量名称;WEIGHT变量名称;FREQ变量名称;BY变量名称串;10/10/2023第16页PROCCORR选项串第一类选项:界定输出输入文献名称:1DATA=输入文献名称省略时犹如其他过程2OUTP=输出文献名称具有Pearson极差有关系数之矩阵、各变量平均数、标准差、观测体个数;3OUTS=输出文献名称具有Spearman极差有关系数之矩阵、各变量平均数、标准差、观测体个数;10/10/2023第17页第二类选项:界定测量关系强度办法,内置值是Pearson:1PEARSON:要求计算积差有关系数,这也是此类内置值;如要同步计算SPEARMAN、KENDALL、HOEFFDING等则必须选用PEARSON;2SPEARMAN:若选此项,则不可同步选用WEIGHT指令;

PROCCORR选项串10/10/2023第18页第三类选项:界定输出COV:要求计算协方差矩阵Nosimple:指明不输出每个变量简单描述性统计量值。PROCCORR选项串10/10/2023第19页VAR变量名称串可在本指令中列举被分析变量。若省略此变量,则对所有数值变量进行分析。WITH变量名称串须跟VAR指令联用,WITH指令中列举m个变量,与VAR指令中列举n个变量,将联合产生m*n矩阵。若只选用VAR指令而忽视WITH指令,则产生n*n正方对称矩阵。PROCCORR选项串10/10/2023第20页10/10/2023第21页10/10/2023第22页多元数据数字特性与有关矩阵X协方差矩阵:S有关矩阵:R关系:R=D-1/2SD-1/2对于SPEARMAN系数,同样有类似东西样本均值向量\协方差矩阵\有关矩阵是总体均值向量\协方差矩阵\有关矩阵相合(一致性)估计10/10/2023第23页是

元总体,样本数据第i个观测数据,称样品观测矩阵第i行组成量有

1)第行均值2)第行方差多元数据数字特性与有关矩阵10/10/2023第24页Spearman有关系数,Spearman有关矩阵

Spearman有关矩阵具有稳健性数据观测矩阵数据标准化处理样品,变量观测数据协方差阵即有关阵.10/10/2023第25页(3)协方差均值向量协方差矩阵

(4)有关系数有关矩阵非负定矩阵

刻画变量之间线性联系密切程度.10/10/2023第26页1.3.3总体数字特性及有关矩阵元总体.总体分布函数总体概率密度总体均值向量总体协方差矩阵设有关系数为总体有关矩阵10/10/2023第27页设1)尤其

2)尤其分别是相合估计,当充足大时,简单随机样本①与总体有相同分布;②是互相独立元随机向量.

10/10/2023第28页无偏估计分别是:证

记对于随机向量,总有故,可证(自证)故得从而是相合估计:10/10/2023第29页

例1.23对某少数民族21位同袍测量血液中四种成份,含量,成果如下:求无偏估计.解由PROCCORR过程,计算得到x1x2x3x4118.828.15.135.1217.425.64.933.931627.4532.2419.329.51.729.1517.427.44.535.6615.325.33.632.3716.725.84.433817.426.74.433916.225.72.333.91016.726.76.4351118.2283.229.71216.726.72.134.91318.126.74.331.51416.726332.71518.130.2734.91620.230.54.834.41720.229.55.536.21821.531.55.836.51918.830.65.435.42021.627.84.834.12121.329.55.835.810/10/2023第30页例1.24(续例1.23)对例1.23数据,计算中位数向量有关矩阵及Spearman有关矩阵并进行分析

.解由PROCCORR过程,算得及对应p值如下:若取,其值,以为与,与,与有关,其有关系数无显著统计意义.1.000000.00.766060.00010.349880.12000.336490.13580.766060.00011.000000.00.431650.05070.340330.13120.349880.12000.431650.05071.000000.00.614960.00300.336490.13580.340330.13120.614960.00301.000000.010/10/2023第31页Spearman有关矩阵及对应值

取,元素对应值皆不大于,故以为具有

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论