1.3 多维数据的数字特征及相关分析_第1页
1.3 多维数据的数字特征及相关分析_第2页
1.3 多维数据的数字特征及相关分析_第3页
1.3 多维数据的数字特征及相关分析_第4页
1.3 多维数据的数字特征及相关分析_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

复习1.2数据分布

常见分布—正态分布,Weibull分布等、直方图、经验分布函数、QQ图茎叶图拟合检查:正态性W检查

数据分布拟合检查—检查法、经验分布拟合检查法10/10/20231第1页1.3多维数据数字特性及有关分析基本内容二维总体数字特性观测数据协方差Pearson有关系数Spearman有关系数SAS系统corr过程

p维总体数字特性有关系数矩阵随机向量性质多维正态分布

观测数据协方差Pearson有关矩阵

Spearman有关矩阵proccorr过程1.3.1二维数据数字特性及有关系数1.3.3多维数据数字特性及有关矩阵1.3.2多维总体数字特性、有关矩阵及多维正态分布10/10/20232第2页一.二维数据数字特性及有关系数

总体(X,Y)T分布函数F(x,y)

,方差Var(X),Var(Y),协方差Cov(X,Y),有关系数

1.3.1二维数据数字特性

——称不有关10/10/20233第3页

当X与Y互相独立时,二维数字特性性质(1)(2)

(3)

10/10/20234第4页二.观测数据协方差、Pearson有关系数

总体(X,Y)T,观测数据

,1.观测数据协方差——观测矩阵——样本方差、协方差——均值

,10/10/20235第5页由Schwarz不等式知

注意:散点图见书图1.11——协方差矩阵,为对称非负定2.观测数据Pearson有关系数

——Pearson有关系数(Schwaraz不等式)10/10/20236第6页可证,当(X,Y)T为二维正态3.二维随机变量有关性检查n充足大时

观测数据

假设检查

统计量如|t|过大,回绝假设,以为X与Y有关.回绝域检查p值

给定,当,回绝H0.以为X与Y有关,Pearson有关系数反应两变量线性关联性强弱.不然,以为不有关.10/10/20237第7页1.秩统计量三.Spearman有关系数

总体X,观测值定义:秩统计量

观测值-0.8,-3.1,1.1,-5.24.2次序统计量-5.2,-3.1,-0.8,1.1,4.2

如-0.8,-3.1,-0.8秩统计量2,1,3或3,1,2记为2.51,2.5秩统计量

3,2,4,1,5

次序统计量

注意:为确保秩统计量唯一性,要求:相同观测值,秩统计量取应排序平均值。10/10/20238第8页分量X,Y一元样本数据

当X,Y有关性较强,则两组秩统计量有关性也较强

2.Spearman有关系数总体(X,Y)T,观测数据

秩统计量分别是

定义:Spearman有关系数

其中

计算得

10/10/20239第9页基于Spearman有关系数假设检查

统计量

给定

,当

,回绝H0.不然,接收H0以为不有关.检查P值四.SAS系统proccorr过程10/10/202310第10页例1.920个随机选用黄麻个体植株,统计青植株重量Y与干植株重量X.设(X,Y)T服从正态分布,数据:(1)求二维观测数据均值向量和协方差矩阵;

(2)计算Pearson有关系数并检查假设;

解:(3)计算Spearman有关系数并检查上述假设.

x6863706659101220303327215142717536265y97189211258293111216332131537546235230584229332185703872740

dataexamp1_9;inputxy@@;cards;689716389270112568265931911210162123212031530375334622735221305584142292733217185537036287265740;run;proccorrdata=examp1_9pearsonspearmancov;

/*方差描述性过程,输出PearsonSpearman有关矩阵,协方差阵*/

run;10/10/202311第11页例1.9成果输出

CORR过程

2变量:xy

协方差矩阵S,自由度n-1=19xyx570.45007845.0789y7845.0789112404.2632

简单统计量

变量N均值标准偏差中位数最小值最大值x2033.8500023.8841027.000005.0000070.00000y20477.50000335.26745342.0000082.000001125

Spearman有关系数,N=20当H0:Rho=0时,Prob>|r|xyx1.00000

=0.97366<.0001y0.973661.00000<.0001

Pearson有关系数,N=20当H0:Rho=0时,Prob>|r|xyx1.00000=0.97971有关性显著

p<.0001y0.979711<.0001

Spearman有关系数,N=20当H0:Rho=0时,Prob>|r|xyx1.00000

=0.97366

有关性显著

p<.0001y0.973661.00000<.000110/10/202312第12页成果分析:

(1)利用proccorr过程,得

(2)数据Pearson有关系数(3)数据Spearman有关系数

检查p值均

X与Y有关性高度显著.10/10/202313第13页1.3.2多维总体数字特性、有关矩阵及多维正态分布

一.p维总体数字特性、有关系数矩阵分布函数p维总体

连续总体概率密度均值向量总体协方差矩阵10/10/202314第14页注意:1.为有关系数2.总是非负定。总体有关矩阵

10/10/202315第15页二.随机向量性质

(1)A—常量矩阵,常向量,则(2)B—常量矩阵10/10/202316第16页三.多维正态分布

1.二维正态分布及性质其中

10/10/202317第17页2.p维正态分布——服从p维正态分布,密度

——协方差阵——均值向量10/10/202318第18页(1)线性组合为正态分布(2)分量为正态分布

(3)分量独立不有关

多维正态分布性质为最大似然估计独立10/10/202319第19页一.样本观测数据协方差、有关矩阵

p维总体:

数据协方差、方差均值向量协方差矩阵——样本观测数据矩阵1.3.3多维数据数字特性及有关矩阵10/10/202320第20页有关系数Pearson有关系数矩阵为对角阵,且注意:1.2.R与S相同,且非负定.——Spearman有关系数矩阵其中为X列数据Spearman有关系数10/10/202321第21页

注意:1.Spearman有关矩阵适用于研究具一般分布p维总体,且对异常值具有耐抗性;2.原数据有关系数矩阵即为标准化数据协方差阵.对j个变量(j列)数据标准化,得标准化数据矩阵其中:从而3.n充足大时,有

标准化处理后n个样品10/10/202322第22页

例1.10

测20名中年人3个生理指标:体重(X1)、腰围(X2)、脉搏(X3);3个训练指标:引体向上次数(X4)、仰卧起坐次数(X5)、跳跃次数(X6).观测数据见书表1.2:解:程序:

二.SAS系统proccorr过程data

exam1_10;inputx1-x6;cards;191365051626018937522110601933858121011011623562121053718935461315558182365641014221138568101381673460612540176317415200401543356172512501693450171203816633521321011515434641421510524746501505019336466703120237621221012017637544602515732521123080156335415225731383368211043;proccorrdata=exam1_10covpearsonspearman;/*调用Corr过程,输出协方差,Pearson,Spearman有关系数矩阵*/varx1-x6;run;10/10/202323第23页(1)计算观测数据均值向量、协方差阵、Pearson有关阵:

CORR过程

6变量:x1x2x3x4x5x6

简单统计量

变量N均值标准偏差中位数最小值最大值x120178.6000024.69051176.00000138.00000247.00000x22035.400003.2023735.0000031.0000046.00000x32056.100007.2103755.0000046.0000074.00000x4209.450005.2862811.500001.0000017.00000x520145.5500062.56658122.5000050.00000251.00000x62070.3000051.2774754.0000025.00000250.00000通过proccorr过程求得观测值均值向量10/10/202324第24页协方差矩阵

自由度=19=样本个数-1

x1x2x3x4x5x6x1

609.6210568.80000-65.11578-50.86316-761.71578-286.50526x2

68.80000010.252632-8.147368-9.347368-129.336842-31.442105x3-65.115789-8.14736851.9894745.742105101.52105312.915789x4

-50.863158-9.3473685.74210527.944737230.107895134.384211x5

-761.715789-129.33684101.521053230.1078953914.576322146.98421x6-286.505263-31.44210512.915789134.384212146.984212629.3789510/10/202325第25页Pearson有关系数矩阵

Pearson有关系数,N=20当H0:Rho=0时,Prob>|r|x1x2x3x4x5x6x11.00000=0.87024-0.36576-0.38969-0.49308-0.22630

有关性好

p12<.00010.11280.08940.02720.3374x20.870241.00000-0.35289-0.55223-0.64560-0.19150

<.00010.12700.01160.00210.4186x3-0.36576-0.352891.000000.150650.225040.034930.11280.12700.52610.34010.8838x4-0.38969-0.552230.150651.000000.695730.495760.08940.01160.52610.00070.0262x5-0.49308-0.645600.225040.695731.000000.669210.02720.00210.34010.00070.0013x6-0.22630-0.191500.034930.495760.669211.000000.33740.41860.88380.02620.001310/10/202326第26页

Spearman有关矩阵

Spearman有关系数,N=20当H0:Rho=0时,Prob>|r|

x1x2x3x4x5x6x11.000000.81423-0.37070-0.38020-0.57774-0.19902

<.00010.10760.09820.00760.4002x20.814231.00000-0.23770-0.54190-0.72473-0.19940<.00010.31290.01360.00030.3993

x3-0.37070-0.237701.000000.136620.179240.098410.10760.31290.56570.44960.6798x4-0.38020-0.541900.136621.000000.656200.322630.09820.0136

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论