数据均值化处理的优势_第1页
数据均值化处理的优势_第2页
数据均值化处理的优势_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、对数据进行均值化处理方式的考察一、对数据进行无量纲处理的方法(一)极差化处理公式:新数据=(原数据-极小值)/(极大值-极小值)(二)中心化处理公式:新数据=(原数据-均值)/标准差(标准化后,新数据指标:均值为0,方差为1)(三)decimal scaling小数定标标准化公式:新数据=元数据/(10*a)(四)极大化处理公式:新数据=原数据/极小值(五)极小化处理公式:新数据=原数据/极大值(其中,a是满足条件的最小整数)(六)均值化处理公式:新数据=原数据/均值(标准化后,新数据指标:均值为1)二、变异系数=( 标准差/均值)× 100%三、中心化处理和均值化处理的比较(一)中

2、心化处理这种标准化的结果将导致数据的一部分信息丢失,即丢失各指标间变异系数上的区别。(二)均值化处理1.均值化后保留各指标的变异系数(1)均值化前各指标的变异系数=均值化后各指标的变异系数,即均值化后变异系数不变(2)均值化后各指标的协方差矩阵的主对角线元素是均值化前各指标变异系数的平方证明(1):xi=xjxj xi表示均值化后的新数据 ,xj表示均值化前的原数据,xj表示原数据的均值1kxi-xi2nxi 为均值化后各指标的变异系数, 1kxj-xj2nxj 为均值化前各指标的变异系数1kxi-xi2nxi=1kxjxj-12n1=1kxj-xjxj2n=1kxj-xj2nxj经验数据:s

3、pss数据包student.sav的体重变量。均值化前,其变异系数0.217693。均值化后,其变异系数仍然为0.217693。此处变异系数主要由excel操作而得。证明(2):设有n 个被评价对象,每个被评价对象用p 个评价指标来描述, 原始数据为(xij)n×p , 均值化后得数据zij,zij= 1,协方差矩阵(vij)p×p,其中vij=1n-1×knxki-xi×(xkj-xi)因为均值化后各指标均值为1,所以vij=1n-1×knzki-xi×(zkj-xi)=1n-1×knxkixi-1×xkjxj-

4、1=1n-1×knxkixi-1×xkjxj-1=1n-1×knxki-xixi×xkj-xjxj=1n-1×knxki-xi×(xkj-xj)xi×xj=1n-1×knxki-xi×(xkj-xj)xi×xj=1n-1×knxki-xi×(xkj-xj)xi×xj1n-1×knxki-xi×(xkj-xj)为原数据的协方差sij,当i=j时vij=1n-1×knxki-xi2xi2=1n-1×knxki-xi2xi22=siixii2即均值化后各指标的协方差矩阵的主对角线元素是均值化前各指标变异系数的平方2.均值化后保留各指标间的相关系数(1)均值化前各指标相依系数=均值化后各指标相依系数,即均值化后相依系数不变。证明(1):均值化前的相依系数rij=kn(xki-xi)(xkj-xj)kn(xki-xi)2×kn(xkj-xj)2=sijsii×sjj均值化后的相关系数rij'=vijvii×vjj=sijxi×xjsiixi×sjjxj=sijsii×sjj=rij(三)总结对原始数据进行均值化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论