下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿袆聿莂蚁肂莇莂螄袅芃莁袆肀腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿袆聿莂蚁肂莇莂螄袅芃莁袆肀腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄
2、羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿袆聿莂蚁肂莇莂螄袅芃莁袆肀腿蒀薆袃肅葿蚈肈羁蒈螀袁莀蒇薀肇芆蒆蚂罿膂蒆螅膅肈蒅袇羈莆蒄薆螁节薃虿羆膈薂螁蝿肄薁蒁羄羀薀蚃螇荿薀螅肃芅蕿袈袅膁薈薇肁肇薇蚀袄莆蚆螂聿节蚅袄袂膇蚄薄肇肃芁螆袀聿芀衿膆莈艿薈罿芄芈蚀膄膀芈螃羇肆莇袅螀莅莆薅羅芁莅蚇螈芇莄衿羃膃莃蕿 数据标准化处理方法 在数据分析之前,我们通常需要先将数据标准化(normalization),利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无
3、量纲化处理两个方面。数据同趋化处理主要解决不同性质数据问题,对不同性质指标直接加总不能正确反映不同作用力的综合结果,须先考虑改变逆指标数据性质,使所有指标对测评方案的作用力同趋化,再加总才能得出正确结果。数据无量纲化处理主要解决数据的可比性。数据标准化的方法有很多种,常用的有“最小最大标准化”、“z-score标准化”和“按小数定标标准化”等。经过上述标准化处理,原始数据均转换为无量纲化指标测评值,即各指标值都处于同一个数量级别上,可以进行综合测评分析。一、min-max 标准化 min-max标准化方法是对原始数据进行线性变换。设mina和maxa分别为属性a的最小值和最大值,将a的一个原始
4、值x通过min-max标准化映射成在区间0,1中的值x,其公式为: 新数据=(原数据-极小值)/(极大值-极小值) 二、z-score 标准化 这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化。将a的原始值x使用z-score标准化到x。 z-score标准化方法适用于属性a的最大值和最小值未知的情况,或有超出取值范围的离群数据的情况。 新数据=(原数据-均值)/标准差 spss默认的标准化方法就是z-score标准化。 用excel进行z-score标准化的方法:在excel中没有现成的函数,需要自己分步计算,其实标准化的公式很简单。步骤
5、如下: 1.求出各变量(指标)的算术平均值(数学期望)xi和标准差si ; 2.进行标准化处理: zij(xijxi)si 其中:zij为标准化后的变量值;xij为实际变量值。 3.将逆指标前的正负号对调。 标准化后的变量值围绕0上下波动,大于0说明高于平均水平,小于0说明低于平均水平。 三、decimal scaling小数定标标准化 这种方法通过移动数据的小数点位置来进行标准化。小数点移动多少位取决于属性a的取值中的最大绝对值。将属性a的原始值x使用decimal scaling标准化到x的计算方法是: x=x/(10*j) 其中,j是满足条件的最小整数。 例如 假定a的值由-986到91
6、7,a的最大绝对值为986,为使用小数定标标准化,我们用1000(即,j=3)除以每个值,这样,-986被规范化为-0.986。 注意,标准化会对原始数据做出改变,因此需要保存所使用的标准化方法的参数,以便对后续的数据进行统一的标准化。 除了上面提到的数据标准化外还有对数logistic模式、模糊量化模式等等: 对数logistic模式:新数据=1/(1+e(-原数据)) 模糊量化模式:新数据=1/2+1/2sin派3.1415/(极大值-极小值)*(x-(极大值-极小值)/2) x为原数据 薈袁膄蒃袄腿膄薆蚇肅膃蚈袂羁膂莈蚅袇膁蒀袀螃芀薂蚃肂艿节衿羈芈莄蚁羄芈薇羇袀芇虿螀膈芆莈薃肄芅蒁螈羀芄
7、薃薁袆莃芃螆螂莂莅蕿肁莂薇螅肇莁蚀蚇羃莀荿袃衿荿蒂蚆膈莈薄袁肄莇蚆蚄羀蒆莆衿袆肃蒈蚂螁肂蚁袈膀肁莀螁肆肀蒃羆羂肀薅蝿袈聿蚇薂膇肈莇螇肃膇葿薀罿膆薁螅袅膅芁薈袁膄蒃袄腿膄薆蚇肅膃蚈袂羁膂莈蚅袇膁蒀袀螃芀薂蚃肂艿节衿羈芈莄蚁羄芈薇羇袀芇虿螀膈芆莈薃肄芅蒁螈羀芄薃薁袆莃芃螆螂莂莅蕿肁莂薇螅肇莁蚀蚇羃莀荿袃衿荿蒂蚆膈莈薄袁肄莇蚆蚄羀蒆莆衿袆肃蒈蚂螁肂蚁袈膀肁莀螁肆肀蒃羆羂肀薅蝿袈聿蚇薂膇肈莇螇肃膇葿薀罿膆薁螅袅膅芁薈袁膄蒃袄腿膄薆蚇肅膃蚈袂羁膂莈蚅袇膁蒀袀螃芀薂蚃肂艿节衿羈芈莄蚁羄芈薇羇袀芇虿螀膈芆莈薃肄芅蒁螈羀芄薃薁袆莃芃螆螂莂莅蕿肁莂薇螅肇莁蚀蚇羃莀荿袃衿荿蒂蚆膈莈薄袁肄莇蚆蚄羀蒆莆衿袆肃蒈蚂螁肂蚁袈膀肁莀螁肆肀蒃羆羂肀薅蝿袈聿蚇薂膇肈莇螇肃膇葿薀罿膆薁螅袅膅芁薈袁膄
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度木材行业碳排放交易合同样板
- 2025年度新材料研发企业员工劳动合同编制指南
- 2025年度茶叶茶园承包种植与农业产业投资基金合同4篇
- 2025版塔吊司机聘用合同及施工现场安全管理责任书3篇
- 2025年理疗仪耗材项目投资可行性研究分析报告
- 2025年度知识产权授权使用合同性质及法律保护4篇
- 二零二五年度特种车辆驾驶员就业保障合同3篇
- 2025年中国抗肿瘤类药物市场规模预测及投资战略咨询报告
- 高空吊篮租赁二零二五年度智能升级改造合同模板3篇
- 二零二五年度SET支付系统加密技术升级与安全评估合同3篇
- 开展课外读物负面清单管理的具体实施举措方案
- 2025年云南中烟工业限责任公司招聘420人高频重点提升(共500题)附带答案详解
- 2025-2030年中国洗衣液市场未来发展趋势及前景调研分析报告
- 2024解析:第三章物态变化-基础练(解析版)
- 2023年江苏省南京市中考化学真题
- 供电副所长述职报告
- 校园欺凌问题成因及对策分析研究论文
- 技术支持资料投标书
- 老年人意外事件与与预防
- 预防艾滋病、梅毒和乙肝母婴传播转介服务制度
- 《高速铁路客运安全与应急处理》课程标准
评论
0/150
提交评论