多元统计分析心得_第1页
多元统计分析心得_第2页
多元统计分析心得_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、多兀统计分析读书心得聚类分析聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类是将数据分类 到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析(cluster analysis是一组将研究对象分 为相对同质的群组(clusters)的统计分析技术。聚类分析也叫分类分析(classification analysis)或数值分类(numerical taxonomy)。聚类分析方法认为,在 所研究的统计总体中,各样品或指标(变量)之间存在着程度不同的相似性(亲琉关 系),因此可以根据一批样品的多个观测指标,具休找到一些能够度量其相似程

2、 度的统计量,并依据这些统计量完成事物的分类。具体的方法,是按样品或指标 的相似性或亲疏关系,逐级地归并即聚类,每次的归并聚成一个新的类直到把全部的样品或指标聚成一类,形成一个由小类逐步到大类的分类系统为止二若将 聚类过程的结果绘成一张分类图谱并进行分析、则就可以完成整个聚类分析过 程。它的主要应用有:聚类分析在商业上被用来发现不同的客户群,并且通过购买模式刻画不同的客户群的特征。在生物上聚类分析被用来动植物分类和对基因 进行分类,获取对种群固有结构的认识。在地理上,聚类能够帮助在地球中被观 察的数据库商趋于的相似性。聚类分析在因特网上被用来在网上进行文档归类来 修复信息等等。下面来简要介绍一

3、下曲国庆和姜玉春写的聚类分析及其在土地利用分类上 的应用,它利用系统聚类分析的基本原理,并根据实际的土地申报登记和土地利 用的调查资料,选择反映住宅建设和占地情况的人均占地面积、平均年建房率、 建设用地利用率、反映耕地分布和占有情况的人均耕地面积、当地经济状况等为聚类指标,探讨聚类分析的模式相似性测度,计算方法和步骤。这其中涉及了很 多问题,如样本数据的采集、统计、标准化和样本相似度测度的选择及确定,文 章最后给出了土地利用聚类分析的计算方法和步骤。读何晓群编著的多元统计分析和张文璋编著的实用统计分析方法与SPSS应用得出的一些体会如下:在聚类分析这一章,张文璋编的多元更具有系统性和层 次性,

4、比如他将聚类分析方法用一个表格的形式表现出来,让不同方法之间的区 别与联系一目了然,同时,他将理论分析和SPSS软件操作结合在一起,都进行了仔细的讲述。回归分析在数量分析中,我们经常会看到变量与变量之间存在着一定的联系,而不只是前面所讨论的单个变量的某些孤立的特性,如均值、方差的特性等。我们要了 解的是变量之间是如何发生相互影响的,这就是所谓的相关分析和回归分析。回 归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关 系的一种统计分析方法,运用十分广泛,回归分析按照涉及的自变量的多少, 可分为一兀回归分析和多兀回归分析;按照自变量和因变量之间的关系类型,

5、可分为线性回归分析和非线性回归分析。下面来介绍一下回归分析的步骤:1根据预测目标,确定自变量和因变量2建立回归预测模型3进行相关分析4检验回归预测模型,计算预测误差5计算并确定预测值以吴良欢和方勇等写的长期施用化肥与有机肥对土壤肥力影响的回归分析 为例,该文章对19851994年持续27季稻-稻-麦轮作制下不同氮、磷、钾化肥 和有机肥用量定位试验中20个不同施肥处理土壤作了肥力测定,采用回归分析 法研究了长期施用化肥及有机肥对土壤肥力的影响,它结合不同施肥处理土壤养分肥力性状的编码值数据,不同施肥处理土壤经27季作物种植后,其有机质含量,氮、磷、钾全量与速效养分含量差异明显,这有利于进行施肥量

6、与土壤养分 肥力间的回归分析,用计算机建立土壤养分肥力与氮、磷、钾、有机肥用量(以编码值表示)的线性回归方程,并作回归系数的显著性检验,以探明长期施用氮、 磷、钾化肥及有机肥对土壤养分肥力因子变化的定量关系。判别分析和Logistic回归判别分析是在分类确定的条件下,根据某一研究对象的各种特征值判别其类 型归属问题的一种多变量统计分析方法。其基本原理是按照一定的判别准则,建 立一个或多个判别函数,用研究对象的大量资料确定判别函数中的待定系数,并计算判别指标。据此即可确定某一样本属于何类。在陈舜华写的逐步Logistic判别分析中,他介绍用极大似然估计对 Logistic判别分析中的变量进行逐步筛选的方法,筛选过程是在对判别系数作 似然比检验的基础上进行的,在变量向前选入与向后剔除的每一步中都用到这种 检验,他先介绍了 Logistic判别的矩阵模型,又介绍了逐步Logistic判别模型, 最后研究从1954年到1983年二月与九月广州的蔬菜上市量,以分析春淡 (以三 月为代表)及秋淡(已九月为代表)的气象成因。在张初兵写的判别分析与Logistic回归的模拟比较中,他利用随机模拟方 法,研究判别分析和Logistic回归分类的回判正确率。模拟结果显示,Logistic 回归的回判正确率优于判别分析。随着随机误差的增大,Logistic回归与判别分析

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论