《多元统计分析及R语言》第1章引论_第1页
《多元统计分析及R语言》第1章引论_第2页
《多元统计分析及R语言》第1章引论_第3页
《多元统计分析及R语言》第1章引论_第4页
《多元统计分析及R语言》第1章引论_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

多元统计分析2课程安排

1、在基本统计方法学习的基础上,深入学习多元统计分析模型及模型实现、分析方法。

2、该门课程每周2.5课时,理论与上机结合。期末考核:

总成绩=平时(20%)+上机(20%)+期末考试(60%)考试方式

平时(20):课堂(40%)+出勤(60%)上机(20):两次实验报告,一次50%

期末考试:闭卷数据整理(完整性,标准化,指标一致性(正向,逆向或适度))多元数据(2个或2个以上变量)相关性分析回归分析普通回归(数量数据)Logistic回归(问卷调查)特征分析判别分析聚类分析主成份分析因子分析对应分析典型分析多位标度MDS分析分类降维相关性第1章多元统计分析概述1.1统计分析历史1.2统计分析用途1.3统计分析内容1.4统计分析软件多元统计分析研究多个随机变量之间相互依赖关系及其内在统计规律的一门学科。

1.1多元统计分析概念自变量和因变量截面数据X1X2X3X4X5X6X7X8X9X10广州5749159.53976828.891.51714.9118.766113.1707187.396388.170793.7深圳6080146.61221775071004347.838.7913102.831274.062638.652296.8珠海4528443.537353668.587.9993.30418.563313.158542.4107196.540296.7汕头1328442.219615068.572.34319.5954.76890.9379250.4039103.150596.6佛山4126636.42286654278.39205.9353.08784.5531560.6522210.138896.1韶关2112444.419520124.649.7651.321.10522.4253123.1507225.55480河源1715747.95417191.132.4723.360.71522.3752227.5387186.574984.8梅州1957936.085919983.741.6352.04941.11213.0253710.0846299.284371.5惠州2893034.09929234.755.018002.24454.6300345.1559249.410395.6汕尾1227836.06679040.2951.88464.4660.58242.5181941.032175.153961简单相关分析偏相关分析复相关分析典型相关分析分析多个或多组变量之间相依关系1.2多元统计分析用途、内容聚类分析判别分析将性质相似的事物或现象归为一类,找出其内在联系和规律变量相依性构造预测模型进行预报控制进行数值分类构造分类模型简化系统结构探讨系统内核主成份分析因子分析对应分析多维标度法在众多因素中找出最佳子集合,构建简化模型多元线性回归逐步回归广义线性回归非线性回归综合评价方法探索多元系统运行的客观规律及外部环境关系1. SAS软件:使用最为广泛的三大著名统计分析软件(SAS,SPSS,S-PLUS)之一1.3统计分析软件1976年推出,主要用于决策支持的大型集成信息系统,被誉为国际上标准软件系统,堪称统计软件界“巨无霸”,因其系统庞大,编程复杂且软件价格昂贵不能被民间广泛使用2. SPSS软件:世界著名统计分析软件之一,是非统计专业人士首选。操作简单,无需编程,功能强大,方便的数据接口和灵活的功能模块组合,但内容不全,编程麻烦,费用较高3. S-PLUS软件:世界最流行统计分析软件之一,被统计专业人士喜爱。操作方便,图形强大,是统计分析和统计制图首选,但需要了解S语言编程特点,费用较高4. Matlab软件:应用最广泛的数值分析软件之一,是数值计算和图像处理首选。编程方便,矩阵运算强大,但统计方法不多,需要一定编程经验,费用较高。5.R软件:可以看成是S-PLUS的免费软件,是当前较为流行的统计分析软件。自由和开源软件,统计功能强大,但初学麻烦,需要一定编程经验R-语言/软件R软件:免费的,志愿者管理的软件。其编程语言与S-plus所基于的S语言一样,编程方便,语言灵活,图形功能强大有不断加入的各个方向统计学家编写的统计软件包。也可以自己加入自己算法的软件包.从网上可以不断更新和增加有关的软件包、数据和程序。可以使用其他软件编制的程序。可以通过网上服务把程序变成机器语言这是发展最快的软件,受到世界上统计师生的欢迎。是用户量增加最快的统计软件。对于一般非统计工作者来说,主要问题是它没有“傻瓜化”。在R官方网站/可以找到安装程序和各种算法包及其使用手册使用编程软件容易吗?以R软件为例.非常好学,极易入门基本功能简单,和写公式一样能在一个小时学会基本运算语句在一天内学会编写函数(子程序)和利用软件包.往往困难的反而是统计内容本身R免费,资源公开(不是黑盒子,也不是吝啬鬼)R可以在UNIX,Windows和Macintosh运行.R有优秀的内在帮助系统,有优秀的画图功能学生能够轻松地转到商业支持的S-Plus程序(如果需要使用商业软件)R语言有一个强大的,容易学习的语法,有许多内在的统计函数.通过用户自编程序,R语言很容易延伸和扩大.它就是这样成长的.R是计算机编程语言.类似于UNIX语言,C语言,Pascal,Gauss语言等.对于熟练的编程者,它将觉得该语言比其他语言更熟悉而对计算机初学者,学习R语言使得学习下一步的其他编程不那么困难.那些傻瓜软件(SAS,SPSS等)语言的语法则完全不同.R的缺点:不如S-Plus在编辑输出的画图那样好没有商业支持(但有网上支持)需要编程,不傻瓜.R里面有什么?Packages(每个都有大量数据和可以读写修改的函数/程序)baseTheRbasepackagebootBootstrapR(S-Plus)Functions(Canty)classFunctionsforclassificationclusterFunctionsforclustering(byRousseeuwetal.)ctestClassicalTestsedaExploratoryDataAnalysisforeignReaddatastoredbyMinitab,SAS,SPSS,...gridTheGridGraphicsPackageKernSmoothFunctionsforkernelsmoothingforWand&Jones(1995)latticeLatticeGraphicslqsResistantRegressionandCovarianceEstimationMASSMainLibraryofVenablesandRipley'sMASSmethodsFormalMethodsandClassesmgcvMultiplesmoothingparameterestimationandGAMsbyGCVPackages(继续)modregModernRegression:SmoothingandLocalMethodsmvaClassicalMultivariateAnalysisnlmeLinearandnonlinearmixedeffectsmodelsnlsNonlinearregressionnnetFeed-forwardneuralnetworksandmultinomiallog-linearmodelsrpartRecursivepartitioningspatialfunctionsforkrigingandpointpatternanalysissplinesRegressionSplineFunctionsandClassesstepfunStepFunctions,includingEmpiricalDistributionssurvivalSurvivalanalysis,includingpenalisedlikelihood.tcltkInterfacetoTcl/Tktools

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论