1入门及使用基础总结_第1页
1入门及使用基础总结_第2页
1入门及使用基础总结_第3页
1入门及使用基础总结_第4页
1入门及使用基础总结_第5页
已阅读5页,还剩79页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计软件介绍

入门篇hedazhaohui@前言1、统计模型的应用特点2、统计学发展现状3、统计学软件的发展4、SPSS介绍1、统计应用特点一、数据量和数据关系复杂性快速膨胀二、数据分析方法日益丰富三、统计应用需要具有可操作性的整体解决方案一、数据量和数据关系复杂性快速膨胀数据海量,且不再以纸面的形式呈现,直接从电子化媒体化的数据库中提取,利用计算机和网络进行有效的数据组织和数据管理已经成为统计应用的基本环节和基础方式海量数据二、数据分析方法日益丰富机器学习、决策树、神经网络和生物遗传算法等已经成为处理海量数据,探索数据内在规律性,获取数据中未知知识的重要手段。三、统计应用需要具有可操作性的整体解决方案因为数据资料的收集困难和不完整,不定期的统计不利于长期发展需要。总之,数学是统计方法的首要工具,是理论基础,而统计应用软件就是统计应用的首要工具。2、统计学发展现状2.1国际角度2.2美国角度2.3中国角度2.4考研角度2.5留学角度2.1国际视野“稳健、真实的数据是制定长期经济需求及关键政策的首要步骤。”白宫预算与管理办公室主任——PeterR.Orszag“语言学、心理学和统计学是21世纪中国最有发展前途的三大学科。”教育部社政司司长、中国人民大学博士生导师——顾海良教授2011年国际统计学会国际统计学会自1853年成立以来,每两年举办一次国际统计大会。来自120多个国家的2300名代表云集都柏林会议中心,参加第58届世界统计盛会。国家统计局总统计师、中国统计学会副会长鲜祖德《2000年以来中国政府统计制度方法的变化及主要结果》国家统计局国际统计中心石婷作《改进经济体间规模和价格的国际比较》专题2.2美国统计学概貌2009年8月5日的《纽约时报》以大篇幅刊登了专栏文章,题目:ForToday‘sGraduate,JustOneWord:Statistics《对当今毕业生来说仅有一个关键词:统计学》专栏内容引用CarrieGrimes,她在哈佛主修专业是人类学和考古学。她对记者说“人们认为野外考古就如探险影片《夺宝奇兵》中主角印地安娜·琼斯一样神奇,然而事实并非如此,我们所做的很多工作都是进行数据分析。”现在,统计学博士Grimes女士从事一项截然不同的挖掘工作。进入Google公司工作,现在是250名数据分析师小组中的一员,她利用统计建模来改进公司的搜索引擎技术。互联网时代的统计学家颠覆了该职业原本死板木讷的形象,Grimes就是其中一员,他们发现自己正逐渐成为稀缺人才。利用统计技术迅速捕捉并引用媒体新发布的信息,这样就能获取广泛的关注度。康奈尔大学计算机科学家和社交网络研究员JonKleinberg跟踪网络空间中信息流,搜寻“给猪涂口红”这样的相关新闻主题,捕捉到了160万个新闻网站和博客。猪涂口红原为英语俚语Puttinglipstickonapig。别以为穿了马甲,我就不认得你目前,统计学成为美国五大热门专业之一。根据美国劳工统计局(BLS)和梅肯研究院的数据,Smart-Money杂志研究发现,富有成长性的5个研究领域——工程学、生命科学、统计学、环境科学、金融属于五大热门领域。梅肯研究院高级管理经济师PerryWong说,统计专业的毕业生往往非常抢手,经常一毕业就被录用在有前途的职位上。根据美国劳工统计局的资料:统计学专业人员的工资水平也较高。

Google公司首席经济师HalVarian说:“我坚持认为,在未来10年里,统计会是最具吸引力的职业。”Leeb资本管理公司驻纽约的首席投资官StephenLeeb说:“无论是替代能源还是医疗保健,都需要统计分析来研究评估并做出抉择。如今,各行业的公司都在寻找统计专家,包括制药公司、保险公司和华尔街的公司。制药公司特别喜欢生物统计专家,他们可以通过建模来检验药物。华尔街喜欢具有定量分析和大尺度建模技能的统计专家。网络巨大的数据量为科学研究与发现开辟了一片新天地。然而数据仅仅是知识的原材料。麻省理工学院电子商务中心主任、经济学家ErikBrynjolfsson说:“我们正飞速迈入一切都将被监测和测算的时代,但最大的问题在于人们利用、分析和解释数据的能力。”专家表示,计算与数据分析技能远比学位重要。新一代数据分析领域的领军人物需要有经济学、计算机科学和数学等多重背景。由表1可以看出:统计学是美国高等教育机构中最为普及的研究方向,顺次是生物统计学,其在研究生阶段的教育机构数远远高于本科阶段。2.3中国统计学概貌1998年9月国家教育部颁布的《普通高等学校本科专业目录和专业介绍》将统计学列为理学类一级学科,这是中国统计界“九五”期间的重大成就。统计学一级学科的地位表明统计学既不是经济学的一个子学科,也不是数学的一个子学科,统计学就是统计学。统计学(代码071601)属于理学大类,统计学类。统计学专业分为三个大的专业方向:数理统计方向、经济统计方向和生物统计方向。就业方向统计学专业毕业生的主要就业流向有三大部分:政府部门(统计局等),银行、保险公司、证券公司等金融部门,市场调查公司、咨询公司、各公司的市场研究部门,工业企业的质量检测部门等企业事业单位。2.4考研角度:统计学排名1

厦门大学

2

中国人民大学3

上海财经大学

4

杭州商学院

5

天津财经学院6

中南财经政法大学7

北京大学

8

复旦大学9

南开大学10

东北财经大学11暨南大学12中央财经大学13西南财经大学14辽宁大学

排名学校名称星级学校数1中国人民大学5★1972厦门大学5★1973南京大学5★1974西南财经大学5★1975东北财经大学5★1976复旦大学5★1977首都经济贸易大学5★1978上海财经大学5★1979天津财经大学5★19710北京大学5★19711中央财经大学4★19712贵州财经学院4★19713浙江工商大学4★19714暨南大学4★19715中南财经政法大学4★19716桂林理工大学4★19717哈尔滨商业大学4★19718福建农林大学4★19719福州大学4★19720海南大学4★197附:概率论与数理统计排名

1北京大学2中国科学技术大学3中南大学4南开大学5清华大学6华中科技大学7北京师范大学8武汉大学9上海交通大学10浙江大学11北京工业大学12山东大学13南京大学14中山大学国内概率统计牛人(2008)概率统计五位院士:王梓坤、陈木法、严加安、马志明,陈希儒。其中前两位是北师大的,严和马是中科院的,陈希儒是中科大的,也是中国唯一一位统计院士,但很可惜2005年8月8日已过逝。北师大的老师有三位,王凤雨,李增沪,崔恒建中南大学的候振挺在Markov及逐段决定马氏过程首屈一指;武汉大学的潘迪鹤,他是许宝禄老先生的弟子,许老先生是中国概率届的鼻祖了;中山大学的梁之舜;北方的学校要首推中科院了,严加安,马志明(两位院士自不必说)还有巩馥洲等南开的概率也是相当强的,王永进,吴荣,郭军义等,河北工大(在天津)的概率在全国也有些影响!当年的牛人刘文(已逝世)带的几名牛学生都在工大。统计方面:华师理论做的最好(茆诗松,王静龙等),中科大应用(陈老生前的弟子)方面最好,人大的(吴喜之等搞经济方面的)也不错。中科院成平、李国英;方开泰老师的在实验设计方面的工作已有世界影响;北大郑忠国、陈家鼎南开张润楚老师;另外东北师大的白志东和史宁中;南京大学的王金德;复旦郑祖康;东南大学韦博成;云南大学王学仁现在国内年轻一代的有香港浸会大学朱力行教授,北大耿直教授(因果推断),北师大崔恒建(稳健统计),科学院王启华(生存分析)、陈敏(时间序列、金融统计)属于较强的牛人。国际数理统计协会会士至今共有18人具有大陆教育背景。他们的毕业学校如下:

海外申请统计是近些年非常热门的申请专业之一,原因就是就业好,薪资高,而且录取难度相对较低,因此无论是统计本专业的申请者还是转专业的申请者都将精力放在这个专业的申请上面。从美国开设统计学专业的学校来看,统计学大致可以分为两类,一类是偏向于理论研究的,另一类是偏向于实际应用的。前者主要包括统计系或者数学系下的统计学,后者包括:数理统计、生物统计、环境统计、金融统计、经济统计、遗传统计、农业统计等等。这些是统计在其他领域的应用而形成的研究分支。申请分析

具备良好的数学背景是普遍的要求。美国大学的录取时候,比较倾向于理工科背景的学生,尤其是本科期间统计学或者数学系的学生。由于还有部分是转专业的申请者,录取委员会的教授们会比较注意这部分人的部分数学背景,比如数学类的基础课程,如数学分析、高等代数(或高等数学)、统计的基础课程、实分析等,或相关的实习经历、参与过的学术项目等。除此之外,一些计算软件,如SPSS、Eviews、MATLAB、SAS等的熟练操作和使用也是录取委员比较看重的方面。美国大学数学统计学专业排名1

斯坦福大学

2

加州大学伯克利分校

3

哈佛大学

4

北卡罗来纳大学教堂山分校

5威斯康星大学麦迪逊分校

6

康奈尔大学

7

芝加哥大学

8

明尼苏达大学TwinCities分校

9

华盛顿大学

10

卡内基美隆大学

4、SPSS统计分析软件概述统计学软件的发展历史和现状SPSS的发展及特点参考教材SPSS使用基础SPSS数据分析的基本步骤统计学软件SASBMDPSPSSEVIEWSTSPEXCELSTATAMINITABR&S-PlusMATLABAMOSSAS

StatisticsAnalysisSystem,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。在国际上,SAS被誉为数据统计分析的标准软件。SAS系统是一个模块组合式结构的软件系统,共有三十多个功能模块。SAS是用汇编语言编写而成的,通常使用SAS需要编写程序,比较适合统计专业人员。最新版本9.3BMDPBioMedicalDataProcessing,最初是用于医药,农业,生化等方面的统计,是一个完整且容易使用的窗口统计软件。

BMDP第一版诞生于1961年,1968年BMDP公司发行,是最早的综合专业统计分析软件,与SAS、SPSS被并称为三大统计软件包,在国际上影响很大,

诞生于美国加州大学,由于BMDP发展路途不畅,从1991年的7.0版以后就没有新版本,最后被SPSS公司收购。SPSS它和SAS、BMDP并称为国际上最有影响的三大统计软件。和国际上几种统计分析软件比较,它的优越性更加突出。在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab的总体印象分的统计中,其诸项功能均获得最高分。在国际学术界有条不成文的规定,即在国际学术交流中,凡是用SPSS软件完成的计算和统计分析,可以不必说明算法,由此可见其影响之大和信誉之高。最新版本21.0eviewsEviews是EconometricsViews的缩写,直译为计量经济学观察,通常称为计量经济学软件包。Eviews是美国QMS公司研制的在Windows下专门从事数据分析、回归分析和预测的工具。使用Eviews可以迅速地从数据中寻找出统计关系,并用得到的关系去预测数据的未来值。Eviews的应用范围包括:科学实验数据分析与评估、金融分析、宏观经济预测、仿真、销售预测和成本分析等。eviewsEViews预测分析计量软件在科学数据分析与评价、金融分析、经济预测、销售预测和成本分析等领域应用非常广泛。应用领域:应用经济计量学;总体经济的研究和预测销售预测;财务分析成本分析和预测;蒙地卡罗模拟经济模型的估计和仿真;利率与外汇预测

StataStata统计软件由美国计算机资源中心(ComputerResourceCenter)1985年研制。特点是采用命令操作,程序容量较小,统计分析方法较齐全,计算结果的输出形式简洁,绘出的图形精美。不足之处是数据的兼容性差,占内存空间较大,数据管理功能需要加强。最新版为12版。R&S-PlusR是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。最初S语言的实现版本主要是S-PLUS。后来Auckland大学的RobertGentleman和RossIhaka及其他志愿人员开发了一个R系统。R与S-PLUS有一定的兼容性。S-PLUS的使用手册,只要经过不多的修改就能成为R的使用手册。所以有人说:R,是S-PLUS的一个“克隆”。但是请不要忘了:Risfree。MinitabMinitab由美国宾州大学研制。其特点是简单易懂,很方便进行试验设计及质量控制功能。在国外大学统计学系开设的统计软件课程中,Minitab与SAS、BMDP并列,根本没有SPSS的份。最新版本为14.0版

LISREL、AMOS结构方程模型分析软件LISREL(analysisoflinearstructuralrelationship)被公认为最为专业的结构方程建模(StructuralEquationModeling,

简称

SEM)

分析工具,其权Amos(AnalysisofMomentStructures),Amos自从6.0版以后已经成为SPSS的家族成员。Amos(阿摩司)这个名字是希伯来先知的名字Amos适合进行协方差结构分析(AnalysisofCovarianceStructures),是一种处理结构方程模型(structuralequationmodeling,SEM)的软件MATLABMatrixLaboratoryMATLAB和Mathematica、Maple、MathCAD并称为四大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数和数据、实现算法、创建用户界面、连

matlab开发工作界面接其他编程语言的程序等,主要应用于工程计算、控制设计、信号处理与通讯、图像处理、信号检测、金融建模设计与分析等领域。SPSS的发展StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司,并于1975年在芝加哥组建了SPSS总部。90年代以后,适应操作系统,诞生了spssforwindows版。历史1968年:斯坦福大学三位学生创建了SPSS1968年:诞生第一个用于大型机的统计软件1975年:在芝加哥成立SPSS总部1984年:推出用于个人电脑的SPSS/PC+1992年:推出Windows版本,同时全球自SPSS11.0起,统计产品和服务解决方案;2009年:定位为预测统计分析软件(PredictiveAnalyticsSoftware)PASW包括四部分:统计分析;数据挖掘;数据收集;企业应用服务2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面不再以PASW为名,修改为统一加上IBMSPSS字样SPSS的特点特点:1、具有完善的数据输入、编辑、统计分析、报表、图形制作等功能;2、强大的文件转换功能;3、强大的函数库(177个)。SAS,Stata和SPSS之间的不同SAS适合高级用户使用。它的学习过程是艰苦的,最初的阶段会使人灰心丧气。然而它还是以强大的数据管理和同时处理大批数据文件的功能,得到高级用户的青睐。Stata较好地实现了使用简便和功能强大两者的结合。尽管其简单易学,它在数据管理和许多前沿统计方法中的功能还是非常强大的。用户可以很容易的下载到别人已有的程序,也可以自己去编写,并使之与Stata紧密结合。SPSS致力于简便易行(其口号是“真正统计,确实简单”),并且取得了成功。但是如果你是高级用户,随着时间推移你会对它丧失兴趣。SPSS是制图方面的强手,由于缺少稳健和调查的方法,处理前沿的统计过程是其弱项。教材:SPSS统计分析与行业应用案例详解杨维忠张甜SPSS统计分析与数据挖掘谢龙汉尚涛参考书:SPSS统计分析方法及应用,薛薇编著,电子工业出版社,2004年。社会统计分析方法-SPSS软件应用,郭志刚,人大SPSSforwindows统计分析教程(第二版),李志辉罗平主编著,电子工业出版社,2005年。SPSSforwindows统计分析教程(第二版),卢纹岱编著,电子工业出版社,2003年。SPSSforwindows统计分析(第3版),卢纹岱编著,电子工业出版社,2006年。学习方法读、看、思考(排名,竞争力,可靠性等)查找统计学原理上机练习,摸索快捷途径自己找数据并结合软件进行实战SPSS使用基础1、软件的安装和启动2、基本操作环境3、软件的退出4、三种基本使用方式两个窗口数据编辑窗口窗口主菜单、工具栏、数据编辑区、系统状态显示区组成;结果输出窗口窗口主菜单、工具栏、分析结果显示区、系统状态显示区组成;数据编辑窗口菜单功能概览数据编辑窗口主要功能定义SPSS数据结构、录入、编辑和管理待分析的数据文件扩展名###.sav结果输出窗口功能及特点功能是显示管理SPSS统计分析、报表及图形的窗口扩展名###.spo基本使用方式完全窗口菜单方式程序运行方式混合运行方式完全窗口菜单方式通过单击菜单、按钮、输入对话框等方式完成;适用于一般的统计分析人员;关键要明确菜单项的作用、选项的统计意义和适用场合及分析结果的含义。程序运行方式编写程序、提交运行SPSS程序在语句窗口(syntaxeditor)下编写,扩展名.sps适用于大规模的统计分析工作Paste的关系1.3数据分析的基本步骤数据分析的一般步骤明确数据分析目标正确收集数据数据的加工整理明确统计方法含义和适用范围正确分析结果软件分析的一般步骤建立SPSS数据文件定义文件及录入修改和保存文件加工整理统计分析解释分析结果第二章数据文件的建立和管理SPSS数据文件数据的结构及定义方法结构定义的应用案例SPSS数据文件特点扩展名.sav有结构的数据文件两项任务描述SPSS数据的结构录入编辑SPSS数据数据文件基本组织方式原始数据的组织方式频数数据的组织方式经过分组汇总后,以频数数据的组织方式采用何种组织方式,主要取决于收集到的数据以及今后要进行的分析SPSS数据的结构和定义方法变量名数据类型、宽度、列宽度变量名标签变量值标签缺失数据度量尺度name长度不多于8首字符以英文字母开头不区分大小写,汉字可默认变量名为VAR00001Type\width\columns数值型、字符型、日期型每种类型的数据都有默认的宽度、小数位和列宽度宽度是变量可显示的最大字符位数列宽度是数据编辑窗口中显示的每列字符位数label对变量名含义的进一步解释说明增强变量名的可视性和统计分析结果的可读性长度可达120个字符Valuelabels对变量取值含义的解释说明信息例如,性别变量和收入水平等注意理解和变量名标签的区别missing原因数据中存在明显错误和不合理的数据存在漏填的数据项三种缺失值得定义measure统计数据根据度量尺度三类定距型数据(scale)定序型数据(ordinal)定类型数据(nominal)角色输入:该变量用于输入,这是系统默认值(如预测变量,自变量);目标:该变量将被作为输入目标(如因变量);两者都:该变量用于输入和输出;无:该数据没有角色分配;分区:该变量用于区分在独立样本中练习、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论