




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SPSS统计分析基础教程主讲人:彭超课程目的应用统计学理解统计数据分析主要方法的基本理论掌握基本统计方法在实践中的应用能熟练运用SPSS软件实现数据分析建立起独立运用统计方法解决实际问题的基础能力参考书目:1、《统计学:从数据到结论》(第2版)吴喜之著,中国统计出版社,2006。2、《统计分析与SPSS的应用》,薛薇编著,中国人民大学出版社,2001。3、《SPSS统计分析教程》,李志辉等主编,电子工业出版社,2003。4、《社会统计方法——SPSS软件应用》,郭志刚主编,中国人民大学出版社,1999。第一章一些基本概念什么是统计呢?报表?数字?你觉得你们需要统计吗?为什么?§1.1统计是什么?统计是人类思维的一个归纳过程站在一个路口,看到每过去20辆小轿车时,也有100辆自行车通过而且平均每10个轿车载有12个人于是,你认为小汽车和自行车在这个路口的运载能力为24:100这是一个典型的统计思维过程§1.1统计是什么?一般来说,统计先从现实世界收集数据(信息),如经济增长然后,根据数据作出判断,称为模型模型是从数据产生的模型也需要根据新的信息来改进不存在完美的模型模型的最终结局都是被更能够说明现实世界的新模型所取代§1.1统计是什么?比如说,经济生产的模型统计学可以应用于几乎所有的领域:精算,农业,动物学,人类学,考古学,审计学,晶体学,人口统计学,牙医学,生态学,经济计量学,教育学,选举预测和策划,工程,流行病学,金融,水产渔业研究,遗传学,地理学,地质学,历史研究,人类遗传学,水文学,工业,法律,语言学,文学,劳动力计划,管理科学,市场营销学,医学诊断,气象学,军事科学,核材料安全管理,眼科学,制药学,物理学,政治学,心理学,心理物理学,质量控制,宗教研究,社会学,调查抽样,分类学,气象改善,博彩等。§1.1统计是什么?一句话,统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。以归纳为主主要思维方方式的统计不是以演绎为主主的数学统计可应用用于各个不不同学科,,在有些学学科已经有有其特有的的方法和特特点;如生物统计(biostatistics)、经济计量学学(econometrics)以及目前很很热门的生物信息(bioinformation)和数据挖掘(DataMining)的方法主体体都是统计计。你想过下面面的问题吗吗?当你买了一一台电视时时,被告知知三年内可可以免费保保修。你想想过厂家凭凭什么这样样说吗?说说多了,厂厂家会损失失;说少了了,会失去去竞争,也也是损失。。到底这个个保修期是是怎样决定定的呢?大学排名是是一个非常常敏感的问问题。不同同的机构得得出不同的的结果;各各自都说自自己是客观观、公正和和有道理的的。到底如如何理解这这些不同的的结果呢??你想过下面面的问题吗吗?任何公司都都有一个信信用问题。。当然,在在这些公司司试图得到到贷款时并并没有不还还贷的不良良记录。如如何根据它它们的财务务和商业资资料来判断断一个公司司的信用等等级呢?我国东部和和西部的概概念是一个个比较笼统统的概念。。如何能够够根据需要要,选择一一些指标来来把各省,,或各市县县甚至村进进行分类呢呢?疾病传播时时,如何能能够通过感感染者入院院前后的各各种因素得得到一个疾疾病传染方方式的模型型呢?你想过下面面的问题吗吗?如何通过大大众调查来来得到性别别、年龄、、职业、收收入等各种种因素与公公众对某项项事物(比比如商品或或政策)的的态度的关关系呢?一个从来没没有研究过过红楼梦的的统计学家家如何根据据比较写作作习惯得出出红楼梦从从哪一段开开始就不是是曹雪芹的的手笔了呢呢?如何才能够够客观地得得到某个电电视节目的的收视率,,以确定广广告的价格格是否合理理呢?你如何理解解下面说法法?“明天降水概概率为40%”“我冬天去新新加坡度假假的概率为为10%”“该节目收视视率是30%”“调查结果表表明20%的观众喜欢欢某节目”“抽样调查结结果的误差差为±3%”“支持率的95%置信区间间为(25%,30%)”“某学校排名名第一”“某县是贫困困县”你如何理解解下面说法法?“某国的综合合竞争力排排名第43位”“该国家属于于发展中国国家”“该药品疗效效99%”“该国贫富差差距大”“这个县收入入比那个县县高”“该结果统计计显著”“消费价格指指数为120%””“他的血压已已经正常了了”可以想象出出的统计应应用例子如何确定观观众/听众是否忠忠实于某节节目(专栏)如何对电视视节目排名名次什么因素影影响一个节节目的收视视率如何按照各各种不同环环境估计某某商店的顾顾客人数如何按照各各种指标评评价雇员如何把地区区(市县镇等)按照各种指指标分类如何确定红红楼梦第几几回不是曹曹雪芹所写写如何确定一一个产品的的可靠性如何进行偏偏差较少的的民意调查查如何根据一一些财务数数据发现漏漏税的嫌疑疑单位?你相信统计计结果吗??数据可以有有误或作假假统计方法((有意或无无意)使用用不当可以以误导。有有低级误导导和高级误误导。常识判断和和直觉是重重要的关于美国选选举的两个个例子(1)谁会在1936选选举中获胜胜?AlfLondon还是F.D.R.(罗斯斯福)?LiteraryDigest(文摘)送出一千万万份问卷(返回二百四四十万份)后,预测London会赢赢.而Gallop(盖洛洛普)只问了5000人说Roosevelt(罗斯斯福)会赢赢.最后罗斯福福和盖洛普普都赢了.文摘倒闭了.谁会在1948选选举中获胜胜?ThomasDewey还还是HarryTruman(杜鲁鲁门)?Crossley,Gallop(盖洛普),Roper所有都预测Dewey会赢(每个个机构用了了5000个问卷).最后(包括括盖洛普)他们都输输了,而而杜鲁门赢赢了.关于美国选选举的两个个例子(2)统计的一些些做法统计可以指指导我们收收集数据.当拥有来自自一些变量量(指标)的数据或记记录,但缺乏模型型来描述这这些变量之之间关系的的情况下,可用统计方方法建立模模型.在有了一定定的模型时时,统计可以确确定手中数数据是否令令人信服地地支持某种种论点.模型也用来来对未来进进行预测.统计直观的的图表展示示,可以使各个个领域的专专家容易理理解中国统计的的独特历史史环境中国统计过过去分为“统计学”(文科的列宁宁主义统计计)和“数理统计”(数学类的国国际意义上上的统计)国内一些学学者把统计计称为是经经济学科的的一部分,,则是中国国特有的与与前苏联关关联的国情情所造成;;读者可以以从《苏联大百科科全书》的统计学条条款得到答答案。但前苏联的的经济学中中的统计学学概念是其其意识形态态和计划经经济体系的的产物,其其模型多属属于小学数数学水平,,很难称为为数学模型型。这与现代经济济学所需要的的大量的统计计和数学形成成鲜明对照.前苏联式的“统计学”不是目前国际际流行意义上上的统计学或或统计学的分分支。统计的内容和和需要的知识识数学的几乎所所有内容(不一定事先知知道需要什么么)用计算机做统统计计算其他(对象)领域的知识统计和数学的的区别数学思维是以以演绎为主统计思维是以以归纳为主,兼有演绎统计各领域利利用几乎所有有存在的数学学内容.但统计本身的的数学是为具具体目标服务务的,自己一般不形形成数学体系系计算机的重要要性由于统计和数数据打交道,没有计算机的的发展统计就就没有前途.计算机和统计计的发展相辅辅相成§1.2现实中的随机机性和规律性性从中学起,我我们就知道自自然科学的许许多定律,例例如物理中的的牛顿三定律律,物质不灭灭定律以及化化学中的各种种定律等等。。但是在许多领领域,很难用如此确确定的公式或或论述来描述述一些现象。。比如,人的寿寿命是很难预预先确定的。。一个吸烟、、喝酒、不锻锻炼、而且一一口长荤的人人可能比一个个很少得病、、生活习惯良良好的人活得得长。因此,可以说说,活得长短短是有一定随随机性的(randomness)。这种随机性性可能和人的的经历、基因因、习惯等无数说不清的的因素都有关系。现实中的随机机性和规律性性但是从总体来来说,我国公公民的平均年年龄却是非常常稳定的。而而且女性的平平均年龄也稳稳定地比男性性高几年。这这就是规律性。一个人可能活活过这个平均均年龄,也可可能活不到这这个年龄,这这是随机的。但是总体来说说,平均年龄龄的稳定性,,却说明了随机之中有规规律性。这种规律就就是统计规律律。概率和机会你可能经常听听到概率(probability)这个名词。。例如在天气气预报中会提提到降水概率率。大家都明明白,如果降降水概率是百百分之九十,,那就很可能能下雨;但如如果是百分之之十,就不大大可能下雨。。因此,从某种种意义说来,,概率描述了某某件事情发生生的机会。显然,这种概概率不可能超超过百分之百百,也不可能能少于百分之之零。换言之之,概率是在0和1之间的一个数数,说明某事件件发生的机会会有多大。有些概率是无无法精确推断断的比如你对别人人说你下一个个周末去公园园的概率是百百分之八十。。但你无法精精确说出为什什么是百分之之八十而不是是百分之八十十四或百分之之七十八。其实你想说的的是你很可能能去,但又没没有完全肯定定。实际上,到了了周末,你或或者去,或者者不去;不可可能有分身术术把百分之八八十的你放到到公园,而其其余的放在别别处。有些概率是可可以估计的比如掷骰子。。只要没有人人在骰子上做做手脚,你得得到6点的概率应该该是六分之一一。得到其他他点的概率也也是一样。得到6的概率或者机机会是可以知知道的,但掷掷骰子的结果果还只可能是六个个数目之一。。这个已知的规规律就反映了了规律性,而而得到哪个结结果则反映了了随机性。如果你掷1000次骰子,那么么,大约有六六分之一的可可能会得到6;这也是随机性性呈现有规律律的一个体现现。§1.3变量和数据一节火车车厢厢有多少坐位位是一个固定定的数目,称称为常数(constant)或者常量。但是,开车后后,坐在这节节车厢的旅客客有多少就没没准了。这有有随机性。该该车厢的乘客客数为变量(variable)。§1.3变量和数据一个学校的注注册在校男女女生比例是固固定的,为常常量但是,该校任任意一群学生生的男女生比比例就不一定定和全校的比比例一样了,,它为变量(variable)。§1.3变量和数据当变量按照随随机规律所取取的值是数量量时该变量称称为定量变量量或数量变量量(quantitativevariable);因为是随机的的,也称为随随机变量(randomvariable)。如身高体重,,购买某商品品的人数等等等SPSS主要为Numeric§1.3变量和数据象性别,观点点之类的取非非数量值的变变量就称为定定性变量或属属性变量或分分类变量(qualitativevariable,或categoricalvariable)。这些定性变量量也可以由定定量变量来描描述,如男女女生的数目,,持有某观点点的人数比例例等等。§1.3变量和数据定性变量只有有用数量来描描述时,才有有可能建立数数学模型,并并使用计算机机来分析。数据中它们通通常用哑元((dummyvariable)代表,比如性性别用0、1代表,三种收收入用0、1、2代表(或用字母代表表)SPSS中没有特别的的变量,往往往用数值表示示§1.3变量和数据有了变量,何何谓数据?不同机构调查查所得到的北北京收入万元元以上市民的的比例都不一一样,这是变变量而这些调查产产生一些数目目,这些数目目就是数据(data)数据是关于变变量的观测值值。§1.3变量和数据通过数据可验验证有关的理理论或假定。。比如通过抽样样调查验证美美国选民对共共和党候选人人的支持率是是否超过50%通过抽样,可可以检验某批批产品是否合合格等等§1.4变量之间的关关系现实世界紧密密联系的人们想知道投投资方式和经经济效益之间间的关系、旅旅客人数和经经济发展之间间的关系等等等不讨论变量之之间的关系,,就无从谈起起任何有深度度的应用,统统计的基本概概念就仅仅是是摆设而已。。§1.4.1定量变量间的的关系例1.1.广告投入和和销售之间的的关系。下表表(数据ads.sav)显示了某企企业的广告投投入和销售额额之间的关系系(万元)。。横坐标代表广广告投入,而而纵坐标代表表销售收入。。看得出有何种种关系吗?§1.4.1定量变量间的的关系能否从该数据据回答下面问问题:这两个变量是是否有关系??如果有,它们们的关系是否否显著?这些关系是什什么关系,能能否用数学模模型来描述??这个关系是否否带有普遍性性?这个关系是不不是因果关系系?§1.4.1定量变量间的的关系关于因果关系系在可控制的试试验中,较容容易找到因果果关系;比如如治疗方式和和疗效的关系系等但是,一般来来说,变量之之间有关系这这个事实并不不意味着一定定存在明确的的因果关系。。§1.4.1定量变量间的的关系比如,北京GDP在一年中是快快速增长的,,而一个刚出出生的巴拿马马婴儿在这一一年中的体重重也是快速增增长的如果画出图来来,它们有类类似线性的关关系但它们显然没没有因果关系系§1.4.1定量变量间的的关系只要有关系,,即使不是因因果关系也不不妨碍人们利利用这种关系系来进行推断断。比如利用公鸡鸡打鸣来预报报太阳升起;;虽然公鸡打打鸣绝对不是是日出的原因因(虽然打鸣发生生在先)§1.4.1定量变量间的的关系简单的办法((诸如画图))可以得到一一些信息,但但不一定能够够给出满意的的答案需要更多的工工具和手段来来进行数值分分析得到更加加严格和精确确的解答因此,需要继继续我们的课课程§1.4.2定性变量间的的关系例1.2.下面是对123人进行关于某某项政策调查查所得结果的的一个简单的的三维表,它它显示了人们们的收入和性性别对该项政政策的观点。。(table7.sav)。计算机软件所所应用的数据据形式§1.4.2定性变量间的的关系从这个数据,,希望可以看看出收入、性性别对观点是是否有影响及及如何影响如果要得到更更加精确的结结论,就要进进行进一步的的分析和计算算这是后面列联联表分析或多多项分布对数数线性模型的的内容§1.4.3定性和定量变变量间的混和和关系有些数据不是是仅有定性变变量或仅有定定量变量需要知道包括括定性和定量量两种变量的的一些变量之之间的关系下面数据就包包含两种变量量Asthma.sav数据§1.4.3定性和定量变变量间的混和和关系该数据有2个定性变量((性别,污染染程度)、一一个定量变量量(年龄)以以及发生哮喘喘的人数我们希望知道道哮喘和这三三个变量之间间的关系这将在Poisson对数线性模型型中讨论§1.5统计、计算机机与统计软件件现代生活越来来越离不开计计算机了最初的计算机机仅仅是为科科学计算而设设计和建造的的。统计是大型计计算机的最早早用户,现在在仍然是数值值计算的主要要用户§1.5统计、计算机机与统计软件件计算机的使用用,从计算机机语言到““傻瓜式”地地点击鼠标输出结果也从从数字输出到到各种可以想想象得到的形形式。输入数据,点点鼠标做一些些选项,就可可得到漂亮结结果但其中充满了了危险的陷阱阱§1.5统计、计算机机与统计软件件计算机无法识识别你的统计计方面的错误误错误的方法、、错误的数据据形式都必然然输出错误的的结果(虽然然看上去可能能很漂亮),,得到大量垃垃圾另外,统计软软件输出的结结果太多、很很难都理解§1.5统计、计算机机与统计软件件统计软件的种种类很多。书书中仅介绍最最常见的几种种。只要学会使用用一种“傻瓜瓜式”软件或或编程软件,,使用其他类类似的软件也也不会困难;;最多看看帮帮助和说明即即可。学习软件的最最好方式是需需要时在使用用中学。统计软件SPSS:这是一一个很很受欢欢迎的的统计计软件件;它它容易易操作作,输输出漂漂亮,,功能能齐全全,价价格合合理。。对于于非统统计工工作者者是很很好的的选择择。SAS:这是功功能非非常齐齐全的的软件件;尽尽管价价格不不菲,,许多多公司司还是是因为为其功功能众众多和和某些些美国国政府府机构构认可可而使使用。。尽管管现在在已经经尽量量“傻傻瓜化化”,,仍然然需要要一定定的训训练才才可以以进入入。对对于基基本统统计课课程则则不那那么方方便。。STATA:这是众众多统统计软软件的的后起起之秀秀;它它操作作灵活活、简简单、、易学学易用用,同同时具具有数数据管管理软软件、、统计计分析析软件件、绘绘图软软件、、矩阵阵计算算软件件和程程序语语言的的特点点。占占用计计算机机系统统资源源少,,绘图图漂亮亮,对对有简简单编编程基基础者者来讲讲十分分容易易上手手,有有专门门出版版的专专业刊刊物。。以上三三种软软件并并称为为新的的国际际三大大权威威统计计软件件统计软软件Excel:它严格格说来来并不不是统统计软软件,,但作作为数数据表表格软软件,,必然然有一一定统统计计计算功功能。。而且且凡是是有MicrosoftOffice的计算算机,,基本本上都都装有有Excel。但要要注意意,有有时在在装Office时没有有装数数据分分析的的功能能,那那就必必须装装了才才行。。当然然,画画图功功能是是都具具备的的。对对于简简单分分析,,Excel还算方方便,,但随随着问问题的的深入入,Excel就不那那么““傻瓜瓜”,,需要要使用用函数数,甚甚至根根本没没有相相应的的方法法了。。多数数专门门一些些的统统计推推断问问题还还需要要其他他专门门的统统计软软件来来处理理。统计软软件S-plus:这是是统计计学家家喜爱爱的软软件。。不仅仅由于于其功功能齐齐全,,而且且由于于其强强大的的编程程功能能,使使得研研究人人员可可以编编制自自己的的程序序来实实现自自己的的理论论和方方法。。它也也在进进行““傻瓜瓜化””以争争取顾顾客。。但仍仍然以以编程程方便便为顾顾客所所青睐睐。R软件::这是一一个免费的的,由志志愿者者管理理的软软件。。其编编程语语言与与S-plus所基于于的S语言一一样,,很方方便。。还有有不断断加入入的各各个方方向统统计学学家编编写的的统计计软件件包。。同时时从网网上可可以不不断更更新和和增加加有关关的软软件包包和程程序。。这是是发展最最快的软件件,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年春沪科版七年级数学下册 第9章 分式 小结与复习
- 2025年度深圳市物流行业劳动合同范本
- 2025年度旅游意外保险合作协议书
- 二零二五年度甲乙丙方写字楼转租管理协议
- 二零二五年度父子间债权转让及债务转移安排协议
- 2025年度智能信用卡委托代理服务合作协议
- 二零二五年度跨境电商股权零元转让协议
- 二零二五年度离婚后财产分割与双方未来子女入学协议
- 电子烟基础知识培训课件
- 2025陕西彬长矿业集团有限公司招聘(150人)笔试参考题库附带答案详解
- 开展我为同学办实事活动
- 医科大学2024年12月五官科护理学作业考核试题答卷
- 火锅店新产品研发方案
- 2024年基金应知应会考试题库
- 2024年河北省公务员录用考试《行测》试题及答案解析
- 科学四年级下册第一单元第4课《车来了》课件
- 膝关节穿刺术课件
- 海信入职在线测评真题
- 陶瓷制品产业链优化与协同创新
- 骨骼肌损伤的再生修复
- 大象版(2017秋)六年级下册 科学 2.4可再生与不可再生资源(教学设计)
评论
0/150
提交评论