统计分析方法1课件_第1页
统计分析方法1课件_第2页
统计分析方法1课件_第3页
统计分析方法1课件_第4页
统计分析方法1课件_第5页
已阅读5页,还剩36页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录第一讲前言第二讲基础知识第三讲总体参数的估计第四讲总体参数的检验第五讲相关与回归分析第六讲列联表第七讲方差分析第八讲主成分与因子分析第九讲聚类与判别分析第十讲典型相关与对应分析第十一讲时间序列分析第十二讲非参数检验第十三讲生存分析第十四讲统计综合评价第十五讲前沿分析方法(一)第十六讲前沿分析方法(二)第一讲前言1统计方法1.1统计是什么1.2随机性和概率1.3变量和数据1.4变量间的关系1.2学习目的1统计方法1.1统计是什么一句话,统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。1.1统计是什么?统计是人类思维的一个归纳过程站在一个路口,看到每过去20辆小轿车时,也有100辆自行车通过而且平均每10个轿车载有12个人于是,你认为小汽车和自行车在这个路口的运载能力为24:100这是一个典型的统计思维过程1.1统计是什么?一般来说,统计先从现实世界收集数据(信息),如观测路口的交通然后,根据数据作出判断,称为模型模型是从数据产生的模型也需要根据新的信息来改进不存在完美的模型模型的最终结局都是被更能够说明现实世界的新模型所取代任何公司都有一个信用问题。当然,在这些公司试图得到贷款时并没有不还贷的不良记录。如何根据它们的财务和商业资料来判断一个公司的信用等级呢?我国东部和西部的概念是一个比较笼统的概念。如何能够根据需要,选择一些指标来把各省,或各市县甚至村进行分类呢?疾病传播时,如何能够通过感染者入院前后的各种因素得到一个疾病传染方式的模型呢?如何通过大众调查来得到性别、年龄、职业、收入等各种因素与公众对某项事物(比如商品或政策)的态度的关系呢?一个从来没有研究过红楼梦的统计学家如何根据比较写作习惯得出红楼梦从哪一段开始就不是曹雪芹的手笔了呢?如何才能够客观地得到某个电视节目的收视率,以确定广告的价格是否合理呢?以归纳为主要思维方式的统计不是以演绎为主的数学统计可应用于各个不同学科,在有些学科已经有其特有的方法和特点;如生物统计(biostatistics)、经济计量学(econometrics)以及目前很热门的生物信息(bioinformation)和数据挖掘(DataMining)的方法主体都是统计。1.2随机性和概率从中学起,我们就知道物理学的许多定律,例如v=v0+at;F=ma等等但是在许多领域,很难用如此确定的公式或论述来描述一些现象。1.2随机性和概率一些现象既有规律性又有随机性(randomness)肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性而绝非每个吸烟的人都会患肺癌,这体现了随机性1.2随机性和概率什么是概率(probability)?新闻中最常见的是“降水概率”从某种意义说来,概率描述了某件事情发生的机会。显然,这种概率不可能超过百分之百,也不可能少于百分之零。概率是在0和1之间(也可能是0或1)的一个数,描述某事件发生的机会。1.2随机性和概率有些概率是无法精确推断的。比如你明天感冒的概率有些概率是可以知道的。比如在打桥牌时得到一手黑桃的概率为1/635013559600,大约为1.574770×10-12(条件是洗牌均匀,没有作弊)。实际上得任何特定的一手牌的概率都是一样的,对吗?1.3变量和数据一节火车车厢有多少坐位是一个固定的数目,称为常数(constant)或者常量。但是,开车后,坐在这节车厢的旅客有多少就没准了。这有随机性。该车厢的乘客数为变量(variable)。1.3变量和数据一个学校的注册在校男女生比例是固定的,为常量但是,该校任意一群学生的男女生比例就不一定和全校的比例一样了,它为变量(variable)。1.3变量和数据当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitativevariable);因为是随机的,也称为随机变量(randomvariable)。如身高体重,购买某商品的人数等等1.3变量和数据象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitativevariable,或categoricalvariable)。这些定性变量也可以由定量变量来描述,如男女生的数目,持有某观点的人数比例等等。1.3变量和数据定性变量只有用数量来描述时,才有可能建立数学模型,并使用计算机来分析。数据中它们通常用哑元(dummyvariable)代表,比如性别用0、1代表,三种收入用0、1、2代表(或用字母代表)1.3变量和数据有了变量,何谓数据?不同机构调查所得到的北京收入万元以上市民的比例都不一样,这是变量而这些调查产生一些数目,这些数目就是数据(data)数据是关于变量的观测值。1.4变量间的关系数量变量间的关系

是否有关是否显著是否可以模型化是否具有普遍性是否因果关系eg.ads分类变量间的关系

eg.table7

分类变量与数量变量间的关系1.4变量间的关系现实世界紧密联系的人们想知道投资方式和经济效益之间的关系、旅客人数和经济发展之间的关系等等不讨论变量之间的关系,就无从谈起任何有深度的应用,统计的基本概念就仅仅是摆设而已。横坐标代表广告投入,而纵坐标代表销售收入。看得出有何种关系吗?§1.4.1定量变量间的关系能否从该数据回答下面问题:这两个变量是否有关系?如果有,它们的关系是否显著?这些关系是什么关系,能否用数学模型来描述?这个关系是否带有普遍性?这个关系是不是因果关系?§1.4.1定量变量间的关系关于因果关系在可控制的试验中,较容易找到因果关系;比如治疗方式和疗效的关系等但是,一般来说,变量之间有关系这个事实并不意味着一定存在明确的因果关系。§1.4.1定量变量间的关系比如,北京GDP在一年中是快速增长的,而一个刚出生的巴拿马婴儿在这一年中的体重也是快速增长的如果画出图来,它们有类似线性的关系但它们显然没有因果关系§1.4.1定量变量间的关系只要有关系,即使不是因果关系也不妨碍人们利用这种关系来进行推断。比如利用公鸡打鸣来预报太阳升起;虽然公鸡打鸣绝对不是日出的原因(虽然打鸣发生在先)§1.4.1定量变量间的关系简单的办法(诸如画图)可以得到一些信息,但不一定能够给出满意的答案需要更多的工具和手段来进行数值分析得到更加严格和精确的解答因此,需要继续我们的课程§1.4.2定性变量间的关系例1.2.下面是对123人进行关于某项政策调查所得结果的一个简单的三维表,它显示了人们的收入和性别对该项政策的观点。(table7.txt)。计算机软件所应用的数据形式§1.4.2定性变量间的关系从这个数据,希望可以看出收入、性别对观点是否有影响及如何影响如果要得到更加精确的结论,就要进行进一步的分析和计算这是后面列联表分析或多项分布对数线性模型的内容§1.4.3定性和定量变量间的混和关系有些数据不是仅有定性变量或仅有定量变量需要知道包括定性和定量两种变量的一些变量之间的关系下面数据就包含两种变量Asthma.txt数据§1.4.3定性和定量变量间的混和关系该数据有2个定性变量(性别,污染程度)、一个定量变量(年龄)以及发生哮喘的人数我们希望知道哮喘和这三个变量之间的关系这将在Poisson对数线性模型中讨论1.2学习目的Wecanunderstandmostquantitativemethodsusedinacademicpublicationsinstatisticalandeconometricalfieldswithoutmuchdifficulty.

Wecandoempiricalresearchfreelywiththemostadaptablequantitativemethods.中文参考书目:统计学:从数据到结论,吴喜之编著,中国统计出版社,2006年10月。概率论与数理统计,茆诗松、周纪芗编著,中国统计出版社,2000年7月。实用多元统计分析,RichardA.Johnson,DeanW.Wichern著,陆璇译,2001年4月。SPSS11统计分析教程,张文彤著,北京希望电子出版社,2002年6月。统计预测与决策,徐国祥主编,上海财经大学出版社,2000年5月。计量经济学教程,赵卫亚编著,上海财经大学出版社,2003年8月。计量经济学方法,JackJohnson,JohnDiNardo著,唐齐鸣等译,中国经济出版社,2002年4月。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论