第七讲推论统计与参数估计_第1页
第七讲推论统计与参数估计_第2页
第七讲推论统计与参数估计_第3页
第七讲推论统计与参数估计_第4页
第七讲推论统计与参数估计_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七讲推论统计与参数估计第一页,共三十三页,2022年,8月28日2“社会学研究关注关心的是总体的情况,不是样本的情况。”——李沛良《社会研究的统计应用》“我们真正感兴趣的是总体,而不是样本。我们抽取样本,只是为了方便,而我们的目的是在于根据已知的统计量来推论各种参数。”——布莱洛克《社会统计学》第二页,共三十三页,2022年,8月28日3一、推论统计的基本概念第三页,共三十三页,2022年,8月28日41.1样本与总体☆总体(Population)所关心的所有元素的集合☆样本(Sample)从总体中按一定方式抽取出的一部分元素的集合总体样本第四页,共三十三页,2022年,8月28日51.2统计量与参数值☆参数值(Parameter)总体的数字特征,通常用希腊字母表示;例如总体均值μ,总体标准差σ;☆统计量(Statistic)样本的概括性测度值,通常用罗马字母表示;例如样本均值,样本标准差S。第五页,共三十三页,2022年,8月28日61.3抽样从组成某个总体的所有元素的集合中,按一定的方式选取或抽取样本(一部分元素)的过程。简单讲,抽样就是从总体中抽取样本的过程。第六页,共三十三页,2022年,8月28日71.3.1抽样方法概率抽样:根据已知的概率(随机原则)选取样本个案

简单随机抽样:分层抽样:

整群抽样:等距抽样:非概率抽样:不是完全按随机原则选取样

偶遇抽样:

判断抽样:配额抽样:第七页,共三十三页,2022年,8月28日81.4概率

随机事件发生可能性(或然性)大小的数量表示。第八页,共三十三页,2022年,8月28日91.5抽样分布抽样分布是根据概率原则而成立的理论分布,显示由同一总体中反复不断抽取不同样本时,各个可能出现的样本统计量的分布情况。第九页,共三十三页,2022年,8月28日101.6推论统计(概念要点)

1、根据样本的统计值来推测总体的参数值。

2、统计推论以概率论为基础,因此统计推论的方法主要适用于概率(随机)抽样的数据。

3、抽样分布原理是统计推论的依据。第十页,共三十三页,2022年,8月28日11二、统计推论的基础:抽样分布

——以均值抽样分布为例第十一页,共三十三页,2022年,8月28日122.1抽样分布(概念要点)由一个总体中反复不断抽取不同样本时,各个可能出现样本统计值的分布情况。比如均值的抽样分布。抽样分布是以概率为基础的。抽样分布是一种理论分布。第十二页,共三十三页,2022年,8月28日132.2均值抽样分布图Xi

根据数学的中心极限定理,在大样本情况下,均值抽样分布接近正态分布。第十三页,共三十三页,2022年,8月28日142.3均值抽样分布的基本特征1、大样本(通常指n≥50,当然越大越好),均值抽样分布服从正态分布;2、均值抽样分布之均值就是总体均值μ;3、均值抽样分布的标准差,称为标准误差(standarderror),计算公式为第十四页,共三十三页,2022年,8月28日152.3均值抽样分布的基本特征(续1)4、如果将均值标准化,就可得到标准正态分布:~

N(0,1)此表达式是参数估计和假设检验的基础第十五页,共三十三页,2022年,8月28日162.3均值抽样分布的基本特征(续2)5、通过标准化转化,均值抽样分布中任意两值之间的样本均值次数所占的比例是可以知道的。通过查标准正态分布表,社会学常用的有:

90%的面积在μ±1.65(SE);95%的面积在μ±1.96(SE);99%的面积在μ±2.58(SE);第十六页,共三十三页,2022年,8月28日172.4均值抽样分布特征的意义

统计推论,就是根据抽样分布的原理来进行的,而抽样分布则与概率密切相关。因此,只要我们是采用随机抽样法,就可以根据抽样分布,以样本的统计值来推测总体参数。第十七页,共三十三页,2022年,8月28日18三、推论统计的两种模式参数估计(parameter’sestimation)假设检验(hypothesistest)第十八页,共三十三页,2022年,8月28日193.1参数估计根据随机样本的统计值对总体的参数值进行估计。例如,由样本算出某社区居民的每月娱乐开支平均是42.5元,然后以此估计某市居民总体平均的娱乐开支情况是多少?是多于42.5,还是少于42.5?中提到支出情况在42.5元左右的多大范围内?

基本逻辑是:先看样本情况,然后估计总体的情况。第十九页,共三十三页,2022年,8月28日203.2假设检验首先假设总体的情况(参数或分布情况)是怎样的,然后通过随机样本的统计值来检验这个假设是否正确。

例如,我们先假设某城市居民总体用于娱乐消费的费用均值是40元,然后根据样本的均值来证明和分析,这一对总体的假设是对还是错。逻辑:先假设总体的情况,然后抽样调查和分析样本的资料,进而检验假设是否正确。第二十页,共三十三页,2022年,8月28日21四、参数估计-点估计参数估计点估计区间估计用一个数值来估计总体参数。用一个取值范围(区间)来估计总体参数。第二十一页,共三十三页,2022年,8月28日224.1点估计常用总体参数的点估计总体均值总体方差σ2

总体标准差σ第二十二页,共三十三页,2022年,8月28日234.2.总体均值的点估计样本均值X就是总体均值的点估计值。样本均值的计算公式为:第二十三页,共三十三页,2022年,8月28日244.3总体方差σ2的点估计样本方差S2就是总体方差的点估计值。样本方差的计算公式为:第二十四页,共三十三页,2022年,8月28日25总体标准差σ的点估计样本标准差S就是总体标准差的点估计值。样本标准差的计算公式为:第二十五页,共三十三页,2022年,8月28日264.4总体成数p的点估计样本成数(比例/比率)P就是总体成数的点估计值。当Xi为定类变量时,其取值有:Xi=1当观测值为所研究的A类0其它表示在样本n次观测中,A类共出现m次。第二十六页,共三十三页,2022年,8月28日274.5总体成数的点估计公式样本成数的计算公式:第二十七页,共三十三页,2022年,8月28日284.6常用总体参数点估计小结总体均值

的点估计值:样本均值X总体方差σ2的点估计值:样本方差S2总体标准差σ的点估计:样本标准差S第二十八页,共三十三页,2022年,8月28日294.7评价估计值的标准所谓总体参数Q的最佳估计值Õ(x1,x2,x3)应当是在某种意义下最近似Q的值。估计值的好坏有以下标准:第二十九页,共三十三页,2022年,8月28日301、无偏性作为母体均值μ的点估计值时,如果我们不是做一次抽样,而是做了m次抽样,我们将得到m个样本容量为n的样本,由m个样本所计算的m个样本的均值是不会完全相同的,也就是说其均值是随机变量。对于一个好的估计值,均值的分布总是围绕着总体参数μ的周围,也就是说各X分布的均值应该恰好就是总体参数μ。这时,我们称估计值为无偏估计值。第三十页,共三十三页,2022年,8月28日312、有效性有效性的标准要求估计值的抽样分布,应该具有较小的分散性。以保证一次抽样的结果能以较高的概率接近待估的总体参数。也就是说,如果有两个估计值Q1和Q2,它们都满足无偏性的话,那么,如果Q1的方差比Q2小时,则称Q1比Q2有效。第三十一页,共三十三页,2022年,8月28日323、一致性当样本容量逐渐增大时,估

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论