电大 社会统计学 第七章 统计推断_第1页
电大 社会统计学 第七章 统计推断_第2页
电大 社会统计学 第七章 统计推断_第3页
电大 社会统计学 第七章 统计推断_第4页
电大 社会统计学 第七章 统计推断_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学任课教师:徐依婷578012689@教材:中央广播电视大学出版社,陈卫

第七章统计推断学习目标:

1、了解统计推断的原理和随机现象、概率分布

2、掌握样本统计量的抽样分布

3、掌握中心极限定理、总体参数的区间估计

4、掌握虚无假设和替换假设第一节统计推断中的相关概念一、随机性1、统计推断就是根据统计量的分布和概率理论,由样本统计量来推断总体参数的过程,包括参数估计和假设检验两部分内容。例如,我们知道某班级一部分同学的期末成绩,以此推测这个班同学的平均成绩。2、随机现象随机现象就是在同一组条件下,每次试验可能出现某一结果,也可能不出现,也就偶然现象。二、概率模型(一)随机变量:如果某现象的出现是一个随机现象,那么变量X就是随机变量。随机变量分为两类:离散型随机变量:变量的值可以逐个列举出来。连续性随机变量:变量的值不能一一列举出来,而是数轴上某一区间的任意一点。(二)概率分布概率分布就是随机变量的取值与其概率构成的分布。通常用P(X)表示随机变量X的概率,概率分布就是X的取值与P(X)的关系分布。根据随机变量的不同,也分为离散型随机变量和连续型随机变量的概率分布两种。离散型概率分布连续型概率分布采用函数的形式来表示连续型概率分布。连续型随机变量取任何一个特定的值的概率为0。因而不能列出每一个值及其相应的概率,通常是研究它取某一区间值的概率。例如,研究a﹤x﹤b的概率,即求P(a﹤x﹤b)是有意义的。三、统计量1、总体与样本:总体:由所研究的全体元素组成的集合称为总体,而把组成总体的每个元素称为个体。例如,在考察某一批灯泡的质量时,该批灯泡的全体就组成一个总体,而其中每个灯泡就是个体。样本:为了解总体X的分布规律或某些特征,我们必须对总体进行抽样观察,即从总体X中随机抽取n个个体,并称为来自总体X的容量为n的样本。(二)参数与统计量参数是研究者想要了解的总体的某种特征值,主要有总体平均数、标准差、比例等。总体参数往往是一个未知数,这也正是抽样的意义所在,人们利用抽样调查的方法根据样本信息推断总体参数值。统计量是根据样本数据计算出来的一个量,关心的样本统计量主要有样本平均数、样本标准差、样本比例等。样本统计量通常选用英文大写字母来表示。与参数不同,统计量是根据样本数据计算出来的,有关样本的特征值,因而统计量是已知的,可以计算的,是估计总体参数的依据。第二节抽样分布样本分布是样本中所有元素各个观察值形成的分布。我们可以得知样本中所有元素的观察值的,样本的分布是可以通过统计图表示的。样本是从总体中抽取的,必然包含总体的一些信息和特征,有时我们也称为样本分布或经验分布。当抽取的样本容量n足够大时,样本的分布就接近总体的分布。同样,当总体很大,而样本量很小时,样本对总体的代表性就相对较差。抽样分布抽样分布是指样本统计量的概率分布,它是在重复选取容量为n的样本时,由每个样本计算出来的统计量数值的相对频数分布。样本均值的抽样分布对于每一个样本我们都可以计算均值,抽取的样本不同,计算的均值就不同,因而我们说样本均值是随机变量。样本均值的抽样分布是所有样本均值形成的分布,即样本均值的概率分布。中心极限定理样本均值的抽样分布与总体的分布和样本容量n有关,当总体为正态分布时,均值抽样分布为正态分布,或者当样本容量n很大时,均值的抽样分布接近正态分布。这就是著名的中心极限定理。中心极限定理具体内容为:不论总体分布是否服从正态分布,从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。(三)样本均值抽样分布的特征假设从容量N的总体中抽取容量为n的样本,其中总体的均值为μ,方差为σ2,样本均值的数学期望为E(),方差为σ2x三、样本比例的抽样分布用π表示总体比例,用P表示样本比例。第三节参数估计参数估计是统计推断的一个重要部分,它是用样本统计量推断总体参数的过程。参数估计可分为点估计和区间估计两种类型。一、点估计点估计就是直接用估计量作为总体参数θ的估计值。用样本均值直接作为总体均值μ的估计值,用样本比例P直接作为总体比例π的估计值,用样本方差直接作为总体方差的估计值等。例如,随机样本的均值为6分,我们用6分直接作为总体的估计值,认为这次考试总体平均分为6分,这就是点估计。一个好的估计量的特征:(1)无偏性。用统计量估计总体参数时必定会有误差,但是多个统计量中有的偏大、有的偏小,偏差的平均数为0,这时,这个统计量就是无偏估计量。或者说估计量抽样分布的数学期望等于总体参数时,就具有无偏性。(2)一致性。所谓一致性是指当样本容量无限增大时,估计值应能越来越接近它所估计的总体参数。(3)有效性。是指当总体参数的无偏估计不止一个统计量时,标准差小的估计量更有效,标准差大的有效性就相对差。也就是说,估计量与总体参数的离散程度也要较小。(4)充分性。是指一个容量为的样本统计量,是否充分反映了全部个数据所反映总体的信息,这就是充分性。二、区间估计(一)区间估计的定义(二)置信水平和置信空间置信区间是在区间估计中,由样本统计量所构造的总体参数的估计区间,它有估计量加减抽样误差构成,我们将区间的最小值称为置信下限,区间的最大值称为置信上限。置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例。求置信区间的步骤(四)区间估计1、总体均值的区间估计在进行区间估计时,我们应首先判断总体是否为正态分布、样本是否为大样本、总体方差是否已知,然后通过样本统计量估计总体参数。具体包括以下步骤:总体方差的区间估计与总体比例的区间估计,只要求了解。详见书138页。第四节假设检验一、概念假设检验是首先对总体参数建立一个假设,然后根据样本信息区检验这一假设是否正确。假设检验和参数估计都是建立在抽样分布的基础上。例如,某品牌灯泡的寿命X服从正态分布(μ,125),厂方说它的平均工作寿命是1800小时。随机测试16次,得到的平均工作温度是1750度。样本结果与厂方所说的是否有显著差异?厂方的说法是否可以接受?这就是假设检验要解决的问题。假设检验的基本思想可以用小概率原理解释。小概率原理,就是在一次试验中小概率事件是几乎不可能发生的。也就是说,如果我们对总体的某个假设是真实的,那么极端值(不支持假设的事件)是几乎不可能发生的。如果发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。第四节假设检验二、虚无假设和替换假设一般假设检验的做法是:选择一个检验,使得当H0为真时,拒绝H0的犯

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论