




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学原理主讲:李晓辉南昌航空大学.第一节 统计量第二节 大数定律与中心极限定理第三节 由正态分布导出的几个重要分布第四节 常用的抽样方法第五节 抽样分布第五章 抽样与抽样分布.第一节 统计量统计量statistic:描画样本特征的概括性数字度量,根据样本数据计算的一个随机变量,是对总体分布特征推断的工具。设X1, X2, Xn为总体X的样本,假设样本的函数g(X1, X2, Xn)是一个随机变量,并且不包含任何未知参数,那么称g(X1, X2, Xn)为统计量。.几个常用的统计量:1. 样本均值: 2. 样本方差: 3.样本规范差: .第二节 大数定律与中心极限定理一、大数定律大数定律law
2、s of large numbers也称大数法那么,它是论述大量同类随机景象的平均结果稳定性的规律。.辛钦大数定理设随机变量X1, X2, Xn相互独立,服从同一分布,且具有数学期望EXi=(i=1,2,n) 那么对恣意0,有定律阐明:只需随机变量独立同分布,即使不存在有限方差,其数学期望仍可由n个随机变量的算术平均值作为其近似值。.二、中心极限定理在统计学中,论证随机变量和的极限分布是正态分布的一系列定理统称为中心极限定理central limit theorem。 .独立同分布中心极限定理 设X1, X2, Xn是独立同分布的随机变量序列,且存在有限的数学期望EXi=和方差DXi=2 (i
3、=1,2,n) ,那么当n时,中心极限定理为均值的抽样推断奠定了实际根底。不论总体服从何种分布,只需期望和方差存在,对这一总体进展反复抽样,当样本量充分大,样本均值就趋于正态分布。.棣莫佛拉普拉斯中心极限定理定理阐明,当n很大,np和n(1-p) (n是实验的次数,p是实验中事件A发生的概率)也都不太小时,二项分布可以用正态分布去近似。 .第三节 由正态分布导出的几个重要分布由样本统计量对未知总体分布进展推断,必需知道统计量所服从的分布。 本节引见几个重要的常用统计量分布:2分布,t分布, F分布。 .一、分位数设X为随机变量,对给定的概率(10),假设实数F满足不等式那么称F为随机变量X分布
4、概率为的上侧分位数。假设实数T/2满足不等式那么称T/2为随机变量X分布概率为的双侧分位数。.规范正态分布的上侧分位数 Z0Z.规范正态分布的双侧分位数 / 2 / 2 Z0-Z/2 Z/2 .设X1,X2,Xn是取自规范正态总体的样本 ,那么随机变量 服从具有n个自在度的2分布,记为c2-分布 (2-distribution).不同自在度的c2-分布c 2n=1n=4n=10.1. 变量值一直为正 2. 通常为不对称的右偏分布,随着自在度的增大逐渐趋于对称 3.期望E(2)=n,方差D(2)=2n(n为自在度) 4.可加性:假设U和V为两个独立的2分布随机变量,U2(n1),V2(n2),那
5、么U+V服从自在度为n1+n2的2分布 c2-分布性质和特点.t-分布 (t-distribution)设XN(0,1),Y 2(n), 且X与Y相互独立,那么称 服从自在度为n的t分布,记为tt(n) .t 分布与规范正态分布的比较t 分布规范正态分布tt (df = 20)t (df = 10)z0.t分布的性质:1与正态分布一样,是对称的,但比正态分布要平一些。2自在度充分大时,t分布近似于正态分布。自在度趋向无穷大时,t分布就是规范正态分布。3t分布的均值为0,其方差为n/(n-2)。 .设X2(m), Y2(n), 且X与Y相互独立,那么称 服从自在度m和n的F分布,记为F-分布 (
6、F distribution).不同自在度的F分布F(1,10)(5,10)(10,10)右偏分布.第四节 常用的抽样方法通常有以下几种抽样方法: 简单随机抽样 分层抽样 系统抽样 整群抽样 多阶段抽样.一、简单随机抽样对总体未作任何处置,按随机原那么直接从总体中抽出假设干单位构成样本.抽取样本的详细方法:抽签法:将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中恣意抽选,签上的号码所对应的单位就是样本单位。随机数表法:将总体中每个单位编上号码,然后运用随机数表,查出所要抽取的调查单位。仅适用于规模不大、内部各单位标志值差别较小的总体直接抽选法 . 先将总体按某一标志分层,然后从
7、各层中按随机原那么抽取样本单位组成样本。二、分层抽样本质上是分组法与随机原那么的结合。例如,在居民生活程度调查中,先按职业分类,然后每种职业分别随机抽取部分居民进展调查。.样本在各层间的分配方法:等比例分配法:按各层单位的比例分配样本单位。类型抽样的优点:能提高样本的代表性;组织起来较为方便;.先将总体各单位按某一标志排队,然后按固定的顺序和间隔抽取样本单位。又称机械抽样或等距抽样。三、系统抽样系统抽样是不反复抽样,适宜于对单位数不多且能进展排序的总体抽样。按无关标志排队按有关标志排队排序和所研讨标志数值大小无关。如调查居民生活程度时,按姓氏笔划排队。排序和所研讨标志数值大小有亲密关系。如居民
8、收入调查,按银行存款多少排序。.根据样本抽选的方法不同,可分为:随机起点系统抽样半距起点系统抽样对称起点系统抽样总体单位按某一标志排序总体单位按某一标志排序总体单位按某一标志排序.系统抽样的益处: 1. 可以使抽样过程大大简化,减轻抽样的任务量;2. 假设用有关标志排队,还可以减少抽样误差,提高抽样推断效果。按有关标志排队系统抽样,实践上是一种特殊的分层抽样。.将总体全部单位分为假设干“群,然后以群作为抽样单位,从总体中抽取假设干群作为样本,并对中选群的一切单位进展全面调查。例:总体群数R=16 样本群数r=4样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性能够较差四、整群抽样
9、ABCDEFGHIJKLMNOPDPIH.五、多阶段抽样 某公司要进展全国性的产品售后效力称心度调查时,通常是先抽几个省,然后从抽中的省中抽取假设干个城市,从抽中的城市中,再抽取假设干个县、村,最后再抽到户,这种抽样方式就是多阶段抽样。 .第五节 抽样分布 一、抽样分布概念 样本统计量取值的概率分布,叫抽样分布sampling distribution。 是推断统计中用样本推断总体时的重要实际根据。.在反复选取容量为n的样本时,由样本均值的一切能够取值构成的概率分布推断总体均值的实际根底二、样本均值的分布. = 50 =10X总体分布n = 4抽样分布xn =16总体服从正态分布N(,2),该
10、总体的任何容量的样本均值x也服从正态分布,x的期望值为,方差为2/n。即x N(,2/n).从均值为,方差为2的一个恣意总体中抽取容量为n的样本,当n(30)充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布样本均值的抽样分布趋于正态分布恣意分布的总体x.样本均值抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本样本均值正态分布样本均值正态分布样本均值非正态分布.总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品) 与全部产品总数之比总体比例可表示为样本比例可表示为三、样本比例的分布(proportion).在反复选取容量为n的样本时
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 5年级下册英语书单词表点读
- 低空空中交通应用场景
- 登山 法治宣传活动
- 4年级观察日记三则怎么写
- 超声波塑料焊接 - 副本 - 副本
- 2025年贵阳幼儿师范高等专科学校单招职业技能测试题库带答案
- 2025年云南商务职业学院单招职业倾向性测试题库一套
- 2025年重庆市绵阳市单招职业倾向性测试题库及参考答案
- 2025年天津公安警官职业学院单招职业技能测试题库1套
- 2025年晋城职业技术学院单招职业技能测试题库学生专用
- 2024年家电市场发展趋势及2025年消费趋势分析报告-GfK
- 2024年陕西省初中学业水平考试·数学
- 劳荣枝案件分析报告
- 火电厂汽机车间安全培训
- 社区网格员消防安全培训
- 剪刀式登高车安全技术交底
- 部编人教版小学4四年级《道德与法治》下册全册教案
- 新疆2022年中考数学试卷(含答案)
- LED显示屏培训资料
- 2024年监理考试-公路工程监理工程师考试近5年真题附答案
- 生产厂房消防施工合同范本
评论
0/150
提交评论