版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
STAT
第六章抽样和抽样分布统计实例STAT统计实例
1.称重问题:某养猪场厂共有存栏生猪10万头,现欲了解这批生猪的平均毛重;
2.选举活动:每个候选人的支持率是多少;
3.生产活动:产品不合格率是多少;
4.环境保护:污染区域、污染程度如何;
5.市场研究:产品品种、价格和质量状况;消费者的购买力状况。统计调查:全面调查、非全面调查。本章将引入“抽样推断”的基本内容(怎么抽、抽多少、如何推断),这将节省人们的各种资源,并达到对客观对象的最佳认识。第六章抽样和抽样分布STAT本章重点
1.统计推断的基本概念
2.抽样分布
3.抽样标准差的意义及计算
本章难点
1.样本均值(比率)的抽样分布第六章抽样和抽样分布STAT第一节统计推断的基本概念一、统计推断
从样本数据得到总体结论的过程就叫做统计推断。统计推断的方法:参数估计、假设检验→运用概率估计的方法。
统计推断的理论:大数定律和中心极限定理。
统计推断的效果:抽样误差可以计算并控制。二、总体与样本三、总体参数与样本统计量第六章抽样和抽样分布STAT
[例]某养猪场共有存栏生猪10万头,现欲了解这批生猪的平均毛重及健康比例。调查者按随机原则从中抽取了100头生猪进行调查,以计算其平均毛重和健康比例。
(一)总体参数:反映总体特征的变量。
(二)样本统计量:反映样本特征的变量。样本的随机性决定统计量的随机性(统计量是随机变量)。注意:分母是多少?第六章抽样和抽样分布STAT
■为什么样本方差和标准差计算公式的分母是n-1而不是n呢?解释:在计算样本方差中,n个偏差x1-,…,xn-有一个约束条件∑(x-)=0,即只有n-1个偏差可以自由取值,剩下的一个偏差由他们确定,所以自由度为n-1。
因为样本标准差(S)是总体标准差的估计值,但只有在用n减去1的情况下才是无偏估计。把分母减去1会使得标准差大于实际的标准差。为什么要这样做呢?因为好的统计学家、科学家一般都是保守的。保守的含义是,如果我们不得不出错,我们出错也是由于过高估计了总体的标准差。除以较小的分母可以让我们做到这一点。主要针对小样本!(见下表)第六章抽样和抽样分布STAT样本规模公式中分子的数值总体标准差的有偏估计(除以n)总体标准差的无偏估计(除以n-1)两者之差105007.077.450.381005002.242.250.0110005000.70710.70750.0004第六章抽样和抽样分布STAT三、简单随机抽样(simplerandomsamplingSRS)抽样组织形式:简单随机抽样,分层(类型)抽样,系统(机械)抽样,整群抽样,多阶段抽样(一)抽样组织第六章抽样和抽样分布STAT(二)抽样方式
1.重复抽样(回置抽样)[例]总体5人年龄:1,2,3,4,5。按重复抽样随机抽取3人。
Xi(可能结果)xi(实际结果)概率第一次抽样1,2,3,4,5
21/5回置第二次抽样1,2,3,4,5
51/5回置第三次抽样1,2,3,4,5
21/5回置[例]N=3人(A、B、C)
n=2。①A、A;②A、B;③A、C;④B、A;⑤B、B;⑥B、C;⑦C、A;⑧C、B;⑨C、C。
★样本可能数目:M=Nn
★样本产生概率=1/Nn
独立同分布的SRS样本第六章抽样和抽样分布STAT
2.不重复抽样(不回置或不重置抽样)[例]总体年龄为:1,2,3,4,5。按不重复抽样从中抽取3人。
Xi(可能结果)xi(实际结果)概率第一次抽样1,2,3,4,521/5外置
第二次抽样1,3,4,551/4外置
第三次抽样1,3,431/3外置[例]N=3人(A、B、C)n=2①A、B;②A、C;③B、A;④B、C;⑤C、A;⑥C、B。★样本可能数目:
M=
N!/(N–n)!★样本产生概率=(N–n)!/N!第六章抽样和抽样分布STAT第二节抽样分布※一、统计误差的种类
1.登记性误差:各种主客观原因所导致的误差。
2.代表性误差(1)系统偏差:破坏随机原则而引起的误差。
(2)抽样误差(samplingerror):随机取样,由于样本与总体结构的差异而导致的偶然性误差。第六章抽样和抽样分布STAT二、抽样分布的概念1.总体分布:总体变量的取值及出现概率所形成的分布。
[例]总体三人(A、B、C)的年龄为1,2,3。N=32.样本分布:样本观测值的分布→包含总体信息和特征的多少取决于样本容量。
→经验分布第六章抽样和抽样分布STAT
3.抽样分布:样本统计量的取值及其出现概率的分布。
→理论分布
抽样分布的形成:抽样分布的影响因素:总体分布、样本容量、抽样方法、抽样组织形式、统计量构造[例]n=2,计算样本平均年龄。第六章抽样和抽样分布STAT三、抽样分布的数字特征(一)样本均值的数字特征→探讨样本均值的期望值和标准差与总体均值及标准差之间的关系
1.重复抽样[例]总体三人(A、B、C)的年龄为1,2,3。N=3
n=2,计算样本平均年龄。第六章抽样和抽样分布STAT
(2)样本均值的标准差(抽样标准差)★
定义:样本均值与其期望值的平均离差。→抽样平均误差
抽样实际误差?
抽样极限误差?
作用:衡量抽样分布的离散程度,反映样本统计量的代表性。→抽样标准差越大(小),抽样分布越离散(集中),样本的代表性平均而言越差(越好)。第六章抽样和抽样分布STAT[计算]N=3人,(A,B,C)=(1,2,3)n=2
无法计算;未显示与总体的关系!第六章抽样和抽样分布STAT
2.不重复抽样
无法计算;未显示与总体的关系!第六章抽样和抽样分布STAT归纳
1.样本均值的期望值等于总体均值。
2.样本均值的标准差:样本均值与其期望值的平均离差。第六章抽样和抽样分布STAT(二)样本比例的数字特征
1.样本比例的期望值等于总体比例。
2.样本比例的标准差:样本比例与其期望值的平均离差。第六章抽样和抽样分布STAT
四、中心极限定理
■设X是具有期望值为、方差为2的任意总体,则样本均值的抽样分布,将随着n的增大而趋于正态分布,即
■当样本容量很大且nP≥5、n(1-P)≥5时,可将样本比例的抽样分布近似看成正态分布。第六章抽样和抽样分布STAT五、正态分布的标准化
1.正态分布的定义身高
1401501601701801900.50.40.30.20.1频率第六章抽样和抽样分布STAT调整:“频率密度”(频率/组距)“频率”;身高
140150160170180190频率密度0.050.040.030.020.01P{150X180}=0.90当n无穷大,折线?
直方或折线覆盖下的面积=?第六章抽样和抽样分布STAT[概率计算的思路]身高
1401501601701801900.050.040.030.020.01f(xi)f(x):概率密度函数第六章抽样和抽样分布STAT
正态分布的定义:
如果随机变量X的密度函数为X
μf(x)则称X服从正态分布,记作X~N(μ,σ2
)2.正态分布的特征正态分布是依赖于μ和σ的一簇分布,其位置和形状随μ和σ的不同而不同,这给研究具体的正态总体带来困难。第六章抽样和抽样分布STAT
3.标准正态分布
[直线研究]表达式:y=a+bxXY第六章抽样和抽样分布STAT一般正态分布的标准化:
x1x2-Z0ZX第六章抽样和抽样分布STAT
标准正态分布的作用:
■标准正态分布在正态分布中形式简单,且任意正态分布的概率都可化为标准正态分布来计算。
■人们根据标准正态分布的分布函数编制了正态分布表,可直接查用。
标准正态分布几种常用的概率:(必须熟记!)P(-1≤Z<1)=0.6826→68.26%P(-1.645≤Z<1.645)=0.90→90%P(-1.96≤Z<1.96)=0.95→95%P(-2≤Z<2)=0.9545→95.45%P(-3≤Z<3)=0.9973→99.73%第六章抽样和抽样分布STAT
[例]假定学生某门学科的考试成绩服从均值为60分、标准差为12分的正态分布。那么某一学生的成绩在60分到75分之间的概率应为多少?(标准正态分布表)
x1x2-Z0Z第六章抽样和抽样分布STAT本章小结:
■从总体中抽取一个特定的样本,我们不知道这个样本与总体分布的关系(样本均值和标准差与总体均值及标准差之间的关系),但我们可以知道抽样分布与总体分布的关系,即所有可能样本均值的期望值和标准差与总体均值及标准差之
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 阴茎畸形与慢性疼痛研究-洞察分析
- 野生动物保护策略-洞察分析
- 心脏康复心理干预-洞察分析
- 血液成分鉴定技术-洞察分析
- 云计算与-class应用-洞察分析
- 水平转移的生态效应-洞察分析
- 微服务架构设计-洞察分析
- 新型气体生产技术研究-洞察分析
- 星链与区块链互操作-洞察分析
- 2024年柳州市柳铁中心医院柳州市第三人民医院高层次卫技人才招聘笔试历年参考题库频考点附带答案
- 理性思维作文素材800字(通用范文5篇)
- 口腔颌面外科学 09颞下颌关节疾病
- 应急物资清单明细表
- 房地产估计第八章成本法练习题参考
- 《社会主义核心价值观》优秀课件
- 《妊娠期糖尿病患者个案护理体会(论文)3500字》
- 《小学生错别字原因及对策研究(论文)》
- 便携式气体检测报警仪管理制度
- 酒店安全的管理制度
- (大洁王)化学品安全技术说明书
- 2022年科学道德与学术规范知识竞赛决赛题库(含答案)
评论
0/150
提交评论