版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、样本样本抽取部分察看单位抽取部分察看单位 统计推断统计推断统计推断统计推断 statistical inferencestatistical inference如:样本均数如:样本均数 样本规范差样本规范差S 样本率样本率 P如:总体均数如:总体均数 总体规范差总体规范差 总体率总体率X内容:内容:参数估计参数估计(estimation of parameters) 包括:点估计包括:点估计与区间估计与区间估计2. 假设检验假设检验test of hypothesis)样本样本抽取部分察看单位抽取部分察看单位 统计推断统计推断第一节样本均数的规范误第一节样本均数的规范误如:样本均数如:样本均数
2、 样本规范差样本规范差S 样本率样本率 P如:总体均数如:总体均数 总体规范差总体规范差 总体率总体率X 抽样误差抽样误差 sampling sampling error) error) :由于个体由于个体差别导致差别导致的样本统的样本统计量与总计量与总体参数间体参数间的差别。的差别。一、抽样实验一、抽样实验 从正态分布总体从正态分布总体N N5.00,0.5025.00,0.502中,每次随机中,每次随机抽取样本含量抽取样本含量n n5 5,并计算其均数与规范差;反复抽,并计算其均数与规范差;反复抽取取10001000次,获得次,获得10001000份样本;计算份样本;计算10001000份
3、样本的均数份样本的均数与规范差,并对与规范差,并对10001000份样本的均数作直方图。份样本的均数作直方图。 按上述方法再做样本含量按上述方法再做样本含量n n1010、样本含量、样本含量n n3030的抽样实验;比较计算结果。的抽样实验;比较计算结果。抽样实验抽样实验n=5n=5抽样实验抽样实验n=10n=10抽样实验抽样实验n=30n=3010001000份样本抽样计算结果份样本抽样计算结果总体的总体的均数均数总体标总体标准差准差 均数的均数的均数均数均数标准差均数标准差n n=5=55.005.000.500.504.994.990.22120.22120.22360.2236n n=
4、10=105.005.000.500.505.005.000.15800.15800.15810.1581n n=30=305.005.000.500.505.005.000.09200.09200.09130.0913nnS3 3个抽样实验结果图示个抽样实验结果图示0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数
5、0501001502002503003504004503.713.924.124.334.544.744.955.155.365.575.775.986.19均数频数2212. 0; 5XSn0920. 0;30XSn1580. 0;10XSn例例7-1 假设正常男子红细胞计数服假设正常男子红细胞计数服从的正态分布总体,从该总体中反从的正态分布总体,从该总体中反复进展复进展100次抽样,每个样本的含量次抽样,每个样本的含量为为10,结果见表,结果见表7-1。书本。书本P105由表由表7-1可见,从同一总体中随机抽取样本可见,从同一总体中随机抽取样本含量含量n=10的假设干样本,各样本算得的样的
6、假设干样本,各样本算得的样本均数并不等于相应的总体均数,且各样本均数并不等于相应的总体均数,且各样本均数也不完全一样。这种由于随机抽样本均数也不完全一样。这种由于随机抽样而呵斥的来自同一总体的样本均数之间及而呵斥的来自同一总体的样本均数之间及样本均数与相应的总体均数之间的差别,样本均数与相应的总体均数之间的差别,称之为均数的抽样误差。称之为均数的抽样误差。 由于样本均数与相应的总体均数之间存在着由于样本均数与相应的总体均数之间存在着差别,由数理统计推理可知:从正态总体中差别,由数理统计推理可知:从正态总体中随机抽取样本含量为随机抽取样本含量为n的样本,每抽取一个的样本,每抽取一个样本可计算一个
7、样本均数,反复样本可计算一个样本均数,反复100次抽样可次抽样可得到得到100个样本均数。个样本均数。 这些样本均数服从均数为这些样本均数服从均数为 ,方差为,方差为 的正态分布的正态分布.其中为样本均数的总体其中为样本均数的总体规范差,计算公式为:规范差,计算公式为: 为了与反映个体差别的规范差或为了与反映个体差别的规范差或相区别,样本均数的规范差用相区别,样本均数的规范差用 表示。表示。 /Xn X 统计上通常将统计量如样本均数、统计上通常将统计量如样本均数、样本率样本率p等的规范差称为规范误等的规范差称为规范误(standard error,SE。所以,样本均。所以,样本均数的规范差数的
8、规范差 又称为样本均数的规范又称为样本均数的规范误,是反映样本均数抽样误差大小的目误,是反映样本均数抽样误差大小的目的。的。 X特点:特点:总体规范误的大小与总体规范差成正比,与样本含量总体规范误的大小与总体规范差成正比,与样本含量的平方根成反比。即当样本含量的平方根成反比。即当样本含量n一定时,规范差越大,即样一定时,规范差越大,即样本的个体差别越大,规范误就越大,样本均数的抽样误差就越本的个体差别越大,规范误就越大,样本均数的抽样误差就越大;规范差越小,规范误就越小,即样本均数抽样误差就越小大;规范差越小,规范误就越小,即样本均数抽样误差就越小。当一定时,当一定时,n越大,就越小;越大,就
9、越小;n越小,就越大。故影响越小,就越大。故影响抽样误差大小的主要要素是样本含量。作为总体参数常数抽样误差大小的主要要素是样本含量。作为总体参数常数通常是未知的,因此,在实践任务中常用样本规范差通常是未知的,因此,在实践任务中常用样本规范差S来估计来估计。 抽样实验小结抽样实验小结 均数的均数围绕总体均数上下动摇。均数的均数围绕总体均数上下动摇。 均数的规范差即规范误均数的规范差即规范误 与总体规范差与总体规范差 相差一个常数的倍数,即相差一个常数的倍数,即 样本均数的规范误样本均数的规范误Standard Error)Standard Error)= =样本规范差样本规范差/ / 计算例计算
10、例7-17-1,例,例7-27-2 从正态总体从正态总体N(m,s2)N(m,s2)中抽取样本,获得均数的分中抽取样本,获得均数的分布仍近似呈正态分布布仍近似呈正态分布N(m,s2/n) N(m,s2/n) 。nS样本含量nX/X二、总体均数的估计二、总体均数的估计pSX、 一一 总体均数的点估计总体均数的点估计point estimationpoint estimation与区间估计与区间估计参数的估计参数的估计点估计:由样本统计量点估计:由样本统计量 直接估计直接估计 总体参数总体参数区间估计:在一定可信度区间估计:在一定可信度Confidence level 下下,同时思索抽样误差,同时
11、思索抽样误差、 统计学中的统计推断包括两个重要的方面:一是利统计学中的统计推断包括两个重要的方面:一是利用样本统计量的信息对相应总体参数值做出推断用样本统计量的信息对相应总体参数值做出推断,如用样本均数估计总体均数,用样本规范差,如用样本均数估计总体均数,用样本规范差S S估估计总体规范差等,称之为点估计。另一个是利用计总体规范差等,称之为点估计。另一个是利用样本统计量来推断我们能否接受一个事先的假设样本统计量来推断我们能否接受一个事先的假设,称之为假设检验。本章只讨论参数估计,假设,称之为假设检验。本章只讨论参数估计,假设检验将在下一章中讨论。而参数估计又分为点估检验将在下一章中讨论。而参数
12、估计又分为点估计与区间估计。计与区间估计。 1.点估计点估计 总体均数的点估计总体均数的点估计(point estimation)就是用样本均数来直接就是用样本均数来直接地估计总体均数,这种方法比较简地估计总体均数,这种方法比较简单,由于没有思索到抽样误差,只单,由于没有思索到抽样误差,只适宜大样本资料的统计推断。适宜大样本资料的统计推断。 2.区间估计区间估计 总体均数的区间估总体均数的区间估计计(interval estimation)是利用样是利用样本信息给出一个区间,并同时给本信息给出一个区间,并同时给出反复实验时该区间包含总体均出反复实验时该区间包含总体均数的概率。数的概率。 1可信
13、区间的涵义可信区间的涵义 从总体中作随机抽样,对于含量为从总体中作随机抽样,对于含量为n的每个样本而言的每个样本而言,都可以算得一个区间。以,都可以算得一个区间。以95%的可信区间为例,意的可信区间为例,意味着在同一总体中作味着在同一总体中作100次反复抽样,可得次反复抽样,可得100个可信个可信区间,平均有区间,平均有95个可信区间包含总体均数估计正确个可信区间包含总体均数估计正确,只需,只需5个可信区间不包含总体均数估计不正确个可信区间不包含总体均数估计不正确,或对于某一个区间而言,它包含总体均数的能够,或对于某一个区间而言,它包含总体均数的能够性为性为95%,而不包含总体均数的能够性仅为
14、,而不包含总体均数的能够性仅为5%。因。因此在实践运用中,以这种方法估计总体均数犯错误的此在实践运用中,以这种方法估计总体均数犯错误的概率仅为概率仅为5%。 2可信区间具有两个要素可信区间具有两个要素(1)准确度准确度accuracy,即可信区间包含的概率,即可信区间包含的概率的大小,普通而言概率越大越好。的大小,普通而言概率越大越好。(2)精细度精细度precision,反映区间的长度,区间,反映区间的长度,区间的长度越窄,估计的精细度越好,反之越差。的长度越窄,估计的精细度越好,反之越差。 (1)总体规范差总体规范差 未知时未知时 : 用样本规范差用样本规范差S 作为的估计作为的估计值计算
15、规范误,按值计算规范误,按t分布原理分布原理。例。例7-4 3)3)可信区间的计算可信区间的计算 (1) 未未知知:按按 t 分分布布。 双双侧侧1可可信信区区间间则则为为: 2,2, XXXtSXtS 2,2,(,)XXXtSXtS 单单侧侧1可可信信区区间间则则为为: ,XXtS 或或 ,XXtS (2) (2)总体规范差总体规范差 知或知或总体规范差总体规范差 未知但未知但n n足够大足够大: : 按正态分布原理;当按正态分布原理;当足够大时用作为估计值。足够大时用作为估计值。例例7-57-5(2) 60n时时:按按 u 分分布布。 已已知知: /2/2XXuu 即即 22XXXuXu
16、22(,)XXXuXu 未未知知但但 n 较较大大: /2/2XXuuS 即即 22XXXuSXuS 22(,)XXXuSXuS 总总体体均均数数双双侧侧1可可信信区区间间可可简简写写为为 22 XXXuXuS或 同同理理,总总体体均均数数的的单单侧侧1可可信信区区间间则则为为 XXXuXu S 或 XXXuXu S 或 第二节第二节 率的规范误率的规范误一、率的抽样误差与规范误一、率的抽样误差与规范误 由于抽样呵斥的样本率之间及样本率与由于抽样呵斥的样本率之间及样本率与总体率之间的差别称为率的抽样误差。总体率之间的差别称为率的抽样误差。 率的抽样误差大小可由率的规范误来衡量率的抽样误差大小可由率的规范误来衡量。 np)1( 假设总体率假设总体率未知,用未知,用样本率样本率p估计估计nppsp)1( 二、样本率的分布二、样本率的分布假设假设
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 篮球场防水施工合同
- 社交媒体知识库使用规范
- 商业步行街绿化草皮种植协议
- 体育设施用地供应管理实施办法
- 影视保险理赔指南
- 协调部工作问题解决策略
- 汽车美容店广告牌租赁合同范本
- 美术馆展品维护指南
- 动漫游戏产业招投标关键环节
- 水库建设工程款结算协议
- 寝室室长工作总结个人工作总结
- 日本初级课本-标准日本语初级上册课文(附中文对照)
- 广东省深圳市深圳实验学校初中部2023-2024学年七年级上学期英语期中考试卷
- (高清版)TDT 1062-2021 社区生活圈规划技术指南
- 安全生产治本攻坚三年行动方案(2024-2026年)解读
- 货物道路运输安全培训课件
- 普通高中物理课程标准样本
- 子宫内低氧症护理措施
- 中国健康生活方式预防心血管代谢疾病指南
- 2023年12月2024届广州市高三年级调研测试英语试卷
- 2024教师行业分析
评论
0/150
提交评论