




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、样本统计量样本统计量:样本中某个变量的统计值。如此次调:样本中某个变量的统计值。如此次调查中高中文化程度的人占查中高中文化程度的人占32%。样本样本 32%总体参数总体参数:与样本中某个变量的统计值相对应的:与样本中某个变量的统计值相对应的总体中的统计值。如全市人口中高中比例为总体中的统计值。如全市人口中高中比例为38%。总体总体38 样本统计量有可能等于总体参数,也有可能样本统计量有可能等于总体参数,也有可能不等于总体参数,但二者之间有着某种概率关不等于总体参数,但二者之间有着某种概率关系。系。推断统计就是教会我们如何利用这种概率推断统计就是教会我们如何利用这种概率关系来由样本统计量推估总体
2、参数。关系来由样本统计量推估总体参数。为了区别样本和总体的不同,样本的平均数用为了区别样本和总体的不同,样本的平均数用x来表示,标准差用来表示,标准差用S表示;总体的平均数用表示;总体的平均数用表表示,标准差用示,标准差用表示。因此,推断统计往往表示。因此,推断统计往往可以看作是由可以看作是由x推断推断。样本样本 32%总体总体= ?(2)类型:推断统计分为)类型:推断统计分为参数估计参数估计和和假设检验假设检验两大类。两大类。参数估计参数估计:根据一个随机样本的统计值来估计总:根据一个随机样本的统计值来估计总体参数。即已知样本,估计总体。体参数。即已知样本,估计总体。x总体总体=38%样本样
3、本 32%xx? ? 1.96 平均数170 1.96*10(170,10)例:某校同学的身高为正态分布,平均值为例:某校同学的身高为正态分布,平均值为170cm,标准,标准差为差为10cm。问:。问:1)高于平均数)高于平均数1.5个标准差的同学身高是多少?个标准差的同学身高是多少?2)162cm身高的同学距平均数有几个标准差身高的同学距平均数有几个标准差?3)95%的同学身高会在什么范围内?的同学身高会在什么范围内?解1:Xi=+Z*=170+1.5*10=185cm;解2: Z=(Xi - )/ =(162-170)/10=-0.8;解3: Xi = -Z * =170-1.96*10=
4、150.4 Xi = +Z * =170+1.96*10=189.6 (150.4189.6)由上可得出:由上可得出:ixZ 其中其中Xi为分布中任何一个值,为分布中任何一个值, 是平均数;是平均数; 是标是标准差。准差。Z是是Xi距离平均数距离平均数的标准差单位,又称的标准差单位,又称Z分分数,同时也表示数,同时也表示Xi与平均数与平均数之间的面积。之间的面积。(2)标准正态分布标准正态分布(Z分布):分布):N(0,1)标准化了的正态分布。即平均数标准化了的正态分布。即平均数=0,标准差,标准差=1的正态分布。的正态分布。( 0,1) =1AGE9383736353433323AGEFre
5、quency5004003002001000Std. Dev = 15.00Mean = 45N = 1254.00(4)样本分布样本分布: D(x ,S)样本中某变量的统计分布,和总体分布一样,样本中某变量的统计分布,和总体分布一样,它有可能是正态分布,也可能不是正态分布。它有可能是正态分布,也可能不是正态分布。AGE9383736353433323AGEFrequency5004003002001000nx(5)样本平均数的抽样分布:)样本平均数的抽样分布:N( ,)从总体中多次重复抽取容量为从总体中多次重复抽取容量为n的样本,每个样本平的样本,每个样本平均数的所形成的统计分布。是由多个均
6、数的所形成的统计分布。是由多个组成的。组成的。总体分布样本平均数的抽样分布D(, )N(,n)样本平均数的抽样分布的特点样本平均数的抽样分布的特点:xixnA 是由多个是由多个 组成,组成,B 正态分布。正态分布。C 它的平均数就等于总体的平均数它的平均数就等于总体的平均数,标准差,标准差则是总体标准差则是总体标准差的的 倍。即倍。即 ,又被称作,又被称作标准误(标准误(Standard Error,S . E)因此,我们所作的任何一次抽样的平均数因此,我们所作的任何一次抽样的平均数 都都可看作是样本平均数的抽样分布中的一个点。它可看作是样本平均数的抽样分布中的一个点。它会有会有95的概率落在
7、的概率落在 1.96 的范围内。的范围内。n1n总体分布总体分布( , )样本分布( , s)x样本平均数的抽样分布(, )n三种分布的关系三种分布的关系推断统计的原理就是推断统计的原理就是:利用样本平均数的抽样分布的正态特征,以及利用样本平均数的抽样分布的正态特征,以及 与与的包含关系,来从样本统计量推估总体参数的包含关系,来从样本统计量推估总体参数(即参数估计),或用样本统计量检验有关总体(即参数估计),或用样本统计量检验有关总体参数的假设(假设检验)。参数的假设(假设检验)。由此可见,参数估计和假设检验实际是相同的。由此可见,参数估计和假设检验实际是相同的。在实际调查中,我们便是利用这一
8、原理,用一次在实际调查中,我们便是利用这一原理,用一次调查的结果来推断总体的参数。我们把某一次调调查的结果来推断总体的参数。我们把某一次调查的结果看作是同样样本规模的无数次调查中的查的结果看作是同样样本规模的无数次调查中的一次,它是样本平均数的抽样分布中的一个点,一次,它是样本平均数的抽样分布中的一个点,可用来估计总体参数可用来估计总体参数 。ixix点估计区间估计总体参数估计假设检验根据样本信息对总体参数的推断2iEXSN例:已知某学校的学生每天课外活动时间例:已知某学校的学生每天课外活动时间的标准差为的标准差为15分钟。现从学生中随机抽取分钟。现从学生中随机抽取25人,得知他们的课外活动时
9、间平均为人,得知他们的课外活动时间平均为60分钟,问该校学生总体平均每天的课外活分钟,问该校学生总体平均每天的课外活动时间会是多少?(选择动时间会是多少?(选择95%的置信区间)的置信区间)解:x=60S.E=15 / 25 1/2Z=1.96ESZxi.=605.886065466区间估计的基本原理区间估计的基本原理前面讲过从正态总体中随机抽取容量为前面讲过从正态总体中随机抽取容量为n n的一的一切可能样本平均数的抽样分布为以总体平均切可能样本平均数的抽样分布为以总体平均数为中心呈正态分布数为中心呈正态分布。当总体标准差当总体标准差 已知时,一切可能样本平均已知时,一切可能样本平均数的标准分
10、数为:数的标准分数为: 呈标准正态呈标准正态分布。分布。 XZn若显著性水平为若显著性水平为0.05,则可靠性概率为,则可靠性概率为0.95。95. 096. 196. 195. 096. 196. 1nXPZP为置信区间即96. 1,96. 195. 096. 196. 1nXnXnXnXP置信下限置信上限1 1、 已知条件下已知条件下当总体当总体 为已知,总体呈正态分布,样为已知,总体呈正态分布,样本容量本容量n n无论大小时,或者当总体无论大小时,或者当总体 为已为已知,虽然总体不呈正态分布,但样本容量较知,虽然总体不呈正态分布,但样本容量较大(大(n30n30)时,样本平均数与总体平均
11、数的)时,样本平均数与总体平均数的离差统计量均呈正态分布,总体平均数的置离差统计量均呈正态分布,总体平均数的置信区间可按信区间可按Z Z分布,用已知分布,用已知 计算。计算。 总体平均数的区间估计 已知总体平均数区间估计举例说明已知总体平均数区间估计举例说明某小学某小学1010岁全体女童身高历年来标准差为岁全体女童身高历年来标准差为6.25cm6.25cm,现从该校随机抽取,现从该校随机抽取2727名名1010岁女童,岁女童,测得平均身高为测得平均身高为134.2cm134.2cm,试估计该校,试估计该校1010岁岁全体女童平均身高的全体女童平均身高的95%95%和和99% 99% 置信区间。
12、置信区间。 总体平均数的区间估计总体平均数的区间估计2 2、未知条件下总体平均数的区间估计未知条件下总体平均数的区间估计当总体当总体未知,总体呈正态分布,样本容量未知,总体呈正态分布,样本容量n n无论大小时,或者当总体无论大小时,或者当总体未知,虽然总体不未知,虽然总体不呈正态分布,但样本容量较大(呈正态分布,但样本容量较大(n30n30)时,样)时,样本平均数与总体平均数的离差统计量均呈本平均数与总体平均数的离差统计量均呈t t分分布,总体平均数的置信区间可按布,总体平均数的置信区间可按t t分布,用分布,用的估计值计算。的估计值计算。 若在若在95%95%可靠区间上对总体平均数做估计,就
13、可靠区间上对总体平均数做估计,就是是t t分布上分布上t=0t=0左右两侧的面积为左右两侧的面积为0.950.95。95. 0,05. 005. 0dfXdfXtSXtPSXt即95. 005. 005. 0XdfXdfStXStXP同理可得总体平均数99%置信区间。其中11122nnXnXnnnnnSSXXXS为总体标准差的估计值; 为样本标准差。X 相关说明: 统计学家的研究表明,身高、体重、统计学家的研究表明,身高、体重、智力、课程分数等数据总体一般呈正态分智力、课程分数等数据总体一般呈正态分布或接近正态分布。目前,在实际研究工布或接近正态分布。目前,在实际研究工作中,对于样本所来自的总
14、体是否呈正态作中,对于样本所来自的总体是否呈正态分布,除特殊情况外,一般不作检验,而分布,除特殊情况外,一般不作检验,而是把它假定为正态分布或接近正态分布。是把它假定为正态分布或接近正态分布。2假设检验假设检验示例示例:纳税起征线的规定是根据当地居民的平均月收入纳税起征线的规定是根据当地居民的平均月收入制定的。有关部门认为某地的起征线应为制定的。有关部门认为某地的起征线应为800元,元,因为根据经验当地居民平均月收入应不低于此数。因为根据经验当地居民平均月收入应不低于此数。在当地进行的一次在当地进行的一次400人的随机抽样表明,居民月人的随机抽样表明,居民月收入为收入为790元,标准差为元,标
15、准差为100元,请用此调查结果元,请用此调查结果在在95的置信水平上检验居民月收入为的置信水平上检验居民月收入为800元的说元的说法是否成立。法是否成立。 假设假设 =8008001.96*5 =800,样本容量为,样本容量为400时的样本平均数的抽样分时的样本平均数的抽样分布:布: N(800,5)样本:样本:X=790 x、S、S.Ex,如果包括,如果包括,就可以说,在给定的置信区间中(或在给定的概率条件下),就可以说,在给定的置信区间中(或在给定的概率条件下),验证(接受)了原假设;如未包含,则说明原假设在给定的验证(接受)了原假设;如未包含,则说明原假设在给定的概率水平上不成立(被否定
16、),或说原假设在给定的显著度概率水平上不成立(被否定),或说原假设在给定的显著度水平(水平(1给定概率)上被否定。给定概率)上被否定。解:1) 确定有关总体参数的假设确定有关总体参数的假设H0 : 800; H1 : 800;2) 确定检验此假设的概率标准:确定检验此假设的概率标准:置信度为95,显著度为5,即Z1.963) 计算样本的有关统计量计算样本的有关统计量 790;S100;S.E= =100/20=54) 以以 为中心,作出样本平均数抽样分布的给定概率区间。为中心,作出样本平均数抽样分布的给定概率区间。( 8001.965),即(),即(790.2 809.8)5) 结论:此区间未
17、包含样本统计量结论:此区间未包含样本统计量790,因此在,因此在5的显著的显著水平上推翻原假设。当地居民的平均月收入小于水平上推翻原假设。当地居民的平均月收入小于800元。元。xns 从上一算法中可以看出,从上一算法中可以看出,Xi距距 的距离是检验假设的距离是检验假设的关键指标:的关键指标: Xi如果落在如果落在 的的95%的置信区间之外,的置信区间之外,这时这时|Zxi|Z95%,即,即|Zxi|1.96。则原假设被否定的概。则原假设被否定的概率率95%,或者说,原假设成立的概率,或者说,原假设成立的概率5%,我们我们称为在称为在5%的显著水平上否定了原假设。的显著水平上否定了原假设。 Xi如果落在如果落在 的的95%的置信区间之内,这时的置信区间之内,这时|Zxi|Z95%,即,即|Zxi|1.96。我们称为在我们称为在5%的显著水平上不的显著水平上不能否定原假设。能否定原假设。因此,可以利用因此,可以利用nsxZi来直接计算出来直接计算出|Zxi|是否大于是否大于Z95%。解:解:1) 确定有关总体参数的假设确定有关总体参数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 图书管理员考试全新试题及答案解析
- 2024年专升本思政理论与法律意识试题及答案
- 2024年专升本思政复习指南试题及答案
- 激光雷达行业分析简报:城市NOA渗透率提升激光雷达行业爆发
- 2024-2025学年八年级政治下册 第六单元 与大自然和谐相处 第12课 感受大自然(人与大自然的不和谐之音)教学实录 鲁人版六三制
- 汽车维修工高级工(三级)理论复习试题及答案
- 七年级历史下册 10 元朝的大一统教学实录 华东师大版
- 奶茶供应链知识培训课件
- 宠物殡葬行业服务理念试题与答案介绍
- 2023六年级数学下册 四 快乐足球-比例尺信息窗3 利用比例尺和实际距离求图上距离第1课时教学实录 青岛版六三制
- 2023北京市-实验动物上岗证培训考试题库
- 吉林省地方教材家乡小学一年级下册家乡教案
- 实验经济学实验设计案例
- 国际经济法自考真题及答案
- 护理时间管理课件
- 《术前讨论制度》课件
- 商业综合体商业项目立项报告
- 油库消防安全知识培训
- 车辆调度及驾驶员管理办法全套
- 淋巴静脉吻合术后护理课件
- 钣金车间生产流程图
评论
0/150
提交评论