版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计学-5抽样与抽样分布 上章复习-内容概要统计软件中与概率有关的函数1 计算分布的概率(离散)或概率密度(连续)的函数。SPSS: PDFEXCEL: =DIST (最后一位参数设为0)2 计算分布的累计概率的函数SPSS: CDFEXCEL: =DIST(最后一位参数设为1)3 计算分布的累计概率函数的反函数SPSS: IDFEXCEL: =INV上章复习-内容概要SPSS二项分布:CDF.BINOM超几何分布:CDF.HYPER泊松分布:CDF.POISSON均匀分布:(x-a)/(b-a) (axb,a和b为起点和终点)正态分布:CDF.NORMAL标准正态分布:同上卡方分布:CDF.
2、CHISQt分布:CDF.TF分布:CDF.F 上章复习-内容概要EXCEL 二项分布:=Binomdist超几何分布:= HYPGEOMDIST (无cumulative)泊松分布:=POISSON均匀分布:(x-a)/(b-a) (axb,a和b为起点和终点)正态分布:NORMDIST标准正态分布:NORMSDIST(Z)(只返回累积概率)卡方分布:CHIDISTt分布:TDISTF分布:FDIST上章复习-作业课后练习抽样-为什么抽样1、试验是破坏性的。2、全面调查很难办到或没有必要,或费用过高、或耗时过长3、样本结论已经足以反映总体性质了,全面调查增加的准确性很微小。抽样-概念总体、个
3、体、样本、样本(容)量、样本个数有限总体无限总体统计量、参数 总体参数:、。样本统计量:样本均值、s、p。 例:如已知,而未知, (xi-)2 Xi/抽样方法 概率样本非概率样本概率样本简单随机抽样 RND(RV.UNIFORM(a,b) =ROUND(RAND()*(b-a)+a,0) 系统抽样 分层抽样 整群抽样 多级抽样 抽样分布 抽样分布由于现实中不可能将所有的样本都抽取一遍,因此,统计量的抽样分布实际上是一种理论分布。【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为X1=1、X2=2、X3=3 、X4=4 。总体的均值、方差及分布如下总体分布14230.1.
4、2.3样本均值的抽样分布 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第一个观察值所有可能的n = 2 的样本(共16个)样本均值的抽样分布 计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第一个观察值16个样本的均值(x)样本均值的抽样分布1.00.1.2.3P ( x )1.53.04.03.
5、52.02.5x所有样本均值的均值和方差式中:M为样本均值的个数样本均值的抽样分布 样本均值的抽样分布 中心极限定理:若给定样本量的所有样本来自任意总体,则样本均值的抽样分布近似服从正态分布,且样本量越大,近似性越强。 1)总体为正态分布,无论n的大小,样本均值的抽样分布都服从正态分布 N(,/n); 2)总体形态未知或不为正态分布时,通常样本量n30时,样本均值的抽样分布将趋于正态分布N(,/n),样本量越大,近似性越强。 3)样本均值的均值=,样本均值的标准差=/n。 4)样本均值的分布范围小于总体分布范围,样本均值的标准差=/n,因此,样本量越大,样本均值分布范围越小,集中程度越大。样本
6、均值的抽样分布样本均值的抽样分布的应用样本均值的标准化Z=(X-) /(X代表任一观测值)Z(均值)=(均值-) / ( /n) 当n30,可以用样本标准差估计总体标准差。z (均值)=(均值-) / ( s/n) 应用:P123 例5.2;例5.3; 例5.4 样本比例的抽样分布 样本比例p; 总体比例。p=X/np的抽样分布是样本比例p的所有可能取值的概率分布。当np5和n(1-p)5,可以认为样本量足够大,从而样本比例p的抽样分布可以用正态分布近似。重复抽样下:E(p)=(p)= , 即PN( , )2分布设随机变量X1,X2,Xn相互独立,且Xi服从标准正态分布N(0,1),则它们的平
7、方和 xi2服从自由度为n的2分布。当自由度n足够大时, 2分布的概率密度曲线趋于对称;当n+时, 2分布的极限分布是正态分布。2分布的数学期望为:E(2)=(2)= n2分布的方差为:D(2)=2(2)= 2n 即当n+时,2(n)N(n,2n)2分布样本方差的抽样分布设总体服从正态分布N (,2 ), 对于来自该总体的简单随机样本,其样本方差s2的分布为 2(n 1)称为自由度为(n-1)的卡方分布2分布t分布Z=(X-) / Z(均值)=(均值-) / ( /n) 当自由度无限增加时,t分布接近标准正态分布。ta:右侧尾概率为a的上侧分位数,也可表示为: tn.a,t1-a或tn.1-a
8、。图形见P129F分布 如果X是2(m)的变量,Y是2(n)的变量,而且X和Y独立:F=(X/m) / (Y/n) 为具有自由度(m,n)的F分布F(m,n)。当第二个自由度相同时,第一个自由度越小,峰越靠近左边。(图形见P131)F分布不以正态分布为其极限,总是一个正偏分布。如果F变量服从F(m,n)分布,那么1/F服从F(n,m)分布,因为1/F=(Y/n) / (X/m)。 抽样误差 样本统计量和总体参数之间的差异成为样本误差。利用样本,可以估计总体,但不能保证完全准确。标准误:样本统计量的抽样分布的标准差,称为统计量的标准误(standard error),标准误衡量的是统计量的离散程度,它测度了用样本统计量估计总体参数的精确程度。如样本均值的标准误:/n。当计算标准误时涉及的总体参数未
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024合同模板附有停止条件之动产赠与契约书范本
- 2024仿真花采购合同
- 《大环境公害事》课件
- 呼伦贝尔学院《经济学基础》2021-2022学年第一学期期末试卷
- 红河学院《综合英语》2022-2023学年第一学期期末试卷
- 专题04 直线和圆的位置关系4种压轴题型全攻略(解析版)
- 专题01 二次函数的定义与二次函数y=ax2、y=a(x-h)2、y=a(x-h)2+k的图象和性质压轴题八种模型全攻略(原卷版)
- 2024【汽车转让合同范本】正规车辆转让合同范本
- 2024劳务清包工合同
- 2024劳动合同法风险规避指南
- GIS超高频局部放电典型图谱(共14页)
- (完整版)篮球校本课程教材
- 水产品保鲜技术论文范文
- 柔性基层沥青路面
- 真崎航の21部
- 临床护理技术操作常见并发症的预防和处理规范(完整版)
- 隧洞专项施工方案(完整版)
- 继电保护课程设计对变压器进行相关保护的设计abrg
- 挖机租赁台班表.doc
- 湖南中医药大学成人教育毕业生鉴定表
- 项目验收文件清单(硬件采购类)
评论
0/150
提交评论