




已阅读5页,还剩31页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
卫生统计学 抽样误差和抽样分布SamplingErrorandSamplingDistribution 主要内容 抽样误差抽样误差的重要性抽样误差的定义抽样误差的规律性标准误标准误的定义标准误的计算标准误的意义标准误的作用 t分布t分布的演化t分布的图形t分布的性质F分布 2分布 2 1 1抽样误差的重要性 既然有误差 为什么还要抽样 无限总体的客观存在试验研究的成本效益问题 costeffect 3 抽样误差的重要性 总体同质个体 个体变异 总体参数未知 样本代表性 抽样误差 随机抽样 样本统计量已知 统计推断 风险 4 1 2抽样误差的定义 假如事先知道某地七岁男童的平均身高为119 41cm 为了估计七岁男童的平均身高 总体均数 研究者从所有符合要求的七岁男童中每次抽取100人 共计抽取了五次 5 抽样误差的定义 五次抽样得到了不同的结果 原因何在 6 抽样误差的定义 定义 由于个体变异的存在 在抽样研究中产生样本统计量和总体参数之间的差异 称为抽样误差 samplingerror 各种参数都有抽样误差 这里我们以均数为研究对象 7 抽样误差的表现 8 抽样误差 定义 只要有个体变异和随机抽样研究 抽样误差就是不可避免的 抽样误差有自己的客观规律 统计学就是拨开抽样误差之雾来洞察客观规律的利器 9 1 3抽样误差的规律性 既然抽样误差是有规律的 那么到底它的分布规律到底是怎样的 Let sEnjoyOurExperiments 10 中心极限定理 centrallimittheorem 的表现 从正态总体中随机抽样 其样本均数服从正态分布 从任意总体中随机抽样 当样本含量足够大时 其样本均数的分布逐渐逼近正态分布 样本均数之均数的位置始终在总体均数的附近 随着样本含量的增加 样本均数的离散程度越来越小 表现为样本均数的分布范围越来越窄 其高峰越来越尖 11 2 1标准误的定义 样本统计量 如均数 也服从一定的分布 与描述观测值离散趋势的指标类似 我们使用样本统计量的标准差来反映抽样误差的大小 又称标准误 standarderror 12 标准误 standarderror 样本统计量的标准差称为标准误 样本均数的标准差称为均数的标准误 样本均数的标准误表示样本均数的变异度 13 2 2标准误的计算 计算公式为其中 为总体标准差 n为抽样的样本例数在研究工作时 由于总体标准差常常未知 可以利用样本标准差近似估计 14 标准误的计算 例 根据7岁男童的身高资料 在已知总体标准差时 标准误为4 38 10 0 438cm而若以第一次抽样的样本标准差来代替总体标准差 则标准误为4 45 10 0 445cm 15 2 3标准误的意义 标准误的意义反映了样本统计量 样本均数 样本率 分布的离散程度 体现了抽样误差的大小 标准误越大 说明样本统计量 样本均数 样本率 的离散程度越大 即用样本统计量来直接估计总体参数越不可靠 反之亦然 标准误的大小与标准差有关 在例数n一定时 从标准差大的总体中抽样 标准误较大 而当总体一定时 样本例数越多 标准误越小 说明我们可以通过增加样本含量来减少抽样误差的大小 16 2 4标准误的作用 标准误的用途衡量样本统计量代表总体参数的可靠性 估计总体参数的可信区间 进行假设检验 17 2 5标准差和标准误的联系与区别 18 2020 2 5 19 3 1样本均数的抽样分布规律 中心极限定理从均数为 标准差为 的正态总体中随机抽样 样本均数服从均数为 标准差为的正态分布 从均数为 标准差为 的任意总体中随机抽样 当样本含量足够大时 样本均数近似服从均数为 标准差为的正态分布 20 3 2t分布的演化 根据中心极限定理的内容 当样本含量足够大时 对从均数为 标准差为 的任意总体中随机抽样所得的样本均数进行标准化变换 有 21 t分布的演化 由于总体标准差往往是未知的 此时往往用样本标准差代替总体标准差 这里 为自由度 degreeoffreedom df 取值为n 1由W S Gosset提出 22 自由度分别为1 5 时的t分布 3 3t分布的图形 由Gosset提出 23 3 4t分布的性质 t分布为一簇单峰分布曲线 t分布以0为中心 左右对称 分布的高峰位置比u分布低 尾部高 即相同的尾部面积对应的界值 比u分布大 例如 P 0 05 u 1 64 而自由度为10的t分布界值 t 1 812 t分布与自由度 有关 自由度越小 t分布的峰越低 而两侧尾部翘得越高 自由度逐渐增大时 t分布逐渐逼近标准正态分布 当自由度为无穷大时 t分布就是标准正态分布 每一自由度下的t分布曲线都有其自身分布规律 t界值表 24 t界值表 单侧 P t t 双侧 P t t 即 P t t t 1 例 查t界值表得t值表达式t0 05 10 2 228 双侧 t0 05 10 1 812 单侧 25 4 2分布 设从正态分布N 2 中随机抽取含量为n的样本 样本均数和标准差分别为和s 设 则 2值服从自由度为n 1的 2分布 2 distribution 是小写希腊字母 读作chi 可见 2分布是方差的抽样分布 26 2分布的特征 2分布为一簇单峰正偏态分布曲线 自由度为 的 2分布 其均数为 方差为2 1时 2分布实际上是标准正态分布变量之平方 自由度为 的 2分布实际上是 个标准正态分布变量之平方和 可表示为 2 u12 u22 uv2每一自由度下的 2分布曲线都有其自身分布规律 27 28 2分布的作用 方差的抽样分布研究样本分布与理论分布的拟合优度检验率或构成比的比较 29 5F分布 设从两个方差相等的正态分布N 1 2 和N 2 2 总体中随机抽取含量分别为n1和n2的样本 样本均数和标准差分别为 s1和 s2 设 则F值服从自由度为 n1 1 n2 1 的F分布 F distribution 30 F分布的特征 F分布为一簇单峰正偏态分布曲线 与两个自由度有关 若F服从自由度为 1 2 的F分布 则其倒数1 F服从自由度为 2 1 的F分布 自由度为 1 2 的F分布 其均数为 2 2 2 与第一自由度无关 第一自由度 1 1时 F分布实际上是t分布之平方 第二自由度 2 时 F分布实际上等于 2分布 每一对自由度下的F分布曲线下的面积分布规律
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 上海邦德职业技术学院《结构设计》2023-2024学年第二学期期末试卷
- 贴片电容生产流程简介
- 企业环保基础知识培训
- 护工与保洁技能培训大纲
- 2025广告预订合同范本
- 2025混凝土班组劳务合同样本
- 2025画册版权、知识产权及注册申请合同协议书范本
- 2025办公室文明合同范本
- 2025年高考历史必修二复习提纲
- 2025实习生合同范本
- 高校校外实习基地建设协议书范本
- 上海市工业技术学校工作人员招聘考试真题2022
- 单片机-外文文献及翻译
- 数字经济学导论-完整全套课件
- 2023学年完整公开课版四季秋海棠
- 形位公差及标注教程
- 妊娠合并梅毒孕产妇入院后处理流程
- 长阳区域构造
- 公路水运工程施工企业(主要负责人和安全生产管理人员)考核大纲及模拟题库
- 计算机在材料学中综合作业
- 建筑工程管理(建筑材料)专业中级职称理论考试题库(汇总版)
评论
0/150
提交评论