版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、卫生学实验课(1) 教材卫生学主编 仲来福 人民卫生出版社2008年 6月 第7版 37次印刷,预防医学教研室,数值变量资料 的 统计分析,内容 第九章:数值变量资料的统计分析 第一节:数值变量资料的统计描述 频数分布表与频数分布图 集中趋势(位置)描述 离散程度描述 第二节:正态分布及应用其 正态分布的特征 正态曲线下面积分布有一定的规律性 正态分布法应用(参考值范围的估计),第三节:数值变量资料的统计推断 均数的抽样误差与标准误 t分布 总体均数 可信区间的估计 假设检验的基本思想 第四节:t检验和u检验 样本均数与总体均数的比较 配对t检验 两个样本均数的比较 假设检验注意事项 第五节:
2、方差分析,一、是非题: 1. 不论资料呈什么分布,用算术均数和中位数表示它们的平均水平都一 样合理。 2. 百分位适用于任何分布类型的资料,因此在选用描述资料集中趋势的 指标时,应首选百分位数。 3. CV是一相对数,无单位,因而具有便于比较分析的优点,可用于多 组资料间度量衡单位不同或均数相差悬殊时作变异度的比较。 4. 增加样本含量可以减小抽样误差,所以样本含量越大越好。 5. S和Sx都是变异指标,因此它们都可以表示抽样误 差的大小。 6.假设检验的目的之一在于了解抽样误差的影响。 7.拒绝Ho时,P值越小越好,接受Ho时,P值越大越 好。 8.t检验时,当tt0.05(v) ,P0.0
3、5,就证明两总体均数相同。 9.两样本均数差别是假设检验可用t检验,也可以用方差分析。 10.完全随机设计方差分析中,F值越大则P值越小。 11.完全随机设计方差分析中,若P0.05则可认为两两之间 都不相同。 12.完全随机设计方差分析中, SS组内一定小于SS组间,二.选择题: 1.关于频数表的用途,下面哪个说法是错误的_。 a揭示频数的分布特征 b便于发现某些极大值和极小值 c样本含量足够大时,以频率估计概率 d 说明某变量足够大时,以频率估计概率 e揭示频数分布的类型 2.对样本含量为7的某资料,计算中位数时,其值为_。 a位次为(n+1)/2的观察值 b位次为n/2的观察值 c位次为
4、(n+1)/2与位次为n/2的观察值之和的一半 d 将观察值从小到大排列后,位次为(n+1)/2的观察值 e以上都不对 3.某人算得资料的S=3.4,可认为_。 a变量值都是负数 b变量值负的比正的多 c 计算有错 d变量值一个比一个小 e变量值多数为0,4.关于变异系数,下面哪个说法是正确的_。 a变异系数的单位与原始数据的单位相同 b变异系数的单位与原始数据的单位不同 C 变异系数没有单位 d变异系数是均数与标准差的相对比 e变异系数是标准差与中位数的相对比 5.两组同质料中,_小的哪个样本均数更有代表性。 a S bCV c d eM 6.两组同质料中_小的哪个样本均数更可靠。 aS b
5、CV c d eM 7.关于t分布和u分布的关系,以下哪个是错误的_。 at分布和u分布都是单峰对称分布 bt分布和u分布的均数都为零 c t分布和u分布曲线下的面积(或t和u的界值)都与自由度有 关 d当样本含量较大时,t分布趋于u分布 e以上都不对,8、在两样本均数比较的假设检验中,如P0.05,则下面哪个结论正确_。 a两总体均数相同 b 两总体均数不同 c两样本均数相同 d. 两样本均数不同 e以上都不对 9.两样本均数的t检验,_。 a要求两组均数相近 b 要求两组方差齐性 c对均数和方差没有要求 d要求均数和方差相近 e以上都不对 10.完全随机设计方差分析中从总变异中分出组间变异
6、和 组内变异 是指_。 a从总均方中分出组间均方和组内均方 b从组内离均差平方和分出各组的离均差平方和 c 从总均数的离均差平方和分出组间离均差平方和和组内离均差平方和 d从组间离均差平方和分出组间与组内的离均差平方 e以上都不对,11.完全随机设计方差分析中的组间均方是_。 a仅仅表示抽样误差大小的指标 b仅仅表示处理因素作用大小的指标 c 表示处理因素的作用和均数的抽样误差两者综合结 果的指标 d表示全部变量值总的离散程度的指标 e以上都不对 12.方差分析中,当FF 0.05(v),P0.05时,结果_。 a可认为各样本均数都不相等 b证明各总体均数不等或不全相等 c可认为各总体均数都不
7、相等 d 可认为各总体均数不等或不全相等 e证明各总体均数都不全相等 13.方差分析中,当P0.05时,应进一步作_检验。 at检验 bu检验 ct检验 d q检验 eF检验 14.q检验中,q值与p值的关系为_。 aq值越大则P值越大 bq值越小则P值越小 c q值越大则P值越小 dq值与P值无关 e以上都不对,问答题: 1.均数几何均数和中位数的适用范围有何异同? 2.中位数与百分位数在意义上计算和应用上有 何区别与联系? 3.标准差和标准误有何区别和联系? 4.可信区间和参考值范围有何不同? 5.假设检验和区间估计有何联系?,小 结 频数分布表 1.频数表的概念:观察值按组段分组,各组段
8、所包含的变量值个数称为 频数。描述各组段及相应频数分布的统计表即称为频数分布表 2.频数编制步骤 a.找出观察值中最大值、最小值并求得极差 b.按极差大小决定“组段”数、组段和组距 c.列表划记 3、频数分布有两个重要特征:集中趋势和离散趋势 4、频数分布类型:频数分布可分为对称和偏态分布两种 类型;偏态分布包括正偏态分布和负偏态分布 5. 频数分布表的用途 (1)揭示资料的分布特征和分布类型 (2)提供分组数据,便于进一步计算指标和统计分析 . (3)便于发现某些特大或特小的可疑值 (4)作为陈述资料的形式,平均数 平均数(average)是描述频数分布集中位置的指标,它代表一组观察值的平均
9、水平。常用的平均数主要有均数(mean)、几何(geomctric mean)和中位数median)。 (a)均数 :用于对称分布的资料,特别是正态分 布资料 (b)几何 均数G:用于描述下列资料的集中趋 势: a .等比资料;b 对数正态分布资料;c .观察值不能有0; d 观察值不能同时有正值和 负值。 (c)中位数M和百分位数Px:百分位数Px是一种 位置指标中 位数常用于描述偏态分布资料的 集中位置,它只受居中 变量值波动的影响,不受两端特小值和特大值的影响。 离散趋势 a.概念:指一组计量资料观察值之间参差不齐的现象,各观察值间的不同或 变异,其程度称为离散度或变异度。 b.描述离散
10、趋势的常用指标: 极差、四分位数间距、方差、标准差和变异系数,尤其以方差和标准差更为常用,正态分布 1.概念: 正态分布又称Gauss分布是一种重要的连续型分布,是医学和生物学中常见的总体分布。 正态分布曲线,用N( )表示,其位置与均数有关,形状与标准差有关。 2.正态分布有四个方面特征, 1).正态曲线在横轴上方,且均数所在处最高。 2).正态分布以均数为中心,左右对称。 3).正态分布的均数有两个参数,即均数与标 准差 (和 ),标准正态分布的均数和 标准差分别为0和1。 4).正态分布的面积分布有一定的规律性,3.正态曲线下面积分布规律 无论 取什么值,正态与横轴间的面积总等于1. 统
11、计学家已经根据9-16求出标准正态分布 到()的面积( 299页)。 即 范围内曲线下的面积等于0.6827在 范围内曲线下面积为0.9500 范围内曲线下 面积为99%,实际工作中经常要用的面积分布规律有以下三点:,4.正态分布应用: 参考值范围的估计(正常值范围的制定) 参考值范围的估计方法: 主要是正态分布法。百分位数法和对数正态分布法, a.正态分布法: 双侧 95% 99% 单侧 上界 95% 下界 95% 上界 99% 下界 99%,b.百分位数法: 如资料呈偏态分布或分布不明,用百分位数法: 双侧 95% P2。5 P97。5 95% P95 (举例上界) P5 (举例下界) 计
12、算用百分位数的公式:,均数的抽样误差 在抽样研究中,由于存在个体差异,在样本均数与总体均数、样本均数与样本均数之间不可避免的存在着差异,这种差异就叫做抽样误 1 ) 标准误 描述样本均数的变异程度的指标,表示抽样误差的大小。可 应用于估计总体均数的可信区间和进行均数间差异的假设检验 2).标准差和标准误有何区别和联系 (a)区别 标准差与标准误的区别 标准差(或s) 标准误( ) 意义上: 描述一组变量值之间的离散 描述样本均数间的离散趋势 应用上 s 越小,表示变量值围绕 越小,表示样本均数与 均值分布越密集,说明均数 总体均数越接近,说明样本 的代表性越好。 均数推断总体均数可靠性越大。
13、可用估计变量值分布范围 可用估计总体均数可信区间 与n的关系 n越大.s越趋于稳定 n越大, 越小 (b)联系 二者均是表示变异度大小的统计指标。 标准误与标准差大小成正比,与抽样例数n的平方根成反比。 当n一定时,同一份资料,标准差越大,标准误也越大。,3)区间估计: 用样本指标估计的总体指标所在的范围,称总体参数的可信区间。习惯上使用95%和99%区间。 95%的可信区间是指样本指标估计总体指标所在的范围,其包含总体指标的可能性为95%,即估计错误概率为5%。 4) t分布是一个重要的连续性分布,是t 检验的基础。 5) 总体均数的区间估计.即估计一定可信度下的总体均数范围 (a)小样本资
14、料情形:按前述t分布的特点,推出小样本 资料的总体均数的95%可信区间的估计公式 (b)大样本(n 50)情形:由于随自由度的增大t 分布 向u 分布逼近,得出大样本资料总体均数的95%可信 区间的估计公式 6) 可信区间与可信限: 可信区间是指包括总体参数的范围,可信限是指范围的两个界值,可信区间的上下限即可信限,假设检验 1)概念和基本思想: 由于抽样误差的存在导致的样本与总体、样本与样本之间的差异不可避免的存在,所以要判断样本与总体,样本与样本之间的差异是抽样误差引起,还是有本质的区别,须用假设检验来回答,即通过样本与总体,样本与样本之间的比较来判断总体是否相同 2)假设检验的基本步骤 (a) 提出无效假设和备择假设 (b) 选定统计方法和计算统计量 (c)确定P值并判断结果 若P,则不拒绝Ho (或接受Ho ),可认为差别是由抽样误差引起的。 若P,则拒绝Ho 接受H1 ,可认为存在本质区别。 3)t 检验 t 检验是指以t 分布为基础的统计量为t值的假设检验。有以下4种情况 (a)样本均数和总体均数比较的t 检验 (b)、配对t 检验 (c)、成组t 检验 (d)、u 检验,4)假设检验与可信区间的区别与联系 (a)可信区间用于推断总体参数所在的范围,假设检验用于推断总体 参数是否不同,前者估计
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 华师大版初中科学1.1机械运动(第2课时)
- 算法设计与分析 课件 5.4.2-动态规划-0-1背包问题-动态规划求解
- 2024年江西客运资格证种类
- 2024年客运从业资格证什么样子
- 2024年客运司机从业资格证
- 2024年长沙客运实操考试
- 吉首大学《教师礼仪与修养》2021-2022学年第一学期期末试卷
- 吉首大学《场景速写》2021-2022学年第一学期期末试卷
- 《机床夹具设计》试卷18
- 吉林艺术学院《全媒体新闻写作》2021-2022学年第一学期期末试卷
- 模具设计评审表(开发前)
- 市政工程变更流程资料表格附件
- 与建设单位的协调配合及互相保护措施
- 课程设计——夹套反应釜
- 调节池施工方案范文
- 正比例函数的图象与性质说课稿
- Excel支票打印模板2021
- 自-铣削用量进给量进给速度(精编版)
- 浅谈化工行业建筑施工质量管理
- 技术标书综合说明
- 中国行政区划空白图
评论
0/150
提交评论