版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1用样本信息来推断总体的特征,称为统计推断。参数估计parameter estimate假设检验hypothesis test统计推断statistical inference21均数的抽样误差与标准误2t 分布参数估计3总体均数的估计3样本参数统计量总体 抽样统计推断统计描述 抽样误差(sampling error)是指在没有系统误差和过失误差的前提下,单纯由于随机抽取样本而产生的样本指标(统计量)间或样本指标与总体指标(参数)之间的随机性误差。1 均数的抽样误差与标准误4均数的抽样误差 欲研究十堰地区 2013 年健康成年女性红细胞的总体均数。红细胞数总体均数 5已知十堰地2013年18岁
2、女生身高服从均数为155.4cm,标准差为5.3cm的正态分布。 153.2154.1154.8157.4nj=30100个 =155.4cm =5.3cmX1,X2,X3,Xi6抽样实验: (a)7 样本均数的分布特点: 1. 各样本均数未必等于总体均数; 2.样本均数之间存在差异; 3.样本均数的分布很有规律,围绕着总体均数, 中间多,两边少,左右基本对称,也服从正态分布。8 抽样研究的目的是用样本信息推断总体特征。 因随机抽样造成的样本均数与总体均数之间差 异或各样本均数之间差异称为均数的抽样误差。 9有没有表示样本均数抽样误差大小的指标呢? 求样本均数的标准差即可反映样本均数间的离散程
3、度,也反映样本均数与总体均数间的差异。我们把样本均数的标准差称为标准误(standard error)。10标准误的计算11例11 某地 150 名 3 岁女孩平均身高为 92.8 cm,标准差为4.6 cm,求其标准误。已知: 92.8 cmS 4.6 cm 12 反映样本均数的可靠性: 同质的资料标准误越小,样本均数越接近总体 均数,抽样误差越小,说明由样本均数推断总 体均数的可靠性越大。 估计总体均数: 结合样本均数 可对总体均数 做区间估计 假设检验:进行均数的 t 检验标准误的应用13标准差与标准误的区别 标准差 (S) 标准误(SX)意义 个体变量值变异度大小, 样本均数抽样误差大
4、小, 即原始变量值的离散程度。 即 样本均数的离散程度。应用 医学参考值范围,对某一 区间估计,对总体均数的 变量值是否在正常范围内 大小作出初步判断; 作出初步判断 ;计算变异 用于假设检验 系数、标准误-14 t 分布于 1908 年由英国统计学家W.S. Gosset以“ Student ”笔名发表,故又称Student t 分布(Studentt-distribution)或称为“ 学生氏 t 分布”。 t 分布主要用于解决小样本的问题。2. t 分布(t-distribution)15随机变量的标准正态分布样本均数的标准正态分布1617 实际工作中, 往往是未知的,常用 s 作为 的
5、估计值,为与 u 转换区别,称为 t 变换,t 值的分布为 t 分布。18t 分布的特征以0为中心,左右对称其形态变化与自由度的大小有关 越小,t值分布越离散,曲线峰高越矮尾部越高 越大,t值分布越集中,曲线峰高上移尾部降低 趋近+,t分布趋近标准正态分布19tf(t) = (标准正态分布) = 5 = 1图15-5 自由度分别为1、5、的t分布0.200.1020 在 t 界值表中列出了t 分布曲线下尾端的面积 ,其中: 一侧尾部的面积称为单侧概率,对应的t值表示为 t . ; 两侧尾部的面积称为双侧概率,对应的t值表示为 t /2. 。t 界值表21P31222 由 t 界值表可知:相同自
6、由度时,t越大,概率P越 小。 相同 t 值时,双侧概率是单侧概率的两倍。 =时,t 分布即为u分布,故t界值表中最 后一行是u界值。23tB0AP24 t 分布主要用于: 总体均数置信区间的估计 t 检验25点估计(point estimation)区间估计(interval estimation)用样本指标(统计量)来估计总体指标(参数),称为参数估计。 统计推断 参数估计假设检验3. 总体均数的估计26 X ,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L 。用样本统计量直接作为总体参数的估计值。例如 于2000年测得某地27例健康成年男性血红蛋白量的样本均数为1
7、25g/L,试估计其总体均数。1) 点估计:27 均数的区间估计:指按预先给定的概率,确定的未知参数的可能范围。 估计错误的概率为,估计正确的概率为1-。2) 区间估计:28 1-称可信度或置信度(confidence level ),常取 95% 或 99% 。 可信限(confidence limit,CL):下限(lower limit,L ),上限(upper limit,U )29 根据一定的可信度估计得到的区间,称为可信区间(confidence interval,CI)。 从理论上讲,进行 100 次抽样,可算得100 个可信区间,平均有 95% 或 99% 的可信区间包含了总体
8、参数。30 可信区间有两个要素: 准确度 精密度例:若=0.05,反复抽样 1000次,根据样本均数可估计得到1000个可信区间,这1000个区间中约有950个包含,有50个不包含。 311、 已知时, 根据已知条件,可信区间的估计有3种方法:322、 未知但 n 足够大(n30)时:333、 未知且 n 较小(n30)时:34例12 随机抽查某地 10 名男孩出生体重 , 得其平均体重为 3.21kg , 标准差为 0.47kg , 试估计该地男孩出生体重均数的 95% 可信区间。35查 t 值表:t0.05(9) = 该地男孩出生体重均数的95%可信区间为: 2.873.55 kg2. 2
9、6236例 某地抽查 150 名 3 岁女孩 , 得身高均数为 92.8cm ,标准误为 0.38cm , 试估计该地 3 岁女孩身高总体均数的 95% 可信区间。37该地 3 岁女孩身高总体均数的 95% 可信区间为:92.1 - 93.5cm38可信区间的两个要素可信度 1- 精度即可信区间的宽度可信区间的注意事项是可信区间包含总体均数的概率39 置信度和精度互相制约。为了提高可信度,得放大置信区间,降低精度;反之提高了精度,必然会使可信度降低。40均数的可信区间与参考值范围的区别 区别点 均数的可信区间 参考值范围意义计算公式 用途按预先给定的概率(1 )确定的包含总体均数的可能范围 指
10、正常人的解剖、生理、生化某项指标的波动范围估计总体均数判断某项指标是否正常41掌握: 抽样误差与标准误的概念及计算; 参数估计的概念、计算及含义。熟悉 t 分布图形及特点、t 界值表的应用。参数估计42用样本信息来推断总体的特征,称为统计推断。参数估计parameter estimate假设检验hypothesis test统计推断statistical inference43假设检验1假设检验的基本原理与步骤2t 检验与 u 检验3方差分析4两类错误假设及假设检验注意事项44假设检验的基本原理 假设检验(hypothesis test)也称显著性 检验(significance test)。
11、主要用于判断两个或多个参数间的差别有无统计学意义。45 例13 根据大量调查,已知一般健康成年男子的脉搏均数为 72次/min,某医生在某山区随机调查100名健康男子,得到脉搏均数为76.2次/min,标准差为4.0次/min,能否认为该山区的健康成年男子脉搏均数高于一般健康成年男子的脉搏均数?46 0=72次/min山区健康成年男子 一般健康成年男子47 山区100名健康男子脉搏与一般健康成年男子不同的原因有二: 仅仅是抽样误差所引起; 确实不同(非抽样误差)。 我们希望从此两原因中找出一个主要的原因,统计学上通过假设检验来回答这一问题。山区男子脉搏总体均数与一般成年男子脉搏均数0相等,差异
12、是由抽样误差引起的,提示山区男子是一般男子总体的一部分。山区男子脉搏总体均数与一般成年男子脉搏均数0不相等,差异可能是由地域等因素引起的,提示山区男子与一般男子是两个不同的总体。48 首先对未知或不完全知道的总体提出一个假设,然后借助一定的分布,观察实测样本情况是否属于小概率事件。 如实测样本情况属于小概率事件,则认为原先的假设错误,拒绝这个假设;如实测样本情况不属于小概率事件,则不拒绝原先假设。假设检验的基本原理49假设检验的一般步骤1.建立检验假设,确立检验水准无效假设 H0: 0 假定总体均数相同备择假设 H1: 0或0( 0 ) 假定总体参数不相同,即差别不是由于抽样误差所致。50 样
13、本均数所代表的未知总体均数 与已知总体均数 0 的比较目的 双侧检验是否 单侧检验是否 是否 0 d 0 d 0 是否d 0 d 0 d 2 1 2 1 2 是否1 2 1 2 1 组内变异 三组之间数据的变异 组间变异 全部数据间的变异 总变异 118基本思想:按分析目的和设计把全部数据之间的总变异分成两部分或更多部分,然后借助F分布作出统计推断。总变异 = 组间变异 + 组内变异119组内变异( SS e ) 组内各个观测值 X i j 与本组内均值 之差的平方和。反映了组内(同一水平下)样本的随机波动。 120组间变异( SS TR ) 组内均值 与总均值 之差的平方和。反映了处理因素各
14、个水平组间的差异,同时也包含了随机误差。 121总变异( SS T ) 全部测量值大小不同,这种变异称为总变异,以各测量值 X ij与总均数 间的差异度量。 122总变异、组间变异、组内变异的关系:对应自由度的关系:123均方(mean square) 离均差平方和大小: 与变异程度大小有关 与其自由度大小有关 将各部分离均差平方和除以相应自由度,其比值称为均方差,简称均方(MS)。124F 值与 F 分布组间均方与组内均方的比值称为 F 统计量,服从 F 分布,即:如果 H0 成立,即各处理组的样本来自相同总体,处理因素没有作用,则组间变异同组内变异一样,只反映随机误差作用的大小。1254.
15、3.3 F分布图4-3 不同自由度时的F分布曲线 F分布有两个自由度,第一自由度()是分子的自由度,第二自由度()是分母的自由度。F分布是方差比的分布,常用于方差齐性检验、方差分析等。126 单因素方差分析(one-way ANOVA)也称完全随机设计的方差分析,单向或单方式方差分析,该设计只能分析一个因素下多个水平对试验结果的影响。一、完全随机设计多个样本均数比较127方差分析表128例17 某研究者将 27 只雄性大鼠随机分成三组(每组 9 只),给予不同处理后 3 周,测定血清中的SOD(超氧化物歧化酶)活性。结果见下表。问三组的SOD活性是否相同?129 三组大鼠血清中SOD活性/(m
16、ol/L) 对照组 环孢素组 环孢素+精氨酸组 365.1 348.3 360.5 394.2 355.2 368.0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1从这个表,可以看到三种变异: 组内数据的变异 组内变异 三组之间数据的变异 组间变异 全部数据间的变异 总变异 130 对照组 环孢素组 环孢素+精氨酸组 合计 365.1 348.3 360.5 394.2 355.2 368.
17、0 373.3 319.9 386.4 375.2 354.4 369.4 358.6 352.7 352.1 370.8 356.8 371.5 350.2 324.4 374.1 410.2 356.2 368.4 360.5 350.2 372.1 ni 9 9 9 27 3358.1 3118.1 3323.1 9799.3 373.1 346.5 369.2 1255770.5 1081872.7 1227682.9 3565326.11311. 建立假设,确定检验水准 H0: 1 = 2 = 3 H1: 1、2 、 3 不等或不全相等 = 0.051322. 选定检验方法,计算统计
18、量1331343. 确定 P 值,作出推断结论以 v组间 为 v1 ,以 v组内 为 v2,查附表 F 界值表,得F0.01(2,24)=5.61,本例 F F0.01(2,24),故 P0.01。结论:按 a = 0.05 检验水准,拒绝 H0,接受 H1,可认为三组的 SOD 活性有差别,但不能认为任何两组SOD活性均有差别。135136P197200137表 15 12 例 17 资料的方差分析表变异来源 SS v MS F P 总 8797.19 26 组间 3735.18 2 1867.59 8.854 0.01 组内 5062.01 24 210.92138二、随机区组设计资料的方
19、差分析 随机区组设计(randomized block design)又称为配伍组设计,涉及处理因素(主要因素)和区组因素(配伍组因素,个体特征),故随机区组设计的多个样本均数比较分析又称两因素方差分析。139随机区组设计资料常见情况: 区组设计资料:先将全部观察对象按某种或某些特征分为若干个区组,每个区组的观察对象数等于处理组数 k,然后将同一区组的 k 个对象随机分配到 k 个不同的处理组所得到的数据资料; 同一个对象的k个部位测定同一指标所得的数据资料; 同一样品用多种不同方法测定同一指标所得的数据资料。140随机区组设计资料数据结构141变异分解总变异SST可分解为:处理因素的变异SS
20、A SSA 反映了各个水平组间的差异(包含随机误差)区组因素的变异SSB SSB 反映了各个区组间的差异(包含随机误差)随机误差SSe SSe 反映了样本的随机波动三者的关系如下:142方差分析表143例18 按性别相同、年龄相近、病情相近把 33 例某病患者配成 11 个区组,每区组 3 个患者,分别给予A 药、B 药和 C药治疗。治疗后患者血浆中的 IGA 含量见表15-14。问经三种不同药物治疗后该病患者血浆中IGA含量有无差别?144区组号 A药 B药 C药 1 1.67 1.77 2.10 5.54 2 2.04 2.03 2.07 6.14 3 1.38 1.45 1.48 4.3
21、1 4 1.02 1.09 1.07 3.18 5 1.29 1.15 1.92 4.36 6 1.32 1.05 1.28 3.65 7 1.17 1.26 1.08 3.51 8 2.12 1.87 2.07 6.06 9 1.64 1.72 1.65 5.01 10 1.75 1.85 2.45 6.05 11 1.65 1.56 1.38 4.59 n i 11 1 1 11 33(N) 17.05 16.80 18.55 52.40( ) 1.55 1.53 1.69 27.64 26.87 33.44 87.95( )表 15-10 三种不同药物治疗后某病患者血浆IGA含量145处
22、理间: H0: 1 = 2 = 3,即三种不同药物治疗后IGA 含量的总体均数相等; H1: 1、2 、 3 不等或不全相等 = 0.05区组间: H0: 1 = 2 = 11,即11个区组的IGA含量的 总体均数相等; H1: 1、2 、 11 不等或不全相等 = 0.05 1. 建立假设,确定检验水准 1462. 选定检验方法,计算统计量147148 对于三种药物,以v处理为 v1 ,以v误差为v2,查F界值表得:F0.05(2,20)=3.49,本例F处理=2.2893 F0.05(2,20),故P 0.05。按a= 0.05 检验水准,不拒绝 H0,即尚不能认为三种不同药物治疗后该病患
23、者血浆中IGA含量不同。3. 确定 P 值,作出推断结论149 对于区组,以v区组为 v1 ,以v误差为v2,查F界值表得:F0.05(10,20)=2.35,F0.01(10,20)=3.37,本例F区组=10.8736 F0.01(10,20),故P 0.01。按= 0.05 检验水准,拒绝 H0,接受 H1,可认为不同区组血浆中IGA含量不同。150P197200151表 15 15 例 18 资料的方差分析表变异来源 SS v MS F P 总 4.7452 32 处理 0.1629 2 0.0815 2.2893 0.05 区组 3.8706 10 0.3871 10.8736 0.
24、01 误差 0.7117 20 0.0356152三、两两比较的 q 检验拒绝H 0,接受H 1, 表示总体均数不全相等。 哪两两均数相等? 哪两两均数不等? 需要进一步作多重比较。153SNK(Student-Newman-Keuls)法 最常用方法之一,其检验统计量为q,故又称为q 检验 。MS误差 :单因素方差分析中的组内均方(MS组内),或两因素方差分析中的误差均方(MS误差)154例19 对例15.17资料不同组的SOD活性的均数作两两比较。1. 建立假设,确定检验水准 H0:任两组的SOD活性的总体均数相等,即 H1:任两组的SOD活性的总体均数不等,即 = 0.051552. 将三个样本均数从大到小排列,编上组次 组次 1 2 3 均数 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度出国留学学费支付及管理合同3篇
- 二零二五年度煤炭运输合同范本:多式联运与综合物流服务协议4篇
- 二零二五版文化中心场地租赁协议书4篇
- 2025年度海洋工程聘用工程师及项目实施合同4篇
- 2025版充电桩安全风险评估与应急预案制定合同3篇
- 二零二五版智慧医疗路演投资合同范本4篇
- 二手房交易详细合同2024年版版B版
- 2025版工业机床设备买卖及零配件供应合同3篇
- 2025版门头装修合同:装修合同附件与补充条款11292篇
- 2025年茶楼服务员劳动合同:茶楼运营管理与员工激励机制3篇
- 2025年度版权授权协议:游戏角色形象设计与授权使用3篇
- 心肺复苏课件2024
- 《城镇燃气领域重大隐患判定指导手册》专题培训
- 湖南财政经济学院专升本管理学真题
- 全国身份证前六位、区号、邮编-编码大全
- 2024-2025学年福建省厦门市第一中学高一(上)适应性训练物理试卷(10月)(含答案)
- 《零售学第二版教学》课件
- 广东省珠海市香洲区2023-2024学年四年级下学期期末数学试卷
- 房地产行业职业生涯规划
- 江苏省建筑与装饰工程计价定额(2014)电子表格版
- MOOC 数字电路与系统-大连理工大学 中国大学慕课答案
评论
0/150
提交评论