




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学,综合练习,三类资料,1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标,如血脂、心率等。 特点: 各观察单位间只有量的差别; 数据间有连续性,三类资料,2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标,如血型、性别等。 特点: 各观察单位间或者相同,或者存在质的差别; 有质的差别者之间无连续性,三类资料,3) 等级资料(ranked data,ordinal data) 以等级表达每个观察单位的某项观察指标,如疗效分级、心功能分级等。 特点: 各观察单位间或者相同,或者存在质的差别; 各等级间只有
2、顺序,而无数值大小,故等级之间不可度量,定量资料的描述,集中趋势: 算术均数 几何均数 中位数 百分位数 离散趋势: 极差 四分位数间距 标准差、方差 变异系数,6,集中趋势指标应用注意事项,算数均数:适用于单峰对称分布资料; 几何均数:适合于作对数变换后单峰对称分布资料; 中位数和百分位数:适用于任何分布的资料; 中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定; 中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。 因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。 不同质的资料应考虑分别计算平均数,7,离散趋势指标应用注意事项,全距:反映资料的分布
3、范围,全距大说明数据的变异度大,适用于任何资料; 四分位间距:两个特定的百分位数,常用于描述不对称资料的特征; 方差和标准差:常用来描述正态分布的资料; 变异系数: 常用于比较度量衡单位不同的两组或多组资料 的变异度; 比较均数相差悬殊的两组或多组资料的变异度,正态分布,Normal distribution 德国数学家Gauss发现 最早用于物理学、天文学 Gaussian distribution,正态分布的特征,正态分布有两个参数(parameter),即位置参数(均数)和变异度参数(标准差)。 高峰在均数处; 均数两侧完全对称。 正态曲线下的面积分布有一定的规律,正态分布和标准正态分布
4、曲线下面积分布规律总结,正态分布的应用,估计频数分布 质量控制 确定临床参考值范围,参考值范围的估计方法,方法双侧 单侧下限单侧上限 正态分布法,参考值范围(reference interval,参考值范围又称正常值范围(normal range)。 什么是参考值范围: 是绝大多数正常人的某观察指标所在的范围。 绝大多数:90%,95%,99%等等。 确定参考值范围的意义: 用于判断正常与异常。 “正常人”的定义: 排除了影响所研究的指标的疾病和有关因素的同质的人群,由抽样引起的样本统计量与总体参数间的差别。 原因:个体变异抽样 表现: 样本统计量与总体参数间的差别 不同样本统计量间的差别 抽
5、样误差是有规律的,抽样误差(sampling error,中心极限定理,从正态总体中随机抽样,样本均数服从正态分布; 从偏态分布的总体中随机抽样,当样本含量足够大时,样本均数也近似服从正态分布,从任意分布的总体(均数,标准差) 中随机抽样,当样本含量逐渐增大时, 样本均数的分布趋向正态分布, 此分布的均数为 ,标准差为,标准误(standard error,样本统计量的标准差称为标准误。 样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度。 当总体标准差未知时,用样本方差代替, 前者称为理论标准误,后者称为样本标准误,标准误与标准差(1,联系: 都表示变异的大小; 样本含量一
6、定时,标准差越大,标准误越大,标准误与标准差(2,标准差 含义: 一组变量值离散程度; 标准差越小,均数的代表性越好; 应用: 估计参考值范围; 与n的关系:样本含量越大,标准差越稳定,n 很大时,标准差趋向于总体标准差,标准误与标准差(3,标准误 含义: 样本统计量的离散程度; 标准误越小,用样本均数来反映总体均数越可靠; 应用: 计算可信区间; 与n的关系: 样本含量越大,均数的标准误越小,n很大时,标准误趋向于0,统计推断(statistical inference,根据样本所提供的信息,以一定的概率推断总体的性质。 总体参数的估计 (parameter estimation) 假设检验
7、 (hypothesis test,区间估计(interval estimation,按一定的概率或可信度(1-)用一个区间估计总体参数所在范围,这个范围称作可信度为1-的可信区间。 这种估计方法称为区间估计。 理论基础:抽样分布规律,假设检验的步骤,建立假设(在假设的前提下有规律可循); 确定检验水准(确定最大允许误差); 计算检验统计量(样本与总体有多大的偏离); 计算概率P (该样本是否支持零假设); 结论(根据小概率原理,均数的假设检验,样本均数与总体均数的比较 配对设计样本均数的比较 两样本均数的比较,均数的假设检验应用条件,独立性、正态性、方差齐性 方差齐性检验 方差不齐时的近似
8、t 检验 大样本时,均数比较的 u 检验,I 型错误和 II 型错误,P值的意义,从 H0 总体中随机获得等于或大于现有统计量值的概率。 拒绝H0时所冒的风险,t,t,定性资料,定性资料的特点 离散性,变量仅取有限的几个值; 资料不含有次序的信息; 举例 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生) 描述指标: 率 相对数 构成比 相对比,常用相对数(1,率(rate),又称频率指标,说明某现象发生的频率和强度。(强度相对数,常用相对数(2,构成比(proportion),又称构成指标,说明一种事物内部各组成部分所占的比重或分布。 各部分构成比之和为1或100,常用相对数(3,
9、比(ratio),又称相对比,是A,B两个有关指标之比,说明A为B的若干倍或百分之几。两个指标可以性质相同,也可以不同,四格表(fourfold table)的概念,这四个格子的频数是整个表的基本数据,其余数据都是从这四个基本数据推算出来的,这种资料称为四格表资料,2检验的基本思想,如果H0假设成立,则实际频数( actual frequency)与理论频数应该比较接近。 如果实际频数与理论频数相差较大,超出了抽样误差所能解释的范围,则可以认为H0假设不成立,即两样本对应的总体率不等,理论频数的计算,实际数 理论频数,T11=53 83/109=40.36 T12=53 26/109=12.6
10、4 T21=56 83/109=42.64 T22=56 26/109=13.36,等级资料的特点,既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料; 比“定量”粗,而比一般的“定性”细; 等级间既非等距,亦不能度量,秩次与秩和,秩次(rank),秩统计量 是指全部观察值按某种顺序排列的位序; 秩和(rank sum) 同组秩次之和,两样本比较的秩和检验(基本原理) Wilcoxon符号秩和检验(基本原理,秩和检验的正确应用,秩和检验可用于任意分布的资料; (1)等级资料; (2)计量资料中: 极度偏态资料,或个别数值偏离过大 各组离散度相差悬殊 资料中含有不确定值大于5年
11、、0.001、1:1024以上 分布类型尚未确知 (3)兼有等级和定量性质的资料,相关与回归,线性相关 等级相关 列联相关 线性回归,相关系数的性质,1 r 1 r0为正相关 r0为负相关 r0为零相关或无相关 相关系数绝对值越大,两变量间相关程度越密切; 相关系数越接近于0,表示相关越不密切,3.回归系数和回归方程的意义及性质,b 的意义 a 的意义 的意义 的意义 意义,直线回归与直线相关的区别与联系,联系 均表示线性关系; 符号相同:共变方向一致; 假设检验结果相同:是否存在共变关系,直线回归与直线相关的区别与联系,区别 r 没有单位,b有单位;所以,相关系数与单位无关,回归系数与单位有
12、关; 相关表示相互关系;回归表示依存关系; 对资料的要求不同: 当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析,实验研究的基本要素,处理因素:作用于受试对象,要求在实验过程中观察其处理的因素 受试对象:处理因素作用的对象 实验效应:受试对象接受试验处理后所出现的实验结果,实验设计的基本原则,基本原则之一:对照 排除“非处理因素”的影响,从而衬托处理因素的作用 基本原则之二:随机 不仅能控制已知的混杂因素(非研究因素),而且还能控制未知的混杂因素。是保证非处理因素在各对照组之间均衡一致的重要条件 抽样随机;分组随机;试验顺序随机 基本原
13、则之三:重复 以提高实验的可靠性,研究设计的常见类型,完全随机分组设计 成组设计 配对设计(目的?) 正确选择分析方法,考试题型,选择 名词解释 简答题 资料分析题,习题,1关于正态分布的特征,下面说法错误的是: A高峰位置在均数 = 处 B为位置参数,越大,则曲线沿横轴向右移动;越小,曲线沿横轴向左移动 C为形态参数,表示数据的离散程度,若小,则曲线形态“矮胖”;大,则曲线形态“瘦高” D正态分布以均数为中心,左右完全对称 2. 各观察值均加上同一数后,( ) (A)均数不变,标准差改变(B)均数改变,标准差不变 (C)两者均改变 (D)两者均不变 3. 某地5人接种某疫苗后抗体滴度为1:2
14、0、1:40、1:80、 1:16 0、1:320。为求平均抗体滴度,最好选用( ) (A)中位数 (B)几何均数 (C)算术平均数 (D)标准差,4正态分布曲线下,横轴上从均数到( + 1.96)的面积为: A95% B45% C47.5% D90% 5. 某人群血糖的正常值范围是指 ( ) (A)该指标在所有人中的波动范围 (B)该指标在所有正常人中的波动范围 (C)该指标在绝大部分正常人中的波动范围 (D)该指标在一个人不同时间的波动范围 6假设检验中的第一类错误是指 A拒绝了实际上成立的H0 B不拒绝实际上成立的H0 C拒绝了实际上不成立的H0 D不拒绝实际上不成立的H0,7. X2.
15、58s包括变量值的 A. 68.3% B. 90.0% C. 95.0% D. 99.0% 8. 均数与标准差之间的关系是 A.标准差越小,均数代表性越好 B. 标准差越小,均数代表性越差 C. 均数越大,标准差越小 D. 均数越大,标准差越大 9.分析定性资料时,最常用的显著性检验方法是 A.t检验 B.正态检验 C.U检验 D.2检验 10.四格表如有一个实际数为0 A.就不能做2检验; B.就不能用校正2检验; C.还不能决定是否可做2检验; D.肯定可做校正2检验,名词解释,总体和样本 参数和样本统计量 抽样误差 标准误 小概率原理 小概率事件 P值的含义 检验效能 一类错误与二类错误
16、 可信区间 相关系数,简答题,1.简述中心极限定理的涵义? 2.描述定量资料的集中位置和离散趋势各有哪些指标? 3.标准差与标准误区别与联系?适用于何种情况? 4.参考值范围和区间估计的区别与联系? 5.假设检验的步骤有哪些? 6.ANOVA的应用条件是什么?当资料不符合方差齐性条件时,需对资料进行变换,常见的变换形式有? 7.秩和检验的条件? 8.直线回归与直线相关的区别与联系 9.简述实验设计的基本要素,基本原则,资料分析题-1,为了考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校(UC Berkley)的儿童健康与发展研究中心随机抽取了12例白种男婴和12例白种女婴的出生资料(单位
17、:磅,1)该资料是数值变量资料还是分类资料? (2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验? (3) 经过计算t值为2.16,已知自由度为22时,双侧面积0.05对应的t界值为2.07,自由度为11时,双侧面积0.05对应的t界值为2.20。试写出假设检验的全过程并下结论,资料分析题-2,11名志愿者接受胆固醇试验,受试者在用药前后各测量一次血清胆固醇(mmol/l)数据如下,试判断此药是否有效? 前6.11,6.81,6.48,7.59,6.42,6.94,9.17,7.33,6.94,7.67,8.15 后 6.00,6.83,6.49,7.28,6.3
18、0,6.64,8.42,7.00,6.58,7.22,6.57,1.该资料属于什么研究类型? 2.写出该假设检验的假设? 3.若算得到t=2.8518,查表知自由度为10时,双侧面积0.05对应的t界值为2.228,自由度为20时,双侧面积0.05对应的t界值为2.086,请问如何下统计结论,现有43例栓塞性脉管炎病人,用甲、乙两种疗法治疗,治疗结果如下 (1)请计算最小理论数 (2)若要比较甲乙疗法的治愈率是否相等,请问使用何种方法? (3)若计算得到2=4.33,校正以后的2=2.94,请问如何下统计学结论?(,资料分析题-3,资料分析题-4,比较缺氧条件下猫和兔的生存时间(时间:分,该资料属于什么试验设计方式? 对资料进行编秩; 该资料总秩和为多少?各组的实际秩和各为多少? 写出对该资料进行假设检验的假设,用离子交换法和蒸馏法分别测定8名健康人的尿汞,结果如下。问两法测量结果有无差别,资料分析题-5,该资料来自于什么试验设计? 对该
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 老年综合征衰弱新研究
- 公车私用行为规范及年度报告2025年度合同书
- 二零二五年度建设工程合同律师咨询费标准及解决方案
- 二零二五年度个人非遗传承借款合同弘扬传统文化
- 2025年度环境监测数据保密协议
- 二零二五年度定制木门售后服务标准合同
- 2025年度校园运动会学生运动服采购及赞助合同
- 2025年度警企合作推进社会治理创新协议
- 2025年度非婚生子女监护权及探望权执行合同
- 事业单位聘用合同(2025年度)编制与执行标准
- 2025年烟台工程职业技术学院高职单招数学历年(2016-2024)频考点试题含答案解析
- 2025年上半年中煤科工集团商业保理限公司招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2025年新人教版八年级下册物理全册教案
- 2025年南京机电职业技术学院高职单招语文2018-2024历年参考题库频考点含答案解析
- 物业管理消防维保流程优化建议
- 电力企业发电企业设备点检定修培训教材
- 化学-浙江省首考2025年1月普通高等学校招生全国统一考试试题和答案
- 四川省成都市2024-2025学年高一上学期期末考试历史试题(含答案)
- 2025年第六届美丽中国国家版图知识竞赛题库及答案
- 2025年湖北中烟工业限责任公司招聘笔试高频重点提升(共500题)附带答案详解
- 9生物与非生物课件-四年级下册科学人教鄂教版
评论
0/150
提交评论