版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计方法介绍http:/ 根据不同的资料类型及不同的统计要求选择不同的统计方法。 http:/ 资料类型: 资料一般可分成三大类:计量资料、计数资料和等级资料。 (1)计量资料: 它是测量每个观察单位某项指标值的大小所得的资料。 (2)计数资料:将观察单位按某种属性或类别分组计数,得到各类别观察单位计数的资料,称为计数资料。 (3)等级资料又称为半定量资料:将观察单位按某种属性的不同程度分组计算所得出的各个不同程度的观察单位计数的资料。http:/ 计量资料的描述性统计 1. 计量资料的描述性统计指标包括: (1)集中位置的指标,用以描述观察值的平均水平。 如算术均数、几何均数、中位数、百分位
2、数等。 (2)资料变异的指标,用以描述观察值间参差不齐的程度,即离散度或称变异度。 如全距、标准差、方差、变异系数、四分位数间距等。http:/ 为观察值的总乘积开n 次方根。常用对数计算,求对数值的均数。再查反对数得出g。几何均数适用于成倍数关系的资料,如抗体滴度、效价等,也用于对数正态分布的资料如某些传染病的潜伏期、细菌计数等。 (3)中位数:用m表示,它将总体或样本的全部观察 值分成两部分,每部分各有50%个观察值。 http:/ 中位数计算方法为:先将原始观察值按由小到大顺序排列后,位次处于中间的那个观察值为中位数。观察值数为奇数时,处于中间的那个数为中位数,偶数时处于中间的两个数的均
3、数为中位数。 中位数适用于表示任何分布资料的平均水平。但常用于非正态分布资料。由于中位数不受个别特大,特小数值的影响, 因此它比均数稳健,常用于资料分布不明,或明显偏态,或分布的一端无确定值的情况。http:/ (100-x)%个观察值大于px。 用途:1.描述一组资料在各个百分位置上的水平,用一组百分位数如p5,p25, p50, p75, p95,可以描述总体或样本的分布特征,如集中位置、变异度等。 2.确定医学正常值范围。 http:/ p25称为第1四分位数;记为q1。 p50称为第2四分位数;记为q2,就是中位数m p75称为第3四分位数;记为q3。http:/ 通常:最小值最大值,
4、 如:3.9805.875http:/ 标准差常用sd表示,方差是标准差的平方。标准差是一种常用的离散指标,结合均数能给出正态分布的特征。实际应用时常以均数标准差的写法综合观察值的集中和离散特征。(7)变异系数:变异系数是一种离散指标,简记为cv,它是标准差与均数之比,用百分数表达。 由于cv无量度单位,而且消除了原始资料的平均水平的影响,因此常用于比较量度单位不相同的指标或者平均水平相差悬殊的指标的变异程度。http:/ 四分位数间距是第3四分位数与第1四分位数之差,即p75p25。 四分位数间距受特大值或特小值影响小,较稳定。 中位数和四分位数间距相结合常用于表示非正态分布资料的平均水平和
5、离散程度。http:/ t检验也称为student t检验。主要用于两组计量资料比较的显著性检验。包括:样本均数与总体均数的比较,两配对样本均数的比较和非配对两样本均数的比较。 二二.t.t检验检验http:/ 样本均数与总体均数比较的t检验 检验样本是否来自均数为0的已知总体 。 如:要研究现在13岁男孩的身高是否比20年前的13岁男孩高。 20年前的13岁男孩平均身高为1.30。现测量了13岁男孩100名平均身高为1.35,标准差为0.12,要检验现在13岁男孩身高的总体均数是否高于1.30。http:/ 配对t检验http:/ 团体t检验 用于非配对两样本均数的比较。 如:两组雌鼠,分别
6、饲以高蛋白和低蛋白饲料, 8周后记录各鼠体重增加量(克)如下,问两组动物增重的均数差别是否显著? 高蛋白组: 134 146 104 119 124 161 107 83 113 129 97 123 低蛋白组: 70 118 101 85 107 132 94 http:/ 样本均数和总体均数比较的t检验: 样本来自正态分布的总体。2 . 配对t检验: 差值的总体为正态分布。3 . 团体t检验: 1)两个样本都来自正态分布的总体。 2)两个总体方差相等。http:/ 进行变量变换,如对数变换,变换成正态分布后再进行t检验。2. 用非参数检验的方法。3 . 两样本比较的t检验时,如正态分布但方
7、差不齐,可用t检验。http:/ 方差分析主要用于检验计量资料中两个或两个以上样本均数间差别的显著性。 常见的错误是进行各组之间的两两t检验。这将增加第一类误差的概率。 两组以上均数的比较不能用两两t检验,而必须用方差分析。如差别有统计学意义,然后再进一步用snk等方法作两两比较。三三. 方差分析方差分析 http:/ 小白鼠给药前后发生咳嗽的推迟时间(秒) 复方 复方 可待因 40 50 60 15 -10 30 -5 105 77 例数 15 15 10 均值 31.67 44 60.7 http:/ 欲比较因素的k个水平的各变量均值,同时控制另一个因素的作用。试验设计时,先将受试对象按其
8、它控制因素性质相同或相近者组成单位组,每个单位组有k个受试对象,分别随机分配至因素的k个水平上。这时每个水平的受试对象不仅数量相同, 而且性质亦相同或相近,就能缩小误差,提高实验效率。它是两样本配对试验的扩大。http:/ 单位组 处理1 处理2 . 处理k 1 x11 x12 . x1k 2 x21 x22 . x2k . b xb1 xb2 xbkhttp:/ 大白鼠注射不同剂量雌激素后的子宫重量(g) 雌激素剂量(g/100g) 大白鼠种系 0.2 0.4 0.8 a 106 116 145 b 42 68 115 c 70 111 133 d 42 63 87 http:/ 欲比较一个
9、因素中k个水平的各均数,同时要控制另二个因素作用时,可用拉丁方设计的方差分析。 要同时研究几个因素的作用,同时要考察因素间的交互作用,可用析因设计的方差分析。http:/ 在各种试验设计中,对主要变量y 研究时,常希望其他可能影响y的变量保持基本一致,以达到均衡可比。例如:比较几种药物的降压作用,各试验组在原始血压、性别、年龄等指标应无显著差异。有时这些变量不能控制,须在统计分析时,通过一定方法来消除这些变量的影响后,再对主要变量y作出统计推断。 如果所控制的变量是分类变量时,可用多因素的方差分析。 http:/ 当要控制的变量是连续型变量时,可用协方差分析。 称这些影响变量为协变量,消除协变
10、量的影响后,或将协变量化成相等后,对y的修正均数所作的方差分析称为协方差分析。例如:比较几种不同饲料对动物体重增加的作用,可把动物的进食量作为协变量。 比较大学生和运动员的肺活量时,可把身高作为协变量。 比较治疗后二组舒张压的大小,可把治疗前的舒张压作为协变量。http:/ 如:比较初生至三周岁儿童男女两组体表面积y之间有无差异,以身高x1和体重x2为协变量比较对身高和体重修正后的体表面积修正均数。http:/ 计数资料的描述性统计:计数资料的描述性统计:率和构成比是计数资料的主要描述性指标。率说明某种现象发生的频率或强度,其公式为: 率=某现象实际发生的例数/某现象可能发生的例数。 常见的率
11、有发病率、患病率、死亡率、痊愈率、有效率等。 构成比表示事物或现象内部各构成部分的比重,通常以100作为比例基数, 故常称为百分比。构成比=事物内部某一构成部分的观察单位数/事物内部各组成部分的观察单位总数 。如性别的构成比,病种的构成比,职业的构成比等。http:/ 构成比和率是两个不同的相对数,用途不一样,不能混淆。最容易犯的错误是把构成比当作率来用。 用率作比较时,应注意其可比性。应审慎思考影响的因素,不能凭表面数值贸然下结论。对于内部构成不同的两个率,应先作标准化处理,才能进行比较, 这称为率的标准化,经标准化后的率称为标准化率。 http:/ 职业 患者人数 所占比例() 工人 15
12、00 50.00 农民 1000 33.33 学生 250 8.33 干部 250 8.33 结论为:工人患近视眼最多,其次是农民,学生和干部患近视眼都比较少。http:/ 职业 调查人数 患者人数 患病率() 工人 2000 100 5.00 农民 2000 100 5.00 学生 1000 100 10.00 干部 1000 100 10.00http:/ 四格表和行列表卡方检验 四格表和行列表卡方检验用于两个或多个率或构成比差异的显著性检验以及两种属性间独立性检验。http:/ 有效 无效 合计 有效率西药 63 16 79 79.75 中药 47 7 54 87.04合计 110 23
13、 133 82.71 两组有效率的差异是否有统计学意义?http:/ 有效 无效 合计 有效率西药组 63 16 79 79.75中药组 47 7 54 87.04 中西结合 65 3 68 95.59 合计 175 26 201 http:/ 血 型 民族 a b o ab 合计 傣族 f11 f12 f13 f14 n1+ 佤族 f21 f22 f23 f24 n2+ 土家族 f31 f32 f33 f34 n3+ 合计 n+1 n+2 n+3 n+4 nhttp:/ . 非参数统计非参数统计l 在统计推断中,如t检验,方差分析等,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为
14、未知,统计推断的目的就是对这些未知参数进行估计或检验。这类统计推断方法称为参数统计。l 非参数统计是一种不依赖总体分布的具体形式的统计方法。http:/ (1)适用于任何总体分布。 (2)计算简便。 (3)易于理解和掌握。 (4)可应用于不能精确测量的资料,如等级资料。缺点: (1)对适宜用参数方法的资料,若用非参数处理,常损失部分信息,降低效率。 (2)虽然许多非参数法计算简便,但不少问题的计算,特别样本较大时,比较繁杂。http:/ 相当于团体t检验。3. kruskal wallis 检验(kw检验)用于两个以上样本的比较,相当于方差分析。4. friedman秩和检验用于试验按随机单位
15、组设计时的秩和检验。http:/ . 等级资料等级资料 等级资料的描述性统计和计数治疗相同,是率和构成比。 等级资料的显著性检验都用非参数检验。 http:/ 考察两指标间有无关系 1. 两指标均为正态计量指标用相关系数。 2. 两指标为非正态计量指标用秩相关系数。 3. 两指标均为等级指标用秩相关系数。 4. 两指标为计数指标用列联系数,卡方检验。 5. 一个为等级指标,另一个为计量指标用秩相关系数,或者用方差分析。 6. 一个为计数指标,另一个为计量指标用 t 检验或者方差分析。http:/ 如要分析一个连续的正态变量(应变量)和其他几个变量(自变量)间有无关系。用多元相关和多元回归分析。
16、 如要分析一个二值变量(反应变量)和其他几个变量(协变量)间有无关系。用logistic回归分析。http:/ 生存分析 对于肿瘤等疾病的疗效及预后的考核常常不用通常的治愈率、好转率等表示,而用生存期表示。 生存分析是指对于生存期这一变量进行分析的一系列特殊的统计分析方法。 生存期从某个标准时刻(发病、确诊、开始治疗或手术等)算起至死亡为止的存活时间。 http:/ 生存期不同于一般指标的两个特点: (1)有截尾数据。 (2)生存期不服从正态分布。 生存分析起先只用于分析生存期,但以后又发展成可分析一切从某种起始事件达到某终点事件所经历的时间跨度。如:起效时间,缓解时间,等。http:/ 有时还收集一些有关因素(称为自变量或协变量), 以分析这些协变量是否对生存时间有影响,影响的大小,是缩短或延长
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年合肥市档案馆公开招聘政府购买服务岗位人员2名备考笔试试题及答案解析
- 抚州市2025年市属国有企业公开招聘员工市国威安保服务有限公司押运员体能测评参考考试试题及答案解析
- 2026届福建省三明市第二中学英语高三第一学期期末综合测试试题含解析
- 2026届宁夏银川市第一中学高三语文第一学期期末统考模拟试题含解析
- 2025年宁乡考试语文试卷及答案
- 2025年安徽送考中学试卷及答案
- 老旧厂房升级改造项目社会稳定风险评估报告
- DB41-T 2412-2023 高标准农田 建设规范
- 燕字课件教学课件
- 广东机场安检VIP检查员安检工作质量考核办法含答案
- 应收账款债权转让协议
- 四川省宜宾市长宁县2024-2025学年九年级上学期期末化学试题(含答案)
- CNAS-CC01:2015 管理体系认证机构要求
- 可行性报告商业计划书
- 甲流防控知识培训课件
- DB32 T538-2002 江苏省住宅物业管理服务标准
- 湖南师范大学课程毛概题库
- 借住合同范本(2篇)
- 2025年民航华北空管局招聘笔试参考题库含答案解析
- 公司反腐败反贿赂培训
- 江西省2024年“三新”协同教研共同体高三联考 地理试卷(含答案解析)
评论
0/150
提交评论