




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、医学统计学理论复习方法的选择决定因素:研究目的,资料类型,是否符合正态分布和方差齐性. 基本概念统计工作一般要经历以下几个步骤:研究设计,搜集资料,整理资料,分析资料统计学(statistics):收集,整理和分析带有随机性的数据,作出推断和预测对资料进行统计分析主要包括统计描述和统计推断两个方面。研究设计可分实验研究设计与调查研究设计两类实验研究的基本要素包括三方面:处理因素,受试对象,实验效应实验研究的基本原则:对照(control),随机化(random),重复(replication)统计描述指用统计指标、统计表、统计图等方法,对资料的数量特征及其分布规律 进行测定和描述,不涉及由样本
2、推断总体问题。总体:一个统计问题所研究的对象的全体;样本:按随机的方式从总体中抽取若干具有代表性的同质个体统计推断可以分为二个部分:参数估计和假设检验。(样本推断总体)参数:用于描述总体分布的数字特征的量(总体均数,总体标准差。,总体率n; 统计量:不包含总体中任何未知参数的样本指标和样本数据的函数(样本均数,样 本标准差S,样本率P)参数估计可分为点估计和区间估计。可信区间的大小与样本含量及可信度的大小有关。一般地说,随着可信度的加大,可 信区间也加大,随着样本含量的加大,可信区间缩小。13.可信区间两要素:准确度:表现为可信度(1-a )的大小,即区间包含总体均数的概率大小; 精确度:表现
3、为区间的长度。在可信度确定的情况下,增加样本例数可减少区间长度,提高精确度。点估计:50% ; 95%可信区间为40% - 60% ; 99%可信区间为37%63%。假设检验应注意的问题:/ 正确的写法:H0:两总体均数相等;H1:两总体均数不相等。/错误的写法:H0:两样本均数相等;H1:两样本均数不相等。H0:两样本均数无显著差异;H1:两样本均数有显著差异。H0:两总体均数无显著差异;H1:两总体均数有显著差异。若同一个t检验的所得t值,对应的单侧概率P较小,为双侧概率的二分之一。若单侧检验误选用双侧检验,就不易拒绝H0 ;反之,若双侧检验误选用单侧就容易拒绝H0。决不能因为单侧易于拒绝
4、H0就盲目选用。通常进行的都为双侧检验;进行单侧检验时必须特别说明,要有充分的理由,并且在实验设计阶段就要预先规定好。I类错误:拒绝成立的H0,规定a=0.05;II类错误:不拒绝不成立的H0,B可由公式计算得到。(1-a)同时降低两类错误的唯一办法:在实际资源可接受限度内适当增加样本量。检验效能:用1-B表示;影响检验效能的四要素:(1)客观上组间效应差异越大,效能越大(2)个体间变异(标准差)越小,效能越大。(反)(3)I类错错误的概率a越大,效能越大。(4)样本量越大,效能越大。标准误(SE ):样本统计量的标准差,标准误越小,表示抽样误差越小,统计量越 稳定与所估计的参数越接近。特别注
5、意的是,统计量包括均数、率、回归系数,均 有对应的标准误。标准差:反应数值之间的离散程度,反应数据与总体均数之间的差异。样本均数的标准误(SEM):反映均数的抽样误差大小。均数标准误的用途:1)衡量样本均数推断总体均数的可靠性;2)估计总体均数的可信区间;3)用于均数的假设检验(2,3统计推断)通过增加样本例数来减少标准误,降低抽样误差。正态分布:又称高斯分布,简记为N(m,o2)o当p=0.0=1时的正态分布称为标准正态分布,记为N(0,1)o正态分布的特征:1 )正态分布是单峰分布,曲线在横轴上方均数处最高。2)正态分布以均数为中心,左右对称。3 )在X=p+-a处各有一拐点。4)正态曲线
6、下面积分布具有一定的规律。横轴上正态曲线下的总面积为100%或1o正态曲线的对称轴为直线X=M,对称轴两侧曲线下的面积相等,各占50% ;曲线下对称于p的区间,面积相等。曲线下区间(p-Q,p + Q )的面积为68.27%区间(叶1.64q,i + 1.64q)的面积为 89.90% ,区间(叶1.96q,/1.96q)的面积为95.00% ;区间(叶2.58q,/2.58q)的面积为99.00%。5 )正态分布有两个参数,即位置参数p和变异度参数(形态参数)Q。位置参数,p增大,曲线向右移动;形状参数,。增大,数据分散,曲线低平总体均数区间估计:当u为1.96时,表示本次试验结果:该区间包
7、含p的可能性为95% ;或95%的概率保证此区间包含了p。资料一般可分成三大类,即计量资料、计数资料和等级资料。计量资料(定量)的统计指标为均数,标准差等,统计检验方法为t检验,方差分析等;当不符合条件时用为非参数统计分析法。计数资料(定性)的统计指标为率,构成比等,统计检验方法为X2检验;等级资料的统计指标也为率,构成比等,统计检验方法为非参数(秩和)统计分析法。二.计量资料的统计指标正态分布资料的平均水平和离散程度常用均数和标准差表示。非正态分布资料的平均水平和离散程度常用中位数和四分位数间距表示。几何均数适用于成倍数关系的资料,如抗体滴度、效价等,也用于对数正态分布的资料如某些传染病的潜
8、伏期等。偏态系数:评价正态分布对称性的指标。对称:skewness=0 ;正偏态:skewness0 ;峰偏左,长尾向右。个别数据特别大(右)负偏态:skewness v0 ;峰偏右,长尾向左。个别数据特别小(左)正偏态对称分布负偏态峰态系数:评价正态分布正态峰的指标。正态峰:kurtosis=0 ;平阔峰:kurtosisv0 ;尖峭峰:kurtosis 0 ;变异系数无量度单位,而且消除了原始资料的平均水平的影响,因此常用于比较度 单位不相同的指标或者平均水平相差悬殊的指标的变异程度。t检验三种类型:单样本t检验,配对设计t检验,成组设计t检验t检验条件:样本均数与总体均数比较的t检验要求
9、样本来自正态分布的总体。配对t检验要求差值d来自正态分布的总体。成组t检验要求两个样本都来自正态分布并具有相同的方差(方差齐性。如不符合要求可作变量变换或用非参数统计分析方法。小样本成组t检验如方差不齐时可用t检验。t分布:与自由度有关,df越小,t值越分散,即曲线的峰部越低,尾部越粗;随着 df逐渐增大时,t分布逐渐逼近标准正态分布;但df等于时,t分布即成为标准正 态分布。方差分析方差分析必须满足4个条件:可加性,方差齐性,正态性,独立性;总的效果可分成若干部分,而每一部分都有一个特定的含义(可加性);各样本都来 自正态总体(正态性),且有一个相同的方差。2 (方差齐性)。各样本是互相独立
10、 的随机样本(独立性,方差公式总体方差(02 )=离均差平方和/N样本方差(S2 )=离均差平方和(N-1 );均方:各部分的离均差平方和除以相应自由度方差分析的基本思想:变异分解。方差(SS )和自由度具有可加性;均方(MS ) 具有可比性。均方之比为F统计量。分解越细致,各部分含义就越明确。检验效能 也越高。变量变换:对于服从对数正志分布的资料可用对数变换,即将主要变量取对数值后再作方差分 析;对于服从泊松分布的资料可用平方根变换;对于表达成百分数的资料可用平方根反正弦变换。单因素方差分析,又称之为完全随机化设计的方差分析。该设计中只有一个处理因 素,要求每个组内样本之间的差异不太大。组间
11、的样本量不一定相等。随机区组设计方差分析用于比较某因素各水平的样本均数,同时控制另一个分类因 素的作用。每个区组的样本量与处理因素的水平数相等。随机区组设计方差分析的条件:残差满足正态分布。均数间的多重比较:进一步比较两组之间的差异SNK-q检验:运用最广泛的两两比较LSD-t检验:最敏感,I类错误概率大Scheffe检验:检验结果与F检验一致,方差分析无意义时使用Bonferroni检验:最保守的检验方法,总次数超过10就不用了Dunnett检验:多个试验组与一个对照组的比较直线相关与回归相关分析:确定变量间相互关系的密切程度与方向,变量之间无自变量或因变量之 分。回归分析:用数学函数量化变
12、量间的依存或因果关系,可用自变量的值来预测应变 量的值。相关分析要求两个变量服从双变量正态分布。回归分析要求因变量服从正态分布, 自变量可以是精确测量和严格控制的变量。如两个变量服从双变量正态分布,则可 以作两个回归方程,用X推算Y,或用Y推算X最小二乘法:使因变量的观察值yi与估计值Vi之间的离差平方和(纵向距离平方 和)达到最小来求得a和b的方法:(yi- y)2求和(回归平方和)最小。用最小二 乘法拟合的直线来代表x与y之间的关系,此直线与实际数据的误差比其他任何直 线相应的误差都要小。决定系数R2 :表示Y的变异中可由方程中的自变量组合所决定的部分占多少;R2 越接近1,说明回归方程的
13、效果越好。回归解释相关:决定系数二(相关系数)2对同一组资料作回归和相关分析,相关系数r与回归系数b的正负号一致,而 且r与b的假设检验完全等价:tb=tr计数资料的统计分析率:某种现象发生的频率或强度。构成比:表示事物或现象内部各构成部分的比重,通常以100作为比例基数,故常称 为百分比。四格表和Rx2表的Pearson卡方检验用于两个或多个率差异的比较。RxC表的Pearson卡方检验用于两个或多个构成比差异的显著性检验以及两种属 性间独立性检验。x2分布:df越高,峰越低四格表卡方检验的应用条件:(40 , 5 , 1 )当总例数大于等于40,各理论频数大于等于5,不须校正。当总例数大于
14、等于40,有一格理论频数小于5,但大于等于1,用卡方校正公式连 续性校正,Yates校正。(不校正易发生I类错误)当总例数小于40 ,或有一格理论频数小于1 ,不能用卡方检验,宜用Fishers确切 概率计算。行x列表卡方检验的应用条件:如果1/5以上格子的理论频数小于5 ,或有1格子 的理论频数小于1,则卡方检验不是一个有效的检验。解决方法:(1 )增加样本含量(最佳方案)(2 )合理合并相邻的行或列(3)用Fisher确切概率计算。3种情况:)列有序(Row Mean Scores Differ):采用 Wilcoxon 秩和检验或者 Kruskal-wallis检验法或CMH-X2行平均
15、得分不同处理这这个问题)行有序:Cochran-Artimage 趋势检验(Cochran-Artimage test for trend)行列皆有序(Nonzero Correlation ):考虑CMHx2非零相关的或等级相关分析非参数统计:适用范围:(1 )用于不满足参数检验方法的计量资料。(2 )等级资料(3 )不能测量具体数值,其观测结果往往只有程度上的区别,如颜色深浅,凝集反应的 强弱等。(4)有不能测量的很大或很小的值。秩:数据从小到大的排列次序。秩和检验的思想就是编秩求和。主要的非参数检验方法:1 )配对资料:符号秩和检验(相当于配对t检验)。按差值d的绝对值编秩;推断 是否来自中位数为零的总体。2)两组比较:Wilcoxon秩和检验(相当于成组t检验)不配对,两样本混合统一 编秩,取样本小的秩合记作T13)多组比较:K-W检验或H检验(相当于完全随机设计方差分析)单因素4)多组比较:Friedman秩和检验(相当于随机单位组设计方差分析)两因素符号秩和检验中,取T+,与T-两者中数值较小者为检验统计量T。T越小,正负 秩和相差越悬殊,越不利于H0,TTa拒绝H0。两独立样本的秩合检验的步骤:1)两个独立样本数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 电梯安装项目挂靠协议书
- 安监局职工餐厅管理办法
- 安监局风险防范管理办法
- 安徽省价格管理暂行办法
- 建材建设工程管理办法
- 广东银行网贷管理办法
- 应急抢险补贴管理办法
- 岳阳旅游项目管理办法
- 工业指标管理暂行办法
- 市场开发体系管理办法
- GB/T 45920-2025铁铝酸盐水泥
- 大健康行业发展趋势
- 北京海淀2025年物理高二下期末达标测试试题含解析
- 陕西省2025年中考语文真题试卷及答案
- 2024-2025学年北师大版七年级数学下册期末阶段复习综合练习题
- 光伏电站台风预警与应急措施
- 2025年广州数学中考试题及答案
- 湖北省省直辖县级行政区划潜江市2024-2025学年七年级下学期期末考试生物试卷(含答案)
- 学霸提优第四单元《我们讲文明》重难点梳理 课件
- 医德培训课件
- 公司适用法律法规标准清单2025年08月更新
评论
0/150
提交评论