已阅读5页,还剩83页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,1,刘芬首都医科大学公共卫生与家庭医学学院流行病与卫生统计学系,医学统计学总复习,.,2,一、概述.科研统计工作的步骤,(1)研究设计(researchdesign):根据研究的目的,从统计学的角度对各步提前做出的周密的计划和安排调查设计实验设计(临床设计、新药设计),科研设计,.,3,(2)收集资料(datacollection)(3)整理资料(datasorting)(4)分析资料(dataanalysis),一、概述.科研统计工作的步骤,.,4,统计分析,统计推断,参数估计,假设检验,点估计,区间估计,统计描述,.,5,均数、中位数、标准差统计量率、构成比相关系数、回归系数等,统计表编制规则统计图条图、直方图、圆图、线图等,统计描述的方法,类型、适用条件,.,6,用样本的信息来推断总体的特征叫统计推断统计分析的主要目的是由样本推断总体,故统计学的主体是统计推断,统计推断,.,7,统计推断,参数估计,假设检验,点估计,区间估计,参数,非参,z检验t检验F检验直线相关与回归,卡方检验秩和检验等级相关,.,8,.资料类型,(1)定量资料计量资料(measurementdata):对每个观察单位用定量方法测定某项指标的数值大小所得的资料,.,9,(2)定性资料计数资料(enumerationdata)按性质或类别进行分组,然后再清点各组数目所得的资料等级资料(rankeddata)将观察单位按某项指标的等级顺序分组,再清点各组观察单位的个数所得的资料,.资料类型,.,10,二、定量资料的基本统计方法,有个模块:统计描述区间估计假设检验相关与回归,.,11,1、统计描述统计指标,平均指标和变异指标分别反映资料的不同特征,常配套使用,根据资料类型不同有不同组合,如正态分布:均数、标准差偏态分布:中位数、四分位数间距,描述集中趋势指标:算术均数(简称均数)()几何均数(G)中位数(M),描述离散程度指标:极差(R)四分位数间距(Q)方差(S2)标准差(S)变异系数(CV),.,12,1、描述偏态分布集中趋势(尿氟均值)的指标:中位数2、比较几组量纲不同的资料的离散程度的指标:变异系数,统计描述,.,13,1)统计表,组合表,简单表,2)统计图,条图圆图线图直方图散点图.,*类型、适用条件*,1、统计描述统计表与统计图,.,14,例1现有145例粪链球菌食物中毒病人,其潜伏期分布如表1所示,属于不对称分布表1粪链球菌食物中毒潜伏期潜伏期(小时)频数(f)累计频数018186456312401031830133246139300139364143422145,.,15,图1粪链球菌食物中毒潜伏期分布,.,16,表2某地144名正常成年男子红细胞数频数表组段频数f4.224.444.674.8165.0205.2255.4245.6225.8166.026.256.46.61,.,17,直方图,图2144名正常男子红细胞计数的直方图,.,18,2、区间估计,正常值(参考值)范围(p21),总体均数的可(置)信区间(p69),正态分布(normaldistribution)可信区间(confidenceinterval,CI),注意:95%CI与95%正常值范围区别,(p70),.,19,单个样本(onesample)t检验配对资料(pairedsample)比较的t检验两独立样本(twoindependentsample)均数比较的检验t检验(当方差不齐时),3、假设检验(hypothesistest),t检验,.,20,亦称studentst检验,应用t检验条件:1)单因素两水平的定量效应指标2)要求各组正态分布3)要求方差齐性如不满足条件,当满足正态性而方差不齐时可进行t检验,否则需采用变换或非参数方法作统计分析,t检验,.,21,t检验的类型,主要用于下列三种情况:(1)样本均数与总体均数比较;(2)配对数值变量资料的比较;(3)两样本均数的比较。,.,22,例2应用克矽平治疗矽肺患者10名,治疗前、后血红蛋白的含量如表3所示,问该药是否引起血红蛋白含量的变化?,.,23,表3克矽平治疗矽肺患者治疗前后血红蛋白含量(g/L)编号治疗前治疗后11131402150138315014041351355128135610012071101478120114913013810123120,.,24,表3克矽平治疗矽肺患者血红蛋白量(克)编号治疗前治疗后治疗前后差数1113140272150138-123150140-1041351350512813576100120207110147378120114-69130138810123120-3,.,25,解:.建立检验假设,确定检验水准0:d=0,假设该药不影响血红蛋白的变化,即治疗前后总体差数为0。1:d0,假设该药影响血红蛋白的变化,即治疗前后总体差数不为0。=0.05.计算检验统计量值,(1)配对检验,.,26,.,27,3确定P值,做出统计推断自由度=n-1=10-1=9,查t临界值(附表2)得:0.883t=1.3071.383,0.200.40,按=0.05水准不拒绝H0,差异无统计学意义。根据目前资料尚不能认为克矽平对血红蛋白含量有影响。,.,28,()两独立样本均数比较的检验(two-independentsamplet-test),.,29,其中:,=n1+n2-2,.,30,例3某克山病高发区测得11例急性克山病患者与该地13名健康人的血磷值(mg%)如表4所示,判定两组均数差异有否统计学意义。,.,31,表4急性克山病患者与健康者的血磷测定值(mg%),患者编号X1健康者编号X214.7312.3426.4022.5032.6031.9843.2441.6756.5351.9865.1863.6075.5872.3383.7383.7394.3294.57105.78104.82113.73115.78124.17134.14,.,32,解:.建立检验假设,确定检验水准0:1=2,即克山病患者与当地健康者的血磷值的均数相同。1:12,即克山病患者与当地健康者的血磷值的均数不相同。=0.05.,.,33,计算检验统计量值,.,34,计算检验统计量值,.,35,3确定P值,做出统计推断自由度=n1+n2-2=11+13-2=22,查t临界值(附表2)得:t=2.547t0.05,22=2.047,0.05。按a=0.05检验水准,不拒绝H0,差异无统计学意义,尚不能认为男性甲状腺机能减退症患者尺骨骨矿含量与正常人有差别。,.,63,4、相关与一致性分析(correlationandconsistencyanalysis),相关:可采用spearman秩相关适用于等级资料,.,64,直线相关与回归分析,应用条件:研究两个定量变量间的相互关系或依存关系,.,65,y。X散点图,.,66,线性相关,是用相关系数r来表示两个变量X,Y间的直线关系相关系数r没有单位,在-1+1范围内波动其绝对值愈接近1,两个变量间的直线相关愈密切,愈接近0,线性相关愈不密切,.,67,直线回归,当两变量间存在着性线关系时,不仅可以用相关系数r表示变量Y与X线性相关的密切程度,还可以用一个二元一次方程来表示,.,68,回归方程的应用-预测与估计,应用最小二乘法求回归方程系数求出回归方程后,如果方程拟合度好(决定系数R),可根据X的值来求Y预测值,.,69,统计方法选择的思路,统计方法选择的四级思维资料类型分布类型设计类型具体条件统计分析的两个方面统计描述(统计指标与图表)统计推断,.,70,资料,资料,类型,数值变量,正态,非正态,X,G,S,参考值范围,统计图表等,线性相关与回归,统计推断,r计算与检验,Y=a+bX,均数可信区间估计,假设检验:t与z检验方差分析,M,QUQL,参考值范围,统计图表等,秩和检验,等级相关,有序多分类变量,构成比,中位数,两分类,无序多分类,二项分布,率,相对比,构成比,假设检验,两组率比较:z检验与卡方检验,多组率和两组或多组构成比比较:卡方检验,配对两分类资料卡方检验,参数估计,正态近似法,直接查表法,统计方法的流程图,.,71,统计方法应用条件和适用资料,集中趋势与离散趋势的统计指标t检验与z检验方差分析2检验非参数检验线性相关与回归,.,72,集中趋势与离散趋势统计指标,集中趋势离散趋势正态分布均数方差、标准差对数正态几何均数几何标准差偏态等中位数四分位数间距变异系数:在两组或多组资料变异度比较组间单位不同组间均数相差较大,.,73,t检验与z检验的应用条件,两组数值变量资料比较;小样本时用t检验,要求资料为随机样本并服从正态分布;大样本时用z检验,仍要求资料为随机样本,但正态性条件可以放宽;在两样本均数比较的t和z检验中,要求两组总体方差相等,即方差齐性;组间要求具有均衡可比性。,.,74,方差分析的应用条件,多组定量资料的比较观察值为独立随机样本,并服从正态分布;样本较大时正态性条件可以放宽;方差齐性组间可比性,.,75,2检验的适用资料,两组样本率的比较;多组样本率的比较;两组或多组构成比的比较;配对设计下两分类资料检验。,.,76,非参数检验的适用资料,有序多分类资料(双向有序,且分类属性相同);极度偏态分布;分布不规则和未知分布资料;数据变异较大,方差不齐,.,77,线性相关与回归的应用条件,散点图有线性趋势;专业上要求分析两变量间关系密切程度和变化方向,通过一个变量预测或控制另一变量;两变量服从双变量正态分布,或X可以精确测量的,Y服从正态分布。,.,78,几个基本概念,样本与总体频率(样本)与概率(总体)资料(变量)类型相对数指标:构成比、率、相对比统计工作步骤假设检验的两类错误,.,79,几个容易混淆的基本概念,1、抽样误差与标准误抽样研究才有抽样误差抽样误差的概念标准误是衡量抽样误差大小的指标2、标准差与标准误关系联系:离散度指标,计算上的联系区别:描述对象不同,意义与应用不同与n的关系不同(p67),.,80,几个容易混淆的基本概念,3、参考值范围与可信区间关系(p70)联系:均为一个数值范围区别:意义不同,与同一资料两范围的不同4、假设检验的意义是通过两组或多组间有差别的样本(均数或率),或样本与总体(均数或率)推断他们的总体(均数或率)是否相同(不能推断差别大小),.,81,几个容易混淆的基本概念,5、检验假设与检验结论(p72、73)无效假设与备择假设(单双侧);是对总体所作,H0假设总体相同或两者无关,检验方法建立于此;对检验方法的H0与H1作总结;检验结论有统计结论与专业结论;是针对检验假设(总体)而作的。,.,82,几个容易混淆的基本概念,6、检验水准与P值(p72)是预先确定的,表示在拒绝H0时可能犯错误的最大概率,属于第一类错误;P值是指如果H0成立,则抽到现有样本统计量及更极端值(与H0相差更大)的可能性,也可表示为在拒绝H0时可能犯错误的实际概率大小;与P值间的关系:P,接受H0,差异无统计学意义;P,拒绝H0,接受H1,差异有统计学意义,.,83,几个容易混淆的基本概念,7、多组比较问题卡方检验与秩和检验中有多组比较问题检验思路是先作总的比较,再作两两组间比较;注意H1、,.,84,几个容易混淆的基本概念,8、线性相关与线性相关系数前提是散点图有线性趋势;两变量线性关系密切程度和变化方向;检验的意义与r值的意义。9、线性回归与线性回归系数前提是散点图有线性趋势;配线求直线回归方程;线性回归系数b意义。,.,85,几个容易混淆的基本概念,10、率、构成比与相对比(相对数)率与比不能相混淆总率与平均率的概念率的标准化法11、方差分析中变异的拆分SS总=SS组间+SS组内总=组间+组内SS总=SS处理+SS区组+SS误差总=处理+区组+误差,.,86,几个容易混淆的基本概念,12、完全
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 劳动合同法员工离职的规定2024年-
- 转租房屋租赁协议范例
- 房屋建设四邻合作协议
- 房地产开发承包合同
- 房地产项目抵押借款合同
- 房产认购协议书
- 新昌县茶叶种植收购合同汇编
- 2023年高考押题预测卷01浙江卷-生物(原卷版)
- 2023年高考地理第一次模拟考试卷-(天津A卷)(全解全析)
- 2023年高考地理复习精题精练-城镇化(解析版)
- 电动客车驱动桥总成设计
- 四川省阿坝藏族羌族自治州《综合知识》事业单位国考真题
- 2023年人民法院电子音像出版社招聘笔试题库及答案解析
- 大学生心理健康优秀说课-比赛课件
- 收款账户变更的声明
- 九年级道德与法治中考复习资料
- 《化学发展简史》学习心得
- 班组建设与班组长管理技巧课件
- 签派员执照考试题库汇总-8签派和实践应用
- 30屈原《楚辞·橘颂》课件
- 销售人员十大军规课件
评论
0/150
提交评论