卫生统计学基本概况和基本概念_第1页
卫生统计学基本概况和基本概念_第2页
卫生统计学基本概况和基本概念_第3页
卫生统计学基本概况和基本概念_第4页
卫生统计学基本概况和基本概念_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1卫生统计学基本概况和基本概念卫生统计学基本概况和基本概念赵耐青复旦大学卫生统计教研室2教学要点统计学统计学Statistics的定义的定义1医学中的统计医学中的统计2基本概念基本概念3统计工作的步骤统计工作的步骤4目标与方法目标与方法53统计学Statistics的定义研究内容研究内容工作内容工作内容搜集搜集整理整理分析分析判断判断参与随机现象研究的设计观察和资料搜集处理研究参与随机现象研究的设计观察和资料搜集处理研究阶段与统计相关的问题并提出建议根据统计学原理阶段与统计相关的问题并提出建议根据统计学原理对资料进行统计分析和推断对资料进行统计分析和推断研究目的研究目的处理数据中的随机变异性,

2、求得可靠的结果处理数据中的随机变异性,求得可靠的结果4生物医学中的统计学分类医学统计学医学统计学Medical Statistics 生物统计学生物统计学Biostatistics 卫生统计学卫生统计学Health Statistics我国:统计学原理在医学中的运用我国:统计学原理在医学中的运用我国:生命科学实验研究我国:生命科学实验研究我国:预防医学研究我国:预防医学研究医学中的统计学科医学中的统计学科国际:生命科学研究、临床医学研究、预防医学研究国际:生命科学研究、临床医学研究、预防医学研究5医学中的统计医学统计医学统计医学中与统计相关问题及其解决方法医学中与统计相关问题及其解决方法收集、

3、处理和分析医学中的随机现象收集、处理和分析医学中的随机现象 统计学思维和方法帮助和解决统计学思维和方法帮助和解决医学研究和卫生决策中与统计相关的问题医学研究和卫生决策中与统计相关的问题 6医学中的统计发展史o医学中的统计思维-百年发展n1834 统计学的目标-数据搜集n1894 Pearson 现代统计教育 Pearson和Galton的努力将其变为高级的应用数学学科, 并用于解决医学、生物学问题n1903 Lister预防医学研究所创建第一个统计系n统计在医学中的作用开始得到强调和认可 强调医学艺术 统计艺术 强调个人经验 科学证据7医学中的统计问题o医学领域的统计问题n实验室研究-实验数据

4、分析n临床研究-个体变异临床试验临床试验-临床治疗的有效性和安全性例如:临床用某种药物治疗缺铁性贫血的疗效甲:治疗10人,8人有效;乙:治疗10人,4人有效临床科研临床科研 外科医生观察了50例肿瘤病人的术后生存情况(月):3,10,20,12,28,7,98医学中的统计问题o医学领域的统计问题n公共卫生-群体流行病研究流行病研究-吸烟与肺癌(Doll和Hill)卫生服务卫生服务-卫生资源需求和利用、医保改革健康统计健康统计-医学人口、生长发育、疾病统计等药学药物筛选、药代动力学等药物筛选、药代动力学等9基本概念个体与同质o个体individual根据研究目的确定的最基本的研究对象单位,也称观

5、察单位根据研究目的确定的最基本的研究对象单位,也称观察单位 v同质同质 (homogeneous)和异质和异质 (heterogeneous)具有相同性质的观察单位称为同质的;否则为异质的具有相同性质的观察单位称为同质的;否则为异质的 调查某地1995年正常成年女子的糖化血红蛋白-同质的要素?调查某地1995年正常成年女子的雌激素水平-同质?10基本概念变量和资料o变量variable所研究的观察对象的一个或几个特征,观察指标所研究的观察对象的一个或几个特征,观察指标 v资料资料data变量的观测值(亦称取值)组成变量的观测值(亦称取值)组成 v随机变量随机变量random variable观

6、察结果是随机的。随机变量分为:连续型和离散型变量观察结果是随机的。随机变量分为:连续型和离散型变量 11基本概念变量和资料o变量类型n连续型变量连续型变量-可能取值范围是一个区间,连续取值。即:在某一区间内的任意一个值都是可能被取到的。n离散型变量离散型变量-取值范围是有限个值或一个数列构成 从变量的背景上考察:离散型变量取值的性质可以具有分类性质和不具有分类性质的。12基本概念变量和资料n离散型变量离散型变量中取值表示分类情况的离散型变量又称为分类变量:o无序变量:两分类两分类和无序多分类无序多分类,如血型。也可用数字进行编码,但没有大小关系。o有序多分类有序多分类变量/等级变量:在研究背景

7、下有等级顺序,如疗效(无效、有效、显效)o变量的转化 连续型连续型-有序有序-分类(信息损失)如:年龄进行分分类(信息损失)如:年龄进行分组,疗效归为有效或无效等。组,疗效归为有效或无效等。13基本概念变量和资料小结14基本概念变量和资料例:调查某地某年1岁儿童的生长发育情况人群人群:某地某年1岁的儿童(同质和变异?)变量变量:性别、身高、体重、出牙、营养状况变量类型变量类型:?15基本概念总体与样本例:假定某该地在1998年的7岁男孩有10万人,现研究1998年该地7岁男孩的身高情况。 现在随机抽样调查了解现在随机抽样调查了解200200名名7 7岁男孩的身岁男孩的身高情况,测量他们的身高,

8、通过分析这高情况,测量他们的身高,通过分析这200200个儿童的身高推断该地个儿童的身高推断该地1010万个万个7 7岁男孩岁男孩身高情况。身高情况。16基本概念总体与样本 上述例子中涉及到下列概念:研究目的:1998年某地年某地7岁男孩的身高情况岁男孩的身高情况研究对象:该地在:该地在1998年的年的10万个万个7岁男孩岁男孩观察单位(个体):每个:每个7岁男孩岁男孩观察指标:身高:身高(观察指标又称为变量观察指标又称为变量)观察值:身高测量值:身高测量值(亦称变量的取值亦称变量的取值)总体:该地:该地1998年的年的10万个万个7岁男孩身高观察值的全岁男孩身高观察值的全体。体。 即:即:1

9、0万个身高观察值构成的一个集合万个身高观察值构成的一个集合样本:随机抽样的:随机抽样的200个个7岁男孩身高观察值岁男孩身高观察值17基本概念总体o总体population 定义o实际研究中往往观察/测量多个指标,构成个体的一组观察指标,因此简单的称总体是根据研究目的确定的同质个体的全体。o有限总体(个体总数是有限的)和无限总体根据研究目的确定的同质的所有个体某项根据研究目的确定的同质的所有个体某项指指标标观察值观察值(测量值测量值)的集合的集合18基本概念总体o在实际研究中,由于研究条件和入选标准的影响,存在研究总体和目标总体的差异o研究总体和目标总体n目标总体:用某药治疗的全部贫血患者(无

10、时间地点限制)n研究总体:符合研究条件的贫血患者o目标总体的范围一般大于研究总体,研究结论在研究总体中成立,但可能可以推广到目标总体,但要谨慎。19基本概念总体与样本o抽样: 在较大范围的研究对象在较大范围的研究对象( (总体总体/ /总体的一部分总体的一部分) )中随机中随机抽取一部分个体,收集这些对象的观察资料抽取一部分个体,收集这些对象的观察资料o样本sample o样本量sample size:样本中的个体总数样本中的个体总数n透过样本数据研究总体规律,通过对样本的分析了解总体的基本情况或推断总体的特征抽抽取这些取这些个体的个体的观察指标的观察指标的测量值构成样本测量值构成样本20基本

11、概念概率和频率o随机事件随机现象的某个可能观察结果。如治疗的结果:治愈和未愈随机现象的某个可能观察结果。如治疗的结果:治愈和未愈v频率频率frequency在在n次观察中,随机事件次观察中,随机事件A发生了发生了m次,则次,则A发生的比例为发生的比例为f=m/n频率呈现随机性和波动性。eg.治愈率不同。随着观察次数n的增大,f随机波动幅度减小, 并趋于常数即概率。21基本概念概率和频率v概率概率probability描述随机事件发生的可能性大小,取值范围为描述随机事件发生的可能性大小,取值范围为0-1小概率事件:随机事件发生的概率小于等于0.05小概率事件原理:小概率事件在一次随机抽样中不会发

12、生 统计推断的原理统计推断的原理一般而言,概率是未知的总体参数22基本概念个体变异和资料分布o同质总体的个体观察值是大同小异o个体变异individual variationo例:调查某地1999年20-40岁全部成年男子的血红蛋白水平o同一总体的同质性,不同总体的异质性n研究同性别、同年龄中日小学生的身高是否相同-大同小异?总体不同?同质个体同质个体的同一指标测量值的同一指标测量值之间的之间的有一定有一定差异差异的的 23基本概念个体变异和资料分布 同类个体变异在概率意义下是有规律的,表现为观察值同类个体变异在概率意义下是有规律的,表现为观察值出现在不同范围中的概率大小出现在不同范围中的概率

13、大小o资料分布n同一总体的个体之间的差异具有一定的规律性,以变量值的分布来反映,如正态分布,称为某变量服从正态分布。n任何随机现象或随机变异都有其固有的分布规律,即概率分布,在大量重复观察的条件下就会呈现其规律性随机变异的规律性为该指标取值的概率分布,简称为资料的分布随机变异的规律性为该指标取值的概率分布,简称为资料的分布24基本概念总体参数o参数n用来确定某一分布的特征;如总体均数,总体阳性率n总体参数往往是未知的刻画总体特征的指标称为总体参数刻画总体特征的指标称为总体参数25基本概念参数和统计量o统计量刻画样本特征的指标称为统计量刻画样本特征的指标称为统计量,即:由观察,即:由观察资料资料

14、计算出来的样本指标;可以用来近似的计算出来的样本指标;可以用来近似的反映总体参数反映总体参数o统计的任务:由样本了解总体,由样本统计量估计总体参数26基本概念抽样误差和测量误差o抽样误差sampling error由随机抽样造成的样本统计量和总体参数之间的差异由随机抽样造成的样本统计量和总体参数之间的差异抽样误差在一次抽样中是随机的,在概率意义下抽样误差在一次抽样中是随机的,在概率意义下(大量重复抽样中大量重复抽样中)是有规律的,这种规律称为抽样分布是有规律的,这种规律称为抽样分布o抽样分布描述统计量估计总体参数的误差由于个体变异存在,抽样误差不可避免,但可通过增加样本含量减小27基本概念抽样

15、误差和测量误差o测量误差n可以通过改进措施消除或减少,是可控的。 如同一时间观察实际观察值呈现规律性的偏离观察真实值实际观察值呈现规律性的偏离观察真实值28统计工作的步骤设计:正确、周密的设计是研究成败的关键正确、周密的设计是研究成败的关键收集:准确可靠:准确可靠n来源:统计报表、工作记录、专题调查或实验整理:原始资料的清理、录入、检查:原始资料的清理、录入、检查分析n统计描述和统计推断,由样本估计总体,由样本统计量估计总体参数;n合理解释统计分析结果,阐明结果与研究背景的关系29目标与方法目标:了解统计的重要性,学会统计的思维,了解统计的重要性,学会统计的思维,用统计的方法为自己的工作服务用统计的方法为自己的工作服务方法:根据实际研究问题,应用统计理论知识,分析资料,得出合理的统计结论n掌握基本知识、基本技能、概念的方法n多联系实际n讨论和操作30统计软件和教学要求o本课程采用Stata软件进行统计实践o要求每位同学能够熟练掌握Stata软件的基本操作o提供给每个同学一套题目和相应的数据(每人的数据是不同的),要求每

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论