卫生统计学李晓松数据的产生_第1页
卫生统计学李晓松数据的产生_第2页
卫生统计学李晓松数据的产生_第3页
卫生统计学李晓松数据的产生_第4页
卫生统计学李晓松数据的产生_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

卫生统计学李晓松数据的产生夏结来第四军医大学

第三章数据产生卫生统计学李晓松数据的产生2/40目录第一节:数据起源第二节:随机对照试验第三节:简单随机抽样第四节:抽样可靠性与代表性第五节:伦理问题0102030405卫生统计学李晓松数据的产生3/40重点难点轶闻数据与可得数据试验性研究与观察性研究试验设计基本标准总体与样本、参数与统计量简单随机抽样

偏倚卫生统计学李晓松数据的产生4/40第一节数据起源卫生统计学李晓松数据的产生5/401.轶闻数据(1)由杂志、报纸、电视、互联网或其它媒体报道一些个案数据,因为其特殊性往往给公众留下突出和深刻印象。(2)特点:缺乏代表性,常诱导人们进行简单推论,得到一些含有倾向性结论。(3)如:电视广告中商家提供数据。2.可得数据(1)为了一些特定目标已搜集或积累数据。(2)特点:可无偿或以低廉价格获取,但通常难以完全满足一些特定研究目标。(3)如:各类监测数据、医院临床病案数据和各类统计年鉴等。(一)轶闻数据与可得数据第一节数据起源卫生统计学李晓松数据的产生6/401.观察性研究(observationalstudy)与试验性研究(experimentalstudy)(1)观察性研究中,研究者观察并测量研究对象一个或多个变量,但不施加任何干预办法。(2)试验性研究中,研究者对研究对象施加处理原因即干预办法,并测量一个或多个变量。(二)抽样调查数据与试验数据第一节数据起源卫生统计学李晓松数据的产生7/402.抽样调查数据(1)抽样调查基本思想就是对总体中一部分,即样本进行了解进而得到总体信息。(2)特点:观察者对被观察事物或现象在不进行任何干预情况下所作观察。3.试验数据(1)经过试验性研究所得到数据。(2)特点:研究对象所处状态是由研究者决定。研究者决定研究对象状态过程称为给予人为干预办法。(3)试验性研究可比性更加好,因果关系推断更具说服力。(二)抽样调查数据与试验数据第一节数据起源卫生统计学李晓松数据的产生8/40因为测量本身问题造成原始数据准确性或可靠性存在问题,基于这么数据所做任何统计分析都可能含有误导性。本章关键问题是怎样科学地产生或搜集高质量原始数据,从而在源头上保障统计结论准确性和可靠性。下面两节我们将以简单随机抽样和随机对照试验为例分别进行介绍,以阐释数据搜集或产生过程关键思想。(二)抽样调查数据与试验数据第一节数据起源卫生统计学李晓松数据的产生9/40第二节随机对照试验卫生统计学李晓松数据的产生10/401.对照(control)(1)案例:“胃冷冻法”治疗胃溃疡是否有效。(2)抚慰剂效应:因为心理效应所产生虚假现象。(3)对照思想:设置对照组以降低非处理原因对处理原因效应影响。(4)标准对照试验:将试验对象随机分配到试验组和对照组,除了对试验组给予处理办法外,两组患者在其它方面都要被同等对待。(5)意义:判别处理原因与非处理原因之间差异,是进行比较必要基础;消除和降低试验误差。(一)设计标准第二节随机对照试验卫生统计学李晓松数据的产生11/402.随机化(randomization)(1)决定怎样将试验对象分配到各处理组中,只有当全部处理组中试验对象基本情况相当初,各处理组间效应比较才是有效。(2)匹配定义:找到性别、年纪等变量情况相同两组对象分别给予不一样处理。(3)匹配存在问题:不一定能完全防止偏倚,因为有太多潜在变量可能影响试验结果,极难把全部原因都进行匹配。(4)随机化思想:使用随机方式使每个试验对象有同等机会被分配到各处理组。(5)随机化方法:抽签。(6)随机化意义:确保了各对比组间均衡可比性。(一)设计标准第二节随机对照试验卫生统计学李晓松数据的产生12/403.重复(repeat)(1)每组只有一个试验对象,那么试验结果可能只依赖于含有这类潜在特质人被分到了哪个组,不过,假如试验对象足够多,这类人效应就能够被平均化,两组区分就会降低。(2)重复思想:利用足够多样原来降低试验随机误差。(一)设计标准第二节随机对照试验卫生统计学李晓松数据的产生13/40试验对象可能含有抚慰剂效应;试验研究者主观看法造成试验结论偏倚;盲法(blind):试验对象甚至试验人员均不知道试验对象接收哪一个处理;双盲意义:双盲则防止了由试验人员和试验对象主观意识造成偏倚。(二)潜在问题第二节随机对照试验卫生统计学李晓松数据的产生14/40第三节简单随机抽样卫生统计学李晓松数据的产生15/401.总体(population)依据研究目确实定同质研究个体全体。2.样本(sample)是为了解总体而观察总体一部分。3.简单随机抽样(simplerandomsample,SRS)(1)随机抽样:总体中每个个体有相同机会被选中作为样本参加调查,降低样本选择偏倚。(2)简单随机抽样:从总体中以相同机会抽取n个个体称为一个简单随机样本,n为样本量。(一)简单随机抽样第三节简单随机抽样卫生统计学李晓松数据的产生16/401.抽样涵盖不全(1)志愿者应答样本:总体中更有意愿完成调查部分对象组成样本,不是总体一个含有代表性样本。2.测量可能存在缺点(1)应答偏倚:被访者被问及关于卖淫或嫖娼等敏感话题时,于法律、道德问题而撒谎。(2)回想偏倚:让被访者回想过去,可能因为记忆不准确产生偏倚。(3)问题措辞:含糊或者带有引导性问题经常产生较大偏倚。(二)潜在问题第三节简单随机抽样卫生统计学李晓松数据的产生17/40第四节样本可靠性与代表性卫生统计学李晓松数据的产生18/401.参数(parameter)(1)用于刻画总体数值特征,如总体均数、总体中位数、总体标准差、总体率等。(2)参数被看成总体某种特征固定数值,通常参数确实切值未知。2.统计量(statistic)(1)用于描述样本数值特征,如样本均数、样本中位数、样本标准差,样本率等。(2)当取得一个样本后就能够得到统计量值,可用于预计未知参数值。(3)统计量值随样本改变而改变。3.统计推断(statisticalinference)从样本数据推理而得到关于总体结论。第四节样本可靠性与代表性卫生统计学李晓松数据的产生19/40第四节样本可靠性与代表性

卫生统计学李晓松数据的产生20/40第四节样本可靠性与代表性

卫生统计学李晓松数据的产生21/40第四节样本可靠性与代表性当用统计量来预计总体参数时,统计量会伴随抽样结果不一样而不一样,该现象可能影响我们采取统计量来预计总体参数质量。由抽样引发统计量与统计量之间或者统计量与总体参数之间变异不是无规律,而是含有某种潜在模式。卫生统计学李晓松数据的产生22/401.变量总体分布

总体中全部个体观察值分布。2.统计量抽样分布统计量分布规律,描述了从同一总体重复抽样时,统计量会有些什么样值,以及每个值出现可能性大小。(一)抽样分布第四节样本可靠性与代表性例3某环境监测点年1月1日至2月28日对每小时PM10浓度值进行监测。图(A)采取某环境监测点监测时间内每小时PM10浓度值,描述是总体分布。图(B)从这个总体中随机抽样(每次样本量为50),共抽取100次得到100个样本均数分布。卫生统计学李晓松数据的产生23/40(一)抽样分布第四节样本可靠性与代表性图(B)样本均数抽样分布图

图(A)全部个体测量值分布图(总体分布)从图知,样本均数变异程度小于个体观察值。卫生统计学李晓松数据的产生24/40重复抽样过程从总体中进行简单随机抽样,每次抽取样本量为n。计算出统计量。重复上述两步,即从同一个总体中重复屡次独立地随机抽样后取得多个统计量。展示多个统计量分布特征。(一)抽样分布第四节样本可靠性与代表性卫生统计学李晓松数据的产生25/40(一)抽样分布第四节样本可靠性与代表性重复抽样过程(统计量为样本均数)卫生统计学李晓松数据的产生26/40(一)抽样分布第四节样本可靠性与代表性重复抽样过程(统计量为样本率)卫生统计学李晓松数据的产生27/401.抽样变异与抽样误差(1)统计量值在重复随机抽样样本中各不相同,这种统计量伴随样本改变而改变现象称为抽样变异(samplingvariability)。(2)抽样误差(samplingerror)表示了统计量与待预计总体参数之间不完全相等事实,而抽样变异则形象地说明了不一样本间统计量存在变异。(二)抽样误差第四节样本可靠性与代表性卫生统计学李晓松数据的产生28/40(二)抽样误差第四节样本可靠性与代表性例1续

就器械锻炼流行病学调查而言,假设人群中实际有60%人抵触器械锻炼。可用计算机设计程序抽取多个简单随机样本,为每个样本计算出一个样本率p,将全部样本率p值绘制成直方图。图(A):从率为0.6总体中分别抽取1000个样本量为100简单随机样本样本率p分布。图(B):从相同人群中抽取1000个样本量为2500简单随机样本,并重新计算得到1000个样本率p,并绘制出直方图。卫生统计学李晓松数据的产生29/40(二)抽样误差第四节样本可靠性与代表性图(B)1000次抽样样本率(n=2500)图(A)1000次抽样样本率(n=100)比较两个直方图,能够看出增加样本量对样本率p抽样分布影响。卫生统计学李晓松数据的产生30/40

(二)抽样误差第四节样本可靠性与代表性卫生统计学李晓松数据的产生31/403.标准误(standarderror)(1)定义:统计量标准差,反应了由抽样引发统计量与总体参数之间或统计量取值之间差异,定量刻画了抽样误差大小。(2)均数标准误:样本均数标准差,反应了均数抽样误差大小。(3)率标准误:样本率标准差,反应率抽样误差大小。(4)用样本均数预计总体均数时,能够借助均数标准误大小来帮助判断预计可靠性。(5)经常期望降低统计量抽样变异从而取得对总体参数更可靠预计。(6)来自随机样本统计量,其变异大小不依赖于总体大小。(二)抽样误差第四节样本可靠性与代表性卫生统计学李晓松数据的产生32/40统计量偏倚:抽样分布均值与待预计参数差值称为统计量偏倚,当偏倚为零时,则称该统计量是对应参数无偏预计。偏倚关注是抽样分布集中位置。假如研究结果与真实结果之间存在方向性偏离,那么这项研究就存在偏倚,样本不具备代表性。(三)偏倚第四节样本可靠性与代表性

偏倚和变异箭靶示意图卫生统计学李晓松数据的产生33/40第五节伦理问题卫生统计学李晓松数据的产生34/40确保全部进入研究个体在数据搜集之前均知情同意(informedconsent)。确保全部研究个体数据保密性(confidential),仅人群水平统计汇总汇报能够公开。全部计划实施研究必须经过伦理审查委员会(institutionalreviewboard)审查,防止研究对象受到可能伤害。基本数据伦理第五节伦理问题卫生统计学李晓松数据的产生35/401.知情同意受试者在参加试验前需充分了解研究性质和任何潜在风险。2.国际医学委员会提议使用下面方法(1)对在小区水平上进行研究,需征得对此试验负责卫生行政部门知情同意。(2)以医院为研究单位时,应该取得当地伦理审查委员会同意。(3)当研究单位是学校、工作场所或小区时,应征得相关责任人同意;同时,尽可能通知小区民众该试验研究目标、预期收益和可能不方便或危险,并通知不一样意人怎样免受干预办法影响。3.保密与匿名(1)保密:最好做法就是将数据中能识别研究对象信息分开或删除。(2)匿名:受试者是匿名,缺点是无法后续追踪调查对象第五节伦理问题(一)知情同意与个人隐私卫生统计学李晓松数据的产生36/40第五节伦理问题(二)临床试验伦理问题1.随机对照试验是当前研究新药疗效唯一方法。2.平衡未来效益和当前风险。3.医学伦理学和国际人权标准都强调“受试者利益必须一直高于科学利益”。4.当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论