医学统计学04数据处理_第1页
医学统计学04数据处理_第2页
医学统计学04数据处理_第3页
医学统计学04数据处理_第4页
医学统计学04数据处理_第5页
已阅读5页,还剩49页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

变量的测量尺定比、定距、定序、定性变量具有测量编(岁编(岁民体重身高治疗方疗1男A2女B3男4男B5女……男A 距离尺度(IntervalScale), 名义尺度数据(nominalscale序列尺度数据(ordinalscale名义尺度数据(nominalscale序列尺度数据(ordinalscale距离尺度数据(intervalscale比例尺度数据(ratioscale基本尺度数据(cardinalscale测量尺类别区分——频数/众次序区分——序数/中距离区分——合计/均比例区分——零点/倍比例尺度—定(ratio√√√√间距尺度—定(interval√√√×序列尺度—定(ordinal√√××名义尺度—定(nominal√×××变量的取值是具有基本尺度的数据——定量变量(scale也称尺度变能够区别数取值是具有序列尺度的数据——定序变量(ordinal也称有序变量、有序分类变量、半定量变量、等级变量取值能够区别个案等取值是具有名义尺度的数据——定性变量(nominal也称分类变取值能够区别个案类别,各个取值之间不具有可比性且互斥。 、职业设计为因的变量称为自变量(independentvariable),也称因素变往往包括处理因素和设计为果的变量称为因变量(dependentvariable),也称目标变量、依变量。在实验研究中往往指效应变量减肥效果为因变量运动强度和节食情况为自变量,这是一个2因素研究,因素水平分别为3和如果做析因设计,这个研究就是一个2因素6(3×2)水平的研究

自变量数量因变量数 资料类

电子化、结构化、核查、编码 结构化数据,如 结果,一般使用表文件记录统计分析的直接对象是结构化的原始数据相互关系简单的原始数据常用一个实体表来记录相互关系复杂的原始数据常用多个相互关联的实体表(数据库)来记冠 G11男NN--21女NN-+31男YN41男NY-…………1女NN-1男YY--2女NN-2男NN--…………2男YN- X5-X11为血脂指标、 上表数据共有15个维度 三维数据,数据有三个维度。如100个人 一定要设有标识变量(如病案号)变量名尽量使用英文( 变量要使用”sex”,同时可使用 ”作 )对可枚举字符变量进行数值编码对变量的类型进行正确设置(如名义、等级、数值等)对变量取值进行限定对缺失值进行定义(如9999)直方图箱式图达准则ത±Q检验马氏距离溯删敏感性分完全随机缺失随机缺失非随机缺失溯行删除或列删估计缺失值(插补建立哑变数据表操融合、铸造、整合待融合的变量要求具新形成两个变量带铸造的变量要求是新形成多个变量,其值均为数值 123123123

123123123123123123

123123123确定分组变量(往往是自变量)分类变量可以直接作为对于数值变量则需要使用一定的汇总函数对目标变量(往往是因变量)进行汇总一般是数值变量选择合适的汇总函数(如均值、标准差、总计等集合函数)学成女男学成女男女女男男男女女整(均值)(标准差整 学专学专女内男外女内女外男外男内男其女内女其专计女内3女外1女其1男内1男外2男其1专内外其女311男121关系数据库设第一范式第二范式→第三范式表

行中所有的值相互关联,代表一 ,称为一个观测、一个记录、一个元组列中所有的值性质相同,代表一种标志,称为一个变量、一个字数据库设计 第一范式:关系中的每个属性都不可再分。(基本要求第二范式第三范式住院住院病空腹血主管医医测量时测量高血主治医高血主治医高血主治医高血主治医高血脂、高血住院医高血脂、高血住院医高血脂、高血住院医高血住院医高血住院医高血高血压高血脂测量时空腹血主管医10主治医10主治医10主治医10主治医11住院医11住院医11住院医01住院医01住院医住院高血压高血主管医医10主治医11住院医01住院医住院住院测量时空腹血住院高血压高血脂主管医101101住院住院测量时空腹血主管医医生主治医住院医

统计指绝对指标相对指标 的度量,其具体表现为标志值 是女身高 的身高是180cm比例,某班级 比例是1:1总尿量,某患者1天的输液量是4000ml统计指标的指标值是由各单位的标志值汇总或计算得来的随着研究目的的不 如某地区12岁男童体重的均值、标准如某地区12岁男童体重身高比的均值、标准指标用来综合反映总体在某方面上的轮廓特征,具有客观性。计算时无获得所 如某地区12岁男童的平均如某地区12岁男童的体重身高数值性。所有的统计指标都是可以用数值来表现的统计指标所反映的就综合性。体量别位总,是量别位志异多 现数综的。具体性。统计指标一般包括总量指标和相对指标单位总量(无测量单位),如某医院医生人数1,000标志总量(有测量单位),如工资总额4980,000时点指标:反映状态现象总体在某一时刻的数量状各时点指标数值不具指标数值大小与其时指标数值是间断计数的、累计结果没有意时期指标:反映事件现象总体在一段时期内发展过程的结各时期指标数值具有可加指标数值大小与包含指标数值是连续登记、累计的结

数无名数是一种抽象化常带有比和率复名数主要用来表示事物的密度、强度和普遍程度等。例如,人均粮食产量用“千克人”表示,人口密度用“人/平方公里”表比例相对数同一范围内A

10%A、B同质比较相对数

10%A、B同质 结构相对数

100%(A、B同质且同时间状态 又称分率相对数,表示如患病率、阳性对 发生相对数

100%(A、B同质但异时间状态 强度相对数用于说明一定空间(和时间)范围内某现象出现的强度(频繁程度和普遍程度均值相对数

100%(A、B异质,B为单位总量强对 密度相对数

100%(A、B异质,B为标志总量 强度相对数用于说明一定空间(和时间)范围内某现象出现的强度(频繁程度和普遍程度动态相对数

完成相对数

“比”用于说明同质且对等的两指标之间的比值“比”常用来表示比例相对指标和比较相对指标,单位是无名数,方向比例相对数, 比、出 比。简称比数比较相对数,如比数比(优势比)、风险比(相 度)“率”用于说明某指标的归一化水平“率”常用来表示0,1):结构相对数,如阳性率、患病率。所有组成部分的值的和等于1发生相对数,如人口出生率 率。取值跟选定的时间范围相关,会随时间累计接甚至超过1。事实上是一个有名数(即“率”/时间)动态相对数、完成相对数的变化率与之相似,但不能表示概率,取值也“平均”一般用来说明某指标的一般水平和均值相对数,如平均(人均)住院费、平均(日均)住院量。一般为单名数密度相对数,如人口密度、年 数。一般为复名数,指标名还可以使用“…密度”“每…”、“单位…”来表粗粗出生某年平均人口同年内活产人某时期内可能发病平均人口同时期内新发生该疾病的例‰治愈接受治疗人治愈人%病死某年患数同年内因该人%指 分 分 基 说 某年平均人口 同年 人 患病 某时点受检查人 检查时发现的患某 数‰生存 期初存活的人 活满特定时期的人 因 某年平均人口 同年内该原 人 死 某 总人 同年内该原 人 研究对随访人新诊断人比(riskritio,relativerisk)(分别为P1、P2)之比:RR=P1=13.31= 研究对

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论