浅析SAS软件在医学统计中的应用_第1页
浅析SAS软件在医学统计中的应用_第2页
免费预览已结束,剩余2页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、浅析 SAS 软件在医学统计中的应用SAS 的中文含义就是统计分析系统,它主要是通过数十个专用模块 而构成的,功能比较全面,包括数据的访问,数据的管理,数据的存 储,还有应用开发,报告编制,计量经济学,运筹方法学,图形处理 以及数据分析等。 医学统计学会涉及到医学领域的很多学科, 其方法 比较复发,而且工作起来计算量也比较庞大。最近这些年来,医学基 因组学和临床试验统计学理论及其方法都在不断地发展和深入着。 因 此,笔者认为作为医学领域的相关统计人员除了要将医学统计学的基 本理论掌握好以外, 还需要对相关的软件操作知识做出必要的了解和 认识。因此,笔者接下来将主要谈一谈 SAS 软件在医学统计

2、当中应用 的相关问题。1 SAS 软件在医学统计中的统计描述在医学当中最为常见的两种资料类型分别是定量资料和分类资料, 因此在对数据进行处理的时候就需要对资料的类型和分析情况作出 了解,这样在对资料进行描述的时候就能够根据特殊的情况选择合适 的方法 1 。1.1 定量资料的统计描述 所谓定量资料的统计描述就是对离散趋势和集中趋势进行描述,在 描述性统计当中, 频数分析和频数描述是两种最为常用的方法, 如果 我们想要对数据进行了解和认识, 那么我们首先就需要从频数分析开 始。进行频数分析需要编制频数表,在编制频数表的时候需要将所有的 观察结果按照一定的顺序做出排列, 需要在排列的顺序当中去发现观

3、 察值的分布规律。 也可以对某一个变量的频数进行频数分析, 编制相 应的频数分布表, 这样就可以将该变量的分布类型揭示出来。 频数分 析能够将远离群体的某些可疑值发现, 因此频数表能够对频数分布的 两个重要特征做出表示,一个是集中趋势,另一个就是离散趋势。我 们根据频数表所绘制出来的直方图就能够更加直观地将资料的分布 特征观察出来2。在SAS 软件当中,我们可以通过分析员来对频数 做出频数分析,通过编程做出频数统计。频数分析能够将定量变量的相关资料的分布情况和集中情况进行一 定的描述。 但是,如果我们想要更多的了解一些关于集中趋势和离散 趋势的确切信息, 那么我们就需要对于一些相关的描述性指标

4、作出必 要的计算3。所以,我们需要利用 SAS 软件当中的分析员来对常用 描述性的统计指标作出描述, 依然使用编程来对描述性的统计指标作 出计算。1.2 分类变量的统计描述 分类变量的数据特征和定量资料是完全不相同的,分类变量的基础 数据是绝对数据, 比如某种疾病的出院人员、 治愈人数以及死亡人数 等等。 在对一组定性资料数据特征进行描述的时候,一般都需要对其 相对数做出计算 4 。在医学统计当中,我们常用到的相对数有构成 比、频率和相对比等。所以在这里,我们也需要通过分析员对我们常 用的相对数指标作出计算。2 SAS 软件在医学统计中对总体均数的应用举个例子来说,已知某地 27 例健康的成年

5、男子的血红蛋白的含量均数是x=125g/L,标准差是 S=15g/L,其数据是(血红蛋白含量g/L) :123, 105, 134,140, 127,112,113,127,145,125, 110,130,112, 138, 110,100, 104,155,147,137,126,125, 100,122,127, 133, 145。对该地健康成年男性的血红蛋白量在 95%、99%的可信区间进行估计。我们可以用来做出总体的均数估计,运行分析员,做出数据集。 经过具体的操作和分析, 我们就可以得出我们需要的结 果:95%Confidence Interval for the mean;Low

6、er Limit : 118.91 ; UpperLimit : 130.87.99%Confidence Interval for the mean; Lower Limit :118.91 ;Upper Limit : 130.87 。计算好这些以后,我们还需要通过 SAS 程度做出总体的均数估计, 可以通过运用 CAPABILITY 过程当中的 INTERVALS句,对其正态分 布的总体均数的各种类型的可信区间做出估计。 在整体均数的计算当 中,其可信区间的 SAS 程序常规格式为:proc capability data二数据集的名字 noprint ;intervals 变量名的列表

7、 /method=4;run;3 SAS 软件在医学统计中队样本含量及检验效能的估计 在各类的医学统计研究当中,对样本含量做出确定是研究设计的一 个重要内容。 因为样本含量计算起来相当麻烦, 而且其样本条件也不 容易掌握, 所以在很多研究当中都将样本含量的计算忽略掉了。 因此 也就很容易发生样本含量偏低、 检测效能偏低以及结果不可靠等情况。 但是我们也不能够盲目去追求大的样本, 因为一旦样本含量过大就会 对很多资源造成浪费, 加剧了质量的控制难度, 造成资料的可靠性下 降5 。所以,在设计当中,只有对样本的大小做出科学的评估,才 能够将检验的效能满足下来。在对样本含量做出估计的时候需要使其具备

8、四点条件。对检验水 平做出确定, 是第一类错误的概率, 其值越小所需要的样本例数就会 越多,所以在通常条件下,我们会选择让 =0.05 ,再根据专业的知识 对双、单侧的检验进行确认;将所期望的检验效能1-提出来,如果两总体确实存在差别的时候, 就能够将这种差别发现, 所以要求检 验的效能越大,其样本的含量也就会越大。因此,检验效能也是由第 二类错误的大小所决定的, 通常情况下,我们都选择 =0.25-0.1 之间, 而相对的检验效能就是 0.75-0.90 之间,检验效能不能够小于 0.75 , 不然的话就不能够将总体真实差异反映出来; 允许出现的误差范围 为 =|2| ,就是对两个总体参数差值进行比较, 而总体参数可以通过预 试验获得, 也可以用专业上认为具有实际意义的差值来替代; 对总 体标准差和总体率进行确定, 通常都是根据试验结果或者预实验结果 来确定,也可以通过样本标准差或者样本率来代替 5 。在 SAS 的系统当

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论