医学统计学与SPSS电脑实验 课件_第1页
医学统计学与SPSS电脑实验 课件_第2页
医学统计学与SPSS电脑实验 课件_第3页
医学统计学与SPSS电脑实验 课件_第4页
医学统计学与SPSS电脑实验 课件_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

医学统计学

与SPSS电脑实验2021/5/71单位:河北医科大学公共卫生学院流行病与卫生统计学教研室授课教师:唐龙妹联系电话:2021/5/72理论:本科知识回顾实验设计方差分析秩和检验卡方检验双变量回归与相关统计图表高级统计方法概述SPSS及实习:数据管理统计描述及t检验方差分析秩和检验卡方检验双变量回归与相关统计图表案例综合分析2021/5/73本科统计学知识回顾2021/5/74

统计学(Statistics)是一门研究数据的收集、整理、分析、表达和解释的科学。

将统计学应用于医学研究领域形成了卫生统计学(HealthStatistics)和医学统计学(MedicalStatistics),卫生统计学偏重于医疗卫生的社会性,医学统计学偏重于医学研究的临床方面,两者之间无截然的界限,其主要内容是相同的。2021/5/75第一节

医学统计学的基本概念2021/5/76总体与样本变量与资料误差概率2021/5/77一、总体与样本

(populationandsample)2021/5/781.总体:根据研究目的确定的性质相同观察单位的全体。确切的说是,全部同质观察单位某项观察值的集合。2.样本:从总体中随机抽取的部分观察单位,其实测值的集合构成样本。样本是总体中有代表性的一部分。2021/5/79二、变量与资料

(variableanddata)

在确定总体之后,研究者对每个观察单位的某项特征进行测量和观察,这种特征称为变量。变量的测得值或观察值称为变量值。变量值构成资料。2021/5/7109、人的价值,在招收诱惑的一瞬间被决定。2023/2/32023/2/3Friday,February3,202310、低头要有勇气,抬头要有低气。2023/2/32023/2/32023/2/32/3/20234:54:05PM11、人总是珍惜为得到。2023/2/32023/2/32023/2/3Feb-2303-Feb-2312、人乱于心,不宽余请。2023/2/32023/2/32023/2/3Friday,February3,202313、生气是拿别人做错的事来惩罚自己。2023/2/32023/2/32023/2/32023/2/32/3/202314、抱最大的希望,作最大的努力。03二月20232023/2/32023/2/32023/2/315、一个人炫耀什么,说明他内心缺少什么。。二月232023/2/32023/2/32023/2/32/3/202316、业余生活要有意义,不要越轨。2023/2/32023/2/303February202317、一个人即使已登上顶峰,也仍要自强不息。2023/2/32023/2/32023/2/32023/2/32021/5/711编号(ID)性别血型体重(kg)疗效张1男A66无效李2男O78有效王3女AB57显效赵4男B69有效……………2021/5/712按变量属性可将资料分为三种:计量资料(measurementdata)计数资料(enumerationcountdata)等级资料(rankedordinaldata)2021/5/713过失误差:指实验过程中由于偶然失误造成的误差。

随机误差:由于随机因素造成的误差。

系统误差:也是实验过程中产生的误差,但它的值或者恒定不变,或者遵循一定的变化规律,其产生的原因往往是可知的或可掌握的。三、误差(error)误差:测量值和真值之间的差值。2021/5/714

随机抽样误差:因存在个体差异,由于随机抽样引起的统计量与参数之间或者统计量与统计量之间的差异。

样本均数的标准差称为均数的标准误,是用来反映抽样误差大小的指标。2021/5/715四、频率与概率

(relativefrequencyandprobability)2021/5/716概率:描述某事件发生可能性大小的数,用P表示。概率的取值范围:[0,1]。小概率事件:当某事件发生的概率很小时,称之为小概率事件。一般取0.05或0.01为小概率事件的标准。小概率事件实际不可能性原理:如果一个事件是小概率事件,在一次试验中我们当作是不可能发生的。2021/5/717第二节

统计工作的基本步骤设计(design)收集资料(collectionofdata)整理资料(sortingofdata)分析资料(analysisofdata)

——统计描述

——统计推断(参数估计和假设检验)2021/5/718第三节

计量资料的统计描述——集中趋势和离散趋势2021/5/719常用集中趋势指标统计指标定义表示符号适用条件算术均数各观察值之和除以观察值的个数总体:μ样本:对称分布,特别是正态或者近似正态分布几何均数n个观察值乘积的n次方根G等比级数资料或对数正态分布资料中位数将全部观察值从小到大排列,居中位置对应的数值M各种资料均适用,特别是偏态分布、资料的分布不明确或者资料的一端或两端无确切数值2021/5/720分布类型

对称分布:集中位置在中间,左右两侧频数大体对称

偏态分布:集中位置偏向一侧,频数分布不对称

正偏态:集中位置偏向左侧

负偏态:集中位置偏向右侧2021/5/721

正态分布是最常见、最重要的一种连续型概率分布,其形态为:中间高,两端低,左右对称,略呈钟型。2021/5/722①正态分布始终在横轴上方,X=μ处曲线达到最高点②正态分布以X=μ为对称轴,左右对称③正态分布的两个参数:位置参数μ和形状参数σ

表示方法X~N(μ,σ2)④正态曲线下面积的分布规律:正态曲线下的总面积为1(100%)(μ-σ,μ+σ)间的面积为68.27%

(μ-1.645σ,μ+1.645σ)间的面积为90%

(μ-1.96σ,μ+1.96σ)间的面积为95%

(μ-2.58σ,μ+2.58σ)间的面积为99%正态分布的特征2021/5/723正态分布的应用

——医学参考值范围正态分布法:适用于正态或近似正态分布资料。对数正态分布法:适用于对数正态分布资料百分位数法:常用于偏态分布资料2021/5/724常用集中趋势指标统计指标定义表示符号适用条件算术均数各观察值之和除以观察值的个数总体:μ样本:对称分布,特别是正态或者近似正态分布几何均数n个观察值乘积的n次方根G等比级数资料或对数正态分布资料中位数将全部观察值从小到大排列,居中位置对应的数值M各种资料均适用,特别是偏态分布、资料的分布不明确或者资料的一端或两端无确切数值2021/5/725标准正态分布:μ=0,σ=1的正态分布对数正态分布:

X(X1,X2,…,XN)不服从正态分布,但对X取对数后Y=lgX,Y(Y1,Y2,…,YN)服从正态分布,则称X服从对数正态分布。对数正态分布是一种正偏态分布。2021/5/726常用描述离散趋势的指标统计指标表示符号用途及缺点全距R各分布类型资料,但仅涉及到最大值和最小值四分位数间距QR各分布类型资料,特别是偏态分布资料,但仅是中间50%观察值的范围方差总体:σ2样本:s2对称分布资料,特别是正态分布资料,但单位是原观察值单位的平方标准差总体:σ样本:s对称分布资料,特别是正态分布资料变异系数CV比较度量单位不同或均数相差悬殊资料的离散趋势2021/5/727正态分布资料:均数和标准差偏态分布资料:中位数和四分位数间距

M(QR)2021/5/728第四节

计量资料的统计推断——总体均数的估计与假设检验2021/5/729一、t分布

t分布(t-distribution)也是一种连续性随机变量的分布类型。最早由英国统计学家Gosset以“Student”的笔名发表,所以又称Studentt分布(Student’st-distribution),主要用于总体均数的区间估计和t检验等。2021/5/7301、t分布是单峰分布,以0为中心,左右对称。2、t分布的图形不是一条曲线,而是一簇曲线,其形状与自由度有关。自由度越小,t值越分散,曲线的峰部越矮,尾部翘得越高。随着自由度逐渐增大,t分布曲线逐渐逼近标准正态分布曲线,当自由度为∞时,t分布曲线与标准正态分布曲线重合。t界值单侧概率对应的界值表示为:双侧概率对应的界值表示为:2021/5/731二、总体均数的估计

参数估计是统计推断的一个重要方面。所谓参数估计是指用样本指标(统计量)估计总体指标(参数)。1、参数估计的方法:

点估计:用样本统计量直接作为总体参数的估计值

区间估计:按预先指定的概率(1-α)确定包含未知总体参数的范围。预先给定的概率用1-α表示,称为置信度或可信度(confidencelevel),常取95%,99%。2021/5/7322、总体均数区间估计的方法①σ已知μ的95%的可信区间:②σ未知μ的95%的可信区间:③σ未知,但n足够大,一般n≥60μ的95%的可信区间:2021/5/733三、t检验

t检验是计量资料假设检验中最简单、最常用的方法。所谓假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。在假设H0成立的条件下计算检验统计量,最后获得P值来判断,拒绝H0还是不拒绝H0。2021/5/734

假设检验的基本思想:先假设差别由抽样造成,即总体间本无差异,在此假设成立的前提下作抽样研究,如果该次抽样属小概率事件,则样本信息不支持原假设的成立,因而拒绝它,反之样本信息支持原假设的成立,不拒绝原假设。2021/5/7351、假设检验的一般步骤①建立假设,确定检验水准检验假设(H0)和备择假设(H1)

确定检验水准(α),②计算统计量

计算方法要受资料类型、设计方案、统计推断目的、资料的分布类型、样本容量的多少等因素决定③确定P值,做出推断结论一般:统计量≥界值时,P≤α,拒绝H0,接受H1

统计量<界值时,P>α,不拒绝H02021/5/7362、t检验的应用条件:t检验理论上要求样本来自正态总体,两小样均数比较时,还要求两样本对应的总体方差相等。2021/5/737①单样本t检验(样本均数与已知总体均数比较的t检验):样本来自正态总体②配对t检验(配对实验设计的t检验):每个对子的差值来自正态总体③

两样本t检验(完全随机设计两样本均数比较的t检验):两个样本均来自正态总体且总体方差相等2021/5/738第五节

正态性检验和两样本方差齐性检验2021/5/739一、正态性检验(1)P-P图(概率图):以实际的累积频率(X)与理论累计频率(Y)作图。(2)Q-Q图(分位数图):以实际分位数(X)与理论分位数(Y)作图。

若两图的散点都在一条直线上,可认为资料服从正态分布1、图示法2021/5/740图100个样本均数的P-P图2021/5/741图100个样本均数的Q-Q图2021/5/742(1)对偏度和峰度各用一个指标评定——矩法效率最高2、计算法(2)用一个指标综合评定——W检验法、W’’检验法和D检验法W检验法和W’’检验:适用于样本含量少于100的资料D检验法:适用于样本容量10-2000的资料2021/5/743

矩法要对偏度和峰度分别检验。偏度指分布不对称的程度和方向,用偏度系数衡量,样本偏度系数用g1表示,总体偏度系数用γ1表示;峰度指分布与正态曲线相比的冒尖程度或扁平程度,用峰度系数衡量,样本峰度系数用g2表示,总体峰度系数用γ2表示。2021/5/744正态性检验的H0应表示为:资料服从正态分布,所以:当P>α时,可认为资料满足正态分布条件2021/5/745二、两样本的方差齐性检验F检验:要求资料服从正态分布。Levene检验:不依赖总体分布的具体形式,而且可以用于多个样本的方差齐性检验。方差齐性检验的H0为:总体方差相等,所以:当P>α时,可认为资料满足方差齐性条件2021/5/746第六节

假设检验中的两类错误2021/5/747Ⅰ型错误:拒绝了实际上成立的H0,也称弃真错误,概率大小由研究者根据研究目的确定,用α表示(预先规定的允许犯Ⅰ型错误概率的最大值)。Ⅱ型错误:“接受”了实际上不成立的H0,也称取伪错误,其概率大小用β表示,β只取单侧,大小一般未知,在已知两总体差值、α和n时,利用公式才能算出。2021/5/748以单样本t检验(单侧)说明:H0:μ=μ0H1:μ<μ0α=0.05Ⅰ

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论