版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《SPSS统计方法体系与案例实验进阶》学习目标:1、掌握频数分析、统计图2、掌握描述统计量的计算3、掌握交叉分组的频数分析重点:1、频数分析、统计图2、常见描述统计量的计算3、交叉分组的频数分析第3章数据资料的描述性分析二项分类如性别男女、病人生存与死亡;多项无序分类,如血型分为A、B、AB、O;例:户口、民族、职业、专业、婚姻状况等.未婚=1、已婚=2、离婚=3、丧偶=4;血型为O型,A型,B型和AB型.★定序资料:数据表现为“类别”但有序.事物按等级或程度顺序计量,类别取值反映排列次序;既有属性类别之分、也有大小程度之别.但是每个相邻数值间的距离并非程度差异的真实反映.运算特点:=,≠,>,<.例:疗效分为显效、有效、好转和无效,糖尿病分为-、+、++、+++.例:满意度(非常不满意=1,不满意=2,中立=3,满意=4,非常满意=5);考试等级优、良、中、及格、不及格;成绩名次(第1,第2,第3,…)第3章数据资料的描述性分析(2)定量资料又称数值资料,是以具体数值与特定计量单位的连续型数据,也可以是无单位计数尺度数据,例如血清胆固醇含量3.0~6.5mmol/L为区间内连续变化实数,脉搏或红细胞计数为一系列的离散点值.★定距资料:数值大小反映排列次序,无绝对意义上的0点.数学运算特点:=,≠,>,<,+,-.例:温度,年历,智商,海拔等.如25与20度之间相差5度,15度与10度差5度;但是不能说30度比15度热一倍!★定比资料:等级最高,数值大小反映排列次序和倍数.相邻取值之间是等距的;有绝对0点.数学运算特点:=,≠,>,<,+,-,×,÷.例:年龄,身高,体重,收入等.第3章数据资料的描述性分析2、描述分析(1)数值资料描述性统计.集中趋势指标有均数、中位数、四分位数、百分位数及众数等;离散趋势指标有方差、标准差、极差、四分位间距及变异系数等.第3章数据资料的描述性分析近似正态分布资料可用均数±标准差描述特征;偏态分布资料可用中位数±四分位数间距描述特征.数据个数较少时,直接观察原始数据就能了解所有信息;数据量如果超出直接处理和记忆,可将原始数据分组汇总为计数资料分析.(2)计数资料常用构成比、率和相对比描述特征,通过绘图直观演示.第3章数据资料的描述性分析对于两个分组或分类的计数资料,还可通过分类交叉表进行描述性分析.二、实验目的1.理解均数、中位数、众数及四分位数的含义,掌握集中趋势指标操作方法;2.理解方差、标准差、极差及四分位间距的含义,掌握离散趋势指标操作方法;3.理解构成比、率和相对比的含义,掌握相对数计算和统计图绘制的操作方法.4.理解交叉表的含义,掌握行列分类交叉表的操作方法.三、案例分析【实例1】[问题叙述]已知56例成年男性测定血清胆固醇水平资料,单位mmol/L.第3章数据资料的描述性分析3.214.035.246.273.546.525.425.015.125.253.212.543.332.363.683.473.513.554.324.524.024.306.016.236.276.354.274.324.525.246.273.546.525.425.425.015.254.023.216.414.306.013.473.513.553.556.325.124.324.525.423.514.324.524.524.02(1)计算集中趋势和离散趋势指标:计算算术均数、中位数、四分位数、众数、方差、标准差、极差、四分位间距和变异系数.了解数据分布的偏度和峰度.(2)数据资料统计分组为6组:[0,3)、[3,4)、[4,5)、[5,6)、[6,7)、[7,+∞),分组计算频数、构成比,绘制饼图、直方图.(3)绘制箱线图和茎叶图(简单了解).第3章数据资料的描述性分析
[操作步骤]建立数值变量“血清胆固醇”,录入数据.(1)点击主菜单“分析”,点击“描述统计”,点击“交叉表”.选择变量“血清胆固醇”进入“变量”框;点击“统计量”.选“均值”、“中位数”、“众数”、“方差”、“标准差”、“极差”等;点击“继续”,点击“确定”.第3章数据资料的描述性分析血清胆固醇N有效56缺失0均值4.6014中值4.4200众数4.52标准差1.11240方差1.237偏度.184全距4.16百分位数253.5500504.4200755.4200(2)点击主菜单“转换”,点击“重新编码为不同变量”.将变量“血清胆固醇”选入“数字变量”,点击输出变量”框,在“输出变量”区域的“名称”处输入“分组”,点击“更改”,完成输出变量名称的定义.第3章数据资料的描述性分析第3章数据资料的描述性分析第3章数据资料的描述性分析“旧值”选“范围”输入0,“到”输入2.9999;“新值”选“值”输入1,点击“添加”;“旧值”选“范围”输入3,“到”输入3.9999;“新值”选“值”输入2,点击“添加”;“旧值”选“范围”输入4,“到”输入4.9999;“新值”选“值”输入3,点击“添加”;“旧值”选“范围”输入5,“到”输入5.9999;“新值”选“值”输入4,点击“添加”;“旧值”选“范围”输入6,“到”输入6.9999;“新值”选“值”输入5,点击“添加”;“旧值”选“范围,从值到最高输入7;“新值”选“值”输入6,点击“添加”;点击“继续”,返回,点击“确定”.对变量“成绩段”,值标签设置编码:1=“[0,50)”、2=“[50,60)”、3=“[60,70)”、4=“[70,80)”、5=“[80,90)”、6=“[90,100]”.第3章数据资料的描述性分析第3章数据资料的描述性分析点击主菜单“分析”,点击“描述统计”,点击“频率”.选择变量“分组”,点击“继续”;点击“确定”.第3章数据资料的描述性分析表2频数及构成比分组频数百分比有效百分比累积百分比有效[0,3)23.63.63.6[3,4)1526.826.830.4[4,5)1628.628.658.9[5,6)1221.421.480.4[6,7)1119.619.6100.0合计56100.0100.0经分析,落在[0,3)、[3,4)、[4,5)、[5,6)、[6,7)、[7,+∞)区间范围中的各组频数分别为2、15、16、12、11,共56例.各组构成百分比为3.6%、26.8%、28.6%、21.4%、19.6.第3章数据资料的描述性分析点击“图表”,点击绘制饼图或直方图(带正态曲线).第3章数据资料的描述性分析定类资料由饼图或条形图表示.血清胆固醇属于定序资料,直方图描述也很合适.(3)绘制箱线图和茎叶图(仅作了解).点击主菜单“分析”,点击“描述统计”,点击“探索”.将血清胆固醇选入右边的因变量列表,点击“绘制”按钮.第3章数据资料的描述性分析第3章数据资料的描述性分析“箱图”中默认点选“按因子水平分组”,“描述性”中点选“茎叶图”第3章数据资料的描述性分析【实例2】[问题叙述]由数据库获得性别与职业、糖尿病与疗效的分类交叉表描述性分析,即汇总交叉类别之间的频数、行类别的百分比和列类别的百分比.见NO3建数据库(病历复杂资料简表).sav.编号籍贯(填空)字符型性别(选择)数值型年龄(选择)数值型血型(选择)数值型职业(选择)数值型糖尿病史(选择)数值型总胆固醇(选择)数值型疗效(选择)数值型1山东男58B工人无5.33有效2广西男69O商人无4.63好转3山东男58B工人无5.33有效4湖北女42A商人无6.12显效5天津男43O农民有4.54好转第3章数据资料的描述性分析[操作步骤]
点击主菜单“分析”,点击“描述统计”,点击“交叉表”.选择变量“性别”进入行列表框;选择变量“职业”进入行列表框.第3章数据资料的描述性分析点击“单元格”.第3章数据资料的描述性分析点击计数中的“观察值”、点击百分比中的“行”、“列”,点击“继续”.性别*职业交叉制表职业合计工人农民商人性别男计数2041741性别中的%48.8%9.8%41.5%100.0%职业中的%66.7%33.3%81.0%65.1%女计数108422性别中的%45.5%36.4%18.2%100.0%职业中的%33.3%66.7%19.0%34.9%第3章数据资料的描述性分析(2)点击主菜单“分析”,点击“描述统计”,点击“交叉表”.选择变量“糖尿病史”进入行;选择变量“疗效评定”进入列,点击“单元格”.第3章数据资料的描述性分析点击计数中的“观察值”、点击百分比中的“行”、“列”、“总数”,点击“继续”.疗效评定合计无效好转有效显效糖尿病史无计数81720449糖尿病史中的%16.3%34.7%40.8%8.2%100.0%疗效评定中的%100.0%81.0%100.0%28.6%77.8%总数的%12.7%27.0%31.7%6.3%77.8%有计数0401014糖尿病史中的%.0%28.6%.0%71.4%100.0%疗效评定中的%.0%19.0%.0%71.4%22.2%总数的%.0%6.3%.0%15.9%22.2%第3章数据资料的描述性分析【练习1】[问题叙述]已知某校某班级60名学生医药数理统计课的期末成绩.836780718162737557869664894791896683847972746196826994817057838578549979647784997692797294865381936985637866778180698376求该班级的平均成绩、标准差、极差、中位数、四分位数间距;设置分数段为6段,[0,50)、[50,60)、[60,70)、[70,80)、[80,90)、[90,100].按分数段统计人数,计算各分数段构成比,绘制直方图.第3章数据资料的描述性分析建立数值变量“学生成绩”,录入并建立数据库.菜单选择:点击主菜单“转换”,点击“重新编码为不同变量”.将变量“学习成绩”选入“数字变量”,点击“输出变量”框,在“输出变量”区域的“名称”处输入“成绩段”,点击“更改”,完成输出变量名称的定义.点击“旧值和新值”.“旧值”选“范围”输入0,“到”输入49.9999;”新值”选“值”输入1,点击“添加”;“旧值”选“范围”输入50,“到”输入59.9999;”新值”选“值”输入2,点击“添加”;“旧值”选“范围”输入60,“到”输入69.9999;”新值”选“值”输入3,点击“添加”;“旧值”选“范围”输入70,“到”输入79.9999;”新值”选“值”输入4,点击“添加”;“旧值”选“范围”输入80,“到”输入89.9999;”新值”选“值”输入5,点击“添加”;“旧值”选“范围”输入90,“到”输入100;”新值”选“值”输入6,点击“添加”;第3章数据资料的描述性分析点击“继续”,返回,点击”确定”.第3章数据资料的描述性分析第3章数据资料的描述性分析对变量“成绩段”,值标签设置编码:第3章数据资料的描述性分析
(2)主菜单“分析”→“描述统计”→“频率”.点击主菜单“分析”,点击“描述统计”,点击“频率”.选择变量“学习成绩”进入“变量”框;点击“统计量”按钮,得统计量设置界面:选“标准差”、“范围”、“均值”、“中位数”、“四分位数”,点击“继续”.返回,点击取消“显示频率表格”,点击“确定”.第3章数据资料的描述性分析
[结果分析]N有效60缺失0均值77.23中值79.00标准差11.934全距52百分位数2569.005079.007584.7560名学生学习成绩的均值为77.23,中位数为79.00,标准差为11.934,极差为52,四分位间距为84.75-69.00=15.75.第3章数据资料的描述性分析主菜单“分析”→“描述统计”→“频率”.变量“学习成绩”选入“变量”框.单击“图表”按钮,选择“直方图”,选“带正态曲线”,点击“继续”;点击“确定”.第3章数据资料的描述性分析主菜单“分析”→“描述统计”→“频率”;变量“成绩段”选入“变量”框.第3章数据资料的描述性分析单击“图表”按钮,选择“条形图”,点击“继续”;点击“确定”.
[结果分析]成绩段频数百分比有效百分比累积百分比有效[0,50)11.71.71.7[50,60)46.76.78.3[60,70)1118.318.326.7[70,80)1626.726.753.3[80,90)1931.731.785.0[90,100]915.015.0100.0合计60100.0100.0第3章数据资料的描述性分析各组段的频数分别为1、4、11、16、19、9;各组段构成百分比分别为1.7%、6.7%、18.3%、26.7%、31.7%、15.0%.按学习成绩绘制直方图、按成绩段绘制饼图:第3章数据资料的描述性分析【练习2】[问题叙述]根据资料作如下描述性分析:(1)计算结石表面积、结石侧肾盂压力的均数和标准差;(2)计算手术时间、灌注量的中位数和四分位间距;(3)绘制性别、肾部位、肾周积液(有无)的频数及构成比分布表和饼图.编号性别肾周积液结石表面积手术时间灌注量肾部位结石侧肾盂压力1女有69.081157400上段105.322男有43.18454500上段110.633女有112.26564900上段170.854男有91.89903500上段120.645男有27.48805000上段130.656女有141.30657000上段140.58第3章数据资料的描述性分析【练习3】[问题叙述]调查表中已知学生的学习情况、午餐地点,性别中对学习情况进行交叉频数和百分比分析、午餐地点中对性别进行交叉频数和百分比分析.注:数据库文件见“NO3交叉表分析(性别学习午餐).sav”.性别*学习情况交叉制表学习情况合计优秀良好中等较差性别男计数616249124296性别中的%20.6%20.9%16.6%41.9%100.0%女计数3520811249404性别中的%8.7%51.5%27.7%12.1%100.0%合计计数96270161173700性别中的%13.7%38.6%23.0%24.7%100.0%第3章数据资料的描述性分析性别*午餐地点交叉制表午餐地点合计宿舍餐厅大服性别男计数7617149296午餐地点中的%60.3%37.5%41.5%42.3%女计数5028569404午餐地点中的%39.7%62.5%58.5%57.7%合计计数126456118700午餐地点中的%100.0%100.0%100.0%100.0%第3章数据资料的描述性分析学习目标:1、掌握单样本t检验、独立样本t检验、配对样本t检验3、掌握单因素方差分析及其两两比较重点:1、样本t检验、独立样本t检验、配对样本t检验2、单因素方差分析及其两两比较第4章总体均值的参数假设检验一、核心知识统计推断规则:
给定显著性水平
(0.01、0.05),根据抽样分布(N(0,1)、t分布)查表得临界值和拒绝域;服从该分布的统计量值与临界值比较大小;作出推断,双侧检验:|统计量|≥临界值,落入拒绝域,拒绝H0.P值的意义:H0成立情况下,超出统计量值的概率(尾部面积);第4章总体均值的参数假设检验若P≤
,拒绝原假设H0;P值越小则拒绝理由越充分.若P>,不拒绝原假设H0;P值越大则不拒绝理由越充分.“假设→确定统计量、求值→查表确定P值→与显著性水平
比较→结论分析”.1、t检验知识样本数据属于数值资料类型,可以通过已知的样本信息,对总体均值与常数、或总体均值之间差异性比较推断,大致有三种:1.1单样本t检验单个总体均数未知,通过观察位置总体中一组样本值,对总体均数是否等于某个常数做出判断,称为单样本t检验.通过样本数据检验总体均值与已知总体均值(常数)差异是否有统计学意义.第4章总体均值的参数假设检验原假设H0:总体均值与某常数相等;(1)数值型,且若已知总体正态分布,总体方差未知,对样本容量没有限制;(2)总体非正态分布,总体方差未知时,大样本也可以适用.1.2两个独立样本t检验完全随机设计:在两个独立总体中随机抽取样本,或将同质受试对象随机分配到不同处理组,观察实验效应(指标),由此推断两组总体差异是否有统计学意义.两组样本容量不必相同,组中数据随机排列、无顺序可言.两个总体均值均未知,通过独立样本组,对两个总体均数是否相等做出判断,用两个独立样本t检验.通过两个独立样本数据检验两个独立总体均值差异是否有统计学意义.第4章总体均值的参数假设检验原假设H0:两个总体均值相等.须满足条件:(1)资料类型为数值型,所在总体服从正态分布;(2)两个样本所在总体方差未知(齐性?非齐性?);(3)两个样本相互独立.两步实施:(1)先检验两个总体方差的齐性.(2)再根据两个总体方差是否齐性,决定检验统计量和自由度.第4章总体均值的参数假设检验1.3两个配对样本t检验配对设计:将条件相同或相近的受试对象配成对子,再将每对中的两个受试对象随机分配到不同处理组.可以节约样本,又排除受试对象非处理因素(混杂因素)影响,尽量突显处理因素作用,配对设计可增强组间的均衡性,从而提高了处理因素的实验效能.(1)同质受试对象配成对子分别接受两种不同处理;(2)同一受试对象接受处理前后.配对比较:两组样本容量相同、一一对应、不能打乱对子内的排列顺序.第4章总体均值的参数假设检验“对子数据”的差值序列为直接计算依据,而原始数据是间接计算依据.两个总体均数均未知,通过两组相关样本,对两个总体均值是否相等做出判断,用配对样本t检验.旨在通过样本数据检验两个配对总体均值差异是否有统计学意义.原假设H0:两个总体均值之差为0.须满足条件:(1)资料类型为数值型,且两个样本所在总体服从正态分布;(2)两个样本所在总体的方差未知;(3)两个样本为配对样本.第4章总体均值的参数假设检验2、方差分析知识分析完全随机设计的多个独立总体均数差异是否有统计学意义.处理结果称为效应,影响处理结果的条件称为因素.因素所处的不同状态(三个及以上)称为该因素的水平.由各水平样本效应情况来推断各水平总体效应之间的差异,确定该因素对处理结果的影响是否有统计学意义.原假设H0:多总体均值相等.基本原理:全部观察值间总变异(总离均差平方和)分解成组间变异和组内变异,总的自由度也相应分解成组间自由度和组内自由度;组间变异体现随机误差和处理因素的作用,组内变异表示随机误差的影响;继续算出各部分的均方,构造F检验统计量,比较处理因素在各组间有无差异.第4章总体均值的参数假设检验须满足条件:(1)各组样本随机独立;(2)各组样本来自正态总体;(3)相互比较的各组样本总体方差相等.拒绝原假设(总体均数全部相等)时,一般要进行两两比较:几个实验组与对照组比较时可用Dunnett法;实验次数较少时可用LSD法;多个均数间两两比较进行探索性研究;试验次数不多时可用S-N-K法;各组试验数相等时可用Tukey或Bonferroni法(实验组数<5);各组试验数不等时可用Scheffe法.第4章总体均值的参数假设检验注意:两两比较方法有多种,它们之间各有优缺点且没有绝对替代性,有些情况下甚至不须严格选择,得出结论之间也有略微差别;大家可以查书但不必重点关注.在各组不满足方差齐性条件时,软件给出了两两比较近似方法.二、实验目的1.掌握单组总体均值与常数差异是否有统计学意义的t检验操作方法;2.掌握两组独立总体均值差异是否有统计学意义的t检验操作方法;3.掌握两组配对总体均值差异是否有统计学意义的t检验操作方法;4.掌握多组总体均值差异是否有统计学意义的方差分析操作方法.第4章总体均值的参数假设检验三、案例分析【实例1】[问题叙述]厂家宣称某种药剂的平均有效期是21.5天,现在从生产线上随机抽样检测药剂共6只,有效期分别为:19、18、22、20、16、25.请由此样本推断,现在生产线上的药剂有效期是否与厂家宣称有差别?菜单选择:主菜单“分析”→“比较均值”→“单样本T检验”.界面设置:选择变量“药剂有效期”进入“检验变量”框;将常数21.5输入“检验值”框,点击“确定”.[操作步骤]一个(或多个)检验变量,变量类型为数值型;一个已知总体均值(常数).定义数值型变量“药剂有效期”,将所有数据录入;已知总体均值为21.5.第4章总体均值的参数假设检验第4章总体均值的参数假设检验[结果分析]
单个样本统计量N均值标准差均值的标准误药剂有效期620.00003.162281.29099单个样本检验检验值=21.5tdfSig.(双侧)均值差值差分的95%置信区间下限上限药剂有效期-1.1625.298-1.50000-4.81861.8186第4章总体均值的参数假设检验经分析,6只药剂有效期样本均值为20.0000,标准差为1.29099.在单样本t检验中,统计量t值为-1.162,对应的概率值P=0.298,远大于显著性水平0.05;说明总体均值与21.5天差异无统计学意义.因此,尚无充分理由否认现在生产线上药剂有效期与厂家宣称的有差别.【实例2】[问题叙述]探讨血清测定结果对于白血病诊断意义,从病例库中完全随机抽取对照组11例、白血病组13例,请推断两组血清测定值(
/ml)是否有差别.对照组:179.21、180.22、183.30、160.17、187.23、185.26、165.31、185.21、178.33、191.36、181.32;白血病组:630.21、602.13、589.27、869.23、638.17、592.30、690.11、723.33、653.26、523.17、516.33、613.37、638.39第4章总体均值的参数假设检验[操作步骤]定义检验变量“血清测定值”,分组变量“组别”;两组数据全部录入检验变量,在分组变量中,对照组录入1、白血病组录入2.点击主菜单“分析”,点击“比较均值”,点击“独立样本T检验”.第4章总体均值的参数假设检验选择检验变量“血清测定值”进入“检验变量”框;选择分组变量“组别”进入“分组变量”框,并点击“定义组”,在“组1”和“组2”框中分别输入分组变量的两个取值1和0,作为不同分组的标识;点击“确定”.第4章总体均值的参数假设检验组别N均值标准差均值的标准误血清测定值对照组11179.72009.275722.79674白血病组13636.866990.4096825.07513方差方程的Levene检验(总体方差齐性检验)均值方程的t检验(总体均值比较)差95%置信区间FSig.tdfSig.均值差值标准误差值下限上限假设方差相等7.352.013-16.6422.000-457.1527.47-514.12-400.16假设方差不等-18.1212.30.000-457.1525.23-511.97-402.32第4章总体均值的参数假设检验经分析,(1)两个总体方差的齐性检验(H0:两个总体方差相等):对应的概率值P为0.013,小于显著性水平0.05,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 六年级语文课件
- 《房地产估价成本法》课件
- 财务应用调研报告范文
- 劳务班组分包合同
- 2024版建筑施工合同标的工程质量及进度补充协议2篇
- 玻璃厂选址报告范文
- 铝合金自行车制造购销合同2024
- 灵芝黑咖啡采购合同范本
- 食堂合作协议
- 七上生物课件显微镜
- 健身房会员服务优化预案
- 2023年山东济南中考满分作文《今朝晴朗可喜》5
- 2024北师大版新教材初中数学七年级上册内容解读课件(深度)
- 2024年公共营养师三级考试试卷及答案
- 三位数乘两位数乘法竖式计算练习100道及答案
- 我国高尿酸血症相关疾病诊疗多学科专家共识培训课件
- 安徽省专业技术人员职称评审系统操作手册(申报个人)
- 35kV-220kV输电线路通道林木清理检修施工方案
- 食品经营许可证换证申请书
- DLT5196-2016 火力发电厂石灰石-石膏湿法烟气脱硫系统设计规程
- 2024年青海省中考英语试卷真题(含答案解析)
评论
0/150
提交评论