版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
..10.11统计分析软件&SPSS建立数据目录10.11统计分析软件&SPSS建立数据110.25数据加工作图111.08绘图解答&描述性分析:22.描述性统计分析:2四格表卡方检验:〔检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布2第七章非参数检验21.单样本的非参数检验2〔1卡方检验2〔2二项分布检验22.两独立样本的非参数检验23.多独立样本的非参数检验24.两相关样本的非参数检验25.多相关样本的非参数检验2第五章均值检验与T检验21.Means过程〔均值检验〔24.单样本T检验25.两独立样本T检验26.两配对样本T检验2第六章方差分析2单因素方差分析:2多因素方差分析:210.25数据加工作图1.Excel中随机取值:=randbetween<55,99>2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤:3.排序:个案排秩4.数据选取:数据-选择个案-如果条件满足:计算新变量:5.频次分析:分析-统计描述-频率还原:个案-全部6.加权:还原7.画图:11.08绘图解答&描述性分析:1.课后题:长条图2.描述性统计分析:频数分析:描述性分析:描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。操作:分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据:任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态,探索分析:〔检验是否是正态分布:茎叶图、箱图实例:操作:交叉列联表〔探索定类型的变量间的相关性:[纯数值的变量用回归分析,名义变量用交叉分析]操作:实例:四格表卡方检验:〔检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布例子:第1步建立数据文建:第2步:对数据进行预处理;〔给数据加权第3步进行卡方检验:第4步结果分析P=0.011<0.05,则在5%显著性水平下拒绝原假设,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。如何选sig值:期望值就是T是理论频数N是样本数量〔合计对应:1选第一个:2选3选配对卡方检验:第1步建立数据文建:第2步对数据进行加权处理第3步进行配对卡方检验结果分析:第七章非参数检验使用情况:在总体分布未知的情况下用非参数检验,分布已知用参数检验。1.单样本的非参数检验〔1卡方检验分析步骤第1步提出零假设:卡方检验的零假设H0是"总体服从某种理论分布",其对立假设H1是"总体不服从某种理论分布"。第2步选择检验统计量:卡方分布选择的是Pearson卡方统计量。已证明,当n充分大时,它近似地服从自由度为k-1的卡方分布。第3步计算检验统计量的观测值和概率p值。第4步给出显著性水平,作出决策。实例:某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中?〔工作日12345次品数251581626第1步分析:由于考虑的是次品是否服从均匀分布的问题,考虑用卡方检验。第2步数据的组织:数据分成两列,一列是工作日,其变量名为"weekday",另一列是次品数,变量名为"number",输入数据并保存。第3步加权设置:将变量"number"定义为权变量。第4步进行卡方检验:第5步主要结果及分析左表是频数分布情况表,第二列为实际观察值出现次数,第三列为理论上每天应出现的次数,第四列为残差右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=0.014<0.05。说明应拒绝每个工作日出现的次品率相等的原假设。即次品数出现是不均匀的。〔2二项分布检验[例7-2]某地某一时期内出生35名婴儿,其中女性19名〔定Sex=0,男性16名〔定Sex=1。问这个地方出生婴儿的性别比例与通常的男女性比例〔总体概率约为0.5是否不同?第1步分析:由于性别分为男与女两种状态,故应用二项分布检验。第2步数据的组织:数据分成两列,其变量名为"性别","频数"。输入数据并保存。进行加权处理。第3步进行二项分布检验:第4步主要结果及分析从上表可知,相伴概率Sig.=0.736>0.05,因此没有理由拒绝零假设。这说明此地新生儿男女比例与通常的男女比例相同。2.两独立样本的非参数检验[例7-3]某公司希望了解两种品牌汽油A和B每加仑的行驶里程是否有区别,表7.15是两种品牌汽油每加仑的行驶里程数,在显著性水平=0.05下,判断两个品牌间是否存在显著性差异?A30.428.729.232.531.729.530.831.130.731.8B33.529.830.131.433.830.931.329.632.833第1步分析:由于是两种品牌的汽油,可以认为是两个独立样本,但行驶里程数根本不知道服从何种分布,可用两独立样本的非参数检验进行分析。第2步数据组织:由于独立样本的非参数检验所检验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。第3步进行独立样本的非参数检验双尾检验的相伴概率为0.151,大于0.05,说明两种汽油无显著性差异。两个相伴概率都大于显著性水平0.05,因此应接受零假设,认为两种汽油之间无显著性差异。Kolmogorov-SmirnovZ值为0.894,相伴概率值为0.400,大于显著性水平0.05,因此应接受两种汽油之间无显著性差异的原假设;根据游程检验计算的Z统计量为-1.149,对应在单尾显著性概率为0.128,大于显著性水平,因此应接受两种汽油之间无显著性差异的原假设。从以上四种检验方法所得到的结果是相同的,即两种汽油之间无显著性差异。3.多独立样本的非参数检验4.两相关样本的非参数检验某企业提出了一项新工艺,为了检验新工艺是否能降低单位成本,随机抽取16个工人分别用新旧工艺生产产品,测得单位成本资料如下表,请在显著性水平0.05下检验是否新工艺降低了成本?new25121422211722161718192422152223old18171619241928182224223025202421第1步分析:由于是同一批工人和同一批机器,其先后的成本是相关的,同时也不知数据的分布情况,故应用两相关样本的非参数检验。第2步数据组织:数据分成两列,第一列为新工艺的成本,第二列为旧工艺的成本。第3步两相关样本的非参数检验:设置如下图Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。结果分析:Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。其相伴概率为0.021,小于0.05,说明新工艺与旧工艺有显著性差异,这与Wilxocon检验结果是一致的。5.多相关样本的非参数检验某文艺晚会有5个节目,共有5个评委参与打分,其数据如下表。问这5个评委的判断标准是否一致。节目1节目2节目3节目4节目5评委18.758.258.898.5评委2109.59.58.99.5评委39.69.19.18.59.6评委49.28.58.99.19.4评委59.659.29.19.18.9第1步分析:由于5个评委打分是分别针对同一个节目,所以数据之间具有相关性,同时不知道数据所服从的分布,可以采用多相关样本的非参数检验。第2步数据组织:由于是分析的评委之间的评判标准是否一致,故应将每个评委所打的分各分成一列。第3步多相关样本的非参数检验:结果分析:卡方值为9.102,自由度为4,相伴概率为0.059>0.05,故应认为5个评委打分是一致的。卡方值为9.102,自由度为4,相伴概率为0.059>0.05,也应认为5个评委的打分具有一致性,这与Friedman检验具有一致性。非参数检验与卡方检验比较:卡方检验是数据总体是服从什么样的分布〔都是频次的方式呈现出来的非参数检验是总体分布情况未知第五章均值检验与T检验参数检验必须说明,他是服从某种分布的实例:1.Means过程〔均值检验〔与非参检验比较非参检验中的二项式检验,但是只能是两个变量。第1步数据组织;根据表5.1生成SPSS数据文件,建3个变量:"sex"、"edu"、"num",数据文件的部分数据如图5-3所示。3、实例分析第2步打开主对话框;选择分析→比较均值→均值,打开同图5-1一样的均值过程主对话框。第3步确定要进行均值比较的变量;在图5-1的对话框中,从左边的候选变量列表框中选择"人口数量〔num"变量,移入"因变量列表"文本框中,表示对该变量进行均值比较分析。第4步确定分组变量;分组变量可以有几层,选择"性别〔sex"变量作为第一层分组变量,将其移入"自变量列表"文本框中。第5步确定输出的统计量;单击图5-1上的选项…按钮,弹出如图所示的子对话框,选择方差和eta复选框,进行方差分析,单击继续按钮,返回主对话框。结果分析:此表是性别的单因素方差分析。表中的Sig.值远大于0.05,说明不同性别受教育的人口数量没有显著性差异。人口数量与性别的相关性度量表。此时的Eta和Eta方取值都很小,说明性别和受教育的人口数量的相关性很差,这也和单因素方差分析表的结论是一致的。4.单样本T检验〔它是对总体均值的假设检验[例5-2]某生产食盐的生产线,其生产的袋装食盐的标准重量为500g,现随机抽取10袋,其重量分别为:495,502,508,496,505,499,503,498,505,500。假设数据总体呈正态分布,请检验生产线的工作情况。第1步数据组织;首先建立SPSS数据文件,只需建立一个变量"Weight",录入相应的数据即可。第2步打开主对话框;选择分析→比较均值→单样本T检验,打开同图5-3一样的单样本T检验主对话框。第3步确定要进行T检验的变量;在图5-3所示的对话框中,选择"Weight"变量作为检验变量,移入"检验变量"框中。第4步输入要检验的值;在图5-4的对话框中的"检验值"中输入要检验的值,本例应输入500。单样本T检验结果表,第一行的TestValue为检验参数值500,即用于比较的总体均值,下面从左至右依次为检验统计量〔t、自由度〔df、双尾检测概率P值〔Sig.<2-tailed>、样本均值与和检验值的差〔MeanDifference、均值差的95%置信区间〔95%ConfidenceIntervaloftheDifference。当置信水平为95%时,显著性水平为0.05,从表中可以看出,双尾检测概率P值为0.432,大于0.05,故零假设成立,也就是说抽样袋装食盐的重量与500克无显著性差异,有理由相信生产线工作状态正常。5.两独立样本T检验[例5-3]为比较两种不同品种的玉米的产量,分别统计了8个地区的单位面积产量,具体数据见表5.8。假定样本服从正态分布,且两组样本相互独立,试比较在置信度为95%的情况下,两种玉米产量是否有显著性差异。第1步数据组织;根据表5.8,SPSS数据文件中建立两个变量,分别为"品种"、"产量",变量"品种"的变量值标签为:a-品种A,b-品种B,录入数据即可。第2步打开主对话框;选择分析→比较均值→独立样本T检验,打开同图5-4一样的两独立样本T检验主对话框。第3步确定要进行T检验的变量;在图5-4所示的对话框中,选择"产量"变量作为检验变量,移入"检验变量"框中。第4步确定分组变量;选择变量"品种"作为分组变量,将其移入图5-4中的"分组变量"文本框中,并定义分组的变量值:Group1—1,Group2—2。结果分析:首先做2个样本方差的齐性检验。上图中sig.=0.752>0.05,因此认为2个样本方差不存在差异,可以按照P=0.332取值。在显著性水平为0.05的情况下,T统计量的概率p值大于0.05,故不应拒绝零假设,,即认为两样本的均值是相等的,在本例中,不能认为两种玉米品种的产量有显著性差异。6.两配对样本T检验3、实例分析[例5-4]以下是某大学跆拳道选手15人的平衡训练的数据,统计实验前、后平衡训练成绩是否有差异。训练前:86,77,59,79,90,68,85,94,66,72,75,72,69,85,88训练后:78,81,76,92,88,76,93,87,62,84,87,95,88,87,80第1步数据组织;首先建立SPSS数据文件,建立两个变量:"训练前"、"训练后",录入相应数据。第2步打开主对话框;选择分析→比较均值→配对样本T检验,打开同图5-5一样的配对样本T检验主对话框。第3步确定配对分析的变量;将变量"训练前"和"训练后"添加到"成对变量"框中,作为第一对分析的配对变量。两配对样本T检验的简单相关关系及其检验结果。表中第3列为训练前和训练两样本的相关系数,第4列是相关系数的检验p值。从表中可以看出,在显著性水平为0.05时,训练前后的概率p值为0.132,大于0.05,接受零假设,可以认为训练前后的成绩没有明显的线性关系。由于概率p值为0.041,小于0.05,拒绝零假设,可以认为训练前后对成绩有显著效果。第六章方差分析单因素方差分析:用四种饲料喂猪,共19头分为四组,每一组用一种饲料。一段时间后称重,猪体重增加数据如下表所示,比较四种饲料对猪体重增加的作用有无不同。饲料A饲料B饲料C饲料D133.8151.2193.4225.8125.3149.0185.3224.6143.1162.7182.8220.4128.9143.8188.5212.3135.7153.5198.6第1步分析:由于考虑的是一个控制变量〔饲料对一个观测变量〔猪体重的影响,而且是4种饲料,所以不适宜用独立样本T检验〔仅适用两组数据,应采用单因素方差分析。第2步数据的组织:数据分成两列,一列是猪的体重,变量名为"weight",另一变量是饲料品种〔变量值分别为1,2,3,4,变量名为"fodder",输入数据并保存。第3步方差相等的齐性检验:由于方差分析的前提是各个水平下〔这里是不同的饲料folder影响下的体重weight的总体服从正态分布,且各组方差具有齐性。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的,因此必须对方差相等的前提进行检验。方差齐性检验的方法:打开分析——比较均值——单因素ANOVA——选项,在"方差同质性检验"前打钩就可以了。方差齐性检验的方法:方差齐性检验的H0假设是:方差相等。从上表可看出相伴概率Sig.=0.995>〔0.05说明应该接受H0假设〔即方差相等。故下面就用方差相等的检验方法。上表是几种饲料方差分析的结果,组间〔BetweenGroups平方和〔SumofSquares为20538.698,自由度〔df为3,均方为6846.233;组内〔WithinGroups平方和为652.159,自由度为15,均方为43.477;F统计量为157.467。由于组间比较的相伴概率Sig.〔p值=0.000<0.05,故应拒绝H0假设〔四种饲料喂猪效果无显著差异,说明四种饲料对养猪的效果有显著性差异。从整个表反映出来四种饲料相互之间均存在显著性差异,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 中国航天历史课件
- 2024年度产品研发与改进合同3篇
- 2024中国石化江苏油田分公司毕业生招聘10人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国电信山东淄博分公司校园招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国核工业集团限公司校园招聘7000人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国大唐集团海外投资限公司招聘33人易考易错模拟试题(共500题)试卷后附参考答案
- 2024中国供销集团校园招聘易考易错模拟试题(共500题)试卷后附参考答案
- 2024中冶华天南京电气工程技术限公司招聘10人易考易错模拟试题(共500题)试卷后附参考答案
- 2024上半年四川内江页岩气产业发展限公司员工招聘8人易考易错模拟试题(共500题)试卷后附参考答案
- 产科健康教育沟通会课件
- 武术队管理制度
- 工程水文学-第7章习题-流域产汇流计算附答案
- 通信行业销售人员销售技巧培训
- 护理学院本科生生产劳动实践教育实施方案
- 妇婴医院护理技术操作新生儿更换尿布法操作流程图与考核评分标准
- 关于范进中举改编成剧本【六篇】
- 降低会阴侧切率的PDCA
- 胃癌科普宣教
- 第二单元“革命岁月”(主题阅读)- 六年级语文上册阅读理解(统编版)
- 临床科研课题设计及申报书撰写技巧
- 《强化学习理论与应用》略梯度方法
评论
0/150
提交评论