实验二基本统计分析

上传人：m*** IP属地：天津上传时间：2022-10-22 格式：DOCX 页数：7 大小：289.52KB 积分：12 举报 版权申诉

已阅读5页，还剩2页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

实验二基本统计分析一、实验目的1．掌握SPSSforWindows基本统计分析。二、实验设备微机、SPSSforWindowsV17.0统计软件包。三、实验内容1．完成频率过程的基本操作。2．完成描述过程的基本操作。3．完成交叉表过程的基本操作。注：每道上机练习题的完成均包括：根据题目的要求建立SPSS数据文件；根据题目的要求进行SPSS统计分析；能正确解读SPSS输出的统计分析结果；根据SPSS输出的统计分析结果，按解题要求写出解题步骤。四、实验步骤频率过程1．建立至少包含一个变量的SPSS数据文件。2•鼠标单击“分析-描述统计-频率”菜单项，打开“频率”主对话框，如图2-1所示。3．在左侧变量框中选择一个或多个变量，单击箭头按钮，使其移到“变量”框中。4•显示频率表格：选中此项输出频数分布表，系统默认此项。5•单击“统计量”按钮，打开“统计量”对话框，选择要输出的统计量，如图2-2所示。“百分位值”栏：■四分位数：输出四分位数，显示25%、50%、75%的百分位数。■割点：将数据平分为所设定的相等等份，在输入框中输入的数值必须为在2-100之间的整数。例如，如果键入了4，则输出第25、50、75百分位数。图2-1 “频率图2-1 “频率”主对话框图2-2“统计量”对话框■百分位数：由用户定义的百分位数，在输入框中键入的数值必须在0〜100之间。键入数值后单击“添加”按钮。也可重复此操作过程，键入多个百分位数；如果要剔除已定义的百分位数，在百分位数框中选择一个数值然后单击“删除”按钮；如果要修改已定义的百分位数，在百分位数框中选择一个数值，然后在参数框中键入一新数值，单击“更改”按钮。（2）“离散”栏：在此栏中选择相应的选项可输出相应的离散量，如标准差、方差、范围（全距，即最大值与最小值之差）、最小值、最大值、均值的标准误等。（3）“集中趋势”栏：在此栏中选择相应的选项可输出相应的集中量，如均值、中位数、众数、合计（即总和）。（4）“分布”栏：■偏度：输出频数分布的偏态量及其标准误。如果此值等于0,分布呈对称形；如果此值为正数，即为正偏态分布（positivelyskewed）；如果此值为负数，即为负偏态分布（negativelyskewed），如图2-3所示。峰度：输出频数分布的峰态量及其标准误。如果此值等于0，分布呈正态峰；如果此值为正数，分布呈高狭峰；如果此值为负数，分布呈低阔峰，如图2-4所示。（5）值为组的中点：选中此项，在计算百分位数和中位数时，假设数据已经分组，且用各组的组中值代表各组数据。单击“继续”按钮，返回主对话框。6．单击“图表”按钮，打开“图表”对话框，如图2-5所示。在对话框中对图形的类型及坐标轴等进行设置。（1）“图表类型”栏：无：不输出图形，系统默认此项。条形图：输出条形图，各高度代表变量各分类的观测值频数，不显示频数为0的分类。图2-3频数分布的偏态

■饼图：输出饼图，各块代表变量各分类的观测值频数，不显示频数为0的分类。■直方图：输出直方图，此图仅适合于连续型随机变量。如果选择了直方图还可以选择“带正态曲线”复选项，即直方图中带有正态曲线。（2）“图表值”栏：纵轴或块表示的统计量，只有选择了条形图或饼图后此栏才有效，有“频率”和“百分比”两个选项。单击“继续”按钮，返回主对话框。7．单击“格式”按钮，打开“格式”对话框，如图2-6所示。在对话框中设置频数表输出的格式。（1） “排序方式”栏在此栏中有“按值的升序排序”（系统默认此项）、“按值的降序排序”、“按计数的升序排序”、“按计数的降序排序”等选项。应注意的是，如果选择了直方图或设置了百分位数栏，那么频数表将按变量观测值升序排列，而忽视此栏的设置。（2） “多个变量”栏：选择多变量输出表格设置。比较变量：将所有变量的有效值及缺失值的统计结果在一个表格中输出，以便比较。系统默认此项。按变量组织输出：为每一个变量单独输出一个有效值及缺失值的统计表格。（3）当多于n个类别时取消表格输出：当频数分布表的分组数大于所设定的数值（默认值为10）时禁止输出频数分布表，以避免产生巨型表格。单击“继续”按钮，返回主对话框。8．单击“确定”按钮，执行SPSS命令。图2-5“图表”对话框图图2-5“图表”对话框图2-6“格式”对话框（二）描述过程1．建立至少包含一个变量的SPSS数据文件。2•单击“分析-描述统计-描述”菜单项，打开“描述性”对话框，如图2-7所示。3．在左侧变量框中选择一个或多个变量作为待分析变量，并单击箭头按钮使其移入“变量”框中。4•“将标准化得分另存为变量”复选项：选中此项，对所选择的每个变量进行标准化产生相应的Z分，作为新变量保存在数据窗中，其变量名为相应变量名加前缀Z。5•单击“选项”按钮，打开“选项”对话框，如图2-8所示。在对话框中可以指定输出均值、合计（即总和）、标准差、方差、范围（即全距）、最小值、最大值、均值的标准误、峰度（输

出峰态量及其标准误）、偏度（输出偏态量及其标准误）；在“显示顺序”栏可指定四种输出顺序：变量列表（按变量表的顺序排列，系统默认此项）、字母顺序（按变量的字母顺序排列）、按均值的升序排列、按均值的降序排列。单击“继续”按钮，返回主对话框。6．单击“确定”按钮，执行SPSS命令。图2-7“描述性”主对话框图2-8“选项”对话框图2-7“描述性”主对话框（三）交叉表过程1．建立至少包含二个变量的SPSS数据文件。2•鼠标单击“分析T描述统计T交叉表”菜单项，打开“交叉表”主对话框。如图2-9所示。在左侧变量框中选择一个或多个变量进入“行”框，作为交叉表中的行变量；在左侧变量框中选择一个或多个变量进入“列”框，作为交叉表中的列变量。3•根据需要选择一个分层变量进入“层”框中。SPSS将根据分层变量的不同取值分别对行/列变量进行描述和分析。如果要增加另外一个控制变量首先单击“下一张”按钮，再选入一个变量。单击“上一张”按钮可以重新选择前面确定的变量。4•“显示复式条形图”复选项：选中此项显示每一组中各变量的分类条形图。图2-9交叉表主对话框图2-10精确检验对话框5•“取消表格图2-9交叉表主对话框图2-10精确检验对话框6．单击“精确”按钮，打开“精确检验”对话框，如图2-10所示。该对话框用于设定是否进行精确概率计算和具体的计算方法。■仅渐进法：仅计算近似的概率值。系统默认此项。MonteCarlo：采用蒙特卡罗模拟方法计算精确概率值。蒙特卡罗模拟默认进行10000次抽样，给出精确概率及99%置信区间(默认值均可更改)。◊置信水平：输入0.01〜99.9之间数值，指定置信水平。◊样本数：输入1~1,000,000,000之间数值，指定在MonteCarlo近似法计算中的样本数，样本数越大则求得的概率值越精确。精确：计算精确的概率值，默认计算时间限制在5分钟内，超过此时限则自动停止。单击“继续”按钮，返回主对话框。7．单击“统计量”按钮，打开“统计量”对话框，如图2-11所示。卡方：进行行/列变量独立性的Pearson卡方检验(Pearsonchi-squaretest)、似然比卡方检验(likelihoodratiochi-squaretest)、Fisher的精确检验(Fisher"sexacttest)、线性和线性组合检验(linear-by-linearassociationtest)。如果数据满足卡方检验的要求(即不能有单元格的期望值小于1，不能有20%以上的单元格的期望值小于5,样本容量大于40)，可使用Pearsonchi-squaretest。在四格表中，如果单元格的最小期望数小于1,或样本容量小于等于40时，则要使用Fisher'sexacttest。而likelihoodratiochi-squaretest用于对数线性模型的检验。当行/列变量均为连续型变量时，使用linear-by-linearassociationtest(线性相关检验)。相关性：相关系数项，仅对数值型变量有效。Pearson相关系数用来检验两个连续型变量的线性相关程度，Spearman相关系数用来检验两个等级变量之间的相关程度。“名义”栏：包含一组用于反映称名变量相关性的指标。■相依系数：即列联系数(contingencycoefficient)，可以描述两个变量之间关联性的高低，它由％2值得出：C=W/(x2+N)，式中为样本总容量。值：0«1。其值为0,表示行/列变量之间没有关联，其值越接近1,表示行/列变量之间的关联越强。Phi和Cramer变量：与列联系数一样，甲和Cramer变量也是用来描述两个变量之间关联性的高低，它由值得出：①二収2/N,V二.*2/N(K-1)(式中n为样C2本总容量，K为行/列变量中较小的水平数。)其值均介于0〜1之间，(注：在四格表％2检验中：①二(ad—bc)\：(a+b)(a+c)(b+d)(c+d)，其值介于1〜+1之间)，绝对值越大，则相关性越强。Lambda:用于反映自变量对因变量的预测误差。Lambda系数等于1,表明自变量可完全预测因变量；Lambda系数等于0,表明自变量不能预测因变量，彼此之间独立。■不定性系数：即不确定性系数(uncertaintycoefficient)，表示使用一个变量的值来预测其他变量的值可能发生的错误。不确定性系数越接近其上限1，表明从第一个观测值获得的有关第二个变量的值的信息越多；不确定性系数越接近其下限0，则表明从第一个观测值获得的有关第二个变量的值的信息越少。“有序”栏：包含一组用于反映顺序变量相关性的指标。Gamma：反映两个顺序变量之间的对称关联，其值的范围在〜+1之间。其绝对值为1时表示两个变量之间存在很强的关联，0则表示两者相互独立。。Somers"d：反映两个顺序变量之间的关联性，其数值范围为〜+1,绝对值接近1,表明两个变量之间的关联性越高；绝对值等于0,表明两个变量之间有没有关联性。Kendall'stau-b：它是对相关的顺序变量进行相关分析。其值的范围在_〜+1之间，符号表明两变量之间相关的方向，绝对值表明相关的密切程度，绝对值越大表示相关程度越高。■Kendall"stau-c：由Kendall"stau-b改进而来，在其基础上对表的大小进行了校正。图2-11统计量对话框图2-12单元显示对话框图图2-11统计量对话框图2-12单元显示对话框图2-13“表格格式”对话框(8)“按区间标定”栏：适用一个为称名变量另一个为等距变量的检验。Eta：系统计算两个n值，一个是将行变量作为因变量，另一个是将列变量作为因变量。n的平方表示组间平方和所解释的因变量总平方和的比例，即耳2=SS组间/SS总和，耳值介于o〜1之间，其值为o表示行/列变量之间没有关联性；值越大，行/列变量之间的关联性越高。Kappa复选项：计算k系数，即内部一致性系数，用来检验两个评估者对同一对象进行评估时是否具有一致性，仅适用于具有相同分类值和相同分类数量的变量交叉表，如2x2交叉表。其值介于〜+1之间，+1表示两者完全一致，0表示两者没有共同点，—表示两者完全相反。风险(Risk)复选项：计算相对危险度(relativerisk)和比数比(oddration)，可检验变量相对某一特定事件的关系，仅适用于2x2交叉表。如果其值小于或等于1，则不能确认事件的发生和因素暴露存在关联；如果大于1，说明两者之间有关联，该因素对事件的发生有影响。McNemar复选项：用于两个相关的二项变量的非参数检验(参见第十一章第六节)。“CochranesandMantel-Haenszel统计量”复选项：该统计量用于两个二项变量的独立性检验和同质性检验。单击“继续”按钮，返回主对话框。8．主对话框中，单击“单元格”按钮，出现“单元显示”对话框，如图2-12所示。在对话框中可以选择显示在交叉表单元格中的统计量，包括观测值数、百分比、残差。(1)“计数”栏：观测值：输出实际观测频数，系统默认此项。期望值：输出预

人人文库> 全部分类> 行业资料 > 机电工程

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

实验二基本统计分析

文档简介

温馨提示

最新文档

评论

实验二 基本统计分析

文档简介

温馨提示

最新文档

评论

相关文档

实验二基本统计分析