统计分析的SPSS应用实验教案_第1页
统计分析的SPSS应用实验教案_第2页
统计分析的SPSS应用实验教案_第3页
统计分析的SPSS应用实验教案_第4页
统计分析的SPSS应用实验教案_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGE2统计分析的SPSS应用(实验教案)目录TOC\o"1-3"\h\u25179《统计分析的SPSS应用》实验教学大纲 39371实验一SPSS数据文件的建立与编辑 426208实验目的 420727实验内容1:认知SPSS 425905实验任务 416755实验步骤 425361实验内容2:数据文件的建立 66010任务导向 614628实验步骤 614176实验内容3:在SPSS中打开Excel数据文件 929485任务导向 915283实验步骤 920491实验二SPSS统计数据的预处理 1125654实验目的 119039实验内容1:数据排序 1126023任务导向 112152实验步骤 1126811实验内容2:变量计算 127215任务导向 1214840实验步骤 1222495实验内容3:数据分组 1331057任务导向 1316571实验步骤 1320399实验内容3:数据选取 1431213任务导向 148661实验步骤 1429289实验三SPSS统计数据的频数分析 1713112实验目的 1730422实验内容1:单变量值的频数分析 17198任务导向: 1728619实验步骤 176830实验内容2:多选题的频数分析 205855任务导向 2015786实验步骤 20356实验内容3:交叉分组下的频数分析 2112122任务导向 215566实验步骤 2216045实验四SPSS描述统计分析 2426810实验目的 244214实验内容1:基本描述统计量的计算 2410831任务导向 2424972实验步骤 2417836实验内容2:绘制各种统计图 2529494任务导向 2513960实验步骤 2515281实验五假设检验的SPSS过程 3126118实验目的 311033实验内容1:单样本T检验 3113231任务导向 319632实验步骤 3113139实验内容2:两独立样本T检验 3227932任务导向 3211978实验步骤 335521实验内容3:两匹配样本T检验 3413042任务导向 349759实验步骤 3526968实验六相关与回归分析的SPSS过程 363422实验目的 3619564实验内容1:相关分析 3629005任务导向 3629246实验步骤 368096实验内容2:线性回归分析 3718949任务导向 3710662实验步骤 3819204实验内容3:非线性回归 4220501任务导向 4218321实验步骤 4218047实验七时间序列分析的SPSS过程 4727969实验目的 4721318实验内容1:时间序列的线图绘制 47905任务导向 4714397实验步骤 4717492实验内容2:时间序列自相关图绘制 4929030任务导向 4918014实验步骤 49606实验内容3:时间序列的季节变动分析 5128501任务导向 514220实验步骤 5121517实验八方差分析的SPSS过程 5414009实验目的 5424396实验内容1:单因素方差分析 5410693任务导向 547156实验步骤 5413830实验内容2:双因素方差分析 5711859任务导向 576884实验步骤 57《统计分析的SPSS应用》实验教学大纲课程名称:统计学实验课名称:统计分析的SPSS应用课时数:16课时实验项目及摘要:序号实验名称必做/选做课时数实验一SPSS数据文件的建立与编辑必做2实验二SPSS统计数据的预处理必做2实验三SPSS统计数据的频数分析必做2实验四SPSS描述性统计分析必做2实验五假设检验的SPSS过程必做2实验六相关与回归分析的SPSS过程必做2实验七时间序列分析的SPSS过程必做2实验八方差分析的SPSS过程选做2实验一SPSS数据文件的建立与编辑实验目的掌握SPSS数据文件的建立掌握多项选择题的变量定义掌握SPSS数据文件的编辑实验内容1:认知SPSS实验任务打开SPSS软件,并了解其窗口结构。实验步骤步骤1:打开SPSS软件。双击SPSS桌面图标后,计算机屏幕上出现一个对话框,如图所示:注释:对话框包括一个六选一单选对话框和一个复选对话框,其内容为:Runthetutorial运行操作指南;Typeindata输入数据选项,建立新的数据集时可选择此项;Runanexistingquery运行一个已经存在的数据文件选项;CreatenewqueryusingDatabaseWizard用数据库处理工具建立新文件;Openanexistingdatesource打开一个已经存在的数据文件;Openanothertypeoffile打开其他类型的文件。Don’tshowthisdialoginthefuture下次启动SPSS时将不会显示对话框。这里直接点击“Cancel”按钮即可。步骤2:认知SPSS主窗口。标尺栏标尺栏菜单栏工具栏数据输入区数据编辑区窗口标签标题栏SPSSforWindows主窗口示意图状态栏当前数据栏显示区滚动条实验内容2:数据文件的建立任务导向以下是某问卷的部分内容,并假设你手头上有3份调查问卷的答案,需要你将它们录入形成SPSS数据文件,并保存该数据文件。1、你的性别是()A、男B、女2、你的身高是____cm3、你的专业是()A、金融B、会计C、工商D、国贸4、你对目前的住宿条件满意程度是()A、非常满意B、满意C、一般D、不满意E、非常不满意5、你认为大学期间应培养哪些能力(限选三个)()A、学习能力B、组织能力C、交际能力D、写作能力E、运动能力F、口才能力G、协作能力H、其他其中三份问卷答案如下:(1)A,172,B,B,ACG(2)A,168,C,B,BCF(3)B,164,A,C,DEF实验步骤数据录入包括两个基本步骤:定义变量和数据录入。这里先讲前4题的变量定义和数据录入,然后单独讲解多选题的变量定义和数据录入,最后将数据文件保存。一、前4题的变量定义和数据录入步骤步骤1:打开SPSS软件。步骤2:在“variableview”窗口中定义变量。注释1:在VariableView表中,每一行描述一个变量,依次是:Name:变量名。Type:变量类型。最常用的是Numeric数值型变量。Width:变量所占的宽度。Decimals:小数点后位数。Label:变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。Columns:变量在DateView中所显示的列宽(默认列宽为8)。Align:数据对齐格式(默认为右对齐)。Measure:数据的测度方式(默认为等间距尺度)。注释2:Values:变量值标签的定义方法,以第3题为例,点击values栏中的按钮,在弹出窗口中依次数据各选项的标签值:步骤3:在“DataView”中录入3份问卷的答案。二、第5题多选题的变量定义和数据录入方法多项选择题的变量定义方法有两种,一是二分法,二是分类法。二分法的做法是:有多少个备选项就定义多少个变量,每个变量的取值只有0和1两个,0代表该选项未被选择,1代表该选项被选择了。分类法的做法是:先确定每道题最多选项个数,然后根据最多选项数确定变量个数,每个变量的取值范围为候选项个数。本例采用分类法来定义变量。步骤1:在“variableview”窗口中定义变量。注释1:由于第5题限选3个,因此按分类法应定义3个变量。若采用二分法,该题共8个选项,则应该定义8个变量。注释2:Values变量值标签的定义如下:步骤2:在“DataView”中继续录入这3份问卷第5题的数据答案。步骤3:保存数据文件,并命名为“临时.sav”选择菜单“File—>Save”,在对话框中找到需要保存的位置,并在文件名中输入“临时”,然后点击“保存”。实验内容3:在SPSS中打开Excel数据文件任务导向在SPSS中打开“多元回归-Book1.xls”的Excel文件实验步骤步骤1:选择菜单“File—>Open—>Data”,弹出“OpenFile”对话框。在查找范围中找到“多元线性回归.xls”所在位置,在“文件类型”框中下拉菜单栏选择Excel(*xls),然后在主窗口中单击“多元回归-Book1”步骤2:单击“打开”,弹出如下对话框,在“Worksheet”框中选择Excel数据区域,步骤3:点击“OK”,SPSS数据视图窗口中就打开了“多元回归-Book1”中的数据实验二SPSS统计数据的预处理实验目的掌握数据排序方法掌握变量计算方法掌握数据分组方法掌握数据选取方法实验内容1:数据排序任务导向在“职工数据”文件中,以职称为主排序变量进行降序,以“基本工资”为第二排序变量升序进行多重排序。实验步骤步骤1:打开“职工数据”文件,选择菜单“Data—>SortCase”。步骤2:将主排序变量指定到“Sortby”窗口中,并在“SortOrder”中选择“Descending”。步骤3:将第二排序变量指定到“Sortby”窗口中,并在“SortOrder”中选择“Ascending”,点击“OK”。实验内容2:变量计算任务导向在职工数据文件中,新建一个变量实发工资,实发工资等于基本工资减去失业保险后,依据职称1-4等级分别上浮20%、15%、10%和5%。实验步骤步骤1:打开“职工数据”文件,选择菜单“Transform—>Compute”。步骤2:在“TargetVariable”中输入“实发工资”,在“NumericExpression”中输入“sr*1.20”,点击左下角“if”按钮。选择“Includeifcasesatisfiescondition”并在下面框框中输入“zc=1”,点击“continue”,返回上一窗口中,并点击“OK”步骤3:以上完成了职称等级等于1时实发工资的变量计算,职称等于2~4时的操作方法类似。注释:变量计算的形式有很多,在“Functiongroup”中提供了非常丰富的计算函数。主要的函数名有:Abs(算术表达式)求绝对值Sqrt(正数)求平方根Exp(算术表达式)求e的若干次幂Mean(变量名,变量名,…)计算每个case多个变量值的平均值Sd求标准差Variance求方差Sum求总和Cfar求变异系数实验内容3:数据分组任务导向在“住房状况调查”数据文件中,为分析人均住房面积的分布特征,首先要对人均住房面积进行分组,共分5组,分别是:10以下,10~20,20~30,30~50,50以上。实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Transform—>Recode—>IntoDifferentVariables”。步骤2:在变量名列表中选择“人均面积”变量,使之添加到“Numericvariable—>Outputvariable”框中,同时在“outputvariable”下“Name”框中输入新变量名“人均面积分组”,单击“Change”确认。步骤3:点击“OldandNewValues”按钮,弹出如下对话框。在“OldValues”中输入人均面积原始范围值,在“NewValue”下输入新的变量值,并点击“Add”。依次输入各组的新旧值后,点击“Continue”返回上一窗口,点击“OK”。注释1:在上面的对话框中,左边需要确定原变量值范围,设置项依次是:Value:输入某个值;System-missing:以系统的缺失值为清点对象;System-orusermissing:以系统或用户指定的缺失值为清点对象;Range:指定原变量的数值区域:其中包括:()through()在框内指定下限和上限lowestthrough():在框内只指定上限;()highestthrough:在框内只指定下限。注释2:变量分组实际上是建立一个新变量,用新变量来代替原有变量。如本例中,原有变量值在10以下的用新变量值1代替,原变量值在10~20之间用新变量值2来代替,依此类推。注释3:Recode命令有两个选项,分别是:IntoSameVariables:数据编码后新的码值直接放到原来的变量中;IntoDifferentVariables:数据编码后新的码值存到一个新变量中。为了避免数据丢失,尽量不要轻易选择前者。实验内容3:数据选取任务导向在“住房状况调查”数据文件中,(1)选择本市户口的住房样本;(2)随机选择全部样本的40%的数据。实验步骤(1)选择本市户口的住房样本步骤1:打开“住房状况调查”数据文件,选择菜单“Data—>SelectCases”。步骤2:选择“ifconditionissatisfied”。步骤3:点击“if”按钮,在新对话框中,在右边框中输入“户口状况=1”。点击“Continue”返回上一窗口中,点击“OK”(2)随机选择全部样本的40%的数据。步骤1:同上。步骤2:选择“RandomSampleofcases”,并点击“Sample”。步骤3:在新对话框中选择“Approximately”,并在后面框中输入40。点击“Continue”返回上一窗口中,点击“OK”确认。注释:在上对话框的Select栏中选择挑选数据子集的方式(单选):Allcase:选择所有数据;Ifconditionissatisfied:按指定条件选择数据。RandomSampleofcases:对观察值进行随机抽样。Basedontimeorcaserange:对某一区间进行抽样。Usefiltervariable:用指定变量作过滤。先选择一个变量,系统自动在数据管理器中将该变量值为0的观测单位标上删除记号,系统对标有删除记号的观测单位不作分析。实验三SPSS统计数据的频数分析实验目的掌握单变量值的频数分析掌握多选题的频数分析掌握交叉分组下的频数分析实验内容1:单变量值的频数分析任务导向:在“住房状况调查”数据文件中,分析被调查家庭中户主的从业状况及文化程度情况,并编制频数分布表。实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze—>DescriptiveStatistics—>Frequencies”。步骤2:将“从业状况”和“文化程度”移入右侧Variable(s)列表框中,然后,选择位于小窗口下端的“Displayfrequencytables复选框”,以确定要输出频数分布表,点击“OK”。分析结果如下:注释:步骤2的对话窗口下方有三个按钮,分别是Statistics、Chart、Format。1、单击Statistics按钮,在新对话框中选择要求输出的统计量。PercentileValues百分数选择项栏(复选项)Quartile四分位数,Cutpointsequalgroups等分位点百分位数(取值范围在2100之间)。Percentile(s)自定义百分数。Dispersion离差栏Stddeviation(标准差)、Variance(方差)、Range(极差)Min(最小值)、Max(最大值)、S.E.Mean(平均值标准误)CentralTendency中心趋势栏Mean算术平均值(均值),Median中位数,Mode众数,Sum算术和。Distribution分布状态栏Skewness(偏度系数)、Kurtosis(峰度系数)。2、单击Chart按钮,得到Frequencies:Chart对话框。ChartType图形栏(单选),选择输出的图形类型。None不输出图形(系统默许)Barcharts条形图Piecharts饼图Histograms直方图Withnormalcurve直方图中显示正态曲线(只有选择直方图时才能选择)。ChartValues栏,选择图形中分类值的表现形式。Frequencies纵轴为频数,饼图中每块表示属于该组观测值频数;Percentage纵轴为百分比,饼图中每块表示该组的观测量数占总数的百分比。3、单击Format按钮,得到对话框图如下。Orderby排序栏,表示频数分布表的排列顺序。(单选)Ascendingvalues按变量值升序排列(系统默许)。Descendingvalues按变量值降序排列。Ascendingcounts按变量各种取值发生的频数升序排列。Descendingcounts按变量各种取值发生的频数降序排列。实验内容2:多选题的频数分析任务导向在“保险市场调查中”数据文件中,对第13题“购买商业养老保险的原因”的各选项出现的频数频率进行分析。实验步骤多选题的频数分析包括两个步骤,一是定义多选题的变量集;二是多选题的频数分析。步骤1:打开“保险市场调查”数据文件。步骤2:定义多选题变量集合。选择菜单“Analyze—>MultipleResponse—>DefineSets”。将变量q13a、q13b、q13c变量移入“VariablesinSet”中,在“VariablesAreCodedAs”中选择“Categories”,输入多选题变量值范围1到7,在Name中定义变量集合名称为“第13题”,并“Label”中注明其标签“购买商业养老保险的原因”,点击“Add”后,点“Close”关闭。步骤3:多选题的频数分析。选择菜单“Analyze—>MultipleResponse—>Frequencies”,在新对话框中将左边“MultResponseSets”中的变量集合移到右边“Tablesfor:”中,点击“0K”。分析结果如下:注释:分析结果中,N表示响应次数;Percent表示响应百分比,计算方法是响应次数除以总响应数;PercentofCases也表示响应百分比,其计算方法响应次数除以样本数。实验内容3:交叉分组下的频数分析任务导向根据“住房问卷调查”数据,分析户口状况和未来三年是否打算买房的交叉分组情况,并编制交叉分组的频数分布表。实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze—>DescriptiveStatistics—>Crosstabs”。步骤2:在Crosstabs对话框中,将“文化程度”移入行变量“Row(s)”中,将“未来三年”移入列变量“Column(s)”中。步骤3:点击“Cells”按钮,选择“Observed”、“Row”、“Column”、“Total”项,点击“Continue”返回上一窗口,点“OK”确定。主要分析结果如下:注释:交叉列联表分析的的两大基本任务,一是编制交叉分组频数分布表,二是在列联表基础上,对两两变量是否存在一定的相关性进行分析。后者的基本操作是单击“Statistics”按钮,在新对话框中选择“Chi-Square”统计量。实验四SPSS描述统计分析实验目的掌握基本描述统计量的计算掌握几种常见统计图的绘制实验内容1:基本描述统计量的计算任务导向根据“住房状况调查”数据文件,对人均住房面积计算基本描述统计量。实验步骤基本描述统计量的计算方法很多,常见的有两种,一种是在频数分析时单击“Statistics”按钮,选择各种描述统计量;一种是在描述统计中计算各描述统计量。第一种方法参见实验三的实验内容1,这里仅对第二种方法进行讲解。步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze—>DescriptiveStatistics—>Descriptive”。步骤2:在Descriptive对话框中将“人均面积”移入Variable(s)列表框中。步骤3:点击右下角的“Options”按钮,将需要计算的各描述统计量选上后,点“Continue”,点“OK”即可。注释:如果需要计算各个案所对应的标准分数值,只需在步骤2对话框中选择左下角“SaveStandardizedvaluesasvariables”复选框。实验内容2:绘制各种统计图任务导向根据“住房状况调查”数据文件,先按文化程度分类,然后在分好的类别中,再按性别分类,最后计算各种类别人员的平均家庭收入水平并绘制分类条形图。根据“住房状况调查”数据文件,想通过饼形图(PieChars)来了解文化程度在总人数中所占的比例,并在图中显示比例数据。实验步骤1、条形图的绘制步骤1:打开“住房状况调查”数据文件,选择菜单“Graphs—>Bar”。步骤2:在打开BarCharts(条形图)选择对话框中,选择Clustered,并在“DatainChartAre”中选择“Summariesforgroupsofcases”,然后点击“Define”。步骤3:在“BarsRepresent”中选择“Otherstatistic”,将左边的“家庭收入”移入“Variable”中;在CategoryAxis输入横坐标轴上的分组变量“文化程度”;在DefineClustersby中输入第二次分类的变量“性别”,点击“OK”。绘制图形结果如下:注释1:步骤2中对话框说明。条形图形状的选择-条形图图标说明Simple:将各类别数值用平行且等宽的条形简单地并列在一起的图形。Clustered:有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类,并用两个以上的条形图并列来分别表示。Stacked(分段条形图):有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类。作图时,以条形的全长代表分成的第一大类别,条形内部各段的长短代表第二类别的组成部分,各段之间是用不同的线条或颜色表示。计算数据统计量的方式选择-DatainChartAreSummariesforgroupsofcases:先对所有数据分类,然后对每类创建条形图Summariesofseparatevariables:对每个变量创建条形图Valuesofindividualcases:对每个数据创建条形图注释2:步骤3中条形图变量及参数选择CategoryAxis:表示坐标轴上的分组变量(第一次分类的变量)。DefineClustersby:第二次分类的变量BarsRepresent:确定条形图所显示的数值。有如下选项可供选择:Nofcases:显示总的观测值数%ofcases:分组个数所占的比例Cumulativenofcases:累计频数(按个数统计)Cumulative%ofcases:累计频率(按比例统计)Othersummaryfunction:其他描述统计量饼图绘制步骤1:打开“住房状况调查”数据文件,选择菜单“Graphs—>Pie”,选择“Summariesforgroupsofcases”,点击“Define”确认。步骤2:在“SlicesRepresent”中选择“Nofcases”表示观测值,在“DefineSlicesby”中移入“文化程度”变量,点击“OK”。饼图分析结果如下:步骤3:双击输出结果中的饼图,在图形编辑器中选择菜单“Elements—>Showdatalabels”,在Properties对话框中,将“NotDisplayed”中的“文化程度”移入“Displayed”框中,点击“Close”。得出最终的饼图效果如下:注释:SPSS作图类型Bar选项可以生成简单条形图、分组条形图和分段条形图。Line选项可以生成单线图、多线图和垂线图。Area选项可以生成简单面积图和堆栈面积图。Pie选项可以生成单圆图。High-Low选项可以生成高-低-收盘图、极差图和距限图。Pareto选项可以生成排列图或Pareto帕雷托图。Control选项可以生成最常见的工序控制图。Boxplot选项可以生成探查数据的箱线图。ErrorBar选项可以生成探查数据的误差条图。Scatter选项可以生成简单散点图、重叠散点图、矩阵散点图和三维散点图。Histogram选项可以生成直方图。NormalP-P选项可以生成变量分布的分位数对正态分布的分位数的图形。NormalQ-Q选项可以生成变量分布的分位数对正态分布的分位数的图形。Sequence选项可以生成变量分布分位数对正态分布分位数的图形。TimeSeries选项可以生成自相关图、偏相关图和互相关图。实验五假设检验的SPSS过程实验目的掌握单样本T检验方法掌握两独立样本T检验方法掌握两匹配样本T检验方法实验内容1:单样本T检验单样本t检验是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。任务导向根据“住房状况调查”数据,检验总体的家庭人均住房面积的平均值是否为20平方米。解:假设检验首先是确定原假设和备择假设,这里原假设和备择假设确定如下:H0:总体家庭人均住房面积为20平方米H1:总体家庭人均住房面积不等于20平方米实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze®CompareMeans®One-SampleTTest”。步骤2:在One-SampleTTest主对话框中,将“人均面积”变量移入“TestVariable(s)”中,在“TestValue:”框中输入检验值20。步骤3:点击“Options”按钮,在“Confidenceinterval”中输入“95%”(本例中显著性水平α取0.05)。然后点击“Continue”返回主对话框,点击“OK”确定。分析结果如下:其中第一个表“One-SampleStatistics”表是人均面积的基本统计量表,第二个表“One-SampleTest”表是假设检验结果表。从第二个表我们可知:检验统计量t值是8.640,自由度df是2992,假设检验的P值(sig.)小于0.05,因此我们得出拒绝原假设的结论,即家庭人均住房面积的总体均值不等于20平方米。注释1:假设检验的决策方法有两种:临界值法和P值法,运用SPSS软件我们通常采用P值法做决策,其决策原理是:若P值>显著性水平α,则拒绝原假设;若P值<显著性水平α,则不拒绝原假设。注释2:在“One-SampleTest”表中,MeanDifference是样本均值与检验值之差;“95%ConfidenceintervaloftheDifference”下的两列表示总体均值与检验值之差的95%的置信区间。实验内容2:两独立样本T检验两独立样本T检验是检验两个没有联系的总体样本均值间是否存在显著的差异,两个没有联系的总体样本也称独立样本。如两个无联系的企业生产的同样产品之间的某项指标的均值的比较,不同地区的儿童身高、体重的比较等,都可以通过抽取样本检验两个总体的均值是否存在显著的差异。任务导向根据“住房状况调查”数据文件,推断本市户口总体和外地户口总体的家庭人均住房面积的平均值是否有差异。解:由于本地户口家庭的人均面积对外地户口家庭的人均面积是无影响的,因此这两个样本是相互独立的。可以应用两独立样本的假设检验。建立假设如下:H0:本地户口与外地户口家庭的人均面积没有显著差异;H1:本地户口与外地户口家庭的人均面积存在显著差异。实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze®CompareMeans®Independent-sampleTTest”,打开Independent-sampleTTest主对话框。步骤2:选择要检验的变量“人均面积”进入检验框中。步骤3:选择分组变量“性别”进入分组变量框中,然后单击“DefineGroup”按纽,打开分组对话框,在Group1中输入分组值1,在Group2中输入分组值2(由于户口状况变量的取值分别是1和2),然后点击“Continue”返回主对话框,点击“OK”确定。输出结果如下:GroupStatistics表是基本统计量表,IndependentSampleTest表是检验结果表。后者的第二列和第三列是检验两样本数据的方差是否相等,从检验结果得知两样本的方差有显著性差异。从第四列开始是对两个样本的均值的是否相等进行检验。从假设检验的Sig值(P值)看出,它小于显著性水平0.05,因此拒绝原假设H0,所以说本地户口和外地户口之间的家庭人均面积有显著差异。而第七列之后分别是均值差、均值差标准误、均值差的置信区间。注释1:两独立样本T检验的基本思路是:首先根据F检验来判断两总体方差是否相等,即方差齐性次检验。然后再根据方差齐性次检验结果来选择两独立样本T检验的方法。注释2:方差齐性次检验结果是IndependentSampleTest表的第二和第三列,该检验的原假设是两总体方差相等,备择假设是两总体方差不相等。注释3:IndependentSampleTest表中第一列,“EqualVarianceAssumed”表示两总体方差相等,在方差齐性次检验中若不拒绝原假设,两独立样本T检验结果查看这行。“EqualVarianceNotAssumed”表示两总体方差不相等,若在方差齐性次检验中拒绝原假设,则选择该行作为两独立样本T检验的结果。注释4:在步骤3中,若分组变量取值多于2个的,则是可以在“CutPoint”中输入一个数字,大于等于该值为一总体,小于该值为一总体。实验内容3:两匹配样本T检验两匹配样本T检验是检验两个有联系正态总体的均值是否存在显著的差异。又称配对样本的T检验。如检验某种药品使用的效果是否显著,需要对使用者使用前后进行比较;再如对某电子计时器准确度效果进行检验,采用同一批志愿者分别用手工计时器和电子计时器测量他们的跑步成绩以进行比较等。任务导向根据“减肥茶数据”文件,为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖志愿者进行跟踪调查,记录了他们喝茶前后的体重数据,推断减肥茶是否具有显著的减肥效果。解:本例中是对同一实验对象的喝茶前后的数据进行比较,这显然是配对样本均值的假设检验的问题。所以要建立假设:H0:喝茶前后的体重没有显著差异H1:喝茶前后的体重有显著差异实验步骤步骤1:打开“减肥茶数据”文件,选择菜单“Analyze®CompareMeans®Paired-SampleTTest”,打开Paired-SampleTTest主对话框。步骤2:选择要检验的两变量进入“PairedVariables”检验框中。注意:一定要同时选择两个变量进入检验框内,否则将无法得到检验结果。点击“OK”确定,得输出结果如下。由上表的检验结果知,假设检验的P值小于0.05,故拒绝假设H0,因此可以得出喝茶前后的体重差异是显著的,认为减肥茶的效果是显著的。注释:两独立样本T检验和两匹配样本T检验的数据结构不同。两独立样本T检验中涉及两个变量,一个是分组变量,一个检验变量,如实验内容2中的户口状况和人均面积;两匹配样本T检验也涉及两个变量,但两变量都是检验变量,一个是总体1的检验变量,一个是总体2的检验变量。实验六相关与回归分析的SPSS过程实验目的掌握相关系数计算和检验的SPSS分析掌握线性回归方程的确定和各种检验的SPSS分析掌握几种典型的非线性回归方程确定的SPSS分析实验内容1:相关分析任务导向根据“住房状况调查”数据,绘制家庭收入、计划面积的散点图,计算它们之间的相关系数并予以检验。实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze®Correlate®Bivariate”,打开Bivariate对话框如下。步骤2:从左边的变量框中选择需要考察的“家庭收入”和“计划面积”进入“Variables”框内;从CorrelationCoefficients栏内选择相关系数的种类,这里选择Pearson相关系数;从“TestofSignificance”栏内选择“Two-tailed”双尾检验方式。步骤3:单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述量,如下图所示。步骤4:单击“Continue”返回主窗口,单击“OK”可以得到相关分析的结果。“DescriptiveStatistics”表是两个变量的基本统计描述量,“Correlations”表是两变量的相关系数及对相关系数的检验结果。从“Correlations”表可知家庭收入和计划面积的相关系数是0.323,对相关系数检验的P值小于0.05,拒绝原假设(相关系数检验的原假设是两变量间不存在线性相关关系),说明两变量之间存在着显著的正线性相关关系。实验内容2:线性回归分析线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象(因变量)与影响因素(自变量)之间的线性函数关系式。任务导向根据“银行贷款”数据文件,分析银行不良贷款受哪些因素的影响,要求确定多元线性回归方程,并进行各种检验。实验步骤步骤1:打开“银行贷款”数据文件,选择菜单“AnalyzeRegressionLinear”,打开LinearRegression对话框。步骤2:从左边框中选择因变量“不良贷款”进入Dependent框内,选择其余四个自变量进入Independent框内。从Method框内下拉式菜单中选择Enter(强行进入法)回归分析方法。注释:回归分析方法包括强行进入法(Enter),消去法(Remove),向前选择法(Forward),向后剔除法(Backward)及逐步回归法(Stepwise)五种。步骤3:点击“OK”确定,得到输出结果。主要的分析结果表格如下:该表中R表示自变量与因变量的复相关系数,RSquare表示判定系数,AdjustedRSquare表示修正的判定系数,Std.ErroroftheEstimate表示估计标准误差。本例中修正的判定系数为75.7%,说明模型拟合度较好。该表为方差分析表,第一列的含义分别表示回归、残差、总计,第二列是离差平方和,第三列是自由度,第四列是均方差,第五列是回归方程显著性检验的F检验统计量值,最后一列是P值。本例中由于P值小于0.05,说明自变量与因变量之间线性关系显著。此表为回归系数表。第一列是常数项和各自变量,第二列是非标准化的系数,第四列是标准化系数,第五列是回归系数显著性检验的t检验统计量值,第六列是回归系数显著性检验的P值。本例中,根据第二列可以写出样本回归方程为:根据最后一列回归系数显著性检验的Sig值(P值),可以看出本年累计应收贷款、贷款项目个数和本年固定资产投资额三个自变量对不良贷款的线性影响不显著(由于P值大于0.05,不拒绝各回归系数等于0的原假设)。注:为方便初学者,本例没有进行多重共线性检验,且回归方法的选择也仅采用强行进入法,这可能导致回归结果不准确。本例中本年累计应收贷款、贷款项目个数和本年固定资产投资额三个自变量对不良贷款的线性影响不显著可能是由于存在多重共线性引起的。注释1:在步骤1中的对话框中,最底部还有几个按钮,它们为回归分析提供了丰富的功能选项。下面解释下各按钮的含义和作用:单击Statistics,打开LinearRegression:Statistics对话框,选择输出的统计量。RegressionCoefficients栏,回归系数选项栏。Estimates(系统默认):输出回归系数的相关统计量:包括回归系数,回归系数标准误、标准化回归系数、回归系数检验统计量(t值)及相应的检验统计量概率的P值(sig)。Confidenceintervals:输出每一个非标准化回归系数95%的置信区间。Covariancematrix:输出协方差矩阵。与模型拟合及拟合效果有关的选择项。Modelfit:能够输出复相关系数R、R2及R2修正值,估计标准误差,方差分析表。Rsquaredchange:引入或剔除一个变量时,R2的变化。Descriptives:基本统计描述。PartandPartialcorrelations:相关系数及偏相关系数。Collinearitydiagnostics:共线性诊断。主要对于多元回归模型,分析各自变量的之间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指数等。Residuals残差栏Durbin-Watson:D.W检验.Casewisediagnostics:奇异值诊断,有两个选项:Outliersoutside()standarddeviations:奇异值判据,默认项标准差≥3。Allcase输出所有观测量的残差值。单击Plots按纽,打开LinearRegression:Plots对话框,选择所需要的图形。在左上角的源变量框中,选择Dependent进入X(或Y)轴变量框,选择其它变量进入Y(或X)轴变量框,除因变量外,其客观存在变量依次是:ZPRED:标准化预测值,ZRESID:标准化残差,DRESID:剔除残差,ADJPRED:修正后预测值,SRESID学生化残差,SDRESID:学生化剔除残差。StandardizedResidualPlots栏,标准化残差图类型,有选择项:Histogram:标准化残差直方图Normalprobabilityplot标准化残差序列的正态分布概率图.Produceallpartialplots依次绘制因变量和所有自变量的散布图单击Options按纽,打开LinearRegression:Options对话框,选择模型拟合判断准则及缺失值的处理方式。SteppingMethodCriteria栏,设置变量引入或剔除模型的判别标准。UseprobabilityofF:采用F检验的概率为判别依据。UseFvalue:采用F值作为检验标准。Includeconstantinequation回归方程中包括常数项。MissingValues缺失值的处理方式。单击Save按纽,打开LinearRegression:Save对话框。选择需要保存的数据种类作为新变量存在数据编辑窗口。其中有预测值、残差,预测区间等。注释2:线性回归的假设理论(1)正态性假设:即所研究的变量均服从正态分布;(2)等方差假设:即各变量总体的方差是相等的;(3)独立性假设,即各变量之间是相互独立的;(4)残差项无自相关性,即误差项之间互不相关,Cov(ei,ej)=0注释3:线性回归模型的检验项目(1)回归系数的检验(t检验);(2)回归方程的检验(F检验);(3)拟合程度判定(可决系数R2);(4)D.W检验(残差项是否自相关);(5)共线性检验(多元线性回归);(6)残差图示分析(判断异方差性和残差序列自相关)。实验内容3:非线性回归上面介绍了线性回归模型的分析和检验方法。如果某对变量数据的散点图不是直线,而是某种曲线的形式时,可以利用曲线估计的方法为数据寻求一条合适的曲线,也可用变量代换的方法将曲线方程变为直线方程,用线性回归模型进行分析和预测。任务导向根据“年人均消费支出和教育”数据文件,试以人均消费性支出为解释变量,教育支出作为被解释变量,拟合用一条合适的函数曲线。解:首先根据上表建立数据SY-10,作出人均消费支出与教育支出的散点图3.14如下:由上面图形可以看出,两个变量的散点图为增长的曲线形式,故选择合适的函数进行曲线估计。实验步骤步骤1:打开“年人均消费支出和教育”数据文件,选择菜单“Analyze®Regression®CurveEstimation”,打开CurveEstimation对话框。步骤2:选择教育支出和年人均消费性支出分别移入解释变量Dependent(s)框中和被解释变量Independent框中。步骤3:选择估计曲线,本例选择Quadratic(二次曲线),Power(幂函数曲线)和Compound(复合曲线)进行对比分析,最后选择最下方的方差分析表(DisplayANOVAtable),单击“OK”得到输出结果。Quadratic(二次曲线)拟合结果如下:Power(幂函数曲线)拟合结果如下:Compound(复合曲线)拟合结果如下:三条曲线拟合效果图如下:从上面的输出结果可以看出,比较各种估计模型的样本决定系数、估计标准误差和F值,拟合程度最好的复合函数曲线,并且其模型的回归系数的检验也通过。故可以选择复合函数曲线作为拟合曲线,其回归方程为:注释:步骤1的对话框中SPSS提供了多种曲线方程,其含义如下表:函数名称方程形式相应的线性回归方程Linear线性函数Quadratic二次多项式Compound复合模型Growth生长曲线Logarithmic对数函数Cubic三次多项式SS曲线Exponential指数函数Inverse逆函数Power幂函数Logistic逻辑曲线实验七时间序列分析的SPSS过程实验目的掌握时间序列的线图绘制掌握时间序列的自相关图绘制掌握时间序列的季节变动分析实验内容1:时间序列的线图绘制任务导向根据“零售量”数据文件,绘制1979至1982年度汗衫背心的零售量月份数据序列图。实验步骤步骤1:定义时间序列:打开“零售量”数据文件,将数据按时间顺序排列,选择菜单“Date®DefineDate”,打开DefineDates对话框。然后从左框中选择合适的时间表示方法,并且在右边时间框内定义起始点,单击“OK”。步骤2:选择菜单“GraphsLine”,打开LineCharts对话框。从中选择Simple单线图,从DateinChartAre栏中选择Valuesofindividualcases,即输出的线图中横坐标显示变量中按照时间顺序排列的个体序列号,纵坐标显示时间序列的变量数据。步骤3:单击“Define”按钮,打开对话框,选择分析变量“零售量”进入“LineRepresent”,在“CategoryLabels”类别标签(横坐标)中选择Casenumber数据个数(或变量Variable),单击Title按纽可以添加标题。步骤4:点击“OK”可得到线图如下所示。实验内容2:时间序列自相关图绘制多数经济现象具有滞后性的特点,而自相关图能够刻画经济的滞后现象,对经济问题的分析和预测起到重要的作用。任务导向根据“零售量”数据文件,绘制1979至1982年度汗衫背心的零售量月份数据自相关图,进行自相关分析。实验步骤步骤1:打开“零售量”数据文件,选择菜单“Gragh→TimeSeries→Autocorrelation”,打开Autocorrelations对话框.步骤2:在左边框内选择要显示的变量进入右边Variables对话框;从Display栏中选择自相关图(Autocorrelations)和偏自相关图(Partialautocorrelations)。注释:如果需要对时间序列进行变换,则要从Transform栏中选择对变量的的变换方式:Naturallogtransform自然对数变换,Differfence差分(确定差分阶数),Seasonallydifference季节差分(确定差分阶数);步骤3:单击“Options”按钮,弹出Options对话框中,在MaximumNumberofLags参数框中选择最大滞后数值,默认值是16。这里选择默认值,然后单击“OK”,得到自相关图和偏相关图如下所示。从上面的两个图形中都可以看出,这个时间序列具有很强的季节性。偏自相关图反映出这个时间序列不是平稳的时间序列,有一定的趋势性。通过时间序列的线图和自相关图后,可以根据时间序列的变动趋势和季节性的特点进行季节分解,分析季节因素的影响程度。实验内容3:时间序列的季节变动分析任务导向基于前面的分析,对“销售量”数据进行季节变动分析实验步骤步骤1:打开“零售量”数据文件,选择菜单“Analyze®TimeSeries®SeasonalDecomposition”,打开SeasonalDecomposition对话框。步骤2:从左边框中选择待分解处理的变量进入Variable框内,并在Model栏中选择模型类型。有乘法模型(Multiplicative)和加法模型(Additive)两种。本例中选择乘法模型。步骤3:在MovingAverageWeight栏中,选择移动平均处理方法,一般当时距n为奇数时选择Allpointsequal;当n为偶数时选择Endpointsweightedby.5。步骤4:单击Save按纽,打开Save对话框,选择是否创建新的变量。新创建的时间序列有:季节指数、调整后的序列值、平滑值及不规则变动。单击OK得到输出结果如下表所示。简单的输出结果只显示季节指数。注释1:季节分解的目的是根据季节指数进行季节调整,消除季节因素的影响,并通过调整前后的指标数据的比较,确定季节因素的影响程度,为预测决策提供科学依据。所以在步骤1中的对话框中,如果选择左下方的Displaycasewiselisting,可以在输出窗口观察计算过程,其中包括移动平均的结果,季节指数的生成过程,序列成分分解过程。否则只输出简单的季节指数。下表中给出了季节分解和调整过程的部分数据。上表第1列是序号,第2列是变量值,第3列是时距为12个月的移动平均值,第4列是变量的观察值与移动平均值的比值的百分数,第5列是季节指数,第6列是季节调整值,第7列是平滑值,第8列是不规则变量。注释2:SPSS时间序列分析菜单“Analyze

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论