统计分析的SPSS应用实验教案_第1页
统计分析的SPSS应用实验教案_第2页
统计分析的SPSS应用实验教案_第3页
统计分析的SPSS应用实验教案_第4页
统计分析的SPSS应用实验教案_第5页
已阅读5页,还剩105页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

(实验教案)《统计分析的SPSS应用》实验教学大纲 2实验一SPSS数据文件的建立与编辑 3实验目的 3实验内容1:认知SPSS 3实验任务 3实验步骤 3实验内容2:数据文件的建立 5任务导向 5实验步骤 6实验内容3:在SPSS中打开Excel数据文件 9任务导向 9实验步骤 9 实验目的 实验内容1:数据排序 任务导向 实验步骤 实验内容2:变量计算 任务导向 实验步骤 实验内容3:数据分组 任务导向 实验步骤 实验内容3:数据选取 任务导向 实验步骤 实验三SPSS统计数据的频数分析 实验目的 实验内容1:单变量值的频数分析 实验步骤 实验内容2:多选题的频数分析 任务导向 实验步骤 实验内容3:交叉分组下的频数分析 任务导向 实验步骤 实验目的 实验内容1:基本描述统计量的计算 任务导向 实验步骤 实验内容2:绘制各种统计图 任务导向 实验步骤 实验五假设检验的SPSS过程 实验目的 实验内容1:单样本T检验 任务导向 实验步骤 实验内容2:两独立样本T检验 任务导向 实验步骤 实验内容3:两匹配样本T检验 任务导向 实验步骤 实验六相关与回归分析的SPSS过程 实验目的 实验内容1:相关分析 任务导向 实验步骤 实验内容2:线性回归分析 任务导向 实验步骤 实验内容3:非线性回归 任务导向 实验步骤 实验七时间序列分析的SPSS过程 实验目的 实验内容1:时间序列的线图绘制 任务导向 实验步骤 实验内容2:时间序列自相关图绘制 任务导向 实验步骤 实验内容3:时间序列的季节变动分析 任务导向 实验步骤 实验八方差分析的SPSS过程 实验目的 实验内容1:单因素方差分析 任务导向 实验步骤 实验内容2:双因素方差分析 任务导向 实验步骤 课程名称:统计学实验课名称:统计分析的SPSS应用实验项目及摘要:序号实验名称必做/选做课时数实验一SPSS数据文件的建立与编辑必做2实验二SPSS统计数据的预处理必做2实验三SPSS统计数据的频数分析必做2实验四SPSS描述性统计分析必做2实验五假设检验的SPSS过程必做2实验六相关与回归分析的SPSS过程必做2实验七时间序列分析的SPSS过程必做2实验八方差分析的SPSS过程选做2实验一SPSS数据文件的建立与编辑>掌握SPSS数据文件的建立>掌握多项选择题的变量定义>掌握SPSS数据文件的编辑实验内容1:认知SPSS实验任务打开SPSS软件,并了解其窗口结构。实验步骤步骤1:打开SPSS软件。双击SPSS桌面图标后,计算机屏幕上出现一个对话框,如图所示:Whatwouldyouliketodo?-C:\Usersastra\Desktop\1.savCOpenanothertypeoffileDontshowthisdialoginthefuture对话框包括一个六选一单选对话框和一个复选对话框,其内容为:●Typeindata输入数据选项,建立新的数据集时可选择此项;●Runanexistingquery运行一个已经存在的数据文件选项;●CreatenewqueryusingDatabaseWizard用数据库处理工具建立新文件;●Openanexistingdatesource打开一个已经存在的数据文件;●Openanothertypeoffile打开其他类型的文件。●Don'tshowthisdialoginthefuture下次启动SPSS时将不会显示对话框。这里直接点击“Cancel”按钮即可。步骤2:认知SPSS主窗口。标尽栏标尽栏当前数据栏标题栏菜单栏工具栏数据输入区数据编辑区EileEditYienDataIransforn&nalyreGraphsItilitiesYindowHelpvarvarvarvar|VAR00001|VAR00002]varvarvarvarvar45四2Data开始Vier(VarlableVley7SPSSProcessorisready实验内容2:数据文件的建立任务导向以下是某问卷的部分内容,并假设你手头上有3份调查问卷的答案,需要你将它们录入1、你的性别是()3、你的专业是()4、你对目前的住宿条件满意程度是()5、你认为大学期间应培养哪些能力(限选三个)()(1)A,172,B,B,ACG(2)A,168,C,B,BCF(3)B,164,A,C,DEF实验步骤数据录入包括两个基本步骤:定义变量和数据录入。这里先讲前4题的变量定义和数据录入,然后单独讲解多选题的变量定义和数据录入,最后将数据文件保存。一、前4题的变量定义和数据录入步骤步骤1:步骤2:Untitled-SPSSDataEditor回×FileEditViewDataTransformAnalyzeGraphsUtilitiesWindowHelp国NameTypeWidthDecimalsLabelValuesMissing1Numeric82性别{1.00,男}…None82Numeric82身高NoneNone8Numeric82专亚{1.00,金融None84Numeric82住宿条件满意度{1.00.非常满None85678]9SPSSProcessorisready注释1:Type:变量类型。最常用的是Numeric数值型变量。Decimals:小数点后位数。Label:变量标签。关于变量涵义的详细说明。Values:变量值标签。关于变量各个取值的涵义说明。Missing:缺失值的处理方式。Columns:变量在DateView中所显示的列宽(默认列宽为8)。Align:数据对齐格式(默认为右对齐)。Measure:数据的测度方式(默认为等间距尺度)。注释2:Values:变量值标签的定义方法,以第3题为例,点击values栏中的按钮,在弹出窗口Untitled-SPSSDataEditor回×FileEditViewDataTransformAnalyzeGraphsUtilitiesWindowHelpNameTypeWidthDecimalsLabelValuesMissing1Numeric82性别{1.00,男].None82Numeric82身高NoneNone83Numeric82专亚{1.00,金融None84Numeric82住宿条件满意度{1.00.非常满None85ValueLabels?X67Value:AddChangeRemoves8Cancel9Help1.00=“金融”2.00=“会计”3.00=“工商”4.00=“国贸”SPSSProcessorisready步骤3:在“DataView”中录入3份问卷的答案。FileEditViewDataTransformAnalyzeGraphsUtilitiesWindowHelp4:x4varvar23456789 SPSSProcessorisready二、第5题多选题的变量定义和数据录入方法多项选择题的变量定义方法有两种,一是二分法,二是分类法。二分法的做法是:有多少个备选项就定义多少个变量,每个变量的取值只有0和1两个,0代表该选项未被选择,1代表该选项被选择了。分类法的做法是:先确定每道题最多选项个数,然后根据最多选项数确定变量个数,每个变量的取值范围为候选项个数。本例采用分类法来定义变量。步骤1:在“variableview”窗口中定义变量。Untitled-SPSSDataEditorFileEditViewDataTransformAnalyzeGraphsUtilitiesWindowHelpNameTypeWidthDecimalsLabelValuesMissing11Numeric82性别{1.00,男)None822Numeric82身高NoneNone83Numeric82专亚{1.00.金融None84Numeric82住宿条件满意度{1.00.E常满None855Numeric82大学注重的能力1{1.00.学习能None866Numeric82大学注重的能力2{1.00.学习能None877Numeric82大学注重的能力3{1.00.学习能None88899…注释1:由于第5题限选3个,因此按分类法应定义3个变量。若采用二分法,该题共8个选项,则应该定义8个变量。注释2:Values变量值标签的定义如下:Add100=“学习能力”2.00=“组织能力”3.00=“交际能力”4.00=”写作能力”5.00=“运动能力”步骤2:在“DataView”中继续录入这3份问卷第5题的数据答案。FileEditViewDataTransformAnalyzeGraphsUtilitiesWindowHelp四4:x5c1122334455778899步骤3:保存数据文件,并命名为“临时.sav”选择菜单“File—>Save”,在对话框中找到需要保存的位置,并在文件名中输入“临时”,实验内容3:在SPSS中打开Excel数据文件任务导向在SPSS中打开“多元回归-Book1.xls”的Excel文件实验步骤步骤1:选择菜单“File—>Open—>Data”,弹出“OpenFile”对话框。在查找范围中找到“多元线性回归.xls”所在位置,在“文件类型”框中下拉菜单栏选择Excel(*xls),然后在主窗口中单击“多元回归-Book1”。&&图▼2003/9/1920:00库用Excel(*.xls)盖单击“打开”,弹出如下对话框,在“Worksheet”框中选择Excel数据区域,√Readvariablenamesfromthefirstrowofdata.Worksheet:Sheetl[A1:F30RangeMaximumwidthforstringcolumns:32767OKCancelHelp步骤3:点击“OK”,SPSS数据视图窗口中就打开了“多元回归-Book1”中的数据。Untitled-SPSSDataEditor回×FileEditViewDataTransformAnalyze可下片用UtilitiesWindowHelg分行编号亿元)各项贷款应收贷款亿元贷款项目本年固定资产投资115223445661VariableView40747SPSSProcessorisreadcendingcending实验二SPSS统计数据的预处理>掌握数据排序方法>掌握变量计算方法>掌握数据分组方法>掌握数据选取方法实验内容1:数据排序任务导向在“职工数据”文件中,以职称为主排序变量进行降序,以“基本工资”为第二排序变量升序进行多重排序。实验步骤步骤1:打开“职工数据”文件,选择菜单“Data—>SortCase”。步骤2:将主排序变量指定到“Sortby”窗口中,并在“SortOrder”中选择“Descending”。#文化程度M]CAscendin×Cancel步骤3:将第二排序变量指定到“Sortby”窗口中,并在“SortOrder”中选择“Ascending”,4年职称[zc]-Descending#基本工资[sr]-AscendingAscending×Cancel实验内容2:变量计算在职工数据文件中,新建一个变量实发工资,实发工资等于基本工资减去失业保险后,依据职称1-4等级分别上浮20%、15%、10%和5%。步骤1:打开“职工数据”文件,选择菜单“Transform—>Compute”。步骤2:点击左下角“if”按钮。选择“Includeifcasesatisfiescondition”并在下面框框中输入“zc=1”,点击“continue”,返回上一窗口中,并点击“OK”。ComputeComputeVariableXType&Label…职称[zc]参文化程度网]Spelf..zc=1OKPasteResetCancelHelpFunctiongroupAllArthmeticCDF&NoncentralCDFConversionCumentDate/TimeDateArithmeticDateCreationTargetVaniable:步骤3:以上完成了职称等级等于1时实发工资的变量计算,职称等于2~4时的操作方法类似。变量计算的形式有很多,在“Functiongroup”中提供了非常丰富的计算函数。主要的Exp(算术表达式)求e的若干次幂Sd求标准差Variance求方差Sum求总和Cfar求变异系数实验内容3:数据分组任务导向面积进行分组,共分5组,分别是:10以下,10~20,20~30,30~50,50以上。实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Transform—>Recode—>IntoDifferentVariables"。步骤2:在变量名列表中选择“人均面积”变量,使之添加到“Numericvariable—>Outputvariable”框中,同时在“outputvariable”下“Name”框中输入新变量名“人均面积分组”,单击“Change”确认。VariablesVariablesNumericVarable>OutputVariable:#年龄我文化程度婚姻我常住人口#户口状况#家庭收入房屋产权我住房满意#计划面积我计划户型地理位罢人均面积分组f(optionalcaseselectioncondition)OKPasteResetCancelHelp步骤3:点击“0ldandNewValues”按钮,弹出如下对话框。在“0ldValues”中输入人均面积原始范围值,在“NewValue”下输入新的变量值,并点击“Add”。依次输入各组的新旧值后,点击“Continue”返回上一窗口,点击“OK”。步骤1:-NewValueCCopyoldvalue(s)CSystem-oruser-missingthroughLowestthroughthroughhighestCAllothervaluesRemove50thruHighest->5OutputvaniablesarestringsWidth8ConveitnumericstringstonumberContinueCancel-OldValue-CValue:CSystem-missingOld->New:Add注释1:在上面的对话框中,左边需要确定原变量值范围,设置项依次是:System-orusermissing:以系统或用户指定的缺失值为清点对象;Range:指定原变量的数值区域:其中包括:()through(lowestthrough():在框内只指定上限;注释2:在10以下的用新变量值1代替,原变量值在10~20之间用新变量值2来代替,依此类推。注释3:IntoSameVariables:数据编码后新的码值直接放到原来的变量中;IntoDifferentVariables:数据编码后新的码值存到一个新变量中。为了避免数据实验内容3:数据选取任务导向在“住房状况调查”数据文件中,(1)选择本市户口的住房样本;(2)随机选择全部样本的40%的数据。实验步骤(1)选择本市户口的住房样本打开“住房状况调查”数据文件,选择菜单“Data—>步骤2:RandomsampleofcasesCUsefitervariable▶UnselectedCasesAre非从业状况#常住人口#现住面积#人均面积#房屋产权我未来三年nCurentStatus:Donotfitercases0KPasteResetCa步骤3:步骤3:点击“if”按钮,在新对话框中,在右边框中输入“户口状况=1”。点击“Continue”返回上一窗口中,点击“OK”确认。SelectCases:If#文化程度我从业状况#家庭收入(2)随机选择全部样本的40%的数据。步骤1:同上。步骤2:选择“RandomSampleofcases”,并点击“Sample”。ABSnumexpr)ANYtest,value,value.…)ARSIN(numexpr)ARTAN(numexpr)CDFNORM(zvalue)CDF.BERNOULLI(q.p)+ContinueCancel步骤3:在新对话框中选择“Approximately”,上一窗口中,点击“OK”确认。并在后面框中输入40。点击“Continue”返回X#文化程度#从业状况Sample…BasedontimeorcaseranContinueCancel×cases在上对话框的Select栏中选择挑选数据子集的方式(单选):●Al1case:选择所有数据;●Ifconditionissatisfied:按指定条件选择数据。●RandomSampleofcases:对观察值进行随机抽样。●Basedontimeorcaserange:对某一区间进行抽样。●Usefiltervariable:用指定变量作过滤。先选择一个变量,系统自动在数据管理器中将该变量值为0的观测单位标上删除记号,系统对标有删除记号的观测单位不作分析。实验三SPSS统计数据的频数分析>掌握单变量值的频数分析>掌握多选题的频数分析>掌握交叉分组下的频数分析实验内容1:单变量值的频数分析在“住房状况调查”数据文件中,分析被调查家庭中户主的从业状况及文化程度情况,并编制频数分布表。步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze—>DescriptiveStatistics—>步骤2:将“从业状况”和“文化程度”移入右侧Variable(s)列表框中,然后,选择位于小窗口下端的“Displayfrequencytables复选框”,以确定要输出频数分布表,点击“OK”。#所在区A#婚姻年常住人口#家庭收入√Displayfrequencytables年文化程度X4分析结果如下:从业状况文化程度从业状况CumulativePercent国营企业私营企业步骤2的对话窗口下方有三个按钮,分别是步骤2的对话窗口下方有三个按钮,分别是Statistics、Chart、Format。1、单击Statistics按钮,在新对话框中选择要求输出的统计量。PercentileValuesQuartilesPercentile(s):AddChangeDispersion-Std.deviationVarianceequalgroupsS.E.meanCentralTendencyContinueValuesaregroupmidpointsDistribution-SkewnessPercentileValues百分数选择项栏(复选项)Cutpointsequalgroups等分位点百分位数(取值范围在2100之间)。Percentile(s)自定义百分数。Stddeviation(标准差)、Variance(方差)、Range(极差)CentralTendency中心趋势栏Skewness(偏度系数)、Kurtosis(峰度系数)。2、单击Chart按钮,得到Frequencies:Chart对话框。●ChartType图形栏(单选),选择输出的图形类型。None不输出图形(系统默许)Barcharts条形图Withnormalcurve直方图中显示正态曲线(只有选择直方图时才能选择)。●ChartValues栏,选择图形Frequencies纵轴为频数,饼图中每块表示属于该组观测值频数;Percentage纵轴为百分比,饼图中每块表示该组的观测量数占总数的百分比。CErequenciesCPercentagesContinueC●CAscendingcountsCDescendingcountsMulipleVariablesx0Orderby排序栏,表示频数分布表的排列顺序。(单选)AscendingDescendingAscendingDescendingvalues按变量值升序排列(系统默许)。values按变量值降序排列。counts按变量各种取值发生的频数升序排列。counts按变量各种取值发生的频数降序排列。实验内容2:多选题的频数分析在“保险市场调查中”数据文件中,对第13题“购买商业养老保险的原因”的各选项出现的频数频率进行分析。多选题的频数分析包括两个步骤,一是定义多选题的变量集;二是多选题的频数分析。步骤1:打开“保险市场调查”数据文件。步骤2:定义多选题变量集合。选择菜单“Analyze—>MultipleResponse—>Define变量移入“VariablesinSet”中,在“VariablesAreCodedAs”中选择“Categories”,输入多选题变量值范围1到7,在Name中定义变量集合名称为“第13题”,并“Label”中注明其标签“购买商业养老保险的原因”,点击“Add”后,点“Close”关闭。XX#购买的商业养老作▲#购买养老保险的广#保费来源[q15]#领取养老金的年齿#每月领取养老金娄年对所购买养老VariablesAreCodedAsDichotomiesCountedvalue:CategoriesRange:|though74参AddChange步骤3:选择菜单“Analyze—>MultipleResponse—>Frequencies”,在新对话框中将左边“MultResponseSets”中的变量集合移到右边“Tablesfor:”中,点击“0K”。XX▶CancelMissingValuesExcludecaseslistwisewithindichotomiesExcludecaseslistwisewthincategoriesMultipleResponseFTable(s)for:$第13题FrequenciesResponsesPercent保险的原使晚年生活有保障一种安全的投资保值方式报着试试看的态度购买亲戚朋友推荐单位统一组织购买保险公司的宣传其他 分析结果中,N表示响应次数;Percent表示响应百分比,计算方法是响应次数除以总响应数;PercentofCases也表示响应百分比,其计算方法响应次数除以样本数。实验内容3:交叉分组下的频数分析任务导向根据“住房问卷调查”数据,分析户口状况和未来三年是否打算买房的交叉分组情况,并编制交叉分组的频数分布表。实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze—>DescriptiveStatistics—>步骤2:在Crosstabs对话框中,将“文化程度”移入行变量“Row(s)”中,将“未来三年”移入列变量“Column(s)”中。#年龄户口状况#人均面积#计划户型SuppresstablesCancel年文化程度▶Column(s):#未来三年步骤3:点击“Cells”按钮,选择“Observed”、“Row”、“Column”、“Total”返回上一窗口,点“OK”确定。CTnuncatecellcountsUnstandardizedAdjustedstandardizedCTnuncatecaseweightsCounts未来三年Total不买购买文化程度初中及以下Count%within文化程度%within未来三年%ofTotal 高中(中专)Count%within文化程度%within未来三年%ofTotal42.0%43.0%42.2%42.2%大学(专、本科)Count%within文化程度%within未来三年%ofTotal 研究生及以上Count%within文化程度%within未来三年%ofTotal45.2%TotalCount%within文化程度%within未来三年%ofTotal 交叉列联表分析的的两大基本任务,交叉列联表分析的的两大基本任务,一是编制交叉分组频数分布表,二是在列联表基础上,对两两变量是否存在一定的相关性进行分析。后者的基本操作是单击“Statistics”按钮,在新对话框中选择“Chi-Square”统计量。Crosstabs;StatisticsX-Nominal—-Ordinal-CancelContingencycoefficient厂GammaPhiandCramér'sVLambdaKendall'staubUncertaintycoefficientKendall'stau-c-NominalbyIntervalKaMcNemar厂Cochran'sandMantel-HaenszelstatisticsTestcommonoddsratioequals实验四SPSS描述统计分析实验目的>掌握基本描述统计量的计算>掌握几种常见统计图的绘制实验内容1:基本描述统计量的计算根据“住房状况调查”数据文件,对人均住房面积计算基本描述统计量。基本描述统计量的计算方法很多,常见的有两种,一种是在频数分析时单击“Statistics”按钮,选择各种描述统计量;一种是在描述统计中计算各描述统计量。第一种方法参见实验三的实验内容1,这里仅对第二种方法进行讲解。步骤1:打开“住房状况调查”数据文件,选择菜单“Analyze—>DescriptiveStatistics—>步骤2:在Descriptive对话框中将“人均面积”移入Variable(s)列表框中。我户口状况#现住面积#房屋产权#住房满意x步骤3:点击右下角的“Options”按钮,将需要计算的各描述统计量选上后,点“Continue”,XXDispersionVarianceDistnbution厂√V厂S.E.meanSkewnessCAphabetioCAscendingmeansContinueCancel如果需要计算各个案所对应的标准分数值,只需在步骤2对话框中选择左下角“Save实验内容2:绘制各种统计图任务导向分类,最后计算各种类别人员的平均家庭收入水平并绘制分类条形图。根据“住房状况调查”数据文件,想通过饼形图(PieChars)来了解文化程度在总人实验步骤步骤1:打开“住房状况调查”数据文件,选择菜单“Graphs—>Bar”。步骤2:在打开BarCharts(条形图)选择对话框中,选择Clustered,并在“DatainChartAre”00住房状况调查,sav-SPSSDataEditorFileEditViewDataTransformAnalyzeGraphsUtilitiesWindowHelp自1:编码21373编码所在区性别年龄婚姻122BarChartsX3DefineSimpleCancel45642576usteredHelpStacked789DatainChartAreCValuesofindividua210420CΩVariableVi40n0.0022nnSPSSProcessorisready步骤3:中;在CategoryAxis输入横坐标轴上的分组变量“文化程度”;在DefineClustersby中输入第二次分类的变量“性别”,点击“OK”。DefineClusteredBar:SummariesforGroupsofCases年编码年年龄我常住人口希现住面积年人均面积我未来三年我计划面积我计划户型希购买类型#地理位置是否贷款年分组后的人均面积[m%ofcases%ofcasesOtherstatistic(e.g..mean)Variable:CategoryAxis:▶Nestvariables(noemptyrowslColumns:XCancel▶WWean家庭收入男女绘制图形结果如下:性别■注释1:步骤2中对话框说明。条形图形状的选择一条形图图标说明Simple:将各类别数值用平行且等宽的条形简单地并列在一起的图形。Clustered:有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类,并用两个以上的条形图并列来分别表示。Stacked(分段条形图):有两种以上分类的数据显示方式,首先将数据分为第一类,然后各类数据再进一步细分为第二类。作图时,以条形的全长代表分成的第一大类别,条形内部各段的长短代表第二类别的组成部分,各段之间是用不同的线条或颜色表示。计算数据统计量的方式选择一DatainChartAreSummariesforgroupsofcases:先对所有数据分类,然后对每类创建条形图Summariesofseparatevariables:对每个变量创建条形图Valuesofindividualcases:对每个数据创建条形图注释2:步骤3中条形图变量及参数选择●CategoryAxis:表示坐标轴上的分组变量(第一次分类的变量)。●DefineClustersby:第二次分类的变量●BarsRepresent:确定条形图所显示的数值。有如下选项可供选择:Nofcases:显示总的观测值数%ofcases:分组个数所占的比例Cumulativenofcases:累计频数(按个数统计)Cumulative%ofcases:累计频率(按比例统计)步骤1:SummariesforgroupsofcasesCancelCSummaniesofseparatevariablesCValuesofindividualcasesDefinePie:SummariesforGroupsofCases我编码所在区我性别参从业状况EE户口状况金家庭收入#现住面积房屋产权住房满意未来三年计划户型地理位置购房价位我是否贷款TemplateC%ofcasesC%ofcasesVariable#文化程度Panelby▶▶Nestvariables[noemptycolumns]Usechartspecficationsfrom:×Ttles.文化程度文化程度国高中(中专)□大学(专、本科)■研究生及以上步骤3:双击输出结果中的饼图,在图形编辑器中选择菜单“Elements—>Showdatalabels”,在Properties对话框中,将“NotDisplayed”中的“文化程度”移入“Displayed”框中,点击“Close”。ChartSize|Text|Fill文化程度个SuppressoverlappinglabelsMatchlabelcolortodataelementApplyCAutomatic×&Border|Categories(1得出最终的饼图效果如下:高中(中专)大学(专、本科)研究生及以上26.9%大学(专、本科)42.03%Bar选项可以生成简单条形图、分组条形图和分段条形图。Line选项可以生成单线图、多线图和垂线图。Area选项可以生成简单面积图和堆栈面积图。Pie选项可以生成单圆图。High-Low选项可以生成高-低-收盘图、极差图和距限图。Pareto选项可以生成排列图或Pareto帕雷托图。Control选项可以生成最常见的工序控制图。Boxplot选项可以生成探查数据的箱线图。ErrorBar选项可以生成探查数据的误差条图。Scatter选项可以生成简单散点图、重叠散点图、矩阵散点图和三维散点图。Histogram选项可以生成直方图。NormalP-P选项可以生成变量分布的分位数对正态分布的分位数的图形。NormalQ-Q选项可以生成变量分布的分位数对正态分布的分位数的图形。Sequence选项可以生成变量分布分位数对正态分布分位数的图形。TimeSeries选项可以生成自相关图、偏相关图和互相关图。实验五假设检验的SPSS过程>掌握单样本T检验方法>掌握两独立样本T检验方法>掌握两匹配样本T检验方法实验内容1:单样本T检验单样本t检验是检验单个变量的均值是否与假定的均数之间存在差异。如将单个变量的样本均值与假定的常数相比较,通过检验得出预先的假设是否正确的结论。任务导向根据“住房状况调查”数据,检验总体的家庭人均住房面积的平均值是否为20平方米。解:假设检验首先是确定原假设和备择假设,这里原假设和备择假设确定如下:H₀:总体家庭人均住房面积为20平方米H₁:总体家庭人均住房面积不等于20平方米实验步骤步骤1:步骤2:在One-SampleTTest主对话框中,将“人均面积”变量移入“TestVariable(s)”中,在“TestValue:”框中输入检验值20。#文化程度#常住人口户口状况#家庭收入我住房满意CancelOptions希人均面积TestValue:204步骤3:点击“Options”按钮,在“Confidenceinterval”中输入“95%”(本例中显著性水平a取0.05)。然后点击“Continue”返回主对话框,点击“OK”确定。MissingValuesContinue士匀其中第一个表“One-SampleStatistics”表是人均面积的基本统计量表,第二个表“One-SampleTest”表是假设检验结果表。从第二个表我们可知:检验统计量t值是8.640,自由度df是2992,假设检验的P值(sig.)小于0.05,因此我们得出拒绝原假设的结论,即家庭人均住房面积的总体均值不等于20平方米。注释1:假设检验的决策方法有两种:临界值法和P值法,运用SPSS软件我们通常采用P值法做决策,其决策原理是:若P值>显著性水平a,则拒绝原假设;若P值<显著性水平α,注释2:intervaloftheDifference”下的两列表示总体均值与检验值之差的95%的置信区间。实验内容2:两独立样本T检验两独立样本T检验是检验两个没有联系的总体样本均值间是否存在显著的差异,两个没有联系的总体样本也称独立样本。如两个无联系的企业生产的同样产品之间的某项指标的均值的比较,不同地区的儿童身高、体重的比较等,都可以通过抽取样本检验两个总体的均值任务导向根据“住房状况调查”数据文件,推断本市户口总体和外地户口总体的家庭人均住房面解:由于本地户口家庭的人均面积对外地户口家庭的人均面积是无影响的,因此这两个样本是相互独立的。可以应用两独立样本的假设检验。建立假设如下:H₀:本地户口与外地户口家庭的人均面积没有显著差异;H₁:本地户口与外地户口家庭的人均面积存在显著差异。实验步骤步骤1:Independent-sampleTTest”,打开Independent-sampleTTest主对话框。性别#文化程度我常住人口#现住面积#房屋产权#住房满意#>未来三年户口状况2?#人均面积DK步骤2:选择要检验的变量“人均面积”进入检验框中。步骤3:选择分组变量“性别”进入分组变量框中,然后单击“DefineGroup”按纽,打开分组对话框,在Group1中输入分组值1,在Group2中输入分组值2(由于户口状况变量的取值分别是1和2),然后点击“Continue”返回主对话框,点击“OK”确定。UsespecifiedvaluesContinue输出结果如下:夕卜地t2-tailegMeani5%ConfidencDifferenceUpper人均正EqualvariGroupStatistics表是基本统计量表,IndependentSampleTest表是检验结果表。后者的第二列和第三列是检验两样本数据的方差是否相等,从检验结果得知两样本的方差有显著性差异。从第四列开始是对两个样本的均值的是否相等进行检验。从假设检验的Sig值(P值)看出,它小于显著性水平0.05,因此拒绝原假设H0,所以说本地户口和外地户口之间的家庭人均面积有显著差异。而第七列之后分别是均值差、均值差标准误、均值差的置信区间。注释1:两独立样本T检验的基本思路是:首先根据F检验来判断两总体方差是否相等,即方差齐性次检验。然后再根据方差齐性次检验结果来选择两独立样本T检验的方法。注释2:方差齐性次检验结果是IndependentSampleTest表的第二和第三列,该检验的原假设是两总体方差相等,备择假设是两总体方差不相等。注释3:IndependentSampleTest表中第一列,“EqualVarianceAssumed”表示两总体方差相等,在方差齐性次检验中若不拒绝原假设,两独立样本T检验结果查看这行。“EqualVarianceNotAssumed”表示两总体方差不相等,若在方差齐性次检验中拒绝原假设,则选择该行作为两独立样本T检验的结果。注释4:在步骤3中,若分组變量取值多于2个的,则是可以在“CutPoint”中输入一个数字,大于等于该值为一总体,小于该值为一总体。实验内容3:两匹配样本T检验两匹配样本T检验是检验两个有联系正态总体的均值是否存在显著的差异。又称配对样本的T检验。如检验某种药品使用的效果是否显著,需要对使用者使用前后进行比较;再如对某电子计时器准确度效果进行检验,采用同一批志愿者分别用手工计时器和电子计时器测量他们的跑步成绩以进行比较等。任务导向根据“减肥茶数据”文件,为研究某种减肥茶是否具有明显的减肥效果,某美体健身机构对35名肥胖志愿者进行跟踪调查,记录了他们喝茶前后的体重数据,推断减肥茶是否具有解:本例中是对同一实验对象的喝茶前后的数据进行比较,这显然是配对样本均值的假设检验的问题。所以要建立假设:H0:喝茶前后的体重没有显著差异H1:喝茶前后的体重有显著差异实验步骤步骤1:打开Paired-SampleTTest主对话框。XXCumentSelectionsVanable2:)喝茶前体重hcq]Options.4步骤2:选择要检验的两变量进入“PairedVariables”检验框中。注意:一定要同时选择两个变量进入检验框内,否则将无法得到检验结果。点击“OK”确定,得输出结果如下。由上表的检验结果知,假设检验的P值小于0.05,故拒绝假设Ho,因此可以得出喝茶前后的体重差异是显著的,认为减肥茶的效果是显著的。两独立样本T检验和两匹配样本T检验的数据结构不同。两独立样本T检验中涉及两个变实验六相关与回归分析的SPSS过程>掌握相关系数计算和检验的SPSS分析>掌握线性回归方程的确定和各种检验的SPSS分析>掌握几种典型的非线性回归方程确定的SPSS分析实验内容1:相关分析任务导向根据“住房状况调查”数据,绘制家庭收入、计划面积的散点图,计算它们之间的相关系数并予以检验。实验步骤步骤1:打开打开“住房状况调查”数据文件,选择菜单“Analyze→Correlate→Bivariate”,打开#现住面积我人均面积#房屋产权#未来三年弗购买类型》地理位罢Variables:#计划面积《CorelationCoefficients√Pearson厂KeTestofSignificanceTwotailedCOnetailed☑FlagsignificantcorelPasteX步骤2:从左边的变量框中选择需要考察的“家庭收入”和“计划面积”进入“Variables”框内;从CorrelationCoefficients栏内选择相关系数的种类,这里选择Pearson相关系数;从“TestofSignificance”栏内选择“Two-tailed”双尾检验方式。步骤3:单击Options按纽,选择输出项和缺失值的处理方式。本例中选择输出基本统计描述量,如下图所示。BivariateCorrelatio☑Meansandstandarddeviations「CrossproductdeviationsandcovaniancesMissingValuesCExcludecaseslistwise×Continue步骤4:单击“Continue”返回主窗口,单击“OK”可以得到相关分析的结果。Correlations家庭收入计划面积家庭收入PearsonCorrelationSig.(2-tailed)N1计划面积PearsonCorrelationSig.(2-tailed)N1*.Correlationissignificantatthe0.01level(2-tailed).“DescriptiveStatistics”表是两个变量的基本统计描述量,“Correlations”表是两变量的相关系数及对相关系数的检验结果。从“Correlations”表可知家庭收入和计划面积的相关系数是0.323,对相关系数检验的P值小于0.05,拒绝原假设(相关系数检验的原假设是两变量间不存在线性相关关系),说明两变量之间存在着显著的正线性相关关系。实验内容2:线性回归分析线性回归是统计分析方法中最常用的方法之一。如果所研究的现象有若干个影响因素,且这些因素对现象的综合影响是线性的,则可以使用线性回归的方法建立现象(因变量)与影响因素(自变量)之间的线性函数关系式。根据“银行贷款”数据文件,分析银行不良贷款受哪些因素的影响,要求确定多元线性回归方程,并进行各种检验。实验步骤步骤1:打开“银行贷款”数据文件,选择菜单“AnalyzeRegressionLinear”,打开Linear册分行编号#各项贷款余额(亿元我本年累计应收贷款(▶#不良贷款(亿元)不|#各项贷款余额(亿元)年本年累计应收贷款(亿参贷款项目个数(个)xCancelSelectionVariable:▶▶▶步骤2:从左边框中选择因变量“不良贷款”进入Dependent框内,选择其余四个自变量进入Independent框内。从Method框内下拉式菜单中选择Enter(强行进入法)回归分析方法。回归分析方法包括强行进入法(Enter),消去法(Remove),向前选择法(Forward),向后剔除法(Backward)及逐步回归法(Stepwise)五种。步骤3:点击“OK”确定,得到输出结果。主要的分析结果表格如下:ModelSummaryModelRAdjusted1该表中R表示自变量与因变量的复相关系数,RSquare表示判定系数,AdjustedRSquare表示修正的判定系数,Std.ErroroftheEstimate表示估计标准误差。本例中修正的判定系数为75.7%,说明模型拟合度较好。ANOVAbModelMeanSquareF4Residual该表为方差分析表,第一列的含义分别表示回归、残差、总计,第二列是离差平方和,第三列是自由度,第四列是均方差,第五列是回归方程显著性检验的F检验统计量值,最后一列是P值。本例中由于P值小于0.05,说明自變量与因變量之间线性关系显著。ModelUnstandardizedCoefficientsStandardizedCoefficientstBStd.ErrorBeta各项贷款余额(亿元)本年累计应收贷款(亿元)贷款项目个数本年固定资产投资额(亿元)-1.022-.029-.325-1.306-1.937标准化系数,第五列是回归系数显著性检验的t检验统计量值,第六列是回归系数显著性检验的P值。根据最后一列回归系数显著性检验的Sig值(P值),可以看出本年累计应收贷款、贷款项目个数和本年固定资产投资额三个自變量对不良贷款的线性影响不显著(由于P值大于0.05,不拒绝各回归系数等于0的原假设)。入法,这可能导致回归结果不准确。本例中本年累计产投资额三个自變量对不良贷款的线性影响不显著可能是由于存在多重共线性引起的。注释1:>單击Statistics,打开LinearRegression:Statistics对话框,选择输出的统计量。DescnptivesColineartydiagnosticsstandarddeviationsRegressionCoefficientsConfidenceintervalsCovarancematrx厂Durbin-WatsonContinue厂厂●RegressionCoefficients栏,回归系数选项栏。Estimates(系统默认):输出回归系数的相关统计量:包括回归系数,回归系数标准误、标准化回归系数、回归系数检验统计量(t值)及相应的检验统计量概率的P值(sig)。Confidenceintervals:输出每一个非标准化回归系数95%的置信区间。Covariancematrix:输出协方差矩阵。●与模型拟合及拟合效果有关的选择项。Modelfit:能够输出复相关系数R、R²及R²修正值,估计标准误差,方差分析表。Rsquaredchange:引入或剔除一Descriptives:Collinearity基本统计描述。Partialcorrelations:相关系数及偏相关系数。diagnostics:共线性诊断。主要对于多元回归模型,分析各自变量的之间的共线性的统计量:包括容忍度和方差膨胀因子、特征值,条件指数等。Casewisediagnostics:奇异值诊断,有两个选Outliersoutside()standarddeviations:奇异值判据,默认项标准差≥3。Allcase输出所有观测量的残差值。>单击Plots按纽,打开LinearRegression:Plots对话框,选择所需要的图形。xxY:X:StandardizedResidualPDEPENDNT"ZPRED*ZRESID*DRESID*ADJPRED*SRESID*SDRESIDContinue ●StandardizedResidualPlots栏,标准化残差图类型,Histogram:标准化残差直方图Normalprobabilityplot标准化残差序列的正态分布概率图.Produceallpartialplots依次绘制因变量和所有自变量的散布图SteppingMethodCntenaUseprobablityofFMissingValuesContinueX●SteppingMethodCriteria栏,设置变量引入或剔除模型的判别标UseprobabilityofF:采用F检验的概率为判别依据。UseFvalue:采用F值作为检验标准。变量存在数据编辑窗口。其中有预测值、残差,预测区间等。注释2:线性回归的假设理论(1)正态性假设:即所研究的变量均服从正态分布;(2)等方差假设:即各变量总体的方差是相等的;(3)独立性假设,即各变量之间是相互独立的;(4)残差项无自相关性,即误差项之间互不相关,Cov(e,ej)=0注释3:线性回归模型的检验项目(1)回归系数的检验(t检验);(2)回归方程的检验(F检验);(3)拟合程度判定(可决系数R²);教育支出(元)教育支出(元)(4)D.W检验(残差项是否自相关);(5)共线性检验(多元线性回归);(6)残差图示分析(判断异方差性和残差序列自相关)。实验内容3:非线性回归上面介绍了线性回归模型的分析和检验方法。如果某对变量数据的散点图不是直线,而换的方法将曲线方程变为直线方程,用线性回归模型进行分析和预测。任务导向解:首先根据上表建立数据SY-10,作出人均消费支出与教育支出的散点图3.14如下:年人均消费性支出(元)实验步骤打开“年人均消费支出和教育”数据文件,选择菜单“Analyze→Regression→CurveEstimation”,打开CurveEstimation对话框。√Quadratic√QuadraticGrowthEponentialLogarthmicDisplayANOVAtableDependentDependent(s):我教育支出K5]▶IndependentVariableTimeXCancel☑Includeconstantine●年份间#年人均可支配收入区1我恩格尔系数区3]#在外就餐K4]我人均使用面积k6]步骤2:选择教育支出和年人均消费性支出分别移入解释变量Dependent(s)框中和被解释变量步骤3:选择估计曲线,本例选择Quadratic(二次曲线),Power(幂函数曲线)和Compound(复合曲线)进行对比分析,最后选择最下方的方差分析表(DisplayANOVAtable),单击“OK”得到输出结果。Quadratic(二次曲线)拟合结果如下:RAdjusted45.707Theindependentvariableis年人均消费性支出MeanSquareFRegressionResidual2Theindependentvariableis年人均消费性支出UnstandardizedCoefficientsStandardizedCoefficientstBStd.ErrorBeta年人均消费性支出-.1482.46E-005-1.135-5.892RAdjustedTheindependentvariableis年人均消费性支出MeanSquareFRegressionResidual1Theindependentvariableis年人均消费性支出UnstandardizedCoefficientsStandardizedCoefficientstBStd.ErrorBetaIn(年人均消费性支出)Thedependentvariableisin(教育支出)Compound(复合曲线)拟合结果如下:RAdjustedTheindependentvariableis年人均消费性支出MeanSquareFRegressionResidual1Theindependentvariableis年人均消费性支出CoefficientsUnstandardizedCoefficientsStandardizedCoefficientstBStd.ErrorBeta年人均消费性支出Thedependentvariableisin(教育支出教育支出 年人均消费性支出从上面的输出结果可以看出,比较各种估计模型的样本决定系数R²、估计标准误差和F值,拟合程度最好的复合函数曲线,并且其模型的回归系数的检验也通过。故可以选y=20.995注释:步骤1的对话框中SPSS提供了多种曲线方程,其含义如下表:函数名称Linear线性函数Quadratic二次多项式Compound复合模型Growth生长曲线Logarithmic对数函数Cubic三次多项式Exponential指数函数Inverse逆函数Power幂函数Logistic逻辑曲线实验七时间序列分析的SPSS过程实验目的>掌握时间序列的线图绘制>掌握时间序列的自相关图绘制>掌握时间序列的季节变动分析实验内容1:时间序列的线图绘制根据“零售量”数据文件,绘制1979至1982年度汗衫背心的零售量月份数据序列图。实验步骤步骤1:定义时间序列:打开“零售量”数据文件,将数据按时间顺序排列,选择菜单“Date→DefineDate”,打开DefineDates对话框。然后从左框中选择合适的时间表示方法,并且在右边时间框内定义起始点,单击“OK”。CasesAre:YearsYears,quartersYears,monthsYears,quarters,monthsWeeks,daysWeeks,workdays(5)Weeks,workdays(6)Days,hoursDays,workhour(8)Cancel步骤2:选择菜单“Graphs→Line”,打开LineCharts对话框。从中选择Simple单线图,从DateinChartAre栏中选择Valuesofindividualcases,即输出的线图中横坐标显示变量中按照时间顺序排列的个体序列号,纵坐标显示时间序列的变量数据。0000SimpleCancelCSummaniesforgroupsofcasesCSummanesofseparatevarniablesValuesofindividualcases品步骤3:单击“Define”按钮,打开对话框,选择分析变量“零售量”进入“LineRepresent”,在“CategoryLabels”类别标签(横坐标)中选择Casenumber数据个数(或变量Variable),#YEAR,notpenodic#MONTH,period12ADATE.FORMAT:"MILineRepresents:CategoryLabelsCasenumberCVaniable▶▶Columns:▶TemplateUsechartspecificationsfrom:XCancelTitles.步骤4:点击“OK”可得到线图如下所示。实验内容2:时间序列自相关图绘制多数经济现象具有滞后性的特点,而自相关图能够刻画经济的滞后现象,对经济问题的分析和预测起到重要的作用。根据“零售量”数据文件,绘制1979至1982年度汗衫背心的零售量月份数据自相关图,进行自相关分析。步骤1:打开“零售量”数据文件,选择菜单“Gragh→TimeSeries→Autocorrelation”,打XX万件零售量]4CancelCumentPeriodicity:12√Autocorelations#Y

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论