第三章的基本统计分析_第1页
第三章的基本统计分析_第2页
第三章的基本统计分析_第3页
第三章的基本统计分析_第4页
第三章的基本统计分析_第5页
已阅读5页,还剩86页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章的基本统计分析第一页,共九十一页,2022年,8月28日基本统计分析通过基本统计分析,能够使分析者掌握数据的基本统计特征,把握数据的总体分布形态。基本统计分析的结论对今后进一步的数据建模,将起到重要的指导和参考作用频数分析计算基本描述统计量(分布特征测度)列联分析(交叉分组下的频数分析)多选项分析比率分析两种方式数值计算图形绘制第二页,共九十一页,2022年,8月28日基本统计分析在Analyze--DescriptiveStatistics菜单中,包括:Frequencies:频数分析过程,特色是产生频数表(主要针对分类变量)Descriptives:数据描述过程,进行一般性的统计描述(主要针对数值型变量)Explore:数据探察过程,用于对数据概况不清时的探索性分析Crosstabs:多维频数分布交叉表分析(列联表分析)Ratiostatistics:比率分析第三页,共九十一页,2022年,8月28日频数分析目的了解变量取值的状况,粗略把握变量值的分布状况研究被调查者的特征(如:性别、年龄、职业)通过这些分析,能够在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差等,并以此证明以后相关问题分析的代表性和可信性方法编制频数分布表:包括计算频数、百分比、累计百分比绘制统计图形:条形图、饼图、直方图第四页,共九十一页,2022年,8月28日频数分布表内容频数(Frequency)

变量值落在某个区间(或某个类别)中的次数百分比(Percent)

各频数占总样本量的百分比有效百分比(ValidPercent)

各频数占总有效样本量的百分比

有效样本量=总样本-缺失样本量

在不包含缺失值个案的所有个案中各变量取值频数的比例累计百分比(CumulativePercent)

各百分比逐级累加起来的结果。最终取值为百分之百第五页,共九十一页,2022年,8月28日统计图柱形图或条形图(BarChart)用宽度相同的条形的高度或长短来表示频数分布变化的图形适用于定序和定类变量的分析柱形图的纵坐标或条形图的横坐标可以表示频数,也可以表示百分比分为单式图和复式图等形式第六页,共九十一页,2022年,8月28日饼图(PieChart)用圆形及圆内扇形的面积来表示频数百分比变化的图形有利于研究事物内在结构组成等问题饼图中圆内的扇形面积可以表示频数,也可以表示百分比第七页,共九十一页,2022年,8月28日直方图(Histograms)用矩形的面积来表示频数分布变化的图形适用于定距型变量的分析可以在直方图上附加正态分布曲线,便于与正态分布的比较第八页,共九十一页,2022年,8月28日频数分析基本操作(1)菜单选项:analyze->descriptivestatistics->frequencies(2)选择几个待分析的变量到variables框.(3)按chart选项,选择所需要绘制的统计图形(4)按Format按钮,调整频数分布表中数据的输出顺序第九页,共九十一页,2022年,8月28日

输出百分位数:输出四分位数,显示25%、50%、75%的百分位数;将数据平均分为所设定的相等等份,可输入2—100的整数,如键入4则输出第25、50、75百分位数自定义百分位数,可输入0—100的整数。离散趋势分布形态栏集中趋势栏输出统计量对话框第十页,共九十一页,2022年,8月28日Format对话框控制频数表输出的分类数量。默认为10多变量框中可设定多变量表格输出的格式设置频数表输出的格式选择频数表中排列顺序按变量升序排列,此为默认按变量降序排列按变量各种取值发生的频数的升序排列按变量各种取值发生的频数的降序排列第十一页,共九十一页,2022年,8月28日multiplevariables单选框组如果选择了两个以上变量作频数表,则comparevariables可以将所有变量的结果在同一个频数表过程输出结果中显示,便于互相比较organizeoutputbyvariables则将结果在不同的频数表过程输出结果中显示,每一个变量一张表第十二页,共九十一页,2022年,8月28日频数分析中的扩展功能—计算分位数分位数是变量在不同分位点上的取值。分位点在0~100之间一般使用较多的是四分位点(Quartiles),即将所有数据按升序排序后平均等分成四份,各分位点依次是25%,50%,75%。于是,四分位数分别是25%,50%,75%分位点对应的变量值此外,还有八分位数、十六分位数等第十三页,共九十一页,2022年,8月28日计算分位数适用于定序数据数据按升序排序后,找到若干个分位点上的变量值quartiles:计算四分位数25%(QL)、50%(中位数)、75%(QU)cutpointsfornequalgroups:n等份percentile:自定义百分位点分位数的应用在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度例:(QL=50,QU=80)和(QL=70,QU=75)的比较第十四页,共九十一页,2022年,8月28日例题3.1利用住房状况问卷调查数据分析被调查家庭中户主的从业状况和目前所住房屋的产权状况分析人居住房面积的分布状况,并对本市户口和外地户口家庭进行比较第十五页,共九十一页,2022年,8月28日目标一:分析从业状况和目前所住房屋的产权状况(1)产权状况和从业状况两个变量都是定类型变量,可通过基本频数分析实现。(2)职业变量的取值(分类)数目较多,为使频数分布表更一目了然,应对内容的输出顺序进行调整,单击Format按钮,选择Descendingcounts按频数的降序输出。(3)单击Chart按钮指定输出产权变量的饼图和职业变量的柱形图。第十六页,共九十一页,2022年,8月28日目标二:分析人均住房面积的分布状况,并对本市户口和外地户口家庭进行比较。1、分析思路:(1)由于人均住房面积数据为定距型变量,直接采用频数分析不利于对其分布形态的把握,因此考虑依据第三章中的数据分组功能对数据分组后再编制频数分布表。(2)进行数据拆分,并分别计算本地户口和外地户口的人均住房面积的四分位数,并通过四分位数比较两者分布上的差异。第十七页,共九十一页,2022年,8月28日2、分析过程:(1)数据分组,将人均住房面积重新分成四组,四组区间分别为,少于10平方米,10-20平方米,20-30平方米,30平方米以上。分组后进行频数分析并绘制带正态曲线的直方图。(2)利用SPSS的频数分析计算所有样本的人均住房面积的四分位数;然后,按照户口类型对数据进行拆分(Splitfile)并重新计算分位数,分别得到本地户口和外地户口的人均住房面积的四分位数。第十八页,共九十一页,2022年,8月28日基本描述统计量目的精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度常见的基本描述统计量有三大类:刻画集中趋势的统计量刻画离散趋势的统计量刻画分布形态的统计量第十九页,共九十一页,2022年,8月28日刻画集中趋势的描述统计量集中趋势是指一组数据向某一中心值靠拢的倾向计算刻画集中趋势的描述统计量正是要寻找能够反映数据一般水平的“代表值”或“中心值”均值(Mean):即算术平均数,是反映某变量所有取值的集中趋势或平均水平的指标。如某企业职工的平均月收入。其计算公式为适用于定距数据。特点:利用了全部数据,易受极端值的影响第二十页,共九十一页,2022年,8月28日刻画集中趋势的描述统计量中位数(Median):即一组数据按升序排序后,处于中间位置上的数据值。如评价社会的老龄化程度时众数(Mode):即一组数据中出现次数最多的数据值。如生产鞋的厂商在制定各种型号鞋的生产计划时应该运用众数第二十一页,共九十一页,2022年,8月28日刻画离散程度的描述统计量离散程度反映各变量值远离其中心值的程度(离散程度),它从另一个侧面说明了集中趋势测度值的代表程度。如果数据都紧密地集中在“中心值”的周围,数据的离散程度较小,说明这个“中心值”对数据的代表性好如果数据仅是比较松散地分布在“中心值”的周围,数据的离散程度较大,则此“中心值”说明数据特征是不具有代表性的第二十二页,共九十一页,2022年,8月28日刻画离散程度的描述统计量全距(Range):也称极差,是数据的最大值(Maximum)与最小值(Minimum)之间的绝对离差。方差(Variance):各变量值与算数平均数离差平方的算术平均数。其计算公式为标准差(StandardDeviation:StdDev):表示变量取值距离均值的平均离散程度的统计量。其计算公式为第二十三页,共九十一页,2022年,8月28日均值标准误差(StandardErrorofMean)样本均值作为抽样样本的平均数也与总体均值之间存在差异。若干次抽样后会得到若干个不同的样本均值,当样本容量足够大时,这些均值服从正态分布,即X~N(μ,σ2/n)可见,样本均值与总体均值的平均差异(离散)程度(方差)为/n。于是,均值标准误差的数学定义为:因此,均值标准误差是描述样本均值与总体均值之间平均差异程度的统计量。样本数越大,样本均值的离散程度越小,对真值的估计越准确第二十四页,共九十一页,2022年,8月28日刻画分布形态的描述统计量数据的分布形态主要指数据分布是否对称,偏斜程度如何,分布陡峭程度等偏度(skewness):描述某变量分布形态的偏斜程度和方向的统计量偏度为0表示对称;大于0表示正偏差大(右偏)小于0表示负偏差大(左偏)偏度绝对值越大,表示数据分布形态的偏斜程度越大第二十五页,共九十一页,2022年,8月28日刻画分布形态的描述统计量峰度(kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量峭度为0表示与标准正态分布峭度相同大于0表示比标准正态分布陡,尖峰小于0表示比标准正态分布缓;平峰第二十六页,共九十一页,2022年,8月28日扁平分布尖峰分布偏态峰态左偏分布右偏分布与标准正态分布比较!第二十七页,共九十一页,2022年,8月28日计算基本描述统计量的操作(1)菜单选项:analyze->descriptivestatistics->descripive(2)选择将参加计算的数值型变量名到variables框。(3)按Options按钮指定计算哪些基本描述统计量,选择相应的选项第二十八页,共九十一页,2022年,8月28日Options对话框

基本统计量当Variables框中有多个变量时,此框确定其输出顺序:按Variables框中的排列顺序输出按各变量的字母顺序输出按均值的升序排列按均值的降序排列分布第二十九页,共九十一页,2022年,8月28日例题3.2利用住房状况问卷调查数据,对人均住房面积计算基本描述统计量,并分别对本市户口和外地户口家庭进行比较分析:首先按照户口对数据进行拆分(Splitfile),然后计算人均住房面积的基本描述统计量第三十页,共九十一页,2022年,8月28日数据标准化处理用于对异常值的判断新变量被称为标准化值或Z分数,反映的是样本值与均值的差是几个标准差单位小于0表示在平均水平下,大于0反之3σ准则:如果标准化值的绝对值大于3,则认为是异常值第三十一页,共九十一页,2022年,8月28日数据标准化处理正态分布的数据标准化后呈标准正态分布数值分布在正负一个标准差之内的可能性为68.2%数值分布在正负两个标准差之内的可能性为95.4%数值分布在正负三个标准差之内的可能性为99.7%如果异常数的总比例大于0.3%,则认为该组数据存在一定的不均衡savestandardizedvaluesasvariables选项将变量作标准化后,结果存入名为“Z+原变量名”的新变量中第三十二页,共九十一页,2022年,8月28日例题3.3利用住房状况问卷调查数据,分析人均住房面积是否存在不均衡现象分析:假设人均住房面积服从正态分布,跟据3σ原则,异常值通常为3个标准差范围之外的值,可通过对数据的标准化处理来判断通过标准化可以得到一系列新变量值对新变量进行排序并浏览其标准化值的取值情况,可以发现z分数值得绝对数大于3的家庭是存在的。对其分组为三组:z人均面积<-3,-3<z人均面积<3,z人均面积>3。并进行频数分析第三十三页,共九十一页,2022年,8月28日交叉分组下的频数分析(列联表分析)例:户口状况与购买意向之间有关联吗?(两变量)例:学习成绩与性别有关联吗?(两变量)例:职业、性别、爱逛商店有关联吗?(三变量)目的了解多个变量在不同取值下的分布情况,掌握多变量的联合分布特征,进而分析变量之间的相互影响和关系基本任务根据收集到的样本数据编制交叉列联表在交叉列联表的基础上,对两两变量间是否存在一定的相关性进行分析第三十四页,共九十一页,2022年,8月28日编制交叉列联表交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表文化程度合计职称123411113213432136433合计445316行变量列变量频数行标题列边缘分布第三十五页,共九十一页,2022年,8月28日列联表(contingencytable)由两个以上的变量交叉分类的频数分布表行变量的类别用r

表示,ri

表示第i

个类别列变量的类别用c

表示,cj

表示第j

个类别每种组合的观察频数用fij

表示表中列出了行变量和列变量的所有可能的组合,所以称为列联表一个

r行c

列的列联表称为r

c

列联表第三十六页,共九十一页,2022年,8月28日列联表的结构(22列联表)列(cj)合计j=1j=2i=1f11f12f11+f12i=2f21f22f21+f22合计f11+f21f12+f22n列(cj)行(ri)第三十七页,共九十一页,2022年,8月28日列联表的结构(r

c

列联表的一般表示)列(cj)合计j=1j=2…i=1f11f12…r1i=2f21f22…r2:::::合计c1c2…n列(cj)行(ri)fij表示第i行第j列的观察频数第三十八页,共九十一页,2022年,8月28日观察值的分布边缘分布行边缘分布行观察值的合计数的分布例如,赞成改革方案的共有279人,反对改革方案的141人列边缘分布列观察值的合计数的分布例如,四个分公司接受调查的人数分别为100人,120人,90人,110人公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420第三十九页,共九十一页,2022年,8月28日观察值的分布条件分布与条件频数变量X条件下变量Y

的分布,或在变量Y

条件下变量X

的分布每个具体的观察值称为条件频数公司1公司2公司3公司4合计赞成68755779279反对32453331141合计10012090110420第四十页,共九十一页,2022年,8月28日百分比分布第四十一页,共九十一页,2022年,8月28日百分比分布1.条件频数反映了数据的分布,但不适合对比2.为在相同的基数上进行比较,可以计算相应的百分比,称为百分比分布行百分比:行的每一个观察频数除以相应的行合计数(fij

/ri)列百分比:列的每一个观察频数除以相应的列合计数(fij

/cj)总百分比:每一个观察值除以观察值的总个数(fij

/n

)第四十二页,共九十一页,2022年,8月28日百分比分布(图示)一分公司二分公司三分公司四分公司合计赞成该方案6875577927924.4%26.9%20.4%28.3%100%68.0%62.5%63.3571.8%66.4%16.2%17.8%13.6%18.8%66.4%反对该方案3245333114122.7%31.9%23.4%22.0%100%32.0%37.5%36.7%28.2%33.6%7.6%10.7%7.9%7.4%33.6%合计1001209011047023.8%28.6%21.4%26.2%100%总百分比列百分比行百分比第四十三页,共九十一页,2022年,8月28日层变量(Layer)第四十四页,共九十一页,2022年,8月28日交叉分组下的频数分析的基本操作菜单选项Analyze-DescriptiveStatistics-Crosstabs第四十五页,共九十一页,2022年,8月28日该框中的变量作为分布表中的行变量和列变量。该框中的变量作为控制变量,决定频数分布表中的层,可有多个控制变量。显示每一组中各变量的分类条形图。只输出统计量,不输出多维列联表。Crosstabs对话框第四十六页,共九十一页,2022年,8月28日交叉分组下的频数分析的基本操作如果进行二维列联表分析,则将行变量选择到Row(s)框中,将列变量选择到Column(s)框中。如果Row(s)和Column(s)框中有多个变量名,SPSS会将行列变量一一配对后产生多张二维列联表。如果进行三维或多维列联表分析,则将其他变量作为控制变量选到Layer框中。多控制变量间可以是同层次的,也可以是逐层叠加的,可通过Previous或Next按钮确定控制变量间的层次关系。第四十七页,共九十一页,2022年,8月28日交叉分组下的频数分析的基本操作选择Displayclusteredbarcharts选项,指定绘制各变量交叉分组下频数分布条形图。选择Suppresstables表示不输出列联表,在仅分析行列变量间关系时可选择该选项。第四十八页,共九十一页,2022年,8月28日Crosstabs的CellDisplay对话框选择在列联表中输出的统计量,包括观测量数、百分比、残差输出观测量的实际数量如果行和列变量在统计上是独立的或不相关的,那么会在单元格中输出期望的观测值的数量。输出单元格中观测量的数目占整行全部观测量数目的百分比输出单元格中观测值的数目占整列全部观测量数目的百分比输出单元格中观测量的数目占全部观测量数目的百分比计算非标准化残差计算标准化残差计算调整后残差第四十九页,共九十一页,2022年,8月28日交叉分组下的频数分析的基本操作单击Cells按钮指定列联表单元格中的输出内容单击Format按钮指定列联表各单元格的输出排列顺序。Ascending表示以行变量取值的升序排列,是SPSS默认项;Descending表示以行变量取值的降序排列。单击Statistics按钮指定用哪种方法分析行变量和列变量间的关系Unstandardized为非标准化剩余,定义为观测频数-期望频数Standardized为标准化剩余,又称Pearson剩余第五十页,共九十一页,2022年,8月28日交叉列联表行列变量间关系的分析目的在列联表的基础上作进一步的分析,可以得到行变量和列变量之间是否有联系、联系的紧密程度如何等更深层次的信息。通过列联表分析,检验行列变量之间是否独立工资收入低中高年龄段青40000中05000老00600工资收入低中高年龄段青00500中06000老40000第五十一页,共九十一页,2022年,8月28日卡方检验大多数情况下,观测频数分散在列联表的各个单元格中,不容易直接发现行列变量之间的关系强弱程度,此时就要借助非参数检验方法和度量变量间相关程度的统计量等手段。通常用的方法是卡方(

)检验。

统计量用于检验列联表中变量间拟合优度和独立性用于测定两个分类变量之间的相关程度为观察频数,为期望频数(ExpectedCount)第五十二页,共九十一页,2022年,8月28日期望频数RT是指定单元格所在行的观测频数合计CT是指定单元格所在列的观测频数合计n是观测频数的合计期望频数的分布反映的是行列变量互不相干下的分布P95第五十三页,共九十一页,2022年,8月28日第五十四页,共九十一页,2022年,8月28日期望频数例如,具有本科学历的高级工程师的期望频数是0.75的计算公式是3*4/16=0.75。期望频数可以理解为,总共16个职工的学历分布是25%:25%:31.3%:18.8%,如果遵从这种学历的总体比例关系,高级职称三人的学历分布也应为25%:25%:31.3%:18.8%,于是期望频数为3*25%、3*25%、3*31.3%、3*18.8%。同理可以理解,总共16个职工的职称分布为18.8%:25%:37.5%:18.8%,本科学历4人的期望频数分别为4*18.8%、4*25%、4*37.5%、4*18.8%第五十五页,共九十一页,2022年,8月28日卡方检验卡方统计量观测值的大小取决于列联表的单元格子数观测频数与期望频数的总差值在列联表确定的情况下,卡方统计量观测值的大小取决于观测频数与期望频数的总差值总差值越大时,卡方值也就越大,实际分布与期望分布的差距越大,表明行列变量之间越相关反之表明行列变量之间越独立第五十六页,共九十一页,2022年,8月28日卡方检验基本步骤(1)提出原假设H0:行列变量之间无关联或相互独立(2)构造卡方统计量统计量服从(r-1)*(c-1)个自由度的卡方分布count:观察(实际)频数expectedcount:期望频数(期望频数反映的是H0成立情况下的数据分布特征)Residual:剩余(观察频数-期望频数)(3)计算卡方统计量的值,并得到该统计量值的概率P值(4)决策。概率P与显著性水平比较,小于等于则拒绝H0,否则不能拒绝第五十七页,共九十一页,2022年,8月28日(4)结论和决策对统计推断做决策通常有两种方式:根据统计量观测值和临界值比较的结果进行决策。如果卡方观测值大于临界值,则认为实际分布与期望分布之间的差距显著,可以拒绝原假设,断定列联表的行列变量间不独立,存在相关关系;反之,接受原假设。根据统计量观测值的概率p值和显著性水平比较的结果进行决策。如果p值小于等于,则认为卡方观测值出现的概率是很小的,是一个本不应发生的小概率事件,但却发生了,因此拒绝原假设,断定列联表的行列变量间不独立,存在依存关系;反之,接受原假设。第五十八页,共九十一页,2022年,8月28日什么是P值?是一个概率值;P(|t|>ti)=p(i=1,2)如果原假设为真,P-值是抽样分布中大于或小于样本统计量的概率;被称为观察到的(或实测的)显著性水平。在实际应用中,用p值更方便,即概率值提供的信息也是很有用的,p值是统计量精确的显著性水平。第五十九页,共九十一页,2022年,8月28日双侧检验的P值/

2

/

2Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值第六十页,共九十一页,2022年,8月28日左侧检验的P值H0值临界值a样本统计量拒绝域抽样分布1-置信水平计算出的样本统计量P值第六十一页,共九十一页,2022年,8月28日右侧检验的P值H0值临界值a拒绝域抽样分布1-置信水平计算出的样本统计量P值第六十二页,共九十一页,2022年,8月28日利用P值进行检验(决策准则)若p-值>

,不拒绝H0若p-值<,拒绝H0第六十三页,共九十一页,2022年,8月28日卡方检验实现步骤cells选项【Counts】框中的【Expected】表示输出期望频数【Residuals】框中的各个选项是在各个单元格中输出观测频数与期望频数的差。【Unstandardized】statistics选项指定用哪种方法分析行变量和列变量间的关系Chi-square为卡方检验第六十四页,共九十一页,2022年,8月28日卡方检验的要求:列联表各单元格中期望频数的大小:一般要求列联表中期望频数小于5的格子数不超过20%,否则会夸大卡方值,容易得出拒绝结论,可以合并单元格。样本量的大小:卡方值会受样本数的影响为此,也有必要对Pearson卡方值进行必要的修正,以剔除样本量的影响。第六十五页,共九十一页,2022年,8月28日例题3.4利用住房状况调查数据,分析本市户口和外地户口家庭对“未来三年是否打算买房”是否持相同态度H0:本市户口和外地户口家庭对未来三年是否打算买房的看法是一致的第六十六页,共九十一页,2022年,8月28日其他统计量似然比卡方(LikelihoodRation)当样本量较大时,似然比卡方与Pearson卡方非常接近,检验结论通常也是一致的线性相关卡方(Mantel-Haenszel卡方)检验列联表中行列变量的线性相关性H0:行列变量零相关只适用于定序变量,不能用于定类变量第六十七页,共九十一页,2022年,8月28日列联表分析的其他方法SPSS还提供了其他测度变量间相关关系的检验方法,包括:适用于两定类变量的方法:Nominal框中列出的方法属该类方法。适用于两定序变量的方法:Ordinal框中列出的方法属该类方法。适用于一定类变量、一定距变量的方法:Nominalbyinterval框中的Eta方法属该类方法。其他方法第六十八页,共九十一页,2022年,8月28日多选项分析按照您自己的实际情况,请依次选择您购买商业养老保险的原因,最多不超过三项:(1)使晚年生活有保障;(2)一种安全的投资保值方式;(3)抱着试试看的态度购买;(4)亲戚朋友推荐;(5)单位统一组织购买;(6)保险公司的宣传;(7)其他。第六十九页,共九十一页,2022年,8月28日多选项二分法SPSS变量名变量名标签变量取值V1是使晚年生活有保障吗?0/1V2是一种安全的投资保值方式吗?0/1V3是抱着试试看的态度购买吗?0/1V4是亲戚朋友推荐吗?0/1V5是单位统一组织购买吗?0/1V6是保险公司的宣传吗?0/1V7是其他吗?0/1第七十页,共九十一页,2022年,8月28日多选项分类法SPSS变量名变量名标签变量取值V1第一原因1/2/3/4/5/6/7V2第二原因1/2/3/4/5/6/7V3第三原因1/2/3/4/5/6/7第七十一页,共九十一页,2022年,8月28日对多选项问题作普通频数分析的困难采用多选项二分法分解问题,对变量V1~V7作频数分析,能很方便地分析出哪种原因是人们购买商业养老保险的主要原因,但却丢失了被调查者购买保险原因的顺序性信息。采用多选项分类法分解,就能够有效解决信息丢失的问题。而对变量V1~V3作频数分析,能方便地得到购买保险的三个主要原因中各个备选原因所占的比例,但却无法方便地分析有多少人是由于某个备选原因而去购买保险的多选项分类法--所选答案具有一定顺序的多选项问题多选项二分法--所选答案没有顺序的多选项问题第七十二页,共九十一页,2022年,8月28日变量值标签变量值频数百分比使晚年生活有保障14590.0单位统一组织购买5510.0合计50100.0变量值标签变量值频数百分比保险公司的宣传63060.0一种安全的投资保值方式22040.0合计50100.0变量值标签变量值频数百分比一种安全的投资保值方式21020.0单位统一组织购买54080.0合计50100.0V1频数分析结果V2频数分析结果V3频数分析结果第七十三页,共九十一页,2022年,8月28日变量值标签变量值频数百分比使晚年生活有保障14530.0保险公司的宣传63020.0单位统一组织购买54530.0一种安全的投资保值方式23020.0合计150100.0V1、V2、V3频数汇总结果第七十四页,共九十一页,2022年,8月28日多选项分析的基本思路按多选项二分法或多选项分类法将多选项问题分解成若干个问题,并设置若干个SPSS变量采用多选项频数分析或多选项交叉分组下的频数分析进行分析定义多选项变量集多选项频数分析第七十五页,共九十一页,2022年,8月28日定义多选项变量集的基本操作步骤定义多选项变量集目的:将已分解的变量定义为一个集合,便于进行多选项分析菜单选项:analyze->multipleresponse->definesets从原变量中选取被分解的变量(数值型)到variablesinsets框指定被分解的变量是按多选项二分法(dichotomize)分解还是按多选项分类法(categories)分解的为变量集命名。系统自动在名字前加字符$.第七十六页,共九十一页,2022年,8月28日用哪个数值来表示选中该选项变量取值的最小值和最大值第七十七页,共九十一页,2022年,8月28日多选项频数分析的基本操作步骤Frequencies:对多选变量集进行频数分析。从multresponsesets中把待分析的多选项变量集选择到tablesfor框中指定是否处理缺失数据Crosstabs:对多选变量集与其他变量集或与原基本变量进行交叉表分析第七十八页,共九十一页,2022年,8月28日多选项交叉分组下的频数分析菜单选项:analyze->multipleresponse->crosstabs选择列联表的行变量并定义取值范围,或选多选项变量集为行变量选择列联表的列变量并定义取值范围,或选多选项变量集为列变量选择列联表的控制变量并定义取值范围,或选多选项变量集为控制变量。第七十九页,共九十一页,2022年,8月28日多选项交叉分组下的频数分析分母为个案数分母为应答数Options:Matchvariableacrossresponsesets:如果列联表的行列变量均为多选项变量集时,第一个变量集的第一个变量与第二个变量集的第一个变量作交叉分组,第一个变量集的第二个变量与第二个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论