![SPSS基本统计分析课件_第1页](http://file4.renrendoc.com/view/f9055f09812fce8295783dc73af10fc2/f9055f09812fce8295783dc73af10fc21.gif)
![SPSS基本统计分析课件_第2页](http://file4.renrendoc.com/view/f9055f09812fce8295783dc73af10fc2/f9055f09812fce8295783dc73af10fc22.gif)
![SPSS基本统计分析课件_第3页](http://file4.renrendoc.com/view/f9055f09812fce8295783dc73af10fc2/f9055f09812fce8295783dc73af10fc23.gif)
![SPSS基本统计分析课件_第4页](http://file4.renrendoc.com/view/f9055f09812fce8295783dc73af10fc2/f9055f09812fce8295783dc73af10fc24.gif)
![SPSS基本统计分析课件_第5页](http://file4.renrendoc.com/view/f9055f09812fce8295783dc73af10fc2/f9055f09812fce8295783dc73af10fc25.gif)
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第四章SPSS基本统计分析对样本数据的刻画与描述1第四章SPSS基本统计分析对样本数据的刻画与描述1提要频数分析计算基本描述统计量交叉分组下的频数分析多选项分析比率分析要求:掌握每种方法的基本功能、作用掌握每种方法的基本操作方法掌握每种方法的适用范围2提要频数分析2一、频数分析频数分析,用于了解变量取值的状况,有利于把握数据的分布特征(一)基本概念频数:频率,变量值落在给定区间的次数(数目)百分比:各频数占总样本数的百分比有效百分比:各频数占有效样本数的百分比有效样本数:不包含缺失值的样本的个数=总样本数-缺失样本数累积百分比:各百分比逐级累加起来的结果注意:频数,只针对单个变量进行!3一、频数分析频数分析,用于了解变量取值的(二)基本分析步骤1.选择菜单AnalyzeDescriptiveStatisticsFrequencies2.选择分析对象变量在Variable(s)框中,放置要进行频数分析的变量;可放置多个,但分析是分别进行的3.调正输出分布表中数据的输出顺序Format…按钮,可按变量值的升降,频数Counts的升降进行排序4.选择输出图形Chart…按钮,可选择显示的内容:频数Frequencies,百分比Percentanges5.输出裁剪可视分析的具体情况,对结果做必要的裁剪(去掉某些变量的分析结果)图形可被编辑:双击图形,出现ChartEdit图形编辑窗口4(二)基本分析步骤1.选择菜单AnalyzeDes(三)扩展功能Statistics计算分位数(PercenticleValues)、计算集中趋势(CentralTendency)、计算离散趋势(Dispersion)、描述分布形态(Distribution)等计算分位数:变量在不同区段内的取值情况、数目(PercenticleValues)注意:分位数的分位范围为0~100,作用:描述数据离散程度,差越大,说明在相应位段上的离散程度越大*拆分会对以后的分析操作一直起作用,即,都会是在每个拆分的组上分别进行分析!5(三)扩展功能Statistics计算分位数(Percent频数分析过程(Frequencies)该过程可计算数据资料的各种描述统计指标、给出变量简单频数分布表、绘制几种变量分布图。Analyze→DescriptiveStatistics→Frequencies出现对话框操作6频数分析过程(Frequencies)该过程可计算数据资料案例4-1:住房状况分析打开对话框选择频数表选择柱状图7案例4-1:住房状况分析打开对话框选择频数表选择柱状图78899101011111212描述统计量表平均数中位数众数标准差方差偏度系数峰度系数全距(极差)最小值最大值百分比13描述统计量表平均数百分比13次级数据资料分析—扩展分析1、对资料进行分组
TransformRecodeIntoDifferentVariable2、对已分组的资料进行频数分析(1)、对频数进行加权DataWeightCases(2)、求分组数据的频数分析表和描述统计量
Analyze→DescriptiveStatistics→Frequencies14次级数据资料分析—扩展分析1、对资料进行分组14案例4-215案例4-21516161717二、计算基本描述统计量若要对定距型数据的分布特征进行更精确的把握,可通过计算基本描述统计量来实现,如:计算均值、标准差、偏度、峰度等。常用基本描述统计量:刻画集中趋势的描述统计量刻画离散程度的描述统计量Dispersion刻画分布形态的描述统计量Distribution18二、计算基本描述统计量若要对定距型数据的分布特征进行更精确的1.刻画集中趋势的描述统计量集中趋势:一组数据向某一中心值靠拢的倾向。目的:找到能够反映数据一般水平的“代表值”常用的中心值:均值Mean:(算术平均值)中位数Median:按升序排列后,处于中间位置的数据值;评价社会老龄化程度众数Mode:一组数据中出现次数最多的数据值;生产鞋号的生产计划均值标准误差StandardErrorofMean:反映样本均值与总体均值间的差异程度191.刻画集中趋势的描述统计量集中趋势:一组数据向某各种平均数之间的关系不同的平均数适用于研究不同的问题,各种平均数都具有自己的含义、特点和应用场合。如算术平均数适用于正态分布的资料,中位数则适用于所有分布类型的资料,几何平均数适用于对数正态分布。刻画数据集中程度的特征量20各种平均数之间的关系刻画数据集中程度的特征量20刻画数据集中程度的特征量算术平均数、中位数和众数的关系若根据光滑的频数曲线来解释这三种测度,可以说均值是变量分布的平衡点或重心;中位数把这个分布正好划分两半;众数正好在分布顶端出现。在频数分布完全对称的情况下,均值=中位数=众数在频数分布右偏时,众数<中位数<均值在频数分布左偏时,均值<中位数<众数左偏分布均值
中位数
众数对称分布
均值=中位数=众数右偏分布众数
中位数
均值21刻画数据集中程度的特征量算术平均数、中位数和众数的关系左偏分2.刻画离散程度的描述统计量Dispersion离散程度:一组数据远离其中心值的程度,即所有数据相对于中心值的疏密程度;越密,离散程度越小,中心值的代表性越强。目的:结合中心值,给出数据更全面、完整的描述常用统计量:样本标准差StandardDeviation(StdDev):表示变量取值距均值的平均离散程度;值越大,差异越大样本方差Variance:意义同上;值越大,差异越大全距Range:极差,数据最大值与最小值间的绝对差;全距大笔全距小的数据分散222.刻画离散程度的描述统计量Dispersion方差(Varance)和标准差(StandardDeviation)A、方差方差是每个变量与其算术平均数之间差的平方的算术平均数。设从某个总体中抽取的数据为,则样本方差为:设该总体的全部数据就是,则总体方差为:
23方差(Varance)和标准差(StandardDeviaB、标准差设从某个总体中抽取的数据为,则样本标准差为:设该总体的全部数据就是则总体标准差为:24B、标准差设从某个总体中抽取的数据为例:样本方差
原始数据:1059136825例:样本方差
原始数据:1059例:样本标准差26例:样本标准差26标准差是测定数据离散程度的最常用的方法。标准差广泛应用于相关与回归分析、抽样推断、统计预测等各方面。27标准差是测定数据离散程度的最常用的方法。标准差广泛应用于相关C、极差(全距)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响未考虑数据的分布计算公式为未分组数据R=max(Xi)-min(Xi)组距分组数据R=最高组上限-最低组下限28C、极差(全距)283.刻画分布形态的描述统计量Distribution数据形态:指数据分布是否对称、偏斜程度、分布陡缓程度等;作为集中趋势和离散程度的补充常用统计量:偏度系数Skewness:描述变量取值分布形态对称性的统计量;绝对值越大,偏斜程度越大;为0,表示对称;正,正偏/右偏,低于平均标准;负,负偏/左偏,高于评价标准峰度系数Kurtosis:描述变量取值分布形态陡缓程度的统计量(与标准正态图做对比);0,相同;正数,更陡(尖峰分布),少数人占东西的多,低于平均标准;负数,更缓(平峰分布),大家比较平均,高于平均标准293.刻画分布形态的描述统计量Distribution偏态与峰度分布的形状左偏分布右偏分布扁平分布尖峰分布偏态峰度与标准正态分布比较!30偏态与峰度分布的形状左偏分布右偏分布扁平分布尖峰分布偏态峰度偏态1. 数据分布偏斜程度的测度2. 偏态系数=0为对称分布3. 偏态系数>0为右偏分布4. 偏态系数<0为左偏分布5.计算公式为31偏态1. 数据分布偏斜程度的测度31峰度1. 数据分布扁平程度的测度2. 峰度系数=3扁平程度适中3. 偏态系数<3为扁平分布4. 偏态系数>3为尖峰分布5.计算公式为32峰度1. 数据分布扁平程度的测度32基本分析步骤选择菜单:AnalyzeDescriptiveStatisticsDescriptives选择分析变量到Variable(S)中设置要分析的方法Option最上:描述集中趋势Dispersion:描述离散程度Distribution:描述分布形态设置输出特点DisplayOrder:输出显示规律Variablelist:按变量在数据窗口中从左到右的次序输出Alphabetic:按变量名字母顺序输出Ascendiingmeans:按均值升序输出Descendingmeans:按均值降序输出33基本分析步骤选择菜单:AnalyzeDescriptive数据描述过程
(Descriptives)该过程计算数据资料的各种描述统计指标,但不给出分布图。Analyze→DescriptiveStatistics→Descriptives出现对话框操作34数据描述过程(Descriptives)案例4-335案例4-335案例4-436案例4-436三、交叉分组下的频数分析(一)基本概念1.交叉分组下的频数分析:又称列联表分析,(条件概率),用于分析多变量不同取值下的数据分布情况,可用于掌握多变量的联合分布特征,进而分析变量间的相互影响和关系,主要是看是否存在关联(相同,一致)。例如:针对职工基本情况表,分析不同职称、不同文化程度交叉分组下的职工频数分析----条件概率37三、交叉分组下的频数分析(一)基本概念37(二)基本分析步骤1.根据收集到的样本数据编制交叉列联表2.在交叉列联表的基础,对两两变量间是否存在一定的相关性进行分析举例:针对职工基本情况表,分析不同职称、不同文化程度交叉分组下的职工频数分析38(二)基本分析步骤38(三)SPSS下的操作步骤1.进行数据的预处理2.选择AnalyzeDescriptiveStatisticsCrosstabs3.选择需要分析的变量:3.1若进行二维列联表分析,行变量放到Rows框,列变量到Columns框。3.2若进行多维列联表分析,将其它维的变量放到Layer框中。(多变量间可以同层次Previous\Next,也可以叠加)(Layer中,放置的一般是互不相干变量,如:性别)4.选择Displayclusteredbarcharts,指定绘制个变量交叉分组下的频数分布柱形图39(三)SPSS下的操作步骤1.进行数据的预处理395.指定输出的内容,Cells按钮Observed:观测频数Expected:期望频数Percentages:行、列百分比Residuals:各单元格中暑促观测频数与期望频数的差Unstandardized,非标准化剩余,观测-期望Standardized,标准化剩余6.指定各单元格的输出顺序,Format钮完成列联表的设定7.指明用于行列间关系的分析方法,Statistics钮--选择变量间关系的分析方法Chi-Square:卡方检验405.指定输出的内容,Cells按钮40列变量行变量列百分比行百分比总百分比频数边缘百分比边缘百分比案例4-541列变量行变量列百分比行百分比总百分比频数边缘百分比边缘百分比4242(四)结果说明1.交叉列联表的主要内容行:行变量,其标题为相关变量的变量值。列:列变量,其标题为相关变量的变量值。行边缘分布:仅针对行变量的分布列边缘分布:仅针对列变量的分布交叉列联表的条件分布:在行(列)变量取值条件下的列(行)变量的分布行百分比:针对行变量在当前行总数的比例列百分比:针对列变量在当前列总数的比例总百分比:针对总体书的比例43(四)结果说明1.交叉列联表的主要内容432.交叉列联表行列变量间关系的分析目的:分析行、列变量间是否有联系、联系的紧密程度等常用方法:非参数检验方法和度量变量间相关程度的统计量(卡方χ2检验、相关性检验)442.交叉列联表行列变量间关系的分析441)卡方检验Pearson(属于假设检验,看假设是否正确)原假设:行、列变量彼此独立。根据统计量观测值和临界值比较的结果进行决策:若观测值大于临界值,则差异显著,行列变量不独立,可拒绝原假设。反之,不能拒绝原假设,行列变量独立。根据统计量观测值的概率P-值和显著性水平α比较的结果进行决策:若P<=α,卡方观测值出现的概率很小,是一个本不该发生却发生了的事情,因此拒绝原假设,行列变量不独立,存在依存关系;反之,接受原假设,行列变量相互独立。451)卡方检验Pearson(属于假设检验,看假设是否正确)42)交叉列联表卡方检验的说明A.列联表个单元格中期望频数大小的问题不应有期望频数小于1的单元格,或不应有大量期望频数小于5的单元格。(>20%时,会存在偏大的趋势,不应使用此方法,可考虑使用似然率卡方检验等方法进行修正)B.样本量大小的问题卡方值受样本量的影响。462)交叉列联表卡方检验的说明463)卡方检验结果表说明自己选一个显著性水平0.05>P,所以无关,不一致。
LikelihoodRatio:似然比卡方(大样本数时,与卡方基本一致)Linear-byLinearAssociation:线性相关卡方,只适合于定序变量,用于检验行列变量的线性相关性,原假设为行列变量0相关。(相关,但户口为定类变量!,不能用此)473)卡方检验结果表说明47四、多选项分析(一)基本概念1.多选项分析:针对问卷调查中多选项的分析(一个变量,可选择一个以上答案,定序、定类)2.编码:将多选项中内容转化为数值型数据的方式。多选项问题的回答方式,答案有一定的先后次序,答案无序,因此在编码时需要考虑。48四、多选项分析(一)基本概念48(二)基本步骤1.将多选项问题分解2.用多选项频数分析或多选项交叉分组下的频数分析等方法进行分析SPSS对调查问卷的处理过程:单选:一个问题设为一个变量,用户的选项为变量值,可选项为变量的取值范围多选:一般是将该问题分解为若干个问题,对应设置若干个SPSS变量,分别存放描述这些问题的几个可能被选择的答案(一个变为多个)多选的分解办法:多选项二分法(MultipleDichotomiesMethod)、多选项分类法(MultipleCategoryMethod)49(二)基本步骤1.将多选项问题分解49多选项二分法:将多选项中的每个答案设为一个SPSS变量,每个变量只有0或1的值,表示是否选择该答案。---不利于内容顺序性的体现多选项分类法:首选估计多选项问题中最多可能出现的答案个数,将其每个组合设置为1个SPSS变量,变量取值为多个可能答案组合中的一个。(依据要求用户可选择的最大数目,来设置变量)---利于顺序性的分析多选项分解办法的选择:是否便于分析和是否丢失信息的角度选择有顺序性的选分类法,无顺序性要求的选二分法50多选项二分法:将多选项中的每个答案设为一个SPSS变量,每个(三)SPSS操作步骤对数据中多选项变量进行分解,输入数据将分解开的变量定义为多项选择变量集AnalyzeMultipleResponseDefineSets进行多选项频数分析AnalyzeMultipleResponseFrequencies结果说明51(三)SPSS操作步骤对数据中多选项变量进行分解,输入数据5五、比率分析(一)基本概念1.比率分析:可理解为比例,用于对两变量间变量值比率变化的描述分析,适用于定距变量例:根据各地保险业务情况,分析财险收入占全部业务收入的比例情况,得到个地区财险收入占总业务收入的比率变量,进而可进行下一步分析2.比例分析的结果可用于计算基本描述统计量(均值、中位数、标准差、全距)等3.加权比率均值:两变量均值的比,描述集中趋势4.ADD平均绝对离差:,Ri,比率值;M,比率变量的中位值;N,样本数;描述离散趋势52五、比率分析(一)基本概念525.COD离散系数:,,平均比率6.PRD相关价格微分:比率均值与加权比率均值的比,描述离散程度7.COV变异系数:分基于均值的变异系数和中位数的变异系数,描述离散程度535.COD离散系数:(二)SPSS步骤1.AnalyzeDescriptiveStatisticsRatio2.Numerator:作为比率变量的分子3.Denominator:比率变量的分母4.GroupVariable:用于分组的变量,可用于做不同组间的比率比较5.Statistics:指明要输出哪些关于比率的描述统计量CentralTendency:描述集中趋势的统计量Dispersion:描述离散趋势的统计量54(二)SPSS步骤1.AnalyzeDescriptiv(三)结果分析1.占比例高,说明高于平均水平2.离散程度高于平均,说明发展水平差异大55(三)结果分析1.占比例高,说明高于平均水平55案例分析:教学评估某综合性大学,为进行教学评估,其中进行一项是对本校的毕业生调查,随机抽取了48名毕业生组成样本,对三个学院的毕业生,要求他们所在的工作单位对其工作表现、专业水平外、语水平的表现进行评分,评分由0到10分,分值越大表明满意程度越高。收集的数据如下:56案例分析:教学评估某综合性大学,为进行教学评估,其学院工作表现专业水平外语水平学院工作表现专业水平外语水平生物学院医学院生物学院医学院医学院生物学院农学院农学院农学院农学院生物学院医学院农学院医学院农学院农学院医学院医学院生物学院生物学院农学院农学院生物学院农学院7.008.008.009.007.007.007.006.008.009.007.009.008.009.009.007.007.009.009.009.008.007.009.008.008.009.007.008.006.004.006.005.006.006.006.006.007.006.005.007.005.005.007.009.006.006.004.006.003.004.004.005.003.006.004.008.003.007.006.002.007.006.006.003.002.004.007.005.004.005.005.008.00农学院生物学院农学院农学院医学院生物学院医学院农学院生物学院医学院医学院农学院生物学院农学院生物学院医学院医学院生物学院农学院生物学院医学院生物学院医学院生物学院6.007.007.007.009.008.009.007.009.009.008.007.008.007.008.0010.0010.009.007.008.008.0010.009.008.006.008.007.005.006.007.008.004.007.006.009.006.008.006.008.007.007.006.004.004.006.008.008.005.006.004.007.002.002.006.004.005.009.005.005.006.002.003.005.005.006.007.007.005.006.006.007.007.0057学院工作表现专业水平外语水平学院工作表现专业水平外语水平生物要求:管理报告对这些数据做出数值的和图型的描述。用人单位对该校毕业生哪个方面最为满意,哪个方面最不满意,应在哪个方面作出教学改革?用人单位对该校毕业生哪个方面的满意程度差别最大?什么原因产生?社会对三个学院的毕业生的满意程度是否一致?能否提出提高社会对该校毕业生满意程度的建议?58要求:管理报告对这些数据做出数值的和图型的描述。58思考:我们需做哪些分析?样本有效性分析评价对象分析:各学院人数、比例学生各方面的整体评价各种评价的比例整体情形(集中、离散趋势等)各学院与整体情况的对比59思考:我们需做哪些分析?591.对这些数据做出数值的和图型的描述。从图中可看出,随机抽取48名学生是由医学院、生物学院和农学院组成,各学院毕业生人数分别占样本的31%、33.3%、35.4%,可见各学院抽取毕业生大致相同,样本具有一定的代表性。601.对这些数据做出数值的和图型的描述。从图中可看2.频数分析过程(Frequencies)表1612.频数分析过程(Frequencies)表161626263633.数据描述过程(Descriptives)643.数据描述过程(Descriptives)64结论和政策建议(1)从表1可知,用人单位对某综合大学的毕业生的工作表现评分最高,而外语水平评分最低。工作表现评分平均得分为8.04分,外语水平平均得分为5.08分。有50%毕业生的工作表现评分在8分以上,其中一半在9分以上,而外语水平评分在5分以下的有50%的毕业生,仅有25%在6分以上,由此可见,用人单位最满意该校毕业生的是工作表现,最不满意的是外语水平。最近,知名管理咨询公司麦肯锡在上海发布的最新研究报告称,“在庞大的中国毕业生队伍中,很少有人能够直接胜任在服务出口行业工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 现代物流业的商业模式优化与创新研究
- DB65-T 4850-2024 工贸行业企业重大安全风险认定
- 寒假实践工作总结
- 社会工作者工作计划样本
- 信息技术教研工作计划
- 人力资源部个人总结
- 高中音乐学期教学工作总结
- 品质文员年终工作总结
- 大学生个人实习总结
- 中学学校教学工作计划
- 供电工程施工方案(技术标)
- 2024年山东省济南市中考英语试题卷(含答案解析)
- 2025中考英语作文预测:19个热点话题及范文
- 读书分享-自驱型成长-如何科学有效地培养孩子的自律
- 暑假作业 10 高二英语完形填空20篇(原卷版)-【暑假分层作业】2024年高二英语暑假培优练(人教版2019)
- 2022年版初中物理课程标准解读-课件
- 2024年建筑业10项新技术
- 语文七年级下字帖打印版
- 第02章 滑模变结构控制基础
- landmark compass培训材料
- 水利水电项目工程混凝土防渗墙施工技术标准规范
评论
0/150
提交评论