社会调查教程第13章课件_第1页
社会调查教程第13章课件_第2页
社会调查教程第13章课件_第3页
社会调查教程第13章课件_第4页
社会调查教程第13章课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、社会调查教程精编本(第二版)江立华 水延凯 主编 国家级精品课程教材 新编21世纪社会学系列教材 第十三章 统计分析第十三章 统计分析第一节 统计分析概述第二节 调查报告的结构和体制第三节 调查报告的写作步骤与撰写要则第一节 统计分析概述统计分析的目的一二第一节 统计分析概述统计分析的过程三统计分析的层次统计分析就是运用统计学原理和方法处理通过调查所获得的数据资料,简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序和方法。 四推断统计的基本原理统计分析的目的简化和描述数据。在社会调查中,搜集的数据多种多样,数量庞大。在撰写调查报告时,没有必要也没有可能罗列每个数据,而是运用

2、统计分析方法将调查数据简化后再描述出来。用样本推断总体。在随机抽样调查中,对样本的调查只是手段而不是目的,真正的目的在于通过对样本进行分析所获得的统计量,来推断总体参数。样本统计量总体参数发现变量之间的统计关系。一统计分析的过程在数据录入和清理之后,数据的统计分析,大致要经过两个过程: 数据预处理,就是在统计分析之前对清理后的数据做预备性处理。预处理,一般包括缺损值处理、加权处理、变量重新编码、数据重新排序,以及创造新变量等。数据统计分析,就是调用统计软件中的各种统计程序对数据进行分析,包括单变量、双变量、多变量统计分析,以及制作统计图、统计表等一系列 工作。二统计分析的层次按照统计分析的性质

3、,可分为:描述统计描述统计是运用数字(如频数、百分比、平均值)和图、表等形式汇总所收集来的数据信息。目的:在不歪曲或丢失大量信息的情况下,将 数据信息简化为更易理解的形式。推断统计。是运用概率分布知识,通过样本统计量预测总体参数的分析方法。目的:通过对样本的调查来了解总体。当数据描述结果仅适用于一个样本,而我们希望了解总体的特征时,可以使用推断统计。 三统计分析的层次按照统计分析涉及变量的多少,可分为:单变量统计分析只涉及一个变量,它用平均数、百分比等来描述单个变量的 特征,也可以进行区间估计、显著性检验等推断统计分析。只能进行描述性研究。双变量统计分析方法,包括列联表分析与 检验、秩相关检验

4、、单因 素方差分析、简单线性回归分析等。当一项统计分析涉及三个或三个以上变量 (其中至少有一个因变量)时,则被称为多变量或多元统计分析。双因素方差分析、 多元线性回归分析、因子分析、Logistic回归分析等。 如果要进行解释性研究,就必须进行双变量统计分析或多变量统计分析。三推断统计的基本原理推断统计的必备前提是,样本数据必须来自随机抽样调查。只有用随机方法 抽取的样本,其样本统计量才具备推断总体的资格。推断统计与抽样分布样本的抽样分布的目的就是运用它来由样本统计量推断总体参数值。 因此,抽样分布是推断统计的依据或工具。抽样分布,是指在一个总体中重复抽取许多大小一样的样本的统计量而 形成的分

5、布。 抽样分布的一个重要作用在于预测统计量的落点及其与所估计参数的接近程 度。抽样分布的建立与作用并非只是人们的一种设想,它有其实际的数理基础或 理论依据,这就是中心极限定理。 四推断统计的基本原理参数估计把通过样本计算出来的统计值称为样本统计量,简称统计量,而把总体统计值称为参数。参数估计就是运用样本统计量对总体参数进行推断或估计的统计过程与统计方法。参数估计包括:点值估计点值估计是选择一个适当的样本统计量直接代表总体的参数值。优点:无偏性、一致性、有效性缺点:无法知道估计的误差到底有多大区间估计区间估计是用一个数值区间表示未知总体参数落入该区间的概率或可能性有多大的一种统计方法。置信区间是

6、指在进行区间估计时,在某一概率水平下总体参数所处的数值区间。四推断统计的基本原理区间估计理论基:抽样分布。核心问题:把样本统计量与总体参数之间的关系转换成抽样分布来处理。布具有的特性是:总体平均数或抽样分布平均数处于样本平均数1.96个抽样分布标准差范围内的概率为95%,处于样本平均数2.58个抽样分布标准差范围内的概率为99%。假设检验假设检验是以抽样分布原理为基础,检验调查样本中的统计特性是否在总体 中同样存在的一种统计方法。它是推断统计中最重要也是最常用的方法。参数估计是用具体的样本统计量(如平均数、标准差、百分比等)来推断总体参数,而假设检验则是检验样本中的事实、关系在总体中是否也存在

7、。属于推断统计范畴,随机抽样是其前提或必备条件。进行假设检验,必须首先建立两个假设:四推断统计的基本原理四第二节 单变量统计分析集中量数分析一二第二节 单变量统计分析离散量数分析三单变量推断统计集中量数分析一离散量数分析二离散量数分析二离散量数分析二离散量数分析二单变量推断统计参数估计(主要是区间估计)是用样本统计量来估计总体参数,它通常只涉及一个变量,也有涉及两个变量的,如相关系数的区间估计等,只是较少用到。在单变量分析中,可分为三种情况或类型:总体平均数的参数估计、总体比率的参数估计和总体方差的参数估计。假设检验:在单变量分析范围内,分为三大基本类型,即总体平均数的假设检验、总体比率的假设

8、检验、总体方差的假设检验。每一类型又可分为两种小类型:单样本总体假设检验:对单个样本的统计量 (如平均数、比率、方差) 可否推断总体的检验;双样本差异的总体假设检验:对两样本统计量的差异(如平均数之差、比率之差、方差之差)是否在总体中也存在的检验,亦即要证明两样本的差异是否由来自两个不同的总体造成。 三第三节 双变量统计分析双变量统计分析的内容一二第三节 双变量统计分析双变量统计分析的方法双变量统计分析的内容双变量统计分析分为相关关系和因果关系两种形式:两变量间的相关关系:当一个变量X发生变化时,另一个变量Y也随之发生变化,相反,当X发生变化时,Y也发生变化。社会现象之间的相关关系,从不同角度

9、可区分为不同类型:按照相关方向的不同:可分为正相关和负相关按照相关强度的不同:可分为完全相关、不相关和不完全相关按照相关形式的不同:可分为线性相关和非线性相关两变量间的因果关系:一变量的变化可以确定为另一变量变化的原因的关系。要确定两个变量之间的因果关 系,必须同时满足三个条件: 两变量间必须存在相关关系先有原因,后有结果。 必须确定变量X与Y之间的关系,不是由于第三个变量的存在而呈现出的一种虚假关系。 一双变量统计分析的方法在双变量统计分析中,由于变量的测量层次不同,因而计算两变量相关系数 的方法和假设检验的方法也不相同。变量的测量层次,可分为定类、定序、定距、定比四种类型,这样就形成了多种

10、不同测量层次变量的两两组合。二双变量统计分析的方法二双变量统计分析的方法定类-定类(或定序)变量分析PRE(proportion reduction in error)叫作消减误差比例。PRE表示的就是当我们用一个变量X来解释另一个变量Y时,能够减少多少比例的误差,能够消减误差的比例越大,表明两个变量的关系越密切,亦即相互影响的作用力越大,反之则越小。PRE取值区间为 0,1。 消减误差比例的计算公式为二双变量统计分析的方法二双变量统计分析的方法二双变量统计分析的方法定距-定距变量分析两个定距变量的相关分析:两个定距变量的相关系数,通常使用皮尔逊积差相关(或积矩相关)公式计算。由于原始公式计算

11、时略为复杂,为了能直接运用X和Y的原始数据计算相关系数,可以将皮尔逊积差相关公式转化成如下公式: 二其中,r表示皮尔逊积差相关系数,X表示变量Y的取值,Y表示变量Y的取值,n表示个案数或样本容量。在处理分组数据时,则采用如下计算公式: 双变量统计分析的方法一元线性回归分析对两个定距变量进行回归分析,被称为一元线性回归分析,即只有一个自变量X ,且两变量间存在线性相关关系。一元线性回归分析,实质上就是要在变量X和变量 Y之间建立一个线性回归方程,从而用X去预测Y。一元线性回归方程的标准形式为:建立回归方程的主要问题是求出方程中回归系数b(回归线的斜率)和回归线在轴上的截距a,这一过程被称为配制回

12、归线或拟合回归线。确定回归系数b的原则是使散点图 (根据X和Y一一对应的值绘制而成的分布图)上各点距回 归线上的相应点的垂直距离平方和为最小,这种求回归系数b的方法被称为最小 二乘方法。求回归系数b的公式为:二这个公式可以说是回归系数b的定义公式,为计算方便,可将其转化为能直接用原始数据计算b的公式:双变量统计分析的方法二第四节 多变量统计分析简介第四节多变量统计分析简介1、多变量相关分析是相对于双变量相关分析而言的。在双变量相关分析中,是用一个统计量 (如相关系数、G 、r等)反映两个变量间的相关关系。当变量达到三个或三个以上时,相关关系的分析就属于多变量相关分析或多元相关分析了。与多变量相

13、关分析直接有关的方法,有偏相关分析复相关分析典型相关分析第四节多变量统计分析简介第四节多变量统计分析简介5、对数线性模型分析:是在自变量和因变量都是定类或定序变量时,用以分析 它们之间的相互关系的多变量统计分析方法,它处理的是以交互分类表形式出现 的定类或定序数据。6、结构方程模型分析:是一种用于建立、估计、检验因果关系模型的功能强大 的多变量统计分析方法。它把因子分析、回归分析、路径分析、方差分析等多种 多变量统计分析方法有机地整合在一起。7、多层线性模型分析:是专门用于对具有层次结构特性的数据进行多变量统计 分析的统计方法。本章要点1、统计分析就是运用统计学原理和方法处理通过调查所获得的数

14、据资料, 简化和描述数据资料,揭示变量之间的统计关系,并进而推断总体的一整套程序 和方法。2、统计分析可按不同标准划分层次。按照统计分析的性质,可分为描述统 计和推断统计;按照统计分析涉及变量的多少,可分为单变量统计分析、双变量 统计分析和多变量统计分析。 3、描述统计是关于样本的统计方法,其分析结果是样本统计量;推断统计 是通过样本推断总体的统计方法,包括参数估计与假设检验。4、单变量统计分析,可分为集中量数分析和离散量数分析两大部分;单变 量统计分析不仅可做描述统计,而且可做推断统计。5、双变量统计分析,主要分析两个变量之间的关系,包括相关关系与因果 关系。6、相关关系可分为不同类型:按照相关方向的不同,可分为正相关和负相 关;按照相关强度的不同,可分为完全相关、不相关和不完全相关;按照相关形 式的不同,可分为线性相关和非线性相关。本章要点7、要确定两个变量之间的因果关系,必须同时满足三个条件: 两变量 间必须存在相关关系。必须确定自变量变化在前,因变量变化在后。必须确定变量X与Y之间的关系,不是由于第三个变量的存在而呈现出的一种虚假关系。8、双变量统计分析有各种各样的方法,选择双变量统计分析方法的基础是变量的测量层次。双变量统计分析同样可进

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论