版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第十章定量资料分析第一节资料的整理与录入
第二节单变量统计分析
第三节双变量统计分析
第四节多变量统计分析
第十章定量资料分析第一节资料的整理与录入第一节资料的整理与录入研究者对调查所收集回的原始资料进行初步的审查和核实,校正错填、误填的答案,剔除乱填、空白和严重缺答的废卷。一、资料的审核第一节资料的整理与录入研究者对调查所收集回的原始资料进行初一、资料的审核审核的方法:实地审核系统审核(集中审核)随机抽取5%-15%重新进行调查审核的内容:检查出问卷资料中存在的问题;重新向被调查者核实。一、资料的审核审核的方法:审核的内容:检查出问卷资料中存在的二、资料的转换将问卷中问题的回答转换成供计算机识别和统计的数字。二、资料的转换将问卷中问题的回答转换成供计算机识别和统计的数三、数据录入统计软件(SPSS)直接录入数据库软件(FoxPro)录入挑选和培训输入人员统一规定数据输入格式和数据文件名录入员各自录入数据合并三、数据录入统计软件(SPSS)直接录入挑选和培训输入人员四、数据清理——有效范围清理数据值超过有效范围错误来源:原始填答、编码、录入过程SPSSFrequencies命令四、数据清理——有效范围清理数据值超过有效范围SPSS四、数据清理——逻辑一致性清理逻辑关系——数据变量间的合理性相倚问题为主Select过滤问题=1Select过滤问题=2SPSSSelect
Cases命令四、数据清理——逻辑一致性清理逻辑关系——数据变量间的合理性四、数据清理——数据质量抽查随机抽取数据结果对照原始问卷填答评估和评价数据资料的质量四、数据清理——数据质量抽查随机抽取数据结果第二节单变量统计分析一、单变量描述统计二、单变量推论统计第二节单变量统计分析一、单变量描述统计
一、单变量描述统计
集中趋势分析用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。平均数众数中位数一、单变量描述统计
集中趋势分析
根据单值分组资料求平均数=xf/f
根据组距分组资料求平均数=fxm/f
根据原始数据求平均数=x/n平均数:总体各单位数值之和除以总体单位数目所得之商。根据单值分组资料求平均数=xf/f离散趋势分析用一个特别的数值来反映一组数据相互之间的离散情况。全距(Range)标准差(Standard
Deviation)异众比率(Variation
Ratio)四分位差(Interquartile
Range)离散系数(Coefficient
of
Variation)离散趋势分析用一个特别的数值来反映一组数据相互之间的离散情况离散趋势分析全距(Range)
标准差(Standard
Deviation)异众比率(Variation
Ratio)四分位差(Interquartile
Range)离散系数(Coefficient
of
Variation)离散趋势分析全距(Range)二、单变量推论统计在一定的可信度(置信水平)下,用样本统计值的某个范围(置信区间)来“框”住总体的参数值。范围的大小反映的是这种估计的精确性问题,而可信度高低反映的则是这种估计的可靠性或把握性问题。区间估计二、单变量推论统计在一定的可信度(置信水平)下,用样区间估计
总体均值的区间估计
总体百分比的区间估计95%95%区间估计总体均值的区间估计95%95%例1调查农大学生生活费状况,随机抽取900名学生作为样本,统计得到他们的月均生活费为186元,标准差是42元。在95%的置信度下,试估计全校学生的月均生活费是多少?把数据代入总体均值的区间估计公式186±Z(1-a)429001.96计算得出总体均值的置信区间为183.26——188.74元例1调查农大学生生活费状况,随机抽取900名学生作为样本,例2调查农大学生对“吸烟行为”的态度,随机抽取400名学生作为样本,统计结果表明“赞成”的比例为20%。在90%的置信度下,试估计全校学生中赞成“吸烟行为”的学生比例的置信区间?把数据代入总体比例的区间估计公式20%±Z(1-a)40020%(1-20%)计算得出总体均值的置信区间为16.7%——23.3%1.65例2调查农大学生对“吸烟行为”的态度,随机抽取400名学生一、交互分类与χ2检验工资收入文化水平合计小学及以下中学大专及以上低78.020.011.040.0中19.073.031.050.0高3.07.058.010.0(n)(360)(550)(90)(1000)表1文化水平与工资水平的交互分类表(%)深入描述样本资料分布和内在结构分组比较,揭示变量间关系将调查所得的一组数据按照两个不同的变量进行综合分类。第三节双变量统计分析一、交互分类与χ2检验工资收入文化水平合计小学及以下中学大专交互分类表的形式要求每个表的顶端要有表号和标题表格中的线条一定要规范简洁表格中百分比符号统一标注表格下端应有每列对应频数表中百分比形式一致,保留足够位小数根据变量关系安排变量行列
变量取值应有所限制交互分类表的形式要求每个表的顶端要有表号和标题χ2检验观察频数所对应的期望频数期望频数=行总数*列总数/全部个案数要保证从样本中得出的结果具有统计意义,保证样本中所体现的变量关系也反映总体的情况,就必须进χ2检验。χ2检验观察频数所对应的期望频数期望频数=行总数*列总数/全二、不同层次变量的相关测量与检验两个定类变量—Lambda系数两个定序变量—Gamma系数两个定距变量—r系数定类与定距变量—E系数二、不同层次变量的相关测量与检验两个定类变量—Lambda系
Lambda相关测量
计算公式λy=
f0-Fy
n-FyX变量每个类别下Y变量的众值频数Y变量的众值频数n=全部个案数Lambda相关测量计算公式f0-Fyn-λ具体计算过程
100名青年的性别与志愿统计表性别志愿合计男女快乐家庭理想工作增长见闻合计104010301004050106040100λ=
=0.40(40+30)—50100—50
结论:青年的性别与志愿两个变量之间呈中等程度的相关。λ具体计算过程100名青年的性别与志愿统计表性别志愿合计男定序变量与定序变量
Gamma系数检验:Z检验
同序对数目
异序对数目定序变量与定序变量Gamma系数检验:Z检验同序对具体计算过程
工人文化程度与收入水平交互分类表收入水平文化程度大学以上中学小学以下合计合计高中低12103258305434161232245620100Nd=3(30+8+16+4)+10(8+4)
+5(16+4)+30(4)=514Ns=12(30+5+16+12)+10(5+12)
+8(16+12)+30(12)=1510具体计算过程工人文化程度与收入水平交互分类表收入水平文化程G=(1510-514)/(1510+514)
=0.49结论:文化程度与收入水平呈中等程度相关。如果用前者去预测后者,可以减少49%的误差用任何两个个案在某变量上的等级次序去预测它们在另一个变量上的等级次序时,看能减少多少误差,消减的误差在全部误差中所占比例越大,表示这两个变量的相关关系越强Gamma
相关测量的基本逻辑:G=(1510-514)/(1510+514)结论:文化程度2.定类/定序变量与定距变量
相关比率:eta平方系数检验:F检验
因变量的数值
因变量的均值自变量X的每个类别上的因变量数值的均值2.定类/定序变量与定距变量相关比率:eta平方系数检验定距变量与定距变量检验:F检验
皮尔逊相关系数
X与Y对等,位置互换,r值不变
r取值[+1,-1],有方向性r本身不具有PRE意义,但r2有定距变量与定距变量检验:F检验皮尔逊相关系数X与Y对等,三、回归分析最小二乘法三、回归分析最小二乘法第四节多变量统计分析多变量统计分析的方法种类较多,比如阐释模式、复相关分析、多元线性回归分析、路径分析、因子分析、聚类分析、判别分析、对数线性模型等等。第四节多变量统计分析多变量统计分析的方法种类较多,一、阐释模式所关心的是两个变量之间的关系,它是通过引进并控制第三变量,来进一步了解和探讨原来两个变量之间关系性质的统计分析方法。因果分析阐明分析条件分析一、阐释模式所关心的是两个变量之间的关系,它是通过引因果分析的目标是检定是否确实存在因果关系。阐明分析的目标则是探讨因果关系的作用方式与作用途径。条件分析所关注的则是原关系在不同条件下是否会有所不同。社会研究方法-10章课件二、复相关分析复相关分析是一种以一个统计值来简化多个自变量与一个因变量之间关系的统计分析方法。它要求所有的变量都是定距以上层次的变量。二、复相关分析复相关分析是一种以一个统计值来简化多个三、多元回归分析Y=b1x1+b2x2+…+bkxk+ab值称为净回归系数,它表示的是在控制了其他自变量以后,某一变量对因变量的单独效果。三、多元回归分析Y=b1x1+b2x2+…+bkxk+第十章定量资料分析第一节资料的整理与录入
第二节单变量统计分析
第三节双变量统计分析
第四节多变量统计分析
第十章定量资料分析第一节资料的整理与录入第一节资料的整理与录入研究者对调查所收集回的原始资料进行初步的审查和核实,校正错填、误填的答案,剔除乱填、空白和严重缺答的废卷。一、资料的审核第一节资料的整理与录入研究者对调查所收集回的原始资料进行初一、资料的审核审核的方法:实地审核系统审核(集中审核)随机抽取5%-15%重新进行调查审核的内容:检查出问卷资料中存在的问题;重新向被调查者核实。一、资料的审核审核的方法:审核的内容:检查出问卷资料中存在的二、资料的转换将问卷中问题的回答转换成供计算机识别和统计的数字。二、资料的转换将问卷中问题的回答转换成供计算机识别和统计的数三、数据录入统计软件(SPSS)直接录入数据库软件(FoxPro)录入挑选和培训输入人员统一规定数据输入格式和数据文件名录入员各自录入数据合并三、数据录入统计软件(SPSS)直接录入挑选和培训输入人员四、数据清理——有效范围清理数据值超过有效范围错误来源:原始填答、编码、录入过程SPSSFrequencies命令四、数据清理——有效范围清理数据值超过有效范围SPSS四、数据清理——逻辑一致性清理逻辑关系——数据变量间的合理性相倚问题为主Select过滤问题=1Select过滤问题=2SPSSSelect
Cases命令四、数据清理——逻辑一致性清理逻辑关系——数据变量间的合理性四、数据清理——数据质量抽查随机抽取数据结果对照原始问卷填答评估和评价数据资料的质量四、数据清理——数据质量抽查随机抽取数据结果第二节单变量统计分析一、单变量描述统计二、单变量推论统计第二节单变量统计分析一、单变量描述统计
一、单变量描述统计
集中趋势分析用一个典型值或代表值来反映一组数据的一般水平,或者说反映这组数据向这个典型值集中的情况。平均数众数中位数一、单变量描述统计
集中趋势分析
根据单值分组资料求平均数=xf/f
根据组距分组资料求平均数=fxm/f
根据原始数据求平均数=x/n平均数:总体各单位数值之和除以总体单位数目所得之商。根据单值分组资料求平均数=xf/f离散趋势分析用一个特别的数值来反映一组数据相互之间的离散情况。全距(Range)标准差(Standard
Deviation)异众比率(Variation
Ratio)四分位差(Interquartile
Range)离散系数(Coefficient
of
Variation)离散趋势分析用一个特别的数值来反映一组数据相互之间的离散情况离散趋势分析全距(Range)
标准差(Standard
Deviation)异众比率(Variation
Ratio)四分位差(Interquartile
Range)离散系数(Coefficient
of
Variation)离散趋势分析全距(Range)二、单变量推论统计在一定的可信度(置信水平)下,用样本统计值的某个范围(置信区间)来“框”住总体的参数值。范围的大小反映的是这种估计的精确性问题,而可信度高低反映的则是这种估计的可靠性或把握性问题。区间估计二、单变量推论统计在一定的可信度(置信水平)下,用样区间估计
总体均值的区间估计
总体百分比的区间估计95%95%区间估计总体均值的区间估计95%95%例1调查农大学生生活费状况,随机抽取900名学生作为样本,统计得到他们的月均生活费为186元,标准差是42元。在95%的置信度下,试估计全校学生的月均生活费是多少?把数据代入总体均值的区间估计公式186±Z(1-a)429001.96计算得出总体均值的置信区间为183.26——188.74元例1调查农大学生生活费状况,随机抽取900名学生作为样本,例2调查农大学生对“吸烟行为”的态度,随机抽取400名学生作为样本,统计结果表明“赞成”的比例为20%。在90%的置信度下,试估计全校学生中赞成“吸烟行为”的学生比例的置信区间?把数据代入总体比例的区间估计公式20%±Z(1-a)40020%(1-20%)计算得出总体均值的置信区间为16.7%——23.3%1.65例2调查农大学生对“吸烟行为”的态度,随机抽取400名学生一、交互分类与χ2检验工资收入文化水平合计小学及以下中学大专及以上低78.020.011.040.0中19.073.031.050.0高3.07.058.010.0(n)(360)(550)(90)(1000)表1文化水平与工资水平的交互分类表(%)深入描述样本资料分布和内在结构分组比较,揭示变量间关系将调查所得的一组数据按照两个不同的变量进行综合分类。第三节双变量统计分析一、交互分类与χ2检验工资收入文化水平合计小学及以下中学大专交互分类表的形式要求每个表的顶端要有表号和标题表格中的线条一定要规范简洁表格中百分比符号统一标注表格下端应有每列对应频数表中百分比形式一致,保留足够位小数根据变量关系安排变量行列
变量取值应有所限制交互分类表的形式要求每个表的顶端要有表号和标题χ2检验观察频数所对应的期望频数期望频数=行总数*列总数/全部个案数要保证从样本中得出的结果具有统计意义,保证样本中所体现的变量关系也反映总体的情况,就必须进χ2检验。χ2检验观察频数所对应的期望频数期望频数=行总数*列总数/全二、不同层次变量的相关测量与检验两个定类变量—Lambda系数两个定序变量—Gamma系数两个定距变量—r系数定类与定距变量—E系数二、不同层次变量的相关测量与检验两个定类变量—Lambda系
Lambda相关测量
计算公式λy=
f0-Fy
n-FyX变量每个类别下Y变量的众值频数Y变量的众值频数n=全部个案数Lambda相关测量计算公式f0-Fyn-λ具体计算过程
100名青年的性别与志愿统计表性别志愿合计男女快乐家庭理想工作增长见闻合计104010301004050106040100λ=
=0.40(40+30)—50100—50
结论:青年的性别与志愿两个变量之间呈中等程度的相关。λ具体计算过程100名青年的性别与志愿统计表性别志愿合计男定序变量与定序变量
Gamma系数检验:Z检验
同序对数目
异序对数目定序变量与定序变量Gamma系数检验:Z检验同序对具体计算过程
工人文化程度与收入水平交互分类表收入水平文化程度大学以上中学小学以下合计合计高中低12103258305434161232245620100Nd=3(30+8+16+4)+10(8+4)
+5(16+4)+30(4)=514Ns=12(30+5+16+12)+10(5+12)
+8(16+12)+30(12)=1510具体计算过程工人文化程度与收入水平交互分类表收入水平文化程G=(1510-514)/(1510+514)
=0.49结论:文化程度与收入水平呈中等程度相关。如果用前者去预测后者,可以减少49%的误差用任何两个个案在某变量上的等级次序去预测它们在另一个变量上的等级次序时,看能减少
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 乡镇视频监控建设项目方案
- 2024年胶条项目规划申请报告模范
- 2024年江西客运从业资格证考试题库c1
- 2024年文山驾驶员客运从业资格证模拟考试题库
- 2024年伊春客运从业资格证模拟考试题库下载
- 2024年天然气水合物项目申请报告模范
- 2024年三亚客运资格证考试内客
- 临床常见栓塞分析:肿瘤介入治疗
- 2024年装卸船机项目申请报告模范
- 科技行业财务决策支持工作总结
- 乡村旅游财务分析策划方案
- 高校学生事务管理1
- (中职)ZZ030植物病虫害防治赛项规程(7月19日更新)
- 2024年国能包神铁路集团有限责任公司招聘笔试参考题库附带答案详解
- 非甾体类抗炎药课件
- 出入库登记管理制度
- 内科医生的职业认知和自我发展
- 抖音传媒管理制度
- 家畜繁殖学课件
- 人教版四年级数学下册《连减的简便运算》的说课稿
- 儿童简历模板
评论
0/150
提交评论