实用社会统计分析技术_第1页
实用社会统计分析技术_第2页
实用社会统计分析技术_第3页
实用社会统计分析技术_第4页
实用社会统计分析技术_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用社会统计分析技术 及spss和stata统计软件操作说明第一讲 课程主要内容: 本课程教授的内容是专门针对抽样调查数据资料的统计分析技术,而不适用于试验性调查资料和观察性调查资料的分析。课程安排: 统计学基础知识:统计学基础知识:1)描述性统计、2)概率论和3)推论统计。(三讲)。 数据处理技术:数据处理技术:4)数据录入、整理、校验和加权、5)数据加工、重组和再生变量。(两讲)。 统计分析技术:统计分析技术:6)量表和指标建构、7)列联表分析技术、8)简单线性回归、9)多元回归、10)非线性转换、11)对数线性模型、12)logistic回归、13)多元logistic回归、14)等级l

2、ogistic回归、15)probit模型、16)tobit 模型、17)poisson 回归、18)因子分析、19)路径分析、20)结构方程、21)事件史分析什么是统计学什么是统计学 统计学就是描述、组织和解释数据或信息的一套工具和技术。它帮助我们理解周围的世界。 统计分析中的两个最基础的概念 描述性统计(描述性统计(descriptive statistics) 推论统计(推论统计(inferential statistics )什么是描述性统计什么是描述性统计(descriptive statistics) 描述性统计就是组织、描述和总结所收集到的一组数据的特征。 需要注意的是,它所描述

3、的是这组数据本身的分布特征。 编号姓名年龄职业1王x x30工人2李x x42干部3张x x18学生4李x x26工人5李x x22工人6刘x x29教师7陈x x19农民8王x x22工人9陈x x25工人10吴x x23工人什么是推论统计什么是推论统计(inferential statistics 推论统计就是从一个较小的群体中了解的信息并得出相关结论,推广到更大的一个群体。我们把较小的这个群体,也就是我们收集了数据的群体称之为样本(sample),把更大的那个群体,也就是我们所感兴趣的、要研究的对象群体称之为总体(population)。 偏误估计(biased estimation)与

4、无偏估计(unbiased estimation) 很多因素导致了偏误估计过高估计或过低估计。样本的代表性、数据收集过程中的误差、计算中的差错,尤其是干扰因素的作用,等等,都有可能导致偏误估计。 要达到无偏估计需要一系列的技术手段,应用统计技术的研究者就是采用这些技术手段,以样本去推测总体,以达到无偏估计。 在社会科学研究中,人为地制造(模拟)试验环境,控制各种干扰因素,以达到(自然)科学的求证方法。这就是社会统计学的一种思维方式。 描述性统计 集中趋势的量度(measures of central tendency) :共性 离散程度 的量度(measures of variability)

5、:异质性集中趋势的量度 集中趋势(平均数值)是对整个群体的数值的最好的代表。 有三种形式的平均数值:平均值(mean)、中位数(median)、众数(mode)。 其中,最常用的是平均值。xxn离散程度 离散程度 (异质性 )反映的是数值之间是如何的不同。 同样均值不同差异程度 。如: 7,6,3,3,1 3,4,4,5,4 4,4,4,4,4 有三个离散程度的量度指标:全距(range)、标准差(standard deviation)、方差(variance)。 其中,最常用的是标准差。标准差标准差 标准差标准差反映的是每一个个案的分值与平均的分值之间的差距,简单来说,就是平均差异有多大。

6、标准差越大表示差异越大。 21xxsn不同样本量的标准差的偏误估计与无偏估计之差比较样本数标准差公式中分子的值总体标准差的偏误估计(除以n)总体标准差的无偏估计(除以n-1)偏误估计与无偏估计之差105007.077.450.381005002.242.250.0110005000.70710.70750.0004十个阶层的平均个人月收入个 人 月 总 收 入 ( 排 除 在 校 生 )944.1741636.9781436.28701601.0014175.56645860.855782.73200863.124664.86358609.443925.426431202.417570.136

7、15557.462540.06715532.824150.142523178.29821.2129793.208455.685526997.006十 大 阶 层国 家 与 社 会 管 理 者经 理 人 员私 营 企 业 主专 业 技 术 人 员办 事 人 员个 体 工 商 户商 业 服 务 业 员 工产 业 工 人农 业 劳 动 者城 乡 无 业 失 业 半 失 业 者total mean 均 值 n 样 本 数std. deviation标 准 差方差 量度离散程度的第三 个 指 标 是 方 差(variance)。 方差就是标准差的平方。221xxsn单变量描述性统计 均值 标准差单变量描

8、述统计的目的 检查数据 对此变量的分布特征做初步判断; 依据此数据推论总体是否合适,要如果做调整; 依据此变量分布特征,选择合适的统计模型。用图形显示数据用图形显示数据 为什么要用图形显示数据? 柱状图柱状图 多边图多边图 线性图线性图 年龄组69311.211.211.2140322.722.733.8162826.326.360.1115818.718.778.877312.512.591.35408.78.7100.06194100.0100.016-2021-3031-4041-5051-6061-70totalvalidfrequency percent valid percentc

9、umulativepercent柱状图ca se s w e ig hte d b y w eig h t年龄组6 1 -7 05 1 -6 04 1 -5 03 1 -4 02 1 -3 01 6 -2 0count1 8 0 01 6 0 01 4 0 01 2 0 01 0 0 08 0 06 0 04 0 0多边图cases weighted by weight年 龄 组61-7051-6041-5031-4021-3016-20count18001600140012001000800600400线性图dot/lines show counts123456年龄组0250500750c

10、co ou un nt tdot/lines show counts203040506070年龄050100150c co ou un nt tdot/lines show counts51015个人月总收入(排除在校生)010002000c co ou un nt t图型显示的频数分布特征 频数分布的特征可以有4个指标来显示: 均值 标准差 斜度(skewness) 峰度(kurtosis) 均值均值 低收入低收入 a群体的平均收入 b群体的平均收入 c群体的平均收入 高收入高收入 频数异质性(标准差)异质性(标准差) 频频数数低收入低收入 均值 高收入高收入群体a的收入分布群体b的收入分布

11、群体c的收入分布 斜度斜度 频频数数低收入低收入 高收入高收入群体a收入分布正向倾斜群体b收入分布无倾斜 群体c收入分布负向倾斜 dot/lines show counts0100002000030000失业半失业者个人月总收入(排除在校生)0255075countcountdot/lines show counts0100002000030000农业劳动者个人月总收入(排除在校生)050100150countcountdot/lines show counts0100002000030000产业工人个人月总收入(排除在校生)01020304050countcountdot/lines show counts0100002000030000商业服务业员工个人月总收入(排除在校生)01020countcountdot/lines show counts0100002000030000个体工商户个人月总收入(排除在校生)010203040countcountdot/lines show counts0100002000030000办事人员个人月总收入(排除在校生)051015countc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论