社会统计学课件_第1页
社会统计学课件_第2页
社会统计学课件_第3页
社会统计学课件_第4页
社会统计学课件_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

社会统计学陈磊哲学与社会学学院社会调查研究的步骤确定课题了解情况建立假设确立概念和测量方法设计问卷试填问卷调查实施(抽样调查)校核与登录统计分析与命题的检验数据的描述分布(频次分布):一个概念或变量的各种情况出现的次数或频次。分布的一般形式为:

(X1,m1)(X2,m2)……(Xn,mn)变量的一切可能取值该种取值所对应的频次概率频率频次分布概率分布频率分布注意:变量的可能取值必须全部列出,并且没有重复。统计表家庭结构频次百分比核心家庭直系家庭联合家庭其它105072011025049.333.85.211.7总数2130100家庭结构的频次分布(××地,1985.6)表头标识行主体行源自××××(表2-1)表尾表号变量取值要注意的问题:每个变量值有且仅有一个“归宿”。变量取值必须完备。(2)变量取值必须互斥。

例1收入(元)0-100200-300300以上收入(元)0-100100-200200以上表2-2表2-3上组限不包括在内不同类型变量的取值特点及统计表特点不同类型变量的取值特点定类变量变量值是哑元,不是连续实数。定序变量变量值可以比较大小,不连续。定距变量离散型:观测值不多连续型:观测值众多各类变量所对应统计表的特点定类变量

※百分比统计表中最后要注明统计总数。

※变量的取值次序可根据需要调整。定序变量

※定序变量的取值有大小次序之分,应保留其变化趋势,不要打乱。定距变量

※离散型定距变量的制表方法与定序变量的制表方法相同。

※将连续型定距变量的变量值分为若干区间或组,然后统计每个组内的频次或百分数。定距变量分组的注意问题1.等距分组与非等距分组:一般采用等距分组,有时非等距分组更能反映现象的本质。2.组数:调查总数N分组数K50~100100~250250以上6~107~1210~203.决定分点的精度:分组点的小数点精确位数比原统计资料高一位。表2-4标明组界:根据分组要求得到的分组点,其精度与原始数据相同,前后分组点不连续。真实组界:将标明组界的精度提高一位,使前后分组点连续。例:设一统计资料中变量年龄的取值范围为1~8岁,按2岁一组,写出标明组界和真实组界。标明组界真实组界1~23~45~67~80.5~2.52.5~4.54.5~6.56.5~8.5问题:真实组距是否违反变量值必须互斥的原则?注意:只有定距变量的统计表存在分组问题!例:100个同龄儿童的身高统计(单位:米)1.431.431.331.391.371.441.381.421.411.401.391.361.421.441.421.301.411.331.431.371.401.441.271.371.331.361.401.461.391.361.381.381.441.561.421.461.381.311.491.491.431.351.411.391.401.361.431.421.321.381.391.411.481.441.411.341.381.511.361.401.411.361.331.371.451.391.441.421.341.431.381.451.401.441.321.441.401.461.461.371.481.361.471.421.471.381.431.421.391.411.391.451.411.371.491.471.371.501.431.40表2-5步骤1:收集数据,写成数据表。步骤2:找出数据中最大值L,最小值S。步骤3:根据表2-4取合适的分组数。此处K=10。步骤4:计算组距h=(L-S)’÷K。结果比原始数据多精确小数点后一位。步骤5:根据组距h和分点精度比原统计数据高一位的原则,将数据分组。步骤6:计算各组的中心值bi。bi=(第i组真实下界值+第i组真实上界值)÷2步骤7:作频次分布表。统计表的特点不需要文字叙述就能反映出资料的特性及资料间的关系。有较高的精确性,但不直观。组号真实组界限中心值频次ni相对频次=ni÷∑ni123456789101.265~1.2951.295~1.3251.325~1.3551.355~1.3851.385~1.4151.415~1.4451.445~1.4751.475~1.5051.505~1.5351.535~1.5651.281.311.341.371.401.431.461.491.521.55147222424106110.010.040.070.220.240.240.100.060.010.01总和∑ni=1001表2-6§3.1如何用图来表示数据?§3.1如何用图来表示数据?统计图(分布图)定类变量:圆瓣图(圆饼图);条形图※圆瓣图:用圆形代表现象的总体,用圆瓣代表现象中一种情况,其大小代表变量取值在总体中所占的百分数。※条形图:用长条的高度来表示资料类别的次数或百分数。一般画成等宽长条。若变量是定类变量,则长条排列次序可以任意,条形离散。例:考察马萨诸塞州NewBedford地方法庭判决的72犯人在服完刑一年到两年半的时间里是否又因新的罪行被判决。结果24个犯了新罪,而剩下的48个在数据收集时还没有。33%67%33%67%图2-1图2-2圆瓣图优点:易于显示每一组的相对大小。对变量取值的排列没有要求,故多用于定类变量。圆瓣图缺点:不易显示每组有多少个观测数。并且圆瓣图在变量取值较多时效果不好。罪犯数(人)0204060罪犯数(人)图2-3图2-4条形图优点:图2-3易于显示每一变量的观测值。图2-4易于显示总观测值和第一类观测数。条形图缺点:图2-3不易显示总的观测数。图2-4不易于显示第一类外的其它类观测数,且变量值越多,等高不等宽的条形图越复杂。注意:上述条形图的值都是从0开始,然而有时也不是这样。思考:怎样为两个分类变量作图?例:马萨诸塞州NewBedford地方法庭的法官RobertKane在马萨诸塞州大学RobertP.Waxler教授鼓励下,让在他的法庭上被判罪的犯人选择进监狱或上由Robert教授教的文学课。印地安那大学的Roger教授跟踪调查了选择听课的32人,发现以后又有6人犯了新罪;而选择去监狱的40人中,18人在被释放后又犯了新罪。(来源:TheNewYorkTimes,Oct.6,1993)罪犯数(人)罪犯数(人)5040302010文学课监狱

(2)定序变量:条形图(长条按序排列,条形可以离散,也可以紧挨)。

(3)定距变量:直方图;折线图。

直方图:由紧挨着的长条组成,但长条的宽度有意义。以长条的宽度表示组距,条形的长度表示频次密度或相对频次密度(频率密度),长条的面积来表示频次或相对频次。频次密度=频次组距(条宽)相对频次密度=相对频次(频率)组距(条宽)注意:直方图仅适用于定距变量。当变量取值是等距分组时,直方图和条形图在本质上是相同的;但在非等距分组的情况下,直方图和条形图完全不同,尤其应该注意。(1)定类变量:饼形图;条形图。(2)定序变量:条形图(长条按序排列,条形可以离散,也可以紧挨)。

(3)定距(分组)变量:直方图;折线图。

直方图:由紧挨着的长条组成,但长条的宽度有意义。以长条的宽度表示组距,条形的长度表示频次密度或相对频次密度(频率密度),长条的面积来表示频次或相对频次。频次密度=频次组距(条宽)相对频次密度=相对频次(频率)组距(条宽)注意:直方图仅适用于定距变量。当变量取值是等距分组时,直方图和条形图在本质上是相同的;但在非等距分组的情况下,直方图和条形图完全不同,尤其应该注意。年龄段

15.5-20.5

20.5-30.5

30.5-40.5

40.5-65.5频次

122

95频次密度

0.22.2

0.9

0.2表2-4一星期内新娘人数的分布图2-4一星期内新娘人数的分布2.22.01.81.61.41.21.00.80.60.40.2015.520.525.530.540.565.5

频次密度

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论