版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第十章 资料的统计分析调查资料的分析是在调查资料审核和整理基础上进行的。资料分析包括统计分析、理论分析。 统计分析 资料分析 理论分析 统计分析方法是一种定量分析。它是进行科学预测的重要方法。统计数据不是指单个的数据,而是由多个数据构成的数据集。单个数据显然用不着统计方法进行分析,我们也得不出任何规律,只有通过对数据集的统计才能探索内在规律。观察问卷访谈12 22 99 86 489如何使用各种统计表与统计图来描述一组数据的分组与分布情况如何通过一组数据计算一些特征数,简缩数据,进一步显示与描述一组数据的全貌(集中情况、分散情况、分布特征)数据如何分组收集方法原始数据表达形式作 用分析过程(图
2、示)统计分析的特点:(1)统计分析要以定性分析为基础;(2)统计分析方法必须和其他分析结合运用; 统计分析有一套专门的方法和技术。 单变量统计分析统计分析 多变量统计分析一、单变量统计分析(单个问题的表格化分析)由一种变量的全部分数或观察值组成的一组或一批数据称为一个分布。单变量数据的描述统计就是对其分布情况进行说明。单变量描述统计包括集中量数分析、离散量数分析。 众数 集中趋势 中位数 平均数单变量统计分析 四分位差 离散程度 全距 标准差 异众比率 集中量数分析(P280) 集中量数就是代表数据分布集中趋势的量数。集中量数分析指的是用一个典型值或代表值来反映一组数据的一般水平,或者说反映这
3、组数据向这个典型值集中的情况。 最常见的集中量数有算术平均数(简称平均数,也称为均值)、众数和中位数三种。 集中量数的作用:说明某一个社会现象在一定历史条件下的一般水平和规模;从空间上比较社会现象的数量规律;对一定社会现象在不同时期的变化进行比较,以说明这些现象发展的趋势和规律;分析社会现象之间的依存关系;众数:是指一组数据中重复次数最多的标志值。1、在单项分组数据资料中求众数方法:用观察方法A.1 3 5 6 7 7 8B.1 3 4 6 7 8 8 9 9 9C.2 2 4 5 6 6 6 6 9 12 15D.1 3 4 5 5 5 6 7 8 8 8 8 10 25平均数标准差中位数四
4、分位差众数异众比率2、在组距分组资料中求众数方法:组中值方法:1.采用观察法找出次数最多的组作为众数所在组;2.计算众数组的组中值即可。计算众数的条件(P283)中位数:是指将一列变量数值按大小顺序排列出来,处于中间位置的那个数。中位数(Md)中位数(Md),又称中数,是频数分布上50%处的数值,即将观察总数一分为二的变量值。在这个值的两边各有相同个数的数据。当数据的个数为偶数时,取分布50%(最中心)处的两个数据的平均数作为中数。方法:1、对未经分组的数据资料计算中位数(P283面)2、对经过分组的数据资料计算中位数;平均数:是指总体各个单位数值之和除以总体单位数目之商。平均数是一个表示某变
5、量所有数值集中趋势或平均水平的统计量。它是市场调查中最常用的调查数据。如调查300户居民的月均食品消费为130元, 这说明居民月均食品消费大多数集中在130元左右或平均水平为130元。 又如调查消费者对某一商品评价平均分为8.5分,则说明消费者对此商品评价大多数集中在8.5分左右,换言之,大部分消费者对商品印象良好。 1、简单算术平均数 2、加权算术平均数3、几何平均数简单算术平均数通常称平均数,又称均数或均值。英文为Mean,故以M表示。如果是由变量X计算得来的就记为 (读X杠),现在一般都 以表示样本的平均数,以U 表示总体的平均数。算术平均数就是各个变量值相加求和再除以变量的总次数。=简
6、单算术平均数的计算方法用原始数据计算平均数 。当一组数据个数不多时,可直接用原始数据来计算。如某实验小组10人的实验成绩为11,13,15,16,16,16,17,18,18,20。其平均数为: =16加权算术平均数(见P286面)几何平均数(Mg) 是n个数据的连乘积开n次方的根。常用作速率的集中量数,如学龄儿童人数的增加率、学校经费的增加率、阅读能力的进步率等。 Mg=中位数与平均数的比较(1)平均数要求计算所有的数值,而中位数只用到数值的相对位置,一般说来平均数利用了更多的信息,更全面和准确. (2)平均数容易受到极端值的影响,中位数则不会受到这种影响.平均数是一种比中位数更为稳定的量度
7、,它随样本的变化比较少.(3)当资料是定序,定类测量或者是有开口组的定距测量时,中位数能够拟补不足. 离中量数分析(P287)总体中各个标志值的差异程度。离散量数分析 离散(中)量数分析 指的是用一个特别的数值来反映一组数据相互之间的离散(中)程度.即各组数据相对于平均数的差异程度(离中程度)。差异程度小,平均数的代表性高;差异程度大,代表性低。它与集中量数一起分别从两个不同的侧面描述和揭示一组数据的分布情况.共同反映出资料分布的全面特征,同时它还对集中量数的代表性做出补充说明.常见的离散量数统计量有全距,标准差,异众比率,和四分位差. 全距(R)全距也叫极差,它是一组数据中,最大值与最小值之
8、差. 它是表示数据分布离散程度最简单的方式,即一组数据中最大数与最小数差,故称两极差。R=Xmax-Xmin当数据较多时,应用频数分布表求全距。其方法为:最大组与最小组的组中值之差或最大组上限与最小组下限之差。R=Xcmax-XcminR=Umax-LminR= 98(最大值) 43(最小值) = 55 求全距 步 骤标准差分析标准差是表示一组数据中各个数值与平均数的离散趋势。具体一点说,标准差越大,说明各个数值彼此之间的差异就越大,各个数值距离平均数这个中心的离散趋势也越大。标准差越小,说明各个数值之间差异就小,各个数值与平均数的离散趋势小。 标准差标准差:一组数据对其平均数的偏差平方的算术
9、平均数的平方根。一般以S(或 来表示 )S=例如,要调查居民人均月购买副食品的状况,从甲、乙两个街道各抽选户调查,调查数据如下:甲街道:75元、80元、82元、85元、78元乙街道:90元、60元、100元、40元、110元通过计算,这两个街道的居民人均月购买副食品都是80元。我们再来计算它们的标准差分别为3.8和29.2。甲街道的抽样标准差为3.8,乙街道抽样的标准差为29.2,乙街道抽样标准差明显高于甲街道抽样标准差。这说明乙街道5户居民之间购买副食品额差异大, 它们与平均数这一中心差距大,即离散趋势大。而甲街道5户居民之间购买副食品额差异较小,它们与平均数这一中心差距也小即离散趋势也小。
10、例1:某校三个系各选5名同学,参加智力竞赛,他们的成绩分别如下:中文系:78 79 80 81 82数学系:65 72 80 88 95英语系:35 78 89 98 100平均成绩 =80标准差:一组数据对其平均数的偏差平方的算术平均数的平方根。S(中文系)=1.414(分)S(数学系)=10.8(分)S(英语系)=23.8(分)S=异众比率:指非众数的次数与全部变量值总次数的比率。 异众比率越小,众数的代表性越大。 四分位差把一组数据按大小排列成序列,然后分成四个数据数目相等的段落,各段落分界点上的数,叫四分位数。(即每组占25)舍去资料中数值最高的25和最低的25,仅就中间50数据求其量
11、数作为离中量数,就是四分位差。 四分位差之间的间距越小,中位数的代表性越大。Q=Q3-Q1离散系数 离散系数是一种相对的离散量数统计量,它使我们能够对同一总体中的两种不同的离散量数进行比较,或者对两个不同总体中的同一离散量数进行比较。 离散系数的定义是:标准差与平均数的比值,用百分比表示。 CV=S/XCV = 100 例1:一项调查得到下列结果,某市人均平均收入为92元,标准差为17元,人均住房面积7.5平方米,标准差为1.8平方米。试比较该市人均收入和人均住房情况哪一个差异程度比较大。解人均收入的离散系数为CV=S/ 100%=18.5%人均住房面积的离散系数为CV=1.8/7.5 100
12、%=24%例2:对广州和武汉两地居民生活质量调查发现,广州居民平均收入为680元,标准差为120元;武汉居民平均收入为360元,标准差为80元。问广州居民相互之间的差异程度,与武汉居民相互之间在收入上的差异程度哪一个更大一些?解广州居民收入的离散系数为CV=120/680 100%=17.6%武汉居民收入的离散系数为CV=80/360 100%=22.2% 目前,我国各类学校招考新生和对学生进行学习成绩考查评定的主要手段是考试。而对考试成绩的评分一般是用百分制来表示,并用各科成绩相加按总分来决定被试者的优劣取舍。这种做法开来似乎公平,实际上很不合理。因为各科试题的难易程度不同,造成评分标准的宽严不一,因此各科考试成绩的统计量数,如平均数、标准差也不相等。我们不能说语文的考分80分等价于数学的考分的80分,也不能说英语考分75分等价于物理的考分75分,在这种情况下,把考生的各科考分等量齐观地相加起来,凭个考生的总分来决定优劣取舍,显然是十分不合理的。科学的方法,就是把考生是各科分数,经过一个标准化的转化过程,把每个考生的各科分数变成标准
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论