版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
社会学-研究方法分析和综合之定量(统计)分析所谓定量(统计)分析,就是对社会研究收集来的数据资料进行计算、统计检验、分析解释,并以此为依据,做出科学推断,揭示社会现象中所蕴涵的规律的一种方法。统计分析包括描述统计和推断统计两种类型。统计分析方法的内容还可以根据变量的多少划分为单变量分析、双变量分析和多变量分析,前两者可称为初等统计,后者可称为高等统计。1.描述统计描述统计主要是对所收集的资料进行整理、分类和简化,描述数据的全貌以表明研究对象的某些特性。描述统计包括数据的初步整理,数据集中趋势和离散趋势以及相关系数的度量等方面。描述统计的目的在于使杂乱无章的数据更清晰直观地显示研究对象的特征,以利于进一步分析。1.描述统计(1)描述统计的基本技术(2)集中趋势测量(3)离散趋势测量(1)描述统计的基本技术频数(Frequency):也称为次数,它是指分布在各类别中的数据个数。频数分布(FrequencyDistribution):是指一组数据中取不同值的个案的次数分布情况,它一般是以频数分布表的形式表达。频数分布表的作用:简化资料。将调查得到的杂乱的原始数据,以十分简洁的统计表反映出来.清楚地了解调查数据的众多信息。(1)描述统计的基本技术频率分布(PercentagesDistribution):是一组数据中不同取值的频数相对于总数的比率分布情况。这种比率在社会调查中经常是以百分比的形式来表达。频率分布表:是不同类别在总体中的相对数量分布。它十分便于不同总体和不同类别之间的比较。(1)描述统计的基本技术统计表:表示被说明的事物及其统计指标和数值的表格。统计表的种类按总体分组的情况分:简单表(P272表11-10)分组表单项分组表(P269表11-6)组距分组表(P269表11-7)复合表(又称交互分类表)P271表11-9(1)描述统计的基本技术统计表的结构从外表形式上看,统计表由表号、总标题(上端中部)、横行标题(左端)、纵栏标题(表上方)、指标数值、注释和资料来源等要素组成。从内容上看,统计表由主词和宾词两部分构成。P271表11-8(1)描述统计的基本技术统计图统计图是利用统计资料绘制成的几何图形或具体形象,它可以从数量方面显示出研究对象的规模、水平、结构、发展趋势和比例关系,是表现统计资料的一种重要形式。条形图饼形图折线图直方图线性图(1)描述统计的基本技术统计图──条形图条形图是用宽度相同的直条的高低或长短来表示各项统计指标数值大小的图形。根据条形图表现统计资料内容的不同,条形图又分为单式条形图、复式条形图和结构条形图。单式条形图单式条形图:是以若干距离相等的单一条形的高低、长短来表明指标数值大小的一种图形。复式条形图复式条形图:是以两个以上的条形为一组,来进行比较的一种图形,它既可以进行组与组之间的比较,又可以进行组内的比较。它常常用来表现分组资料。结构条形图结构条形图:是以一个独立的条形或几个条形的全部长度代表被说明现象的总体,并把条形分割为几个小段,用来表示构成这一总体的各个组成部分。它既可以比较现象的各部分在总体中所占比重的大小,又可以说明现象在不同时期的构成资料。这些资料可以是绝对数,也可以是百分数。(1)描述统计的基本技术统计图──饼形图饼形图通常是以圆形面积或以圆内各扇形面积的大小来表示统计指标数值大小的图形。(1)描述统计的基本技术统计图──直方图直方图是由紧挨着的长条构成的,与条形图不同的是,它的条的宽度是有意义的,实际上它不是用长条的高度而是用长条的面积表示频率的大小,长条的纵轴高度表示频率密度(频率密度=频率/组距),长条的宽度表示组距。某班统计学考试成绩分布图2101518505101520
成绩(分)60708090100人数(1)描述统计的基本技术统计图──折线图折线图是用直线连接直方图中条形顶端的中点而成的。当组距逐渐减小时,折线将逐渐变为平滑,趋向为曲线。
(
某班统计学考试成绩折线图210151850510152095
成绩(分)人数060708090100(1)描述统计的基本技术统计图──线性图线性图:表示两个变量之间的函数关系的曲线图,可以表明事物的发展规律、总体单位的分配情况、揭示事物间的依存关系或表明计划执行的进度。1.描述统计(1)描述统计的基本技术(2)集中趋势测量(3)离散趋势测量(2)集中趋势测量集中趋势分析:是从一组数据中抽象出一个代表值,以代表现象的共性和一般水平。除可以说明某一社会现象在一定条件下数量的一般水平外;集中趋势还可以对不同空间的同类现象或同一现象在不同时间的状态进行比较;以及分析某些社会现象之间的依存关系。最常见的集中量数有算术平均数(简称平均数,也称为均值)、众数和中位数三种。(2)集中趋势测量众数众数是一组数据中出现次数最多(即频数最高)的那个数值,用Mo
表示。适用条件:只有集中趋势明显时,才能用众数作为总体的代表值。例:有16例高血压病人的发病年龄(岁)为:42,45,48,51,52,54,55,55,,61,61,62,62,试求众数。58,58,58,58(2)集中趋势测量众数需要注意的几个问题:定性数据可以存在众数。众数是一组数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数。例对于某些数据而言,例如均匀分布,并不存在众数。如,原始数据:10591268对于某些数据存在两个或多于两个的众数。如,原始数据:252828
364242
某城市居民关注广告类型的频数分布
广告类型人数(人)比例频率(%)
商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100
这里的变量为“广告类型”,这是个定类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即
Mo=商品广告(2)集中趋势测量众数众数的计算方法(1)单项数列确定众数,即出现次数最多(频率最大)的标志值就是众数。(2)组距数列确定众数:在等距数列条件下,先确定众数组,然后再通过公式进行具体计算,找出众数点的标志值。(2)集中趋势测量众数计算公式:
是众数所在组的下限;是众数所在组前一组的次数;是众数所在组后一组的次数;是众数所在组的次数;
是众数组的组距。27按成绩分组(分)学生人数(人)60以下60—6970—7980—8990以上21519153合计54例对某公司员工奖金情况进行调查,得到资料如下表所示:奖金数额员工人数600以下84600-800161800-10002441000-12001571200-1400361400以上18合计700也可以作图求解众数暨南大学统计学系M0=897.65方法:即先画相邻三组次数分布直方图,然后连接相邻两组次数差的对角线,再以对角线的交点向x轴引一条垂线,它与X轴的交点即为众数.众数示意图(2)集中趋势测量中位数中位数:将总体单位的某一数量标志的各个数值按照大小顺序排列,居于中间位置的那个数值就是中位数。它的含义是全部数据中有一半数值在它之上,另一半数值在它之下。Md50%50%(2)集中趋势测量中位数计算方法①由未分组资料确定中位数排序:确定中位数位置奇数:中间位置的标志值为中位数。偶数:中间位置相邻两个变量值的简单平均数是中位数。原始数据:
2422212620排序: 2021222426位置: 123 45位置===n+125+123中位数22原始数据:
105 91268排序: 56891012位置: 123 456位置n+126+123.5中位数8+928.5(2)集中趋势测量中位数②由定序分组资料求中位数中位数的位置为:
(300+1)/2=150.5从累计频数看,中位数的在“一般”这一组别中。因此
Md=一般某城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数
非常不满意
不满意一般满意非常满意2410893453024132225270300合计300—(2)集中趋势测量中位数③由单值分组资料求中位数先计算中间位置:(n+1)÷2=(150+1)÷2=75.5再找出其对应值④由组距分组资料求中位数第一步:确定中位数所处位置,按确定(f为次数)。第二步:采用公式计算上限法:用“以上累计”法确定中位数。下限法:用“以下累计”法确定中位数。其中:U是中位数所在组的上限,L是中位数所在组的下限,fm是中位数所在组的次数,Sm+1是中位数所在组后面各组累计数,Sm-1是中位数所在组前面各组累计数,i是中位数所在组的组距。例现检测某厂生产的一批电子产品的耐用时间,得到资料如下表所示:耐用时间产品个数累计次数以下累计以上累计600以下8484700600-800161245(Sm-1)616800-1000244(fm)4894551000-1200157646211(Sm+1)1200-140036682541400以上1870018合计700--(2)集中趋势测量算术平均数(TheArithmeticMean)简称均数(Mean)或均值,定义为所有测量值之和除以变量值个数(即,样本含量SampleSize)。反映一组呈对称分布的变量值在数量上的平均水平。(2)集中趋势测量算术平均数(TheArithmeticMean)①直接计算法计算公式:例:试计算1,3,7,9的均数?(2)集中趋势测量算术平均数(TheArithmeticMean)②加权算术平均法当数据已分组,形成了变量数列:成绩
x人数f708085122合计5平均成绩=(70+80+85)/3
?平均成绩=所有人的成绩总和/总人数
=(70+80*2+85*2)/5=80(2)集中趋势测量算术平均数(TheArithmeticMean)②加权算术平均法计算公式例:由单值分组求算术平均值工人日产量(件)工人人数(人)工人人数比重(%)1011121314701503801501008.7512.5047.501872512.50合计800100.00平均指标的种类平均指标静态平均数动态平均数位置平均数数值平均数几何平均数调和平均数算术平均数中位数众数集中趋势(Centraltendency)——平均指标一组数据向其中心值靠拢的倾向和程度;测度集中趋势就是寻找数据一般水平的代表值或中心值;不同类型的数据用不同的集中趋势测度值;选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型来确定。众数、中位数、平均数的特点和应用众数不受极端值影响具有不惟一性数据分布偏斜程度较大时应用中位数不受极端值影响数据分布偏斜程度较大时应用平均数易受极端值影响数学性质优良数据对称分布或接近对称分布时应用左偏分布均值
中位数
众数对称分布
均值=中位数=
众数右偏分布众数
中位数均值众数、中位数和平均数的关系图示中位数、众数和平均数之间的数量关系决定于总体内次数分配的状况。1.描述统计(1)描述统计的基本技术(2)集中趋势测量(3)离散趋势测量(3)离散趋势测量所谓离散趋势(又称离中趋势),是指数列中各变量值之间的差距和离散程度。离势小,平均数的代表性高;离势大,平均数代表性低。离中趋势(差异程度)——变异指标变异指标用以反映总体各单位标志值的变动范围或参差程度,与平均指标相对应,从另一个侧面反映了总体的特征。(3)离散趋势测量全距(极差Range)R=最大值—最小值(R=Xmax–Xmin)优、缺点计算简便,意义清楚,但反映现象的差异程度较粗略,实用价值甚小。(3)离散趋势测量异众比率所谓异众比率,是指非众数的频数与总体单位数的比值,用VR来表示
其中:fmo为众数的频数;n是总体单位数异众比率能表明众数所不能代表的那一部分变量值在总体中的比重。例:根据下表中的数据,计算异众比率。某城市居民关注
广告类型的频数分布解:根据公式,得广告类型人数(人)频率(%)
商品广告11256.0
服务广告5125.5
金融广告94.5
房地产广告168.0
招生招聘广告105.0
其他广告21.0
合计200100.0
这说明在所调查的200人当中,关注非商品广告的人数占44%,即关注商品广告的人数占56%。由于异众比率值较大,从而用“商品广告”来反映城市居民对广告关注的一般趋势,代表性还不是很好。(3)离散趋势测量异众比率例:某项调查发现,现今三口之家的家庭最多(32%),求异众比率。某开发商根据这一报导,将房屋的户型大部分都设计为适合三口之家居住的样式和面积,你认为如何呢?(3)离散趋势测量四分位差(Quartiledeviation)四分位数(Quartile)(三个四分位数)一组数据按从小到大排列时,处于1/4位置上的变量值称为第一个四分位数(下四分位数),处于3/4位置上的变量值称为第三个四分位数(上四分位数),而中位数就是第二个四分位数。四分位数通常用符号Q表示。在未分组时下四分位数(Q1)的位置=上四分位数(Q3)的位置=显然,中间的四分位数(Q2)就等于Md。(3)离散趋势测量四分位差(Quartiledeviation)四分位数的确定例:根据下表中的数据,计算甲城市家庭对住房满意状况评价的四分位数。甲城市家庭对住房状况的评价解:已知N=300,得下四分位数的位置上四分位数的位置则根据累积频数
Q1
=不满意,Q3=满意回答类别甲城市户数(户)累积户数(户)非常不满意2424不满意108132一般93225满意45270非常满意30300合计300—(3)离散趋势测量四分位差四分位差是第三四分位数(上四分位数)和第一四分位数(下四分位数)的半距。其作用是避免全距受极端值影响大的缺点。计算公式在定距和定比变量中在定序变量中(3)离散趋势测量标准差(Standarddeviation)各变量值对其算术平均数的离差平方的算术平均数的平方根,又称均方差,用S表示。标准差是最常用的离散程度测度值。基本公式:
或(3)离散趋势测量标准差未分组资料标准差的计算
例:求72、81、86、69、57这些数字的标准差。
72-1181864861316969-41657-162563650506(3)离散趋势测量标准差分组资料标准差的计算计算公式式中fi为第i组的次数例:调查大一男生60人的身高情况如下表所示,求他们身高的标准差。
计算左边数列的标准差组距f150~1541154~1582158~1627162~16610166~17016170~17412174~1787178~1825合计60组距fx
150~1541152-16.5272272.3154~1582156-12.5156312.5158~1627160-8.572.3505.8162~16610164-4.520.3202.5166~17016168-0.50.254170~174121723.512.3147174~17871767.556.3393.8178~182518011.5132661.3合计60---0---2499一、资料的整理和分析(一)资料整理1.定性资料整理2.定量资料整理(二)资料定性分析1.定性分析基本步骤2.定性分析方法(三)资料定量分析1.描述统计2.
推论统计2.推论统计推论统计就是利用样本的统计值对总体的参数值进行估计的方法。推论统计的内容主要包括两个方面:(1)区间估计(2)假设检验(1)区间估计(IntervalEstimation)以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值来估计总体参数的值所在的范围,叫做总体参数的区间估计。区间估计的实质就是在一定的可信度(置信度)下,用样本统计值的某个范围(置信区间)来估价总体的参数值。范围的大小反映的是这种估计的精确性问题,而可信度高低反映的则是这种估计的可靠性或把握性的问题。(1)区间估计区间估计的结果通常可以采取下述方式来表述:我们有95%的把握认为,全市职工的月收入在182元至218元之间。全市人口中,女性占50%至52%的可能性为99%。区间估计中的可靠性或把握性是指用某个区间去估计总体参数值时,成功的可能性有多大。它可以这样来解释:如果从这个总体中重复抽样100次,约有95次所抽样本的统计值都落在这个区间。说明这个区间估计的可靠性为95%。对于同一总体和同一抽样规模来说①所给区间的大小与做出这种估计所具有的把握性形成正比;②区间大小所体现的是估计的精确性,区间越大,精确性程度越低,区间越小精确性越高,二者成反比;③从精确性出发,要求所估计的区间越小越好,从把握性出发,要求所估计的区间越大越好,因此人们总是需要在这二者之间进行平衡和选择。在社会统计中,常用的置信度分别为90%,95%和99%。与他们所对应的允许误差(α)分别为10%,5%和1%。在计算中,置信度常用1-α来表示。(2)假设检验利用样本信息,根据一定的概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。假设检验实际上就是先对总体的某一参数作出假设,然后用样本的统计量去进行验证,以决定假设是否为总体所接受。(2)假设检验假设检验的依据假设检验所依据的是概率论中的“小概率原理”,即“小概率事件在一次观察中不可能出现的原理”,但是如果现实的情况恰恰是在一次观察中小概率事件出现了,应该如何判断呢?一种意见认为该事件的概率仍然很小,只不过偶然被遇上了。另一种则是怀疑和否定该事件的概率未必很小,即认为该事件本身就不是一种小概率事件,而是一种大概率事件。
后一种意见代表的正是假设检验的基本思想。举例说明假设检验的基本思路某单位职工上月平均奖金为210元,这个月的情况与上月没有大的变化,我们设想平均奖金还是210元。为了验证这一假设是否可靠,我们抽取100人作调查,结果得出月平均奖金为220元,标准差为15元。显然,样本的结果与总体结果之间出现了误差,这个误差是由于我们假设错误引起的,还是由于抽样误差引起的呢?如果是抽样误差引起的,我们就应该承认原来的假设,而如果是假设错误引起的,我们就应该否定原假设。方法通过将原假设作为虚无假设,而将与之对立的假设作为研究假设,然后用样本的数据计算统计量并与临界值比较。当统计值的绝对值小于临界值,即│Z│<Zα/2时则接受虚无假设,否定研究假设;当统计值的绝对值大于或等于临界值:即│Z│≥
Zα/2时则拒绝虚无假设,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024版样机试制合作协议
- 2024年出租车租车合同模板
- 怀孕期间夫妻分手协议
- 城市轨道交通工程建筑信息模型(BIM)分类与编码标准
- 建筑行业标准脚手架租赁合同
- 2024项目投资合同撰写要点
- 购买混凝土合同范本
- 生物中图版自主训练:第三单元第一章第一节遗传物质的发现
- 简单的赔偿协议书2024年
- 2024届毕业生就业协议书样本
- 小学语文人教三年级上册 群文阅读《奇妙的中心句》
- 大数据和人工智能知识考试题库600题(含答案)
- 2023年上海机场集团有限公司校园招聘笔试题库及答案解析
- 镜头的角度和方位课件
- 污水处理常用药剂简介知识讲解课件
- 五年级上册英语课件-Unit 1《My future》第1课时牛津上海版(三起) (共28张PPT)
- 光交接箱施工规范方案
- 气温和降水学案
- 普及人民代表大会制度知识竞赛试题库(1000题和答案)
- 国家电网公司施工项目部标准化管理手册(2021年版)线路工程分册
- 《汽车低压线束设计规范》
评论
0/150
提交评论