版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
复习串讲2一、社会统计学知识体系的逻辑两条线索:单变量到多变量描述到推论统计方法描述统计推论统计参数估计假设检验描述统计一、测量层次二、数据的组织与展示三、集中趋势与离散趋势4一、四种测量层次的数学特性定类测量定序测量定距测量定比测量类别区分(=、≠)√√√√次序区分(>、<)√√√距离区分(+、-)√√比例区分(×、÷)√二、数据的组织与展示(一)定类数据的组织与展示(二)定序数据的组织与展示(三)定距数据的组织与展示(一)定类数据的组织与展示定类:表:频数分布表
图:条形图饼图
对比条形图
项目1998199920002001(一)优抚对象补助金额国家支出集体供给(二)农村传统救济金额国家支出集体供给(三)城乡各种福利院支出国家支出集体供给68.032.435.629.87.022.820.210.39.991.451.140.328.57.920.623.113.79.4
107.660.746.931.78.323.428.719.09.7
108.169.538.6
29.512.117.440.526.414.1合计118.0143.0168.0178.1苏州科技学院7(二)定序数据的组织与展示表:累加频次,简写为cf两种形式:cf频次从低到高向上累加(“小于该组上限的频数和”)cf频次从高到低向下累加(“大于该组下限的频数和”)图:条形图累积频数表(CF)向上累加——以变量数列首组的频数为始点,逐个累计各组的频数,展示小于该组上限的频数和。向下累加——以变量数列末组的频数为始点,逐个累计各组的频数,展示大于该组下限的频数和。受教育程度频数百分比Cfcf初中高中、职高、技校大专大学本科研究生及以上1723786627524340.45.520.163.910.10.45.926.089.9100.0100.099.694.174.010.1总计4306100苏州科技学院9(三)定距数据的组织与展示表:统计表组距、组数、组限图:直方图折线图直方图和条形图的区别:条形图的宽度无意义,用长度表示频数或百分比;直方图的宽度代表组距,面积代表频数或百分比。直方图的矩形是连续排列的,条形图的矩形可以分开可以连续。三、集中趋势与离散趋势变量的测度离散程度集中趋势众数中位数均值方差和标准差四分位差异众比率为了简化资料,用众值、中位值、均值来代表变量分布的集中趋势;
但为了说明它们的所能代表集中趋势的可靠程度,还需用变量的离散程度加以补充。(一)变量类型与集中趋势测度值表
变量类型和所适用的集中趋势测度值变量类型定类变量定序变量定距变量适用的测度值※众数※中位数※均值—众数众数——中位数分布的形状与
众数、中位数和均值的关系对称分布
均值=中位数=众数左偏分布均值
中位数
众数右偏分布众数
中位数
均值高层次变量可以用低层次变量的测量方法但统计分析中,更多的是用均值。对于偏态的分布,应使用中位值作为集中趋势。只有单峰和基本对称的图形,用均值作为集中趋势才是合理的。1.众数MO(概念要点)集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于定类变量,也可用于定序变量和定距变量2.中位值(概念要点)集中趋势的测度值之一排序后处于中间位置上的值Me50%50%不受极端值的影响主要用于定序变量,也可用定距变量,但不能用于定类变量中位值的计算公式(计算公式)未分组数据的计算公式分组数据的计算公式P973.均值(概念要点)1. 集中趋势的测度值之一2. 最常用的测度值3. 一组数据的均衡点所在4. 易受极端值的影响5.用于定距变量,不能用于定类变量和定序变量均值(计算公式)设一组数据为:X1,X2,…,XN简单均值的计算公式为设分组后的数据为:X1,X2,…,XK(组中值)相应的频数为:f1,f2,…,fi分组均值的计算公式为åå===++++++=KiiKiiiNNNffXffffXfXfXX11212211LL&均值(数学性质)1. 各变量值与均值的离差之和等于零
2.各变量值与均值的离差平方和最小——最小平方的性质3、算术平均数受抽样变动影响微小,通常它是总体资料集中趋势的最佳度量;4、算术平均数受极端值的影响颇大,遇到这种情况时,就不宜用它代表集中趋势了;5、分组资料如果遇到开放组距时,不经过特殊处理将无法得到算术平均数,一般不建议计算;6、用于数值型数据,不能用于定类数据和定序数据;调和平均数1. 集中趋势的测度值之一2. 均值的另一种表现形式3. 易受极端值的影响4. 用于定比数据5.计算公式为原来只是计算时使用了不同的数据!(二)变量类型与离散趋势测度值表
变量类型和所适用的离散趋势测度值变量类型定类变量定序变量定距变量适用的测度值※异众比率※四分位差※方差或标准差—异众比率异众比率——四分位差高层次变量可以用低层次变量的测量方法离散趋势数据分布的另一个重要特征如果个案之间的差异很大,则集中趋势的代表性就会很低从另一个侧面说明了集中趋势测度值的代表程度不同类型的数据有不同的离散程度测度值1.定类数据:异众比率1.离散程度的测度值之一2.又称离异比率或者质异指数3.非众数的频数占总频数的比率4. 计算公式为
5.用于衡量众数的代表性;不属于众数的个案所占比例愈大,表示众数的代表性愈小V=2.中位数:四分位差、极差四分位差1. 上四分位数与下四分位数之差
Q
=Q75–Q252. 离散程度的测度值之一3. 反映了中间50%数据的离散程度4.不受极端值的影响5.用于衡量中位数的代表性(值越大,中位数的代表性越小)四分位值:排序后处于25%和75%位置上的值Q25Q50Q7525%25%25%25%Q1与Q3差异越大,表示有50%的个案越是远离中位值,因此中位值的代表性就越差。定距数据:极差1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7891078910未分组数据R=max(Xi)-min(Xi).=组距分组数据R
最高组上限-最低组下限5.计算公式为定距数据:方差和标准差1. 离散程度的测度值之一2. 最常用的测度值3. 反映了数据的分布反映了各变量值与均值的平均差异,具体意义表示以均值作为代表值时会引起的偏差或者错误。根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3相对离势:离散系数凡是用相对数来表达的变异指标,统称为相对离势,主要有异众比率、标准差系数、平均差系数和一些偏态系数;比较具有不同单位的资料的参差程度;比较单位虽然相同而均值不相同的资料的参差程度;要想实现计量单位不同或者平均水平不一的对象之间的直接比较:绝对离势/平均指标=相对离势;全距系数、标准差系数全距系数:全距与其算术平均数之比标准差系数:数据的标准差与算术平均数之比;用百分比表示。例题:根据10个人的身高和体重资料,计算出平均身高为172.0厘米,平均体重为70.0千克,身高的标准差为4.98厘米,体重的标准差为4.77千克,问:身高和体重的离散程度的大小?描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据统计学探索现象数量规律性的过程抽样分布:描述到推论的理论基础(1)如果样本相当大(n大于30,50),则抽样分布接近正态分布;(2)抽样分布的均值就是总体均值;(3)抽样分布的标准差称为标准误差,是总体方差除以样本大小(n)的平方根;扬州大学32二、推论统计参数估计(parameter’sestimation)根据随机样本的统计值对总体之参数值进行逻辑:先看样本情况,才问总体情况。类型:点估计参数估计假设检验
逻辑:先假设总体的情况,然后再抽样和分析样本的资料,进而验证假设是否正确。类型:差异性检验、独立性检验扬州大学33(一)参数估计点估计区间估计用一个数值来估计总体参数。用一个取值范围(区间)来估计总体参数。扬州大学34大样本总体均值区间估计的常用公式置信度为90%:置信度为95%:置信度为99%:统计量的选择:z,t?分布,样本容量,总体方差?总体服从正态分布,且总体方差(2)已知如果不是正态分布,可以由正态分布来近似(n≥30)使用正态分布统计量Z正态,小样本,总体方差δ2未知用t值估计(二)假设检验按总体的对象个数分:单总体两总体多总体按总体的内容:均值成数方差是否相关1.一个总体的检验Z检验(一端与二端)t检验(一端与二端)Z检验(一端与二端)
2检验(一端与二端)均值一个总体比例方差单总体假设检验选择统计量Z?
t
?
是正态分布还是非正态是大样本还是小样本总体方差已知还是未知2.两个正态总体的参数检验两个总体的检验Z
检验(大样本)t
检验(小样本)t
检验(小样本)Z检验F
检验独立样本配对样本均值比例方差一、两个独立样本均值之差的检验(一)两个总体均值之差的Z检验(12、22
已知)(二)两个总体均值之差的Z检验
(12、22
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 如何泡蛤蚧酒?泡酒的正确方法与配方大全泡酒的比例是多少泡酒的功效与作用解析
- 医疗运营策略方案
- 【培训课件】员工敬业与责任心培训
- 医院手术证明书
- 2024正式的委托代理合同样书
- 2024建筑劳务的合同范本
- 2024至2030年中国地坎行业投资前景及策略咨询研究报告
- 2024至2030年中国铝合金挡风板行业投资前景及策略咨询研究报告
- 2024至2030年中国花洒产品数据监测研究报告
- 2024至2030年中国自行车把芯数据监测研究报告
- 白内障手术前后眼内炎的预防诊断与治疗医学课件
- 熟词生义开课
- 培养孩子的好习惯课件
- 二年级上册总复习(表内乘法)-完整版PPT
- 四年级美术上册课件-14.漂亮的房间4-苏少版(共17张PPT)
- 整形外科诊疗规范
- 总账会计岗位职责招聘
- GB∕T 17268-2020 工业用非重复充装焊接钢瓶
- 新闻写作的基本知识与常见问题
- 幼儿园:中班美术活动《柿柿如意》
- 交通事故伤残鉴定知识培训及案例课件
评论
0/150
提交评论