统计学复习-上_第1页
统计学复习-上_第2页
统计学复习-上_第3页
统计学复习-上_第4页
统计学复习-上_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《统计学》复习上第一章总论统计学三个主要学派:*A.政治算术学派(〈英>威廉•配第、〈英〉约翰•格朗特)威廉•配第:《政治算术》采用统计方法对实质性问题进行了研究,是统计学的创始人。约翰•格朗特:人口统计学的创始人。*B.记述学派[国势学派](〈德>康令、〈德〉阿亨瓦尔)*阿亨瓦尔:1764年首创统计学一词。*C.数理统计学派(〈比利时〉阿道夫•凯特勒)阿道夫•凯特勒:将概率论广泛地引进统计形成近代统计。(近代统计分为:描述统计和推断统计。)统计的三种涵义:1•统计工作(活动):调查研究。资料收集、整理和分析。是基础。2•统计资料:是统计工作的成果。包括统计数据和分析报告。3•统计学:研究如何搜集、整理、分析数据资料的一门方法论科学。统计学:*性质:是研究大量社会现象(主要是经济现象)的总体方面的方法论科学。*研究对象:大量社会现象的数量方面。包括数量特征、数量关系、数量界限等。统计学的分类与特点:1•分类:数理(理论)统计学和应用(专门)统计学。其中,应用统计学又分为经济统计学、社会统计学和科学技术统计学三大类。2•特点:广泛性、数量性、总体性、具体性、变异性。统计的职能、研究方法和统计工作过程:基本任务:统计的基本任务是对国民经济和社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督。$三大职能:提供信息(基础职能)、咨询服务、监督检查.$$研究方法:大量观察法、统计分组法、综合指标法、统计模型分析法、统计推断法。$3•工作过程:统计设计(明确调查目的、确定总体或样本、明确调查方法)、统计调查(资料的搜集)、统计整理(资料的处理和显示)、统计分析(结果的说明)。统计总体和总体单位:总体:是客观存在的、在同质基础上结合起来的许多个别单位的整体。具有客观性、大量性、同质性(构成总体的基础)、变异性和相对性五个特点。总体按其单位是否可以计数分为有限总体和无限总体。一个统计总体可以有多个指标。总体单位:构成总体的各个基本单位(或元素),是各项统计数字的原始承担者。总体与总体单位:整体与个体的关系,具有相对性。标志和变量:标志1•概念:标志是总体单位所具有的属性和特征。分类:根据标志在总体单位之间的具体表现是否相同:不变标志和可变(变异)标志;根据标志所说明现象的性质不同:品质标志和数量标志。变异:标志在各单位之间的变化或差别,包括质的差别和量的差别。可变标志都会发生差异,变异是统计的前提。变量1•概念:数量标志的不同具体表现称为变量。变量的具体数值称为变量值。2•分类:按取值是否连续分为连续变量(任意数表示。可以在两位整数之间插入无限小数。)和离散变量(只能按整数计算)。统计指标:1•概念:反映统计总体数量特征的科学概念和具体数值。由指标名称和指标数值所构成。2•特征:具体性、综合性、数量性。分类:按反映的数量特征不同:数量指标(规模大小、数量多少)和质量指标(属性,生产效果、工作质量)。*B•实物指标和价值指标。按作用和表现形式不同:总量指标、相对指标、平均指标和变异指标。按功能不同:描述指标、评价指标和预警指标。标志与指标:联系:指标的数值都是数量指标汇总得到的;标志与指标之间存在着转化关系。区别:(1) 两者说明的对象不同:标志说明总体单位特征;指标说明总体的数量特征。(2) 标志分数量标志和品质标志,而只有数量标志用数值表示,品质标志则不能;指标不论数量指标还是质量指标都用数值表示。(3) 数量标志的数值不一定经过汇总得到;指标数值则必须经过汇总才能得到。(4)完整的统计指标必须具备一定的时间、地点等条件;标志一般不需要。指标体系:概念:反映社会经济现象数量特征的表一系列相互联系的统计指标的统称。内容:由社会经济现象的特点来决定。包括产品统计、工业劳动工资统计、劳动资料统计、劳动对象统计、产品销售、库存与价格统计、成本财务统计。反映了因果关系、依存关系、平衡关系。3•分类:基本统计指标体系(反映国民经济和社会发展,包括社会指标体系、经济指标体系和科学技术指标体系。)和专题统计指标体系(针对某项社会经济问题而制定,如企业经济效益指标体系、价格指标体系、小康生活指标体系等。)。设计原则:科学性、目的性、整体性、统一性、可比性。第二章资料收集统计数据的来源:1•初级资料(第一手资料);2•次级资料(第二手资料);*3•统计网站与统计出版物。统计数据的类型:(按所采用的计量尺度不同)定类数据(分类数据):如工种有金工、电工等。定序数据(顺序型数据):如职称分为教授、副教授、讲师、助教。定距数据:如温度有50、61、79°C等。数值型数据 广aD.定比数据:如职工的年收入8、4、9万元等。统计调查概述:含义:根据统计研究的目的和要求,运用各种调查的组织形式和方法,有组织、有计划向所研究的社会现象总体各单位搜集统计资料的过程。2•作用(意义):所搜集和提供的资料是统计整理和分析的基础;调查所搜集的原始资料的质量在很大程度上决定了是整个统计工作质量。3•基本要求:准确性、及时性、全面性。4.分类:按搜集资料的组织方式:统计报表制度和专门调查。按调查对象是否完全:全面调查和非全面调查。按调查的连续性:经常性调查和一次性调查。按资料搜集的方法不同:直接观察法、报告法、采访法和通讯法。调查方案的设计:1•确定调查目的;2•确定调查对象、调查单位和填报单位;3•确定调查项目和调查表(单一表、一览表);确定调查时间一一规定资料所属的时点或时期、调查期间;制定调查的组织实施计划。问卷设计:1•基本结构:问卷标题、问卷开头、甄别部分、问卷主体、背景部分。2•设计程序:准备阶段、拟订初稿、试访和修改、定稿。3•设计原则:功能性原则、可靠性原则、效率原则、可维护性原则。4•问题与答案的设计:问题设计:开放式和封闭式(二项选择式、多项选择式、序列式、等级式、定距式)。注意的问题:目的,可行性;回答要容易;问题应明确和精确;避免逻辑错误;顺序要先易后难;避免诱导;问题要有针对性;调查项目数量应适当;问题与答案要编码。5•量表的分类:定类量表、定序量表、定距量表。统计调查的方式:统计报表制度:(全面调查)1•概念:根据国家的统一规定,按照统一的表格形式,统一的指标内容、统一的报送时间,自上而下逐级提供统计资料的统计报告制度。主要搜集国民经济和社会发展基本情况的资料。2•特点:统一性、时效性、全面性、可靠性。分类:按报表内容和实施范围不同:国家统计报表、部门统计报表和地方统计报表。按调查范围不同:全面统计报表和非全面统计报表。按保送周期不同:日报、旬报、月报、季报、半年报和年报等。按填报单位不同:基层报表和综合报表。一般格式:表头:表名、填报单位、制发机关和表号。表身:报表主体。表脚:填表人、负责人、报出日期。5•资料来源:原始记录和统计台账。6•汇总方式:逐级汇总、集中汇总、逐级汇总和集中汇总相结合。专门调查:专门调查普查、重点调查、典型调查和抽样调查四种,这类调查大多属于一次性的调查。1•普查:为了研究某种社会现象而专门组织的一次性的全面调查。2•重点调查:在所调查的对象中,选择一部分重点单位进行调查登记的非全面调查。可以专门组织一次性调查,也可以对重点单位布置报表。(P44)典型调查:在对调查对象进行全面分析的基础上,有意识地选择若干具有代表性的典型单位进行深入调查的一种非全面调查。(P44)4•抽样调查:非全面调查。在全部调查单位中按照随机原则抽取一部分单位进行调查,根据调查的结果推断总体的一种调查方法。抽样调查将逐步成为统计调查的主体。国家统计调查体系的目标模式:建立以必要的周期性普查为基础,经常性的抽样调查为主体,重点调查、科学核算等为补充的多种方法综合运用的国家统计调查方法体系。实现周期性的普查制度,掌握重要国情。大力推广应用抽样调查技术,确定其主体地位。缩小和精简全面统计报表的范围,发挥重点调查的作用。注重科学的推算方法,加快统计信息自动化系统的建设。(我国统计报表制度中,大多数的统计报表属于经常性的群面调查。)第三章资料整理资料整理概述:1•意义:根据统计研究的把目的与要求,对所搜集到的大量、零星分散的个体原始资料进行科学加工与综合,使之系统化、条理化、科学化,为统计分析提供反映事物总体和特征的资料。$内容:统计资料审核(完整性、正确性审核>统计资料分组(统计整理的关键)、统计资料汇总、编制统计图表、统计资料的系统积累。$*调查问卷的答案缺失可能的三种表现:全部不回答、部分不回答、隐含不回答。3•数据的预处理:数据的审核:审核资料的完整性和及时性;审核资料的正确性;次级资料的审核。资料审核后的订正。资料整理方案的设计:确定汇总指标与综合表;确定分组方法;选择资料汇总的形式;确定资料的审查内容与方法。统计分组:1•含义:根据统计总体内在的特征与统计研究的任务需要,将统计总体按照一定的标志划分为若干组成部分的一种统计方法.一种在统计总体内进行的定性分类;把同质总体中具有不同性质的单位分开;把总体划分为一个个性质不同的、范围更小的总体。2•原则:穷尽原则、互斥原则。$作用:区分现象的性质,划分现象的类型;反映现象的内部结构;揭示现象之间的依存关系或因果关系$(*恩格尔系数)。4•标志的选择:必须遵循的原则。根据研究问题的目的选择分组标志;选择能够反映现象本质或主要特征的标志;考虑现象所处的具体历史条件和经济条件。5•简单分组与复合分组:根据统计分组时采用标志的多少。(P59)次数分布数列(分配数列):构成(基本要素):总体分组;总体单位在各组分配的次数。次数的绝对数称为频数,即各组的总体单位数。次数的相对数称为频率或比重,即次数与总次数的比值。*变量数列各组频率的总和为1。2•分类:品质数列和变量数列。变量数列分为单项数列和组距数列。组距数列分为等距数列和异距数列。3•变量数列的编制:初步分析:计算全距(R)=变量的最大值(Max)—变量的最小值(Min)。估算组数(K)与组距(I):K=R/I。定上下限:第一组下限WMin;最后一组上限$Max。具体问题:(1)组限(上限和下限):一组的最大值和最小值。连续变量:组限用重合式,即相邻两组的组限必须是重叠的。{1000~2000;2000~3000;...}……… (3)离散变量:组限一般不用重合式。{1~6;7~12;...}开口组:缺上限或下限的组{200以下;200~500;...;1200以上}。既有上限又有下限的组为闭口组。重合式:“上限不在内。”一组的上限不再本组而在下一组。{100~200;200~300;...200既是第一组的上限又是第二组的下限。如正好有200的数据则归入第二组。}组距:a.闭口组组距:连续变量组组距=上限一下限。离散变量组组距二上组下限一本组下限。b.开口组组距:用其相邻组的组距来近似代替。{300以下;300~500;500~700;...“300以下”这组的组距就用“300~500”这组的组距近似代替,则组距I=200。}组数:取决于总体的全距和组距。组中值:闭口组:组中值二(上限+下限)/2。开口组:缺上限的组中值二下限+(邻组组距/2);缺下限的组中值二上限一(邻组组距/2)。4•累计次数分布表和分布图:较小累计次数、较大累计次数。(P66)统计表和统计图:统计表:$结构:总标题;横行标题(统计研究的对象。也称主词。);纵栏标题(说明主词的指标名。也称宾词。);数字资料。$2•种类:a.$按主词的不同:简单表、简单分组表、复合分组表。$*b.按宾词的不同:平行形式、复合(交叉)形式。*对总体按某个标志进行分组:分组表。3•设计与填写:原则:合理、科学、实用、简介、美观。(P69)统计图:1•特点:简洁具体、形象生动和直观易懂。2•分类:条形图、饼形图(圆形图)、直方图、曲线图(线性图or折线图:变量的组数无限增多时,折线便趋于一条光滑的曲线。)、象形图。曲线(折线)图根据所反映的统计资料内容,分为分配曲线(折线)图、依存关系曲线(折线)图和动态曲线(折线)图。次数(变量)分布类型:正态分布(也叫钟型分布):两头小,中间大。U型分布:两头大,中间小。J型分布(正J型和反J型):一头大,一头小。第四章总量指标和相对指标*综合指标的具体表现形式:总量指标、相对指标、平均指标和变异指标。总量指标:1•概念:总量指标是反映客观现象总体一定时间、地点条件下的$总规模、总水平$的统计指标。其表现形式是绝对数,且是有名数。2•作用:人们认识现象总体数量特征的基础指标,可以反映国家、地区、部门或单位在一定时期的基本情况;计算其他统计分析指标的基础。种类:按反映总体内容的不同:总体单位总量和总体标志总量。按反映的时间状态不同:时期指标和时点指标。(1) 时期指标:$具有可加性,可以累加;数值大小与包含的时期长短有直接关系;数值时连续登记、累计的结果。${XXXX年;XX季度;今年;•••}(2) 时点指标:$不具有可加性,相加无意义;数值大小与其时间间隔长短无直接关系;数值时间断计算的。${X月末;X月X日;年底;•••}按所采用的计量单位不同:实物指标(直接反映总体的使用价值总量)、价值指标(反映总体的价值总量)、劳动指标。实物指标的计量单位:自然单位(人、头、辆等)、度量衡单位(吨、米、千米等)、双重单位(千瓦/台)、复合单位(吨公里、千瓦时等)、标准实物单位(15匹马力为拖拉机的一个标准台)。价值指标的计量单位:元、亿元、万美元等。劳动量指标的计量单位:工时、工日、课时等。4•计算方法:直接计量法和间接推算法。注意问题:明确总量标志的含义与范围;计算实物指标时要注意现象的同类性;在统一汇总时必须要有统一的计量单位。*总量指标数值大小随总体范围扩大而增大,缩小而减小。相对指标:概念:相对指标是说明社会经济现象之间数量对比关系的统计指标,是两个有联系的指标数值对比求得比值或商数。2•作用:可以反映现象之间的联系程度、发展程度及经济效益等;b.便于比较和分析事务。3•表现形式:a.无名数:没有计量单位,抽象化的数值。${系数和倍数(将对比的基数抽象为1而计算的相对数)、成数、百分数和千分数、百分点•••}$大多数的相对指标是无名数。b.名数(有名数):有计量单位,通常是由分子、分母的单位符合而成。{人/平方千米、瓦/人、元/人•••}种类及计算方法:分类:计划完成程度相对指标、结构相对指标、比例相对指标、比较相对指标、动态相对指标、强度相对指标。比较相对指标:比较相对数二某指标数值/另一总体的同类指标数值*100%(静态对比、不同总体中同类指标对比)$分子分母在某种情况下可以交换$,但若对比的对象为一典型标准对象,则分子分母不能互换。一般用倍数或系数表示,有时也用百分数表示。例甲、乙两公司2009年销售额分别为5.4亿元和3.6亿元,贝U:比较相对指标=5.4/3.6=1.50(倍)动态相对指标(发展速度):动态相对数二报告期水平/基期水平*100%(动态对比、同一总体)一般用百分数表示。*增长速度二(报告期水品-基期水品)/基期水品*100%=发展速度-1。值正叫增长速度(增长率),值负叫降低速率(降低率)。例甲企业2009年的产值是2400万元,2008年的产值是2000万元,贝U:发展速度=2400/2000=120%强度相对指标:强度相对数二某一总量指标数值/另一有联系而性质不同的总量指标数值*100%(不同总体的不同性质指标对比。强度相对指标的分子与分母属于不同总体。$某些强度相对指标的分子分母可以互换$形成正指标、逆指标。但人均GDP、人口出生率和死亡率等之类的强度相对指标的分子、分母不能互换。分类:有名数:商品流转次数,人均GDP等;无名数:人口自然增长率、产值利润率等。*5.六种相对指标的比较:第五章平均指标和变异指标平均指标:1.概念:平均指标是反映同质总体各单位某一标志在具体时间、地点条件下达到的一半水平的统计指标,也称平均数。它是总体内各单位参差不齐的标志值的代表值,也是对变量分布集中趋势的测定。2•特点:将数量标志差异抽象化;只能就同类现象计算;能反映总体变量值的集中趋势。$作用:反映现象总体的综合特征;反映变量分布的集中趋势;用于对比分析;可作为论断事物的一种数量标准或参考。$种类:按反映的时间状态不同:静态平均数和动态平均数。按计算或确定的方法不同:数值平均数和位置平均数。数值平均数主要有算术平均数、调和平均数、几何平均数。

位置平均数主要有中位数和众数。(一)数值平均数:A.算术平均数:算术平均数二总体标志总量/总体单位总量1•分类:a.简单算术平均数:(最简单的那种•••)b.加权算术平均数:

匸XfX= iiib.加权算术平均数:

匸XfX= iii若为组距数列,先计算组中值,用组中值代替各组标志值。其而不是准确数值。比重形式的加权算术平均数:具有假定性,假定各组标志值均匀分布,计算结果只是近似值,而不是准确数值。比重形式的加权算术平均数:*权数:是分布数列中的频数或频率,对求平均数起一个权衡轻重的作用,是影响平均数变动的两个因素之一(另一因素是变量值)。影响加权算术平均数的因素:变量、权数(包括次数的相对数和次数的相对数)算术平均数的数学性质算术平均数与总体单位数的乘积等于总体各单位标志值的总和;如果每个变量值加或减任意数值A,则平均数也要增多或减少这个数A;如果每个变量值都乘以或除以任意数值A,则平均数也乘以或除以任意数值A;各个变量值与算术平均数的离差之和等于零;各个变量值与算术平均数的离差平方之和等于最小值。调和平均数:概念:总体各单位标志值倒数的算术平均数的倒数,也称倒数平均数。分类:b.加权调和平均数:vb.加权调和平均数:v—H"Xi先计算总体单位标志值倒数的加权算

术平均数,然后求其倒数。(m为权数)TOC\o"1-5"\h\z几何平均数: Sm= i_H Sm/iXi

概念:n个比率乘积的n次方根。计算平均比率和平均速度。分类:简单几何平均数:x为变量值,n为变量值个数,n为X-n卜x 连乘符号(不是pai,罗马数字2的G i 底不封口)。加权几何平均数:f为次数,其余同上。例1 某商品由出厂价到一级站毛利率为8%,一级站到二级站毛利率为10%,二级站到零售店毛利率为10%,零售店到消费者手中毛利率为15%,求该商品四个环节的平均毛利率为多少?解把毛利率还原为本利率,则平均本利率为:X=41.08x1.1x1.1x1.15=110.72%平均毛利率为10.72%。例2投资银行某笔投资的年利率是按复利计算的,25年的年利率分配是:有1年为3%,有4年为5%,有8年为8%,有10年为10%,有2年为15%,求平均年利率。解: X=f:兀xfiG i=¥‘(103%)ix(105%)4x(1O8%)8x(110%)iox(115%)2=257.948783=108.6%计算结果说明,25年的年平均利率为8.6%。例3某产品有三道工序,合格率分别为95%、93%、90%,求三道工序的平均合格率。 ①无=3,95%x93%x90%=3.0.79515=92.64%所以,平均合格率为92.64%。位置平均数:A.众数(Mo):(.数据.组高度偏态时,….众数更具代表性。)1•概念:总体中出现次数最多的标志值。2•确定:单项数列确定众数:直接观察法。组距数列确定众数:上限公式:M二上限公式:M二X-A2xdouA+A12Xu为上限,△2为众数组与后一组次数差,差,下限公式:A1为众数组与前一组次数M二X+差,下限公式:A1为众数组与前一组次数M二X+fxd

oL△+△12d为众数组组距。XL为下限,其余同上。概念:将总体各单的位标志值按大小顺序排列,处于中点位置的标志值即为中位数。2•确定:a.未分组资料确定中位数:先将标志值(n个)按大小顺序排列,然后确定中点位次Om=(n+1)/2,贝U,n为奇数,Me即为中点位次上的变量值;n为偶数,Me为中点位次相邻两数的算术平均数。b.单项数列确定中位数:按大小顺序排列好的变量数列,用公式(工f+l)/2确定中点位次,包含次中点位次的组即为中位数组,改组标志值即为Me。c.组距数列确定中位数:上限公式:“匸冯/2-S , 小Me=X m+ixd x一Mou3x一Meu/m下限公式: 冯/2-S人Me=X+ m-ixdL/mXu为上限,XL为下限,fm为中位数组的次数,Sm-1为中位数组以前各组的次数之和,Sm+1为中位数组以后各组的次数之和,d为中位数组组距。(三)位置平均数与算术平均数的关系:正态分布时:负偏态分布(左偏):x<Me<x<Me<Mox>Me>MoD.适当偏态时(偏斜不大):x=Me=Mo*平均数在右,众数在左为右偏;平均数在左,众数在右为左偏。变异指标:1.概念:反映总体各单位标志值之间便已程度的综合指标,又称标志变异指标或标志变动度。2•作用:衡量平均指标代表性的大小;研究先想到的稳定性和均衡性;确定必要抽样单位数的依据。计算方法:A.异众比率(Vr):非众数组次数占总次数的比率。

R=x—x=980—450=530(兀)AmaxminR=x—x=990—580=410(兀)Bv严越大,"众数代表性越差;反之,越好。B四分位差(Q.D.):数列四等分(QI、Q2、Q3),第3个四分位数(Q3)1个四分位数(Q1)之差。Q.D.越凶啊,中间数据越集中;反之,越分散。全距(R):数列中最大值与最小值之差,也称极差。R=Xmax-XminR越大,总体中标志值变动范围

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论