统计学基础考试重点保你不挂科_第1页
统计学基础考试重点保你不挂科_第2页
统计学基础考试重点保你不挂科_第3页
统计学基础考试重点保你不挂科_第4页
统计学基础考试重点保你不挂科_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、. 基础知识第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件

2、下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。3、举例说明总体、样本、参数、统计量、变量这几个概念。总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人

3、口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,是调查所要达到的具体目标。调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。调查项目和调查表,要解决的是调查的内容。2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。3、统计调查方式:抽样调查、普查、统计报表等。抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经

4、济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。除此之外,还有重点调查和典型调查。4、统计数据的误差通常是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差和非抽样误差两类。抽样误差主要是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差是人为因素造成的(理论上可以消除)5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理

5、和研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。6、数据的收集方法分为询问调查与观察实验。精品.7、统计调查方案包括哪些内容?调查目的即调查所要达到的具体目标;调查对象和调查单位,调查对象是根据调查目的确定的调查研究的总体或调查范围,调查单位是构成调查对象中的每一个单位;调查项目和调查表,就是调查的具体内容;其它问题,即明确调查所采用的方式和方法、调查时间及调查组织和实施细则。第三章:数据整理与展示1、对于通过调查取得的原始数据,应主要从完整性和准确性两个方面去审核。2、对分类数据和顺序数据主要是

6、做分类整理,对数值型数据则主要是做分组整理。3、数据分组的步骤:确定组数、组距,最后制成频数分布表统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。组中值(下限值+上限值)/24、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图和饼图。5、直方图与条形图的差别:条形图是用条形的长度表示各类别频数的多少,宽度则是固定的,直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组

7、的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。第四章:数据分布特征的测度1、一组数据的分布特征可以从哪几个方面进行测度?一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。2、简述众数、中位数和均值的特点和应用场合及关系。众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位

8、数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。关系:如果数据的分布是对称的,众数、中位数和均值必定相等,即mo=me=xbar;如果数据是左偏分布,说明数据存在极小值,三者之间的关系表现为:xbarmemo;如果数据是右偏公布,说明数据存在极大值,必然拉动均值向极大值一方靠,则momexbar(图)3、为什么要计算离散系数?第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。第二,它们与原变量值的计量单位相同

9、,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。4、均值是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。5、四分位差主要用于测度顺序数据的离散程度,数值型数据也可以计算四分位差,但不适合于分类数据。精品.6、方差是各变量值与其均值离差平方的平均数。方差的平方根是标准差。方差、标准差计算公式(分组数据、未分组数据两种,自己写)样本方差和标准差计算公式(同上)7、对于分类数据,主要用异众比率来测度其离散程度;对于顺序数据,主要用四分位差来测度其离散程度;对于数值型数据,主

10、要用方差或标准差来测度其离散程度。8、经验法则:68%1;95%2;99%3第五章:抽样与参数估计1、常用的概率抽样方法主要有:简单随机抽样,分层抽样,系统抽样,整群抽样2、置信水平(p115)第七章:相关与回归分析1、解释相关关系的含义,并说明其特点。相关关系是变量与变量之间存在的不确定的数量关系。特点是:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。2、简述相关系数的取值及其意义,并说明相关程度的几种情况。相关系数1r1 。若0r1 ,表明x与y之间存在正线性相关关系;若1r0 ,表明x与y之间存在负线性相关关系;若r1,表明x与y之间为完全正线性相关

11、关系;若r1 ,表明x与y之间为完全负线性相关关系。r0.8时,可视为高度相关;0.5r0.8时,可视为中度相关;0.3r0.5时,视为低度相关;当r0.3时,说明两个变量之间的相关程度极弱。3、解释回归模型、回归方程、估计的回归方程的含义回归模型是描述因变量y如何依赖于自变量x和误差项的方程。回归方程是描述因变量y的期望值如何依赖于自变量x的方程。估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。4、简述参数最小二乘估计的基本原理。 这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都

12、小。根据这一思想确定直线中未知常数和的方法称为最小二乘法,即:5、简述判定系数的含义和作用回归平方和占总平方和的比例,称为判定系数。它测度了回归直线对观测数据的拟合程度,它反映了在因变量y的总变量差中由于x与y之间的线性关系所解释的比例。第八章:时间序列分析和预测1、利用增长率分析时间序列时应注意哪些问题?首先,当时间序列中的观察值出现0或负数时,不宜计算增长率;其次,在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析。第九章:指数1、什么是指数?它有哪些性质?反映复杂现象在不同场合下综合变动的一种特殊相对数,称为指数。性质:相对性;综合性;平均性;动态和静态兼有的特性。

13、2、指数有哪些类型?根据对比场合不同,分为动态指数和静态指数;根据指数研究对象的范围不同,分为个体指数和总指数。;根据编制方法的不同,总指数分为综合指数和平均指数;根据指数反映的性质不同,分为质量指数、数量指数;根据比较时所采用的基期不同,分为定基指数和环比指数;根据计算采用权数与否,分为简单指数和加权指数。精品. 计算题 1某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70

14、81单位规定:60分以下为不及格,6070分为及格,7080分为中,8090分为良,90100分为优。要求:(1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表;(2)指出分组标志及类型及采用的分组方法;(3)计算本单位职工业务考核平均成绩(4)分析本单位职工业务考核情况。解:(1)成 绩职工人数频率(%)60分以下60-7070-8080-9090-10036151247.51537.53010合 计40100 (2)分组标志为"成绩",其类型为"数量标志";分组方法为:变量分组中的开放组距式分组,组限表示方法是

15、重叠组限;(3)本单位职工业务考核平均成绩(4)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态,说明大多数职工对业务知识的掌握达到了该单位的要求。22004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下:品种价格(元/斤)甲市场成交额(万元)乙市场成交量(万斤)甲乙丙1.21.41.51.22.81.5211合计5.54精品.试问哪一个市场农产品的平均价格较高?并说明原因。解: 品种价格(元)x甲市场乙市场成交额成交量成交量成交额mm/xfxf甲乙丙1.21.41.51.22.81.51212112.41.41.5合计5.5445.3解:先分

16、别计算两个市场的平均价格如下:甲市场平均价格(元/斤) 乙市场平均价格(元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。 3某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件,标准差为9.6件;乙组工人日产量资料如下:日产量(件)工人数(人)1525354515383413要求:计算乙组平均每个工人的日产量和标准差; 比较甲、乙两生产小组哪个组的日产量更有代表性? 解:(1)(件) (件) (2)利用标准差系数进行判断: 精品.因为0.305 >0.267故甲组工人的平均日产量更有代表

17、性。 4某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其月平均产量水平,得每人平均产量560件,标准差32.45要求:(1)计算抽样平均误差(重复与不重复); (2)以95%的概率(z=1.96)估计该厂工人的月平均产量的区间;(3)以同样的概率估计该厂工人总产量的区间。 解: (1) 重复抽样: 不重复抽样: (2)抽样极限误差 = 1.96×4.59 =9件月平均产量的区间: 下限: =560-9=551件 上限:=560+9=569件 (3)总产量的区间:(551×1500 826500件; 569×1500 853500件)

18、5采用简单随机重复抽样的方法,在2000件产品中抽查200件,其中合格品190件.要求:(1)计算合格品率及其抽样平均误差(2)以95.45%的概率保证程度(z=2)对合格品率和合格品数量进行区间估计。(3)如果极限误差为2.31%,则其概率保证程度是多少? 解:(1)样本合格率p = n1n = 190200 = 95% 抽样平均误差 = 1.54%(2)抽样极限误差p=zp = 2×1.54% = 3.08%下限:p=95%-3.08% = 91.92%上限:p=95%+3.08% = 98.08% 则:总体合格品率区间:(91.92% 98.08%) 总体合格品数量区间(91.

19、92%×2000=1838件 98.08%×2000=1962件) (3)当极限误差为2.31%时,则概率保证程度为86.64% (z=) 6 某企业上半年产品产量与单位成本资料如下:精品.月 份产量(千件)单位成本(元)123456234345737271736968要求:()计算相关系数,说明两个变量相关的密切程度。 ()配合回归方程,指出产量每增加1000件时,单位成本平均变动多少? ()假定产量为6000件时,单位成本为多少元?解:计算相关系数时,两个变量都是随机变量,不须区分自变量和因变量。考虑到要配和合回归方程,所以这里设产量为自变量(),单位成本为因变量()月

20、份产量(千件)单位成本(元)123456234345737271736968491691625532951845041532947614624146216284219276340合 计2142679302681481 ()计算相关系数:说明产量和单位成本之间存在高度负相关。()配合回归方程 =-1.82 =77.37 回归方程为:.产量每增加1000件时,单位成本平均减少.元()当产量为件时,即,代入回归方程:精品.×.(元) 7根据企业产品销售额(万元)和销售利润率(%)资料计算出如下数据: n=7 =1890 =31.1 2=535500 2=174.15 =9318 要求: (

21、1) 确定以利润率为因变量的直线回归方程. (2)解释式中回归系数的经济含义. (3)当销售额为500万元时,利润率为多少? 解:(1)配合直线回归方程: b= = =0.0365 a= =-5.41 则回归直线方程为: yc=-5.41+0.0365x (2)回归系数b的经济意义:当销售额每增加一万元,销售利润率增加0.0365% (3)计算预测值: 当x=500万元时 yc=-5.41+0.0365=12.8% 8 某商店两种商品的销售资料如下:商品单位销售量单价(元)基期计算期基期计算期甲乙件公斤50150601608121014要求:(1)计算两种商品销售额指数及销售额变动的绝对额;(

22、2)计算两种商品销售量总指数及由于销售量变动影响销售额的绝对额;(3)计算两种商品销售价格总指数及由于价格变动影响销售额的绝对额。 解:(1)商品销售额指数= 销售额变动的绝对额:元 (2)两种商品销售量总指数= 销售量变动影响销售额的绝对额元 (3)商品销售价格总指数= 价格变动影响销售额的绝对额:元 9某商店两种商品的销售额和销售价格的变化情况如下:精品.商品单位销售额(万元)1996年比1995年销售价格提高(%)1995年1996年甲乙米件12040130361012要求:(1)计算两种商品销售价格总指数和由于价格变动对销售额的影响绝对额。 (2)计算销售量总指数,计算由于销售量变动,

23、消费者增加(减少)的支出金额。解:(1)商品销售价格总指数= 由于价格变动对销售额的影响绝对额:万元 (2))计算销售量总指数:商品销售价格总指数=而从资料和前面的计算中得知: 所以:商品销售量总指数=,由于销售量变动,消费者增加减少的支出金额: - 10某地区1984年平均人口数为150万人,1995年人口变动情况如下:月份1369次年1月月初人数102185190192184计算:(1)1995年平均人口数;(2)1984-1995年该地区人口的平均增长速度.解:(1)1995年平均人口数=181.38万人(2)1984-1995年该地区人口的平均增长速度: 精品.11某地区1995199

24、9年粮食产量资料如下:年份1995年1996年1997年1998年1999年粮食产量(万斤)434472516584618要求:(1)计算各年的逐期增长量、累积增长量、环比发展速度、定基发展速度;(2)计算1995年-1999年该地区粮食产量的年平均增长量和粮食产量的年平均发展速度;(3)如果从1999年以后该地区的粮食产量按8%的增长速度发展,2005年该地区的粮食产量将达到什么水平? 解:(1)年 份1995年1996年1997年1998年1999年粮食产量(万斤) 环比发展速度 定基发展速度逐期增长量累积增长量434-47210876108763838516109321188944825

25、84113181345668150618105821424034184平均增长量=(万斤)(万斤) (2)平均发展速度(3)=980.69(万斤) 12年 份1995年1996年1997年1998年1999年粮食产量(万斤) 环比发展速度 逐期增长量 434- 10876 44 68 10582 要求:(1)计算各年的逐期增长量、累积增长量、环比发展速度、定基发展速度;(2)计算1995年-1999年该地区粮食产量的年平均增长量和粮食产量的年平均发展速度;(3)如果从1999年以后该地区的粮食产量按8%的增长速度发展,2005年该地区的粮食产量将达到什么水平? (做法见上题)精品.例题1:某工

26、厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其月平均产量水平,资料如下: 日产量(件)524534540550560580600660 工人数(0人)469108643要求:(1)计算样本平均数和抽样平均误差。(2)以95.45%(t=2)的可靠性,估计该厂工人的月平均产量和总产量的区间。解答: n=50, n=1500,t=2(1)计算样本平均数和抽样平均误差 计算重复抽样的抽样平均误差:精品.(2)以95.45%的可靠性估计该厂工人的月平均产量和总产量的区间。计算重复抽样的抽样极限误差:该厂工人的月平均产量重复抽样的区间范围是:则,该厂工人的月平均产量区间范围是

27、在550.82件至569.18件之间。总产量为:550.82*1500=826230件569.18*1500=853770件该厂工人的总产量的区间范围是在826230件至853770件之间。例题2:采用简单随机重复抽样的方法,在2000件产品中抽查200件,其中合格品190件.要求:(1)计算合格品率及其抽样平均误差(2)以95.45%的概率保证程度(t=2)对合格品率和合格品数量进行区间估计。 解答:已知: n=200 n=2000f(t)=95.45% t=2(1)合格品率: p=95% 合格品率的抽样平均误差: (2)合格品率的区间范围:下限=上限= 即合格品率的区间范围为:91.92%-98.08% 合格品数量的区间范围为:91.92%*2000-98.08%*2000 1838 .4件1961.6件之间. 精品.类似例题讲解:某企业生产三种产品的资料如下:产品单位产 量单位成本(元)基期计算期基期计算期甲乙丙件公斤台1005001501205002001545910557要求:(1)计算三种产品单位成本总指数及由于单位成本影响总成本的绝对额。(2)计算三种产品产量总

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论