2022年统计学名词解释及简答题(3)_第1页
2022年统计学名词解释及简答题(3)_第2页
2022年统计学名词解释及简答题(3)_第3页
2022年统计学名词解释及简答题(3)_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、学习必备欢迎下载名词说明一、分类数据 ( categorical data)是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的;二、次序数据 ( ran k data)是只能归于某一有序类别的非数字型数据;三、数值型数据 ( metric data)是按数字尺度测量的观看值,其结果表现为详细的数值;四、系统抽样 (systematic sampling)将总体中的全部单位(抽样单位)按肯定次序排列,在规定的范畴内随机的抽取一个单位作为初始单位,然后按事先规定好的规章确定其他样本单位,这种抽样方法被称为系统抽样;五、非概率抽样(non-probabili

2、tysampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原就, 而是依据争论目的对数据的要求,实行某种方式从总体中抽出部分单位对其实施调查;六、抽样误差 (sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差;七、四分位数 quartile 也称四分位点, 他是一组数据排序后处于25%和 75%位置上的值;四分位数是通过 3 个点将全部数据等分为4 部分,其中每部分包括25%的数据;八、离散系数 也成为 变异系数 ( coefficient of variation ),它是一组数据的标准差与其相应的平均数之比;其运算公式为:svsx离散系数是测

3、度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度;离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小;九、泊松分布 ( poisson distribution )是用来描述在一指定时间范畴内或在指定的面积或体积之内某一大事显现的次数的分布;十、中心极限定理( central limit theorem ):设从均值、 2 有限 的任意一个总体中抽取样本量为n 的样本,当 n 充分大时,样本均值x 的抽样分布近似听从均值为、方差2/n 的正态分布;十一、置信区间 ( confidence interval )在区间估量中,有样本统计量所构造的总体参数的估量区

4、间称为置信区间,其中区间的最小值称为置信上限;十二、显著性水平significant level 是一个统计专出名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险,其实这就是前面所说假设检验中犯弃真错误的概率,它是由人们依据检验的要求确定的,通常取0.05或0.01,这说明,当做出接受原假设的打算时,其正确的概率为95%或 99% ;十三、方差分析 ( analysis of variance, anov a )就是通过检验各总体的均值是否相等来判定分类型自变量对数值型因变量是否有显著影响;十四、相关系数 ( correlation coefficient )是依据样本数据运算的

5、度量两个变量之间线性关系强度的统计量;十五、回来模型 ( regression model)对于具有线性关系的两个变量,可以用一个线性方程来表示他们之间的关系; 描述因变量 y 如何依靠于自变量x 和误差项的方程称为回来模型;十六、点估量利用估量的回来方程,对于x 的一个特定值x0 ,求出 y 的一个估量值就是点估量;点估量可分为两种:一是平均值的点估量;二是个别值的点估量;十七、时间序列( time series)是同一现象在不同时间上的相继观看值排列而成的序列;十八、指数平滑法 ( exponential smoothing )是通过对过去的观看值加权平均进行猜测的一种方法, 该方法使 t

6、+1 期的猜测值等于 t 期的实际观看值与t 期的猜测值的加权平均值;十九、指数 ,或称统计指数,是分析社会经济现象数量变化的一种重要统计方法;指数是测定多项内容数量综合变动的相对数;这个概念中包含两个重点: 第一个要点是指数的实质是测定多项内容; 指数概念的其次个要点是其表现形式为动态相对数,既然是动态相对数,就涉及指标的基期对比,不同要素基期的挑选就成为指数方法需要争论的问题;二十、居民消费价格指数( consumer price index , cpi )是度量居民消费品和服务项目价格水平随时间变动的相对数,反映居民家庭购买的消费品和服务价格水平的变动情形;简答题一、概率抽样的定义及特点

7、概率抽样 ( probability sampling )也称随机抽样,是指遵循随机原就进行的抽样,总体中每个单位都有肯定的机会被选入样本;它具有以下几个特点:第一,抽样时是按肯定的概率以随机原就抽取样本;其次,每个单位被抽中的概率是已知的,或是可以运算出来的;最终,当用样本对总体目标量进行估量时,要考虑到每个样本单位被抽中的概率;二、简述直方图与条形图的不同点直方图与条形图不同;第一,条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)就是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率, 宽度就表示各组的组距, 因此其高度与宽度均有意义;其次,

8、由于分组数据具有连续性,直方图的各矩形通常是连续排列, 而条形图就是分开排列; 最终,条形图主要用于展现分类数据,而直方图就主要用于展现数值型数据;三、简述一张好的图形应具有以下基本特点:( 1) 显示数据( 2) 让读者把留意力集中在图形的内容上,而不是制作图形的程序上;( 3) 防止歪曲;( 4) 强调数据之间的比较;( 5) 服务于一个明确的目的;( 6) 有对图形的统计描述和文字说明;四、简述制作统计表应留意的几个问题第一,要合理支配统计表的结构,比如行标题、列标题、数字资料的位置应合理支配;其次,表头一般应包括表号、总标题和表中数据的单位等内容;再次,表中的上下两条横线一般用粗线,中

9、间的其他线要用细线,这样使人看起来清晰、醒目;最终, 在使用统计表时, 必要时可在表的下方加上注释,特殊要注明数据来源,以表示对他人劳动成果的敬重,以备读者查阅使用;五、简述众数、中位数和平均数的关系从分布的角度看,众数始终是一组数据分布的最高峰值,中位数是处于一组数据中间位置的值,而平均数就是全部数据算术平均;因此,对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下关系:假如数据的分布式对称的,众数m 0 、中位数( m e)和平均数( x )必定相等,即 m 0 = m e = x ;假如数据是左偏分布,说明数据存在微小值, 必定拉动平均数向微小值一方靠,而众数和中位数由于

10、是位置代表值,不受极值的影响,因此三者之间的关系表现为:x < m e < m 0 ;假如数据是右偏分布,说明数据存在极大值,必定拉动平均数向极大值一方靠,就m 0 < m e < x ;六、简述一组数据的分布特点可以从哪几方面进行测设数据分布的特点可以从三方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或集合的程度;二是分布的离散程度, 反映各数据远离其中心值的趋势;三是分布的外形,反映数据分布的偏态和峰态;七、简述古典概型的特点( 1) 结果有上限;( 2) 各个结果显现的可能行被认为是相同的;八、简述评判估量量好坏的标准1 无偏性2 有效性3 一样

11、性九、简述假设检验的流程第一提出原假设和备择假设;原假设和备择假设分别为:h 0 :3190 克h 0 :3190 克)接下来,需要确定适当的检验统计量,并运算其数值;最终可以进行统计决策;十、什么是假设检验中的两类错误?一类错误是原假设h 0 为真却被我们拒绝了,犯这种错误的概率用表示,所以也称错误或弃真错误 ;另一类错误是原假设为伪我们却没有拒绝,犯这种错误的概率用表示,所以也称错误或取伪错误;十一、说明运算2 统计量的步骤步骤一:用观看值f0 减去期望值f e;步骤二:将 f0f e 之差平方;步骤三:将 f0f 2 的结果除以;e步骤四 ;将步骤三的结果加总;十二、方差分析包括哪些类型

12、?它们有何区分?依据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分 析;当方差分析中只涉及一个分类型自变量时称为单因素方差分析;在对实际问题的争论中, 有时需要考虑对试验结果的影响;当方差分析中涉及两个分类型自变量时,称为双因素方差分析;十三、说明r2 的含义和作用怎样度量它们之间的关系强度呢?可以用组间平方和(ssa)占总平方和( sst)的比例大小来反映,这一比例记为r2 ,即r2ssa组间 sssst总ss其平方根 r 就可以用来测量两个变量之间的关系强度;r2 的平方根 类似于第 11 章中介绍的相关系数 r可以用来测量自变量与因变量之间的关系强度;依据上面的结

13、果可以运算出 r=0.591404 ,这说明行业与投诉次数之间有中等以上的关系;十四、简述方差分析的基本步骤1 提出假设2 构造检验的统计量3 统计决策4 方差分析表十五、简述判定系数的含义及作用判定系数是对估量的回来方程拟合优度的度量;判定系数r2 测度了回来直线对观测数据的拟合程度;如全部观测点都落在直线上,残差平方和 sse=0,r2 =1,拟合是完全的;假如y 的变化与 x 无关, x 完全无助于说明y 的变差,此时 y.y ,就r2 =0.可见r2 的取值范畴是 0,1 ; r2 越接近于 1,说明回来平方和占总平方2和的比例越大, 回来直线与各观看点越接近,用 x 的变化来说明y 值变差的部分就越多, 回归直线的拟合程度就越好;反之,r 越接近于 0,回来直线的拟合程度就越差;十六、在多元线性回来中,挑选自变量的方法有哪些?变量挑选的方法主要有:向前挑选、向后剔除、逐步回来、最优子集等;十七、简述时间序列的构成要求时间序列的成分可以分为四种,即趋势(t )、季节性或季节变动( s)、周

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论