统计学复习资料_第1页
统计学复习资料_第2页
统计学复习资料_第3页
统计学复习资料_第4页
统计学复习资料_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学(统计学的应用领域(工商管理方面)1.公司发展战略,2.产品质量管理,3市场研究,4.财务分析,5.经济预测,6.人力资源管理)重要术语概念(选择判断)总体:包含所研究的全部个体(数据)的集合。样本:从总体中抽取的一部分元素的集合。参数:用来描述总体特性的概括性数字度量。统计量:用来描述样本特性的概括性数字度量。变量:阐明现象某种特性的概念。简朴随机抽样:也称纯随机抽样,它是从含有个元素的总体中,抽取个元素作为样本,使得总体中的每一种元素都有相似的机会(概率)被抽中。分层抽样:也称分类抽样,它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素构成一种样本。系统抽样:也称等距抽样或机械抽样,它是先将总体中的各元素按某种次序排列,并按某种规则拟定一种随机起点;然后,每隔一定的间隔抽取一种元素,直至抽取个元素形成一种样本。整群抽样:先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,随即再对抽中的各个群中所包含的全部元素进行观察。预计量:用来预计总体参数的统计量的名称,用符号表达。预计值:用来预计总体参数时计算出来的预计量的具体数值。点预计:用样本统计量的某个取值直接作为总体参数的预计值。区间预计:在点预计的基础上,给出总体参数预计的一种范畴。置信区间:由样本统计量所构造的总体参数的预计区间。置信水平:也称为置信系数,它是将构造置信区间的环节重复多次后,置信区间中包含总体参数真值的次数所占的比率。假设检查:先对总体参数提出某种假设,然后运用样本信息判断假设与否成立的过程。单侧检查:也称单尾检查,是指备择假设含有特定的方向性,并含有符号“>”或“<”的假设检查。回绝域:能够回绝原假设的检查统计量的全部可能取值的集合。临界值:根据给定的明显性水平拟定的回绝域的边界值。值:也称观察到的明显性水平,如果原假设是对的的,那么所得的样本成果出现实际观察成果那么极端的概率有关关系:变量之间存在的不拟定的数量关系。有关系数:也称Pearson有关系数,是根据样本数据计算的度量两个变量之间线性关系强度的统计量。最小二乘法:也称最小平办法,使因变量的观察值与预计值之间的离差平方和达成最小来求得和的办法。第一章1.理解“总体”,“样本”,“变量”P7-P9第2章2.理解“简朴随机抽样”,“分层抽样”,“整群抽样”,“系统抽样”P183.理解“非抽样误差”P35和“误差的控制”P39第3章4.看一下品质数据的整顿与展示,重视“分类数据的整顿与展示”P525.“数据型数据的整顿与展示”P61重视数值型数据的图示。第4章6.集中趋势的度量:理解众数,中位数,分位数P86-P887.加权平均数的公式P928.组中值的平均数计算,例题P929.原则差公式P10010.原则分数公式P10111.离散系数公式P10312.当K取不同值时表达的含义P107第7章13.点预计与区间预计P17714.理解置信区间饿3点P17915.评价预计量的原则:无偏性,有效性,一致性(理解)P18116.总体均值的区间预计P18317.例题7.2P18418.不同状况下总体均值的区间预计(表格)P18619.总体比例的区间预计P18720.例题7.4P187例题7.7P191例题7.8P19221.样本量的拟定P201第8章22.理解“两类错误”的含义P21323.假设检查的流程P215-P217(不考计算,单选或判断)24.左单侧检查右单侧检查(单选,判断)第11章25.变量间关系的度量P31226.散点图含义P314不同形态的散点图代表的意思P31527.有关系数公式P31728.有关系数的性质P31829.一元线形回归方程P32330.预计的回归方程P32331.解方程组的公式:P32432.时间序列的描述性分析重点P388-P391理解(选择判断)1.抽样误差,非抽样误差,误差的控制.P35,P39抽样误差:由于抽样的随机性引发的样本,成果与总体真值之间的误差.(是一种随机性误差,只存在于概率抽样中)抽样误差的控制:它是不可避免的,控制办法:变化样本量,抽样误差越小,所需要的样本量就越大.非抽样误差:相对抽样误差而言,是指抽样误差之外的,由于其它因素引发的样本观察成果与总体真值之间的差别.(不仅存在概率误差,并且存在于非概率误差)非抽样误差的控制:重要是调查过程的质量控制.(涉及调查员的挑选,调查员的培训,督导员的调查专业水平,对调查过程进行奖惩的制度,等等)2.数据的整顿与展示数据类型整顿办法图示办法品质数据分类数据1.频数:落在某一特定类别(或组)中的数据个数。2.频数分布:数据在各类别(或组)中的分派。3.比例:一种样本(或总体)中各个部分的数据与全部数据之比。4.比率:样本(或总体)中各不同类别数值之间的比值。①条形图②帕累托图③饼图次序数据1.累积频数:将各有序类别或组的频数逐级累加起来得到的频数。2.累积频率:将各有序类别或组的比例逐级累加起来得到的频数。①累积频率分布图②环形图数值型数据数据的分组:根据统计研究的需要,将原始数据按照某种原则化分成不同的组别.环节以下:1.拟定组数:K=1+2.拟定组距:(最大值-最小值)/组数组中值=(下限值+上限值)/23.根据分组整顿成频数分布表(统计)品质形的都合用于数值型,但以上的不适合于品质型.分组数据:直方图,折线图,曲线图未分组数据:茎叶图,箱线图时间序列数据:线图多变数据:散点图,气泡图,雷达图3.离散程度的度量P96数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;越小代表性就越好..重要采用测度值来描述.根据数据类型的不同重要的测度值重要有异比众率(分类数据),四分位差(次序数据),方差和原则差,极差,平均差(数值型数据)4.点预计与区间预计含义P177点预计:是用样本统计量的某一种取值直接作为总体参数θ的预计值.区间预计:在点预计的基础上,给出总体参数预计的一种区间范畴,该区间普通由样本统计量加减抽样误差得到.5.对置信区间的理解,注意的几点:P179(1)如果用某种办法构造的全部区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该办法的构造的区间称为置信水平为95%的置信区间.(2)总体参数的真值是固定的,未知的,而用样本构造的区间则是不固定的.(3)在实际问题中,进行预计时往往只抽取一种样本,此时所构造的是与该样本相联系的一定置信水平(例如95%)下的置信区间.6.评价预计量的原则予P1801.无偏性:是指预计量抽样分布的数学盼望等于被预计的总体参数.设总体参数为θ,所选择的预计量为,如果E()=θ,则称为θ的无偏预计量.2.有效性:对同一总体参数的两个无偏预计量,有更小原则差的预计量更有效.(3)一致性:指随差样本量的增大,点预计量的值越来越靠近被须总体的参数.7.两类错误区P213α错误(弃真错误):原假设Ho为真却被我们回绝了,犯这种错误的概率α用表达。β错误(取伪错误):原假设为伪我们却没有回绝,犯这种错误的概率β用表达。8.假设检查的流程。P215运用P值进行决策P2179.单侧检查P2181左单侧检查(越大越好)2.右单侧检查(越小越好)10.变量间关系的度量P31211.散点图含义P314不同形态的散点图代表的意思P31512.有关系数的含义,性质P318有关系数是根据计算的度量两个变量之间线性关系强度的统计量。总体有关系数用ρ表达,样本有关系数用r表达。性质:(1)有关系数r的取值范畴是-1≤r≤1,普通取小数点后两位。r的正负号表明两变量间变化的方向;|r|表明两变量间有关的程度,r>0表达正有关,r<0表达负有关,r=0表达零有关。|r|越靠近于1,表明两变量有关程度越高,它们之间的关系越亲密。①取值范畴:|r|≤1②表达有关方向:r>0为正有关;r>0为负有关。③鉴别有关程度的办法及原则:r=0为不有关,|r|<0.3为微弱有关,0.3<|r|<0.5为低度有关,0.5<|r|<0.8为明显有关,0.8<|r|<1为高度有关,|r|=1为完全有关。(2)r含有对称性。(3)r数值大小与x和y的原点及尺度无关。(4)r仅仅是x与y之间线性关系的一种度量,它不能用于描述非线性有关系。(5)r即使是两个变量之间线性关系的一种度量,却不一定意味着x与y一定有因果关系。13.时间序列的描述性分析重点P388-P391重要公式(计算题)(一)集中趋势的度量重要公式名称公式中位数P87一组数据排序后处在中间位置上的变量值简朴样本平均数加权样本平均数fi各组变量值出现的频数Mi各组组中值=(各组最大值+各组最小值)/2几何平均数异众比率(是指非众数组的频数占总频数的比例..Vr越大,阐明非众数组的频数占总频数的比搬弄是重越大,众数的代表性就越差.)四分位差(内距,四分间距)反映了中间50%数据的离散程度,其数值越小,阐明中间的数据越集中;越大,阐明中间数据越分散.极差:(全距)描述数据离散程度的最简朴测度值,受极端值影响.简朴平均差(未分组数据)平均差越大阐明数据的离散程度越大.反之.加权平均差(分组数据)简朴样本方差(未分组数据)P99加权样本方差(分组数据)简朴样本原则方差(未分组数据)P100加权样本原则差(分组数据)原则分数(变量值与其平均数的离差除以原则差后的值。)P101离散系数(变异系数)是一组数据的原则差与其对应的平均数之比..离散系数大,数据的离散程度大.反之..它们是成正比的.P103(s原则差,x平均数)(二)抽样分布重要公式总体均值的置信区间(正态总体,已知)P183注意P184例题总体均值的置信区间(未知,大样本)P183总体均值的置信区间(正态总体,未知,小样本)总体比例的置信区间P187(注意P187.192例题)预计总体均值时的样本容量P201(注意P202例题)预计总体比例时的样本容量(三)回归重要公式有关系数P317回归方程P323E(y)=β0+β1x(β0:在Y轴上的截距,β1:斜率,表达x每变动一单位,Y的平均变动值)一元线性方程P323回归方程的截距P324回归方程的斜率(回归系数)P324时间序列重要公式环比增加率P390定基增加率平均增加率简答题:统计数据能够分为哪几个类型?不同类型的数据各有什么特点?P5答:1.①按照所采用的计量尺度不同,能够将统计数据分为分类数据,次序数据和数值型数据。②按照统计数据的收集办法,能够将统计数据分为观察数据和实验数据。③按照被描述的现象与时间的关系,能够将统计数据分为截面数据和时间序列数据。2.分类数据和次序数据阐明的是事物的物质特性,普通用文字表述,其成果均体现为类别。数值型数据阐明的是现象的数量特性,普通用数值来体现。观察数据是通过调查或观察而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据则是在实验室中控制对象而收集到的数据。截面数据普通是在不同的空间获得的,用于描述现象在某一时刻的变化状况。时间序列数据是准时间次序收集到的,用于描述现象随时间变化的状况。数据的类型按计量尺度分类数据只能归于某一类别的非数字型数据,它是对事物进行分类的成果,数据体现为类别,是用文字来表述的.次序数据归于某一有序类别的非数字型数据,数据体现为类别,但是有序的.数值型数据现象的数量特性,普通用数值来体现。按收集办法观察数据通过调查或观察而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。实验数据在实验室中控制对象而收集到的数据。准时间状况截面数据在不同的空间获得的,用于描述现象在某一时刻的变化状况。时序数据准时间次序收集到的,用于描述现象随时间变化的状况。2、比较概率抽样和非概率抽样的特点,举例阐明什么状况下适合采用概率抽样?什么状况下适合非概率抽样?答:概率抽样的特点eq\o\ac(○,1)抽样时是按一定的概率以随机原则抽取样本。eq\o\ac(○,2)每个单位被抽中的概率是已知的,或是能够计算出来的。eq\o\ac(○,3)当用样本对总体目的量进行预计时,要考虑到每个样本单位被抽中的概率。非概率抽样的特点:操作简便,时效快,成本低,并且对于抽样中的统计学专业技术规定不是很高。非概率抽样适合探索性的研究,调查的成果用于发现问题,为更进一步的数量分析提供准备。同时也适合市场调查中的概念测试,如产品包装测试、广告测试等。概率抽样适合调查的目的是用样本的调查成果对总体对应的参数进行预计,并计算预计的误差,得到总体参数的置信区间。2.概率抽样的含义及其特点。P17答:概率抽样也称随机抽样,是指遵照随机原则进行的抽样。特点:①抽样时是按一定的概率以随机原则抽取样本。②每个单位被抽中的概率是已知的,或是能够计算出来的。③当用样本对总体目的量进行预计时,要考虑到每个样本单位被抽中的概率。3.直方图与条形图有何区别?P65答:直方图与条形图的区别有:①条形图是用条形的长度表达各类别频数的多少,其宽度则是固定的;直方图是用面积表达各组频数的多少,矩形的高度表达每一组的频数或频率,宽度则表达各组的组距,因此其高度与宽度均故意义。②由于分组数据含有持续性,直方图的各矩形普通是持续排列,而条形图则是分开排列。③条形图重要用于表达分类数据,而直方图则重要用于表达数值型数据。4.制作统计表应当注意哪几个问题?P77P75答:制作统计表时应考虑下列几点:①要合理安排统计表的构造,例如行标题,列标题,数字资料的位置应安排合理。②表头普通应涉及表号,总标题和表中数据单位等内容。③表中的上下两条横线普通用粗线,中间的其它线要用细线,这样使人看起来清晰,醒目。一张好的图表应显示好数据,让读者把注意力集中在图形的内容上,而不是制作图形的程序上,避免歪曲,强调数据之间的比较,服务于一种明确的目的,有对图形的统计描述和文字阐明。5.简述时间序列的构成要素。答:时间序列指将某一统计指标数据按照时间次序排列起来而形成的统计序列。时间序列的构成要素有时间要素和数据要素,时间要素指现象所属的时间,而数据要素指的是不同时间上的统计数据。6.为什么要计算离散系数?P102答:方差和原则差是反映数据分散程度的绝

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论