版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
《数量方法(二)》(代码00994)自学考试复习提纲
第一章数据的整理和描述。根本知识点:数据的分类:按照描述的事物分类:.分类型数据:描述的是事物的品质特征,本质表现是文字形式;.数量型数据:事物的数量特征,用数据形式表示;.日期和时间型数据。按照被描述的对象与时间的关系分类:.截面数据:事物在某一时刻的变化情况,即横向数据;.时间序列数据:事物在肯定的时间范围内的变化情况,即纵向数据;.平行数据:是截面数据与时间序列数据的组合。数据的整理和图表显示:.组距分组法:1)将数据按上升顺序排列,找出最大值max和最小值min;2)确定组数,计算组距c;3)计算每组的上、下限(分组界限)、组中值及数据落入各组的频数vi(个数)和频率力(平均数a(频数:鬻I?的和)"),形成频数的和 工:匕频率分布表;4)唱票记频数;5)算出组频率,组中值;6)制表。.饼形图:用来描述和表现各成分或某一成分占全部的百分比。注意:成分不要多于6个,多于6个一般是从中选出5个最重要的,把剩下的全部合并成为“其他”;成分份额总和必须是100%;比例必须于扇形地域的面积比例一致。.条形图:用来对各项信息进行比拟。当各项信息的标识(名称)较长时,应当尽量采纳条形图。.柱形图:如果是时间序列数据,应该用横坐标表示时间,纵坐标表示数据大小,即应当使用柱形图,好处是可以直观的看出事物随时间变化的情况。.折线图:明显表示趋势的图示方法。简单、简单理解,对于同一组数据具有唯一性。.曲线图:许多事物不但自身逐渐变化,而且变化的速度也是逐渐变化的。具有更加自然的特点,但是不具有唯一性。.散点图:用来表现两个变量之间的相互关系,以及数据变化的趋势。.茎叶图:把数据分成茎与叶两个局部,既保存了原始数据,又直观的显示出了数据的分布。三、数据集中趋势的度量:.平均数:简单理解,易于计算;不偏不倚地对待每一个数据;是数据集地“重心”;缺点是它对极端值十分敏感。
平均数=全体数据的总和平均数=全体数据的总和
数据的个数.中位数:将数据按从小到大顺序排列,处在中间位置的一个数或最中间的两个数的平均数。它的优点是它对极端值不像平均数那么敏感,因此,如果包含极端值的数据集来说,用中位数来描述集中趋势比用平均数更为恰当。.众数:数据中出现次数最多的数。缺点是一个数据集可能没有众数,也可能众数不唯一;优点在于它反映了数据集中最常见的数值,而且它不仅对数量型数据(数据都是数值)有意义,它对分类型数据集也有意义;并且能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。.分组数据的平均数(加权平均):五,粗(频数x组中值)的和£'匕-出尔将心结.闭蛇将平均数“一嬴丽—=玄丁为组数,%为第।组频数,yi为第i组组中值。.平均数,中位数和众数的关系:数据分布是对称分部时:众数=中位数=平均数数据分布不是对称分部时:左偏分布时:众数V中位数V平均数右偏分布时:众数〉中位数>平均数四、数据离散趋势的度量:.极差R=最大值max—最小值min.四分位点:第二四分位点。2就是整个数据集的中位数;第一四分位点。是整个数据按从小到大排列后第四个(假设但不是整数,取左右两4 4个的平均);第三四分位点a是整个数据按从小到大排列后第也以个(假4m-4-1设网上不是整数,取左右两个的平均)。四分位极差=乌一。1,它不像4极差R那么简单受极端值的影响,但是仍旧存在着没有充分地利用数据全部信息地缺点。.方差:离平均数地集中位置地远近;2 2 —2n匕是频数,乃是组中值,匕即数据的个数,其=至2即用分组数据计算的平均数。.标准差:cr=7o^„变异系数:表示数据相对于其平均数的分散程度。V=gxlOO%X。根本运算方法:1、一组数据3,4,5,5,6,7,8,9,10中的中位数是( )A.5 B.5.5C.6 D.6.5解析:按从小到大排列,此九个数中,正中间的是6,从而答案为C。2、某企业30岁以下职工占25%,月平均工资为800元;30—45岁职工占50%,月平均工资为1(X)0元;45岁以上职工占25%,月平均工资1100元,该企业全部职工的月平均工资为( )A.950元 B.967元C.975元 D.1000元解析:25%X800+50%X1000+25%X1100=975,应选C。3、有一组数据的平均数和标准差分别为50、25,这组数据的变异系数为(A.0.2TOC\o"1-5"\h\z解析:变异系数卜=旦*100%=2=0.5,应选C。x 504,假设两组数据的平均值相差较大,比拟它们的离散程度应采纳( )A.极差 B.变异系数C.方差 D.标准差解析:考变异系数的用法,先B。5、一组数据4,4,5,5,6,6,7,7,7,9,10中的众数是( )A.6B.6.5C.7D.7.5解析:出现最多的数为众数,应选C。6、对于峰值偏向左边的单峰非对称直方图,一般来说( )A.平均数>中位数〉众数 B.众数〉中位数〉平均数C.平均数〉众数〉中位数 D.中位数〉众数〉平均数解析:数据分布是对称分部时:众数=中位数=平均数数据分布不是对称分部时:左偏分布时:众数V中位数V平均数右偏分布时:众数〉中位数>平均数需要记住提,峰值偏向左边的单峰非对称直方图称为右偏分布,峰值偏向右边的单峰非对称直方图称为左偏分布,从而此题答案为B。第二章随机事件及其概率。根本知识点:一、随机试验与随机事件:.随机试验:a)可以在相同的条件下重复进行;b)每次试验的可能结果可能不止一个,但是试验的全部可能的结果在试验之前是确切了解的;C)试验结束之前,不能确定该次试验确实切结果。.样本空间。:a)全部根本领件的全体所组成的集合称为样本空间,是必定时间;b)样本空间中每一个根本领件称为一个样本点;c)每一个随机事件就是假设干样本点组成的集合,即随机事件是样本空间的子集;d)不包含任何样本点的随机事件就是不可能事件力。.样本空间的表示方法:a)列举法:如掷骰子。={1,2,3,4,5,6}b)描述法:假设掷骰子出现{1,3,5}可描述为:掷骰子出现奇数点。二、事件的关系和运算.事件的关系:a)包含关系:事件A的每一个样本点都包含在事件B中,或者事件A的发生必定导致事件B的发生,成为事件B包含事件A,记做AuB或者假设AuB且BuA则称事件A与事件B相等,记做A=Bob)事件的并:事件A和事件B至少有一个发生的事件称为事件A与事件B的并,记做AUB或者A+B。c)事件的交:事件A与事件B同时发生的事件称为事件A与事件B的交,记做AD8或者AB。d)互斥事件:事件A与事件B中,假设有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称这两个事件是相容的。adb=°。e)对立事件:一个事件B假设与事件A互斥,且它与事件A的并是整个样本空间Q,则称事件B是事件A的对立事件,或逆事件。事件A的对立事件是AQA=</>,AljA=Qof)事件的差:事件A发生,但事件B不发生的事件,称为事件A与事件B的差,记做A-B。.运算律:a)交换律:AnB=8UA,An8=BnAb)结合律:AU(8UC)=(AUB)UC,A(BQ=(AB)C-c)分配律:AU(Bnc)=(AijB)n(Auc),An(5uc)=(AnB)u(Anc):d)对偶律:X|JB=Apfl,XriB=AUfio三、事件的概率与古典概型:.事件A发生的频率的稳定值”称为事件A发生的概率,记做:P(A)=P,0</?<lo.概率的性质:a)非负性:P(A)>0;b)标准性:OWpWl;c)完全可加性:p(UA)=£p(a,);i=l /=!d)P(0)=0;e)设A,B为两个事件,假设AuB,则有P(8-A)=P(8)-P(A),且P(B)>P(A);.古典概型试验与古典概率计算:a)古典概型试验是满足以下条件地随机试验:①它的样本空间只包含有限个样本点;①每个样本点的发生是等可能的。b)古典概率的计算:p(A)=";Nc)两个根本原理:①加法原理:假设做一件事情有两类方法,在第一类方法中有m种不同方法,而在第二类方法中有n种不同方法,那么完成这件事情就有m+n种不同方法。加法原理可以推广到有多类方法的情况;①乘装原理:假设做一件事情可以分成两步来做,做第一步有m种不同方法,做第二步有n种不同方法,那么完成这件事情有mn种不同方法。乘法原理也可以推广到多个步骤的情形。.条件概率:在事件B发生的条件下(假定P(B)>0),事件A发生的概率称为事件A在给定事件B下的条件概率,简称A对B的条件概率,记做:…=还;P(B).概率公式:a)互逆:对于任意的事件A,P(A)+P(A)=\;b)广义加法公式:对于任意的两个事件A和B,P{A+5)=P(A)+P(B)-P(AB),广义加法公式可以推广到任意有限个事件的并的情形,特别地:P(A+B+C)=P(A)+P(B)+P(C)-P(AB)-P(AC)-P(BC)+P(ABC)c)减法公式:P(A一B)=P(A)-P(AB) •AnB,则尸(A-B)=P(A)-P(B);d)乘法公式:P(AB)=P(A)P(B|A),P(A)WO;e)事件独立:假设P(A5)=尸(A)P(8),则A与3相互独立。f)全概率公式:设事件Ai,A2,―,A”两两互斥,Ai+A2+ +An=Q(完备事件组),且P(AJ>0,i=l,2,n则对于任意事件B,有:P(3)=tp(A,)P(B|A,);
1=1g)贝叶斯公式:条件同上,则对于任意事件B,如果P(B)>0,有:tp(a)p(8ia)
(=1。根本运算方法:1、事件的表示:例1、设A、B、C是三个随机事件,用A、B、C的运算关系表示事件:A不发生但B与C发生为( )A.ABC B.ABCC.ABC D.ABC解析:此题考察事件的表示方法,选B。例2、对随机事件A、B、C,用E表示事件:A、B、C三个事件中至少有一个事件发生,则E可表示为( )AUBUC B.Q-ABCC.AUBUC D.ABC解析:选A。2、古典概型例1、正方体骰子六个面点数分别为2、4、6、8、10、12,掷二次所得点数之和
B.-12D.B.-12D.1A.—36C.-6解析:样本空间中样本点一共有36个,两次掷得点数和不可能小于4,从而选Do例2、在一次抛硬币的试验中,小王连续抛了3次,则全部是正面向上的概率为()1C.C.16D.-3解析:样本空间一共有8个样本点,全部正面向上只有一次,应选B。例3、某夫妇按国家规定,可以生两胎。如果他们每胎只生一个孩子,则两胎全TOC\o"1-5"\h\z是女孩的概率为( )A.— B.-16 8C.- D.-4 2解析:生两胎,样本空间共有4个样本点,应选C。3、加法公式、减法公式、条件概率例1、设A、B为两个事件,P(A)=0.4,P(B)=0.3。如果BcA,则P(AB)=()A.0.1 B.0.3C.0.4 D.0.7解析:BuA,则析AB)=P(B),应选B。例2、设A、B为两个事件,P(A)=0.4,P(B)=0.8,P(X8)=0.5/iJP(B|A)=(A.0.45 B.0.55C.0.65 D.0.375解析:由P(云B)=P(B)—P(AB),从而P(AB)=0.3,P(B|A)=依0=0.375,P(B)应选D。例3、事件1和B相互独立,且P(X)=0.7,P⑻=0.4,则P(AB)=( )B.0.2B.0.21D.0.42C.0.28解析:事件「和B相互独立知事件A与B独立,从而P(AB)=P(和P(B)=0.12,A0例4、事件A,B相互独立,P(A)=0.3,P(BA)=0.6,则P(A)+P(B)=TOC\o"1-5"\h\zC.0.9 D.1解析:由事件A,B相互独立知P(B|A)=P(B)=0.6,从而选C。4、事件的互斥、对立、独立关系:例1、A与B为互斥事件,则A后为( )A.AB B.BC.A D.A+B解析:A与B为互斥事件,即AB=cp,从而选C。例2、事件A、B相互对立,P(A)=0.3,P(AB)=0.7,则P(A-B)=( )C.0.3 D.1解析:由事件A、B相互对立知AB=0),从而P(A—B)=P(A)=0.3,选C。例3、事件A、B相互独立,P(A)=0.2,P(B)=0.4,则P(A+B)=( )A.0.50C.0.52 D.0.53解析:P(A+B)=P(A)+P(B)-P(AB),由A、B相互独立知P(AB)=P(A)P(B),从而P(A+B)=P(A)+P(B)-P(A)P(B)=0.52,选C。例4、事件A、B互斥,P(A)=0.3,P(B|A)=0.6,则P(A-B)=( )A.0 B.0.3C.0.9 D.1解析:事件A、B互斥有AB=<D,从而P(A-B)=P(A)-P(AB)=P(A)=0.3,选B。5、全概率公式和贝叶斯公式:例1、在厂家送检的三箱玻璃杯中,质检部门抽检其中任一箱的概率相同。已知第一箱的次品率为0.01,第二箱的次品率为0.02,三箱玻璃杯总的次品率为0.02o求第三箱的次品率。假设从三箱中任抽一只是次品,求这个次品在第一箱中的概率。解析:设从表示抽到第i箱,i=l,2,3.B表示次品,则P(A)=P(A)=P(4)=LP(6|A)=O.O1,P(8|4)=0.023P(8)=Zp(A)P(6IA)=0.02,从而P(BIA)=0.03,即第三箱的次品率为0.03./=!tp(A)P(8IA);=1即从三箱中任抽一只是次品,这个次品在第一箱中的概率为l/6o例2、实战演习中,在甲、乙、丙三处射击的概率分别为0.2,0.7,0.1,而在甲、乙、丙三处射击时命中目标的概率分别为0.8,0.4,0.6o假设最终目标被命中,求目标是由乙处射击命中的概率。解析:设A表示在甲处射击,4表示在乙处射击,4表示在丙处射击,B表示命中,则P(A)=0.2,P(A2)=0.7,P(A3)=O.l,P(B|A)=0.8,P(B|4)=O4,P(5|A)=0.6p(4।B)=,P(4)P(8⑷=056£p(4)p(8IA)i=l从而目标是由乙处射击命中的概率为0.56.第三章随机变量及其分布。根本知识点:一、离散型随机变量:取值可以逐个列出.数学期望:1)定义:Ex=^xiPi,以概率为权数的加权平均数;i2)性质:E(C) =C (常数期望是本身)E(aX) =aE(X) (常数因子提出来)E(aX+b) =aE(X)+b (一项一项分开算)E(aX+bY) =aE(X)+bE(Y) (线性性).方差:定义:Dx=E(x-Ex)2=^(x(.-Ex)2pi;2)性质:D(c) =0 (常数方差等于0)D(aX) =a2D(X) [常数因子平方提)D(aX+b)=a2D(X)3)公式:D(X)=jE(X2)-E2(X)(方差=平方的期望一期望的平方);.常用随机变量:0~1分布:a)随机变量X只能取0,1这两个值;X-B(1,p);E(X)=pD(X)=p(l-p)2)二项分布:a)分布律:P(X=Q=C:pR(l-p)i,k=0,1,2, 〃;X〜B(n,p)E(X)=npD(X)=np(l-p)e)适用:随机试验具有两个可能的结果A或者筋且P(A)=p,P(才)=l—p,将试验独立重复n次得到n重贝努里试验。3)泊松分布:a)分布律:P(X=k)=^^,k=0,l,2……,X>0k\X~P(X)E(X)=XD(X)=Xe)适用:指定时间内某事件发生的次数。连续型随机变量:.设X是一个连续型随机变量:X的均值,记做口,就是X的数学期望,即u=EX;X的方差,记做D(X)或是(X/的数学期望,即:D(X)=E[(X-〃)2]=E(x2)—〃23)X的标准差,记做。,是X的方差标的算术平方根,即<7=行;2.常用连续型随机变量:名称分布律或密度记法E(X)D(X)均匀分布/(X)=<---9Ca<x<b)b-a0,其他X~U[a,b]a+b2(b-a)212指数分布f(x)=x>0,x>o0,x<0X~E(A)171下正态分布p(x)=71 一(A4^=22/,CT>02tht2X~N(〃,a2}ua-标准正态分布°(x)=,=0段y/X7rX〜N(0,1)013.正态分布的密度曲线y=P(x)是一条关于直线x=u的对称的钟形曲线,在x=u处最高,两侧迅速下降,无限接近X轴;。越大(小),曲线越矮胖(高瘦)。.标准正态分布的密度曲线y=6(x),是关于Y轴对称的钟形曲线。.随机变量的标准化Xf与三(减去期望除标差)。4dx.标准化定理:设X〜N(〃,o-2),贝忆=三二幺〜N(O,1)。a二维随机变量:.用两个随机变量合在一起(X,Y)描述一个随机试验,(X,Y)的取值带有随意性,但具有概率规律,则称(X,Y)为二维随机变量。.X,丫的协方差:cov(X,Y)=E(X-EX)(Y-EY)]=E(XY)-EX・EY,cov(X,Y)>0说明X与丫之间存在肯定程度的正相关关系,cov(X,Y)=0称X与丫不相关,cov(X,Y)<0说明X与丫存在肯定程度的负相关关系;.X,丫的相关系数:%=.(X,2,取值范围是— 越接近JVoxxVdF1,说明X与丫之间的正线性相关程度越强,越接近于-1,说明X与丫之间的负线性相关程度越弱,当等于0时,X与丫不相关。.随机变量的线性组合:E(aX+bY)=aE(X)+bE(Y);D(aX+bY)=a2D(X)+2abCov(X,Y)+b2D(Y)决策准则与决策树:.对不确定的因素进行估量,从几个方案中选择一个,这个过程称为决策;.决策三准则:1)极大极小原则:将各种方案的最坏结果(极小收益)进行比拟,从中选择极小收益最大的方案;2)最小期望损失原则:选择期望损失最小的方案;3)最大期望收益原则:选择期望收益最大的方案。.决策树:使我们把不确定因素的过程以图解的形式表示出来,有简单、直观的优点。。根本运算方法:1、随机变量的含义:例1、某一事件出现的概率为1/4,试验4次,该事件出现的次数将是( )A.1次 B.大于1次C.小于1次 D.上述结果均有可能解析:答案为D,此题考察对随机变量的理解。2、六种常见分布例1、某企业出厂产品200个装一盒,产品分为合格与不合格两类,合格率为99%,设每盒中的不合格产品数为X,则X通常服从( )A.正态分布 B.泊松分布C.均匀分布 D.二项分布解析:将任一个合格品记为0,不合格记为1,则X〜B(200,0.01L选D。例2、一般正态分布N。2)的概率分布函数F(x)转换为标准正态分布
N[0,1)的概率分布函数时表示为( )A.①(x) B.O(2LlE)C.①(x-U) D.①(二)解析:此题考察正态分布的标准化X~N(〃,cr2),贝忆=3二幺~N(0,l),选B.a例3、掷一枚不均匀硬币,正面朝上的概率为3,将此硬币连掷3次,则恰好24次正面朝上的概率是( )A.— B.126464C.— D.366464解析:记X表示正面向上的次数,则X~B(3,a 27-),P(X=2)=C^0.7520.25=—,Co4 , 64例4、假设随机变量X服从正态分布,则随机变量Y=aX+b(aW0)服从(A.正态分布 B.二项分布C.泊松分布 D.指数分布解析:此题考察正态分布的线性组合仍为正态分布,选A。例5、某电梯一星期发生故障的次数通常服从( )A.两点分布 B.均匀分布C.指数分布 D.泊松分布解析:选D,泊松分布描述不常发生的事情。例6、一个服从二项分布的随机变量,其方差与期望之比为1/3,则该二项分布TOC\o"1-5"\h\z的参数「为( )A.1/3 B.2/3C.l D.3解析:此题考察二项分布的方差与期望'瑞=7包=「「=;'从而选B。例7、设随机变量例7、设随机变量X的概率密度函数为R(x)=-(x-2)2/8(―8VXV8)则X的方差D(X)=(B.2B.2C.3 D.4解析:此题考察正态分布的密度函数,选D。k-0.4例8、随机变量X分布律为P(x=k)=——,k=0,1,2,3,…则X的方差k!D(X)=( )
A.0.4 B.2C.2.5 D.3解析:此题考察泊松分布的方差,选A。例9、据调查,某单位男性员工中吸烟者的比例为20%,在一个由10人组成的该单位男性员工的随机样本中,恰有3人吸烟的概率是多少?解析:设X表示10人中抽烟的人数,则X〜B(10,0.2),从而P(X=3)=Ct;0.230.87(自行用计算器计算出概率)o例10、某零件的寿命服从均值为1200小时,标准差为250小时的正态分布。随机地抽取一个零件,求它的寿命不低于1300小时的概率。(①(0.3)=0.6179,中(0.4)=0.6554,①(0.5)=0.6915)解析:设某零件的寿命为X,则X〜N(1200,2502),从而P{X>P{X>1300}=1-P{X<1300}=1-P〈 < TOC\o"1-5"\h\zI250 250=1一①(0.4)=0.34463、随机变量期望、方差及协方差的运算和性质:例1、设X和丫为两个随机变量,D(X)=10,D(Y)=1,X与丫的协方差为-3,则D(2X-Y)为( )A.18 B.24C.38 D.53解析:由。(aX+》y)=a2£>(x)+2a/?Cou(X,y)+〃£)(y)知,答案为D。例2、设X和丫是两个相互独立的随机变量,已知D(X)=60,D(Y)=80,则Z=2X-3Y+7的方差为( )A.100 B.960C.1007 D.1207解析:由于常数方差为0,且由X和丫独立知其协方差为0,从而由公式D(aX+hY)=a2D(X)+b2D(Y)知答案为B。TOC\o"1-5"\h\z例3、设X为随机变量,E(X)=2,D(X)=6,则RX2)为( )A.5 B.10C.20 D.30解析:由方差的等价定义:D(X)=E(X2)—E2(X)知,答案为B。例4、假设已知OX=25,Oy=9,COV(X,y)=10.5,则X与y相关系数r为B.B.0.6D.0.8C.0.7例5、设X、Y为随机变量,D(X)=6,D(Y)=7,Cov(X,Y)=l,试计算D(2X—3Y).解析:由O(aX+by)=a20(x)+2aZ?Cov(X,y)+〃£)(y)知解析:由相关系数计算公式A,=解析:由相关系数计算公式A,=潦焉知答案为仁D(2X-3Y)=4D(X)-12Cov(X,Y)+9D(Y)=75»4、概率分布、密度函数:例1、离散型随机变量X只取-1,0,2三个值,已知它取各个值的概率不相等,且三个概率值组成一个等差数列,设P(X=0)=a,则a=( )A.1/4 B.1/3C.1/2 D.1解析:由于三者成等差数列,故设X取-1的概率为a-d,取2的概率为a+d,而三者相加为1,从而a=1/3,答案为B。例2、设随机变量X的概率密度函数为P(x)=[2 'L5则*的数学期望e(X)=0其它A.A.1C.1.5 D.2解析:显然,从概率密度函数知X~U(1,1.5),从而期望为1.25,答案为B。第四章抽样方法与抽样分布。根本知识点:一、 抽样根本概念:.总体:研究对象的全体;.个体:组成总体的每一个个体;.抽样:从总体中抽取一局部个体的过程;.样本:从总体中抽出的一局部个体构成的集合;.样本值:在一次试验或观察以后得到一组确定的值;.随机样本:1)个体被抽到的可能性相同;2)相互独立;3)同分布。二、抽样方法:.简单随机抽样:总体中有n个单元,从中抽取r个单元作为样本,使得全部可能的样本都有同样的时机被抽中。有放回抽样的样本个数为〃';无放回抽样的样本个数为C:。.系统抽样(等距抽样):将总体单元按照某种顺序排列,按照规则确定一个起点,然后每隔肯定的间距抽取样本单元。.分层抽样:在抽样之前将总体划分为互不交叉重叠的假设干层,然后从各个层中独立地抽取肯定数量的单元作为样本。.整群抽样:在总体中由假设干个总体单元自然或人为地组成的群体称为群,抽样时以群体为抽样单位,对抽中的各群的全部总体单元进行观察。
抽样中经常遇到的三个问题:.抽样选取不当;.无答复:处理无答复常用的方法:1)注意调查问卷的设计和强化调查员的培训;2)进行屡次访问;3)替换无答复的样本单元;4)对存在无答复的结果进行调整。.抽样本身的误差。抽样分布与中心极限定理:.不包含任何未知参数的样本函数称作统计量;.常用的统计量:1)样本均值:;2)样本方差:S2=土£(x,-62;3)样本标差:S=VS2o.统计量的分布叫做抽样分布,当样本容量n增大时,不管原来的总体是否服从正态分布,其样本均值都将趋向于正态分布,当n230时,样本均值就可以近似的服从正态分布。.中心极限定理:设随机变量Xi,X2, Xn独立同分布,且EXi=u,DXi=。2,i=l,2, n,元=/酒;戌=£(花/)=/;%=口;D又=。6汇;X,)== X,)=+之〃,=+也2=41)设随机变量X”X2, X”独立同分布,且EXi=u,DXi=。'i=l,_ _近似 , -近似2,……n,X=^yX,.,则X〜N(〃,cr2);学〜N(O,1);2)设随机变量X“X2,JI *302)设随机变量X“X2,x.独立同(o,1)分布,则X;x,.〜氏〃,p),一“近似且£X,〜N(np,np(l-p))„应30五、常用的抽样分布1.样本均值的抽i羊分布:总体均值、方差抽样方法样本的期望样本方差有限总体重复抽样♦n有限总体不重复抽样11MN-n~N-\
无限总体任意♦n假设有限总体不重复抽样片<5%时,其修正系数标T近似为1,样本均值的方差可以简化为2.样本比例的抽i羊分布:总体比例抽样方法EPDP无限总体任意Pp(l-p)n有限总体有放回抽样Pp(l-p)n有限总体无放回抽样P■(1一〃),N-nn N-\〃 N-n假设有限总体无放回抽样N<5%时,其修正系数豺近似为1,样本比例的方差可以简化为若包。三种d、样本的抽样分布:名称统计量记法上a分位点X2分布X1,X2 Xn分布A2.“2. .—2Zi+72+ +Xn=xx2〜x2(n)PlX2>/(〃)]=a『分布X-N(0,1),丫〜x2(n)X,丫相互独立Z~/(n)P[t>%(")]=aF分布u〜/(〃1),V~z\n2)U,V相互独立,尸=晚F^F(n}9n2)P\F>Fa(ne〃2)】=a%〃2)=尼(晨)几种雪星要统计量的分布:设X〜N(P,。2),X1,X2,……Xn是X的样本,样本均值又= ,样本方差52=+X;(X,-62:1.r分布:》〜N(〃,咛)•标选化—孕〜N(O,1)”本标却代轲>孕~«“_1);2.X22.X2分布:Z:(X「方23.设X1,X2,……Xn是N(从,这)的样本,丫],丫2,……Yn是N(〃2,蟾)的样本,并且都相互独立,则:
》-》-F〜N(4-〃24+给标准化>xy(〃]〃2)〜N(0,1)用'以%代替0/*,一产〜伞1+%_2)
S&J—I—S;=^E;(X,「反)2;5;=卷詈氏-斤;s合=31^。根本运算方法:1、根本概念及抽样方法:例1、如果抽选10人作样本,在体重50公斤以下的人中随机抽选2人,50-65公斤的人中随机选5人,65公斤以上的人中随机选3人,这种抽样方法称作()A.简单随机抽样 B.系统抽样C.分层抽样 D.整群抽样解析:此题考察概率抽样方法的分类,答案为C。例2、将总体单元按某种顺序排列,按照规则确定一个随机起点,然后每隔肯定的间隔逐个抽取样本单元。这种抽选方法称为( )A.系统抽样 B.简单随机抽样C.分层抽样 D.整群抽样解析:此题考察概率抽样方法的分类,答案为A。2、抽样分布与中心极限定理:TOC\o"1-5"\h\z例1、一个具有任意分布形式的总体,从中抽取容量为n的样本,随着样本容量的增大,样本均值又将逐渐趋向于( )A.泊松分布 B.3c2分布C.F分布 D.正态分布解析:此题考察中心极限定理,答案为D。例2、在简单随机抽样中,如果将样本容量增加9倍,则样本均值抽样分布的标准误差将变为原来的( )A.1/9倍 B.1/3倍C.3倍 D.9倍解析:由于D(X)=从而标准误差为隼,答案为B。例3、对于容量为N的总体进行不重复抽样(样本容量为n),样本均值又的方差为(.ct2zN-n.A.—( )nN-1
D.N-lD.N-l解析:此题考察样本均值的抽样分布,答案为A。例4、设Xl,X2,…,Xn是从正态总体N(U,。2)中抽得的简单随机样本,其中u已知,。2未知,n22,则以下说法中正确的选项是( )A. A. 是统计量n2nB.J之X,2是统计量TOC\o"1-5"\h\z-2n .、 1 1 «C・ -")2是统计量 D.匕■七氏_〃产是统计量1r=l 1解析:此题考察的是统计量的概念,不能含有未知参数,故答案为D。例5、一个具有任意分布形式的总体,从中抽取容量为n的样本,随着样本容量的增大,样本均值逐渐趋向正态分布,这一结论是( )A.抽样原理 B.假设检验原理C.估量原理 D.中心极限定理解析:此题考察的是中心极限定理的内容,答案为D。3、三种小样本分布与几种重要统计量的分布例1、从总体X~N 中抽取样本X1, X”,计算样本均值又=4之Xi,随机变量舒服从(1i=l随机变量舒服从(样本方差s2=—!-支(Xi-又)2,当n<30时,i=lA./分布 B.F分布C.t分布 D.标准正态分布解析:此题考察的是几种重要统计量的分布中的t分布,答案为C。例2、从总体X~N(〃,,)中重复抽取容量为n的样本,则样本均值又=工之Xjni=lB.-
n解析:此题考察的仍旧是样本均值的抽样分布,由D(无)=之知答案为D。n第五章参数估量。根本知识点:一、参数估量.参数点的估量:设总体分布中含有未知参数。,从总体中抽取一个样本Xi,X2,……Xn,用来估量未知参数。的统计量3(Xl,X2,……Xn)称为参数。的一个估量量,假设Xl,X2,……Xn是样本的一组观察值,则](X],X2,……Xn)称为参数G的一个点估量值。.估量量的评价标准:I)无偏性:设方是总体中未知参数。的估量量,假设则称]是0的无偏估量量。样本均值又是总体均值U的无偏估量量,成=〃;样本方差S?是总体方差。2的无偏估量量,ESZ=O2O2)有效性:。的方差最小的无偏估量量称为。的有效估量量;正态总体的样本均值X是总体均值P的有效估量量。(以上两种情况在样本容量固定的情况下发生;当样本容量增大是方越来越接近真值。)3)一致性:假设当样本容量增大时,估量量2的值越来越接近未知参数0的真值,则称方是。的一致估量量。样本黑是总体黑的一致估量量。二、总体均值的区间估量:.设8是总体分布中的未知参数,Xi,X2.……Xn是总体的一个样本,假设对给定的a[0<a<1),参在两个估量量3(Xi,X2,……Xn)和我2(Xi,X2,……Xn),使P(@<6<a)=l—a,则称随即区间(3,02)位参数。的置信度位1-a的置信区间。a称为显著水平。.意义:随机区间(",星)包含。真值的概率是1-a。2.待估参数总体均值〃 X;……X"样本〉估计量.〜N(〃,二)
标准化.置信度l-a大样根或必知>Z=3〜N(0,1)置信、>刀土Z,标准化.置信度l-a小样本4知3代以"=?〜置信.区呵)又土4n4.总体均值的置信区间(置信度1-a)总体分布样本量。已知0未知正态分布大样本又土Z巴十27〃又土Z巴+27〃正态分布小样本刀土Za多17nX±L(n-1)-^非正态分布大样本又土Z“辛2反土Z“房27n总体比例的区间估量:总体比例的置信区间(置信度1-a)样本量抽样方法置信区间大样本有放回抽样产严无放回抽样「土z”仁四、 两个总体均值之差的置信区间(置信度1-a)总体分布样本量0已知。未知正态分布大样本又”zjH+WIV〃1 〃2用Si替代。।用S2替代。2正态分布小样本X-Y±ZaK+^~7V〃1 〃2X-丫±ta(n]+n2-2)xS^J—+—2 V^ln2非正态分布大样本X-Y±zl^-+^iVnin2用$替代。।用S?替代。2五、大样本,两个总体比例之差(8-P2)的置信区间,置信度(1-a):i士zjg+s
2\n\ n2六、 样本容量确实定(置信度l-a):抽样方法置信区间同意误差样本容量有放回抽样(或抽总体均值刀土3予云〃=(十)2A样比<5%)总体比例飞”Z;P(1-P)n=-=—— A2不放回抽样总体均值x士z17rg0予卡“昭先算出有放回抽样的样本容量n0;然后:总体比例IP(l-P)N-n〃=」一1+%Np±Z」Sx0fVnN—1△—ZJ〃xN—1。根本计算方法:1、参数估量及评价标准:例1、估量量的无偏性是指( )A.估量量的数学期望等于总体参数的真值B.估量量的数学期望小于总体参数的真值C.估量量的方差小于总体参数的真值D.估量量的方差等于总体参数的真值解析:此题考察估量量的无偏性这一概念,答案为A。例2、假设Ti、T2均是。的无偏估量量,且它们的方差有关系DTDDT2,则称()A.Ti比T2有效 B.Ti是0的一致估量量C.T2比Ti有效 D.T2是。的一致估量量解析:此题考察估量量的有效性这一概念,答案为C。例3、设总体X服从正态分布N(u,。2),u和/未知,(Xi,X2, X„)是来自该总体的简单随机样本,其样本均值为M,则总体方差。2的无偏估量量是
C去步「自2 D.^px.-xr解析:此题考察一个重要结论一一样本方差是总体方差的无偏估量,答案为A。2、区间估量:例1、假设置信水平保持不变,当增大样本容量时,置信区间( )A.将变宽 B.将变窄C.保持不变 D.宽窄无法确定解析:答案为Bo例2、置信系数l-a表示区间估量的( )A.精确性 B.显著性C.可靠性 D.精确性解析:此题考察置信系数的概念,答案为C。例3、设总体X服从正态分布N(〃,凉),而已知,用来自该总体的简单随机样本Xi,X2,…,Xn建立总体未知参数〃的置信水平为l-a的置信区间,以L表示置信区间的长度,则(置信区间的长度,则(a越大L越小C.a越小L越小a越大L越大D.a与L没有关系a越大L越小,应选A。解析:由于总体方差已知,从而L=2XZ"a越大L越小,应选A。例4、对于成对观测的两个正态总体均值差的区间估量,可以采纳的统计量是()A.t统计量 B.Z统计量C./统计量 D.F统计量解析:此题考察不同条件下,选取不同统计量进行区间估量,答案为A。例5、在小样本情况下,如果总体服从正态分布且方差未知,则总体均值的置信度为1—a的置信区间()A.X±Za/2赤 B.X土Z“2赤ex±ta/2(n-1)而 D.x±ta/2(n-1)赤解析:此题考察不同条件下,选取不同统计量进行区间估量,答案为C。例6、假设某单位员工每天用于阅读书籍的时间服从正态分布,现从该单位随机抽取了16名员工,已知他们用于阅读书籍的平均时间为50分钟,样本标准差为
20分钟,试以95%的置信度估量该单位员工用于阅读书籍的平均时间的置信区间。(d25(15)=2.13JOO25(16)=2.12JOO5(15)=1.753,^(16)=1.746)解析:此题是正态总体,总体方差未知,小样本,显然采纳下面公式计算:
田土%(〃-1)2](以下具体计算略)例7、某餐馆欲估量每位顾客午餐的平均消费数额,依据以往的经验,顾客午餐消费的标准差为15元。假设中午在该餐馆就餐的顾客非常多,现要以95%的置信度估量每位顾客午餐的平均消费数额,并要求同意误差不超过3元,应抽取多少位顾客作为样本?(Zo.o5=l.645,Zo.o25=1.96)解析:题设条件是总体分布未知,大样本,其区间估量公式为,X±Za-^=,一«/M从而同意误差为阜
从而同意误差为阜
万<3(以下具体计算略)例8、某企业采纳两种不同的促销方法进行销售。使用甲促销方法进行销售的30天里,日均销售额为50万元,样本标准差为5万元;使用乙促销方法进行销售的30天里,日均销售额为40万元,样本标准差为4万元。求使用甲、乙促销方法进行销售的日均销售额之差的置信度为95%的置信区间。(Zo,o5=1.645,Zo.o25=1.96)解析:此题显然是双总体均值之差的区间估量,采纳公式:以下具体计算略)X-Y+以下具体计算略)X-Y+Z例9、某市场调查机构对某品牌家电进行市场调查,一共随机调查了1000名顾客,其中有700人表示喜欢该品牌家电。试以95%的可靠性估量喜欢该品牌家电的顾客比例P的置信区间。(Zb.05=1.645,Zo.o25=1.96)解析:此题考察的是比例的区间估量,应用公式p±z\^—^\(以下具体计算略)
第六章假设检验。根本知识点:一、 假设检验的根本概念:.小概率原理:小概率事件在一次试验中很难发生,但并不意味着绝对不会发生。.对总体参数的取值所作的假设,称为原假设(或零假设),记做H。;原假设的对立假设称为备选假设(备择假设),记做乩。
.犯“H。为真,但拒绝HJ这种错误的概率a称为显著水平;这种错误称为第一类错误]弃真错误);.“H。不成立,但接受H。”的这种错误称为第二类错误;犯这种错误的概率记做B0.用来推断是否接受原假设的统计量称为检验统计量。.当检验统计量取某个范围D内的值时,我们拒绝原假设H。;这是D称为拒绝域;拒绝域的边界点称为临界点。.假设检验的根本思想:先假定H。成立,在这个前提下用样本数据进行推导、计算,如果导致小概率事件发生,择拒绝H。,否则就接受H。。8.当检验的统计量〜N[0,1)时:Ho:U=UoH.:U#Uo双假检验:|Z|2Z巴2Ho:U>UoH,:U<Uo左侧检验:Z<—ZaHo:U<UoH,:U>Uo右侧检验:z>z„9.假设检验的五个步骤:1)提出原假设与备选假设。原则:1、把含有等号的式子作为原假设;2、从样本做出猜想而期望证实的问题作为备选假设;2)选取统计量。通过选取适当的统计量来构造小概率事件;3)按P(拒绝Ho/H。真)=a确定拒绝域;4)计算统计量的值;5)做出推断:当样本值落在拒绝域内,小概率事件发生,拒绝Ho;当样本值不落在拒绝域内,小概率事件没发生,接受H。。总体均值的假设检验:已知条件HoH.检验统计量及其分布拒绝域X-N(u,。2)0=0o,已知U=Uo,或大样本□=U0UUoX~LL”。为真Z=^—^〜N(0,l)/y[n|Z|>z£U>UoP<Uozw-z“U<UoU>UoZ>z„X-N(u,。2)。未知,小样本U=UoUWUoX-u%为真t=—~Jy/n~2U>MoU<Uo,4一%5-1)U<U0U>Mot>ta(n-l)三、总体比例的假设检验:已知条件HoH.检验统计量及其分布拒绝域大样本P-PoP*PoZ=P-P。 丝“N(0,l)|Z|>z„~2PNPoP<PoPo(l-Po)Vnzw-z“
p£PoP>PoZNZ"两个总体均值(比例)之差的假设检验:已知条件HoH,检验统计量及其分布拒绝域X〜”,看)oI,o2已知,或大样本U!=U2U 口2X-Y〃。为真Z=, 〜N(0,l)2 2回+%V n2(设〃厂〃2=°)|Z|>Z„2UI>u2U1<U2zw-z“U1<u2U|>U2ZNZ0x〜y〜%(乂。;),。1,。2未知,或小样本U1=P-2UirU2X-Y%为其, 一|/|>/a(nl+n2-2)21— 1 fynl1叼乙)sJ+工。n2U1>U2P)<区-乙(〃1+”2-2)U1<U2U1>U2此〃为+%-2)大样本Pi=plP尸02p-P %为真Z= 12 〜N(0,l)P(l-P)(-+-)V n1n2|Z|>Z£~2PiNPiPl<P2Z-Z"P\(PiPi>P2ZNZa。根本计算方法:1、假设检验的根本概念:例1、显著性水平a是指( )A.原假设为假时,决策判定为假的概率B.原假设为假时,决策判定为真的概率C.原假设为真时,决策判定为假的概率D.原假设为真时,决策判定为真的概率解析:第一类错误又称拒真(弃真)错误,犯此类错误的概率为a,故也称其为a错误,表示原假设为真,决策判定为假从而拒绝接受原假设,应选C。例2、以下关于第一类、第二类错误的说法中正确的选项是( )A.原假设Ho为真而拒绝Ho时,称为犯第一类错误B.原假设Ho为真而拒绝Ho时,称为犯第二类错误C.原假设Ho为假而接受Ho时,称为犯第一类错误D.原假设Ho为假而拒绝Ho时,称为犯第一类错误解析:此题考察第一类错误和第二类错误的概率,选A。例3、在假设检验中,记H。为待检假设,则犯第二类错误指的是( )A.Ho成立,经检验接受Ho B.Ho不成立,经检验接受HoC.Ho成立,经检验拒绝H。 D.Ho不成立,经检验拒绝Ho解析:此题考察第一类错误和第二类错误的概率,选B。例4、设a和万是假设检验中犯第一类错误和第二类错误的概率。在其他条件不变的情况下,假设增大样本容量n,则( )A.a减小增大 B.a减小,月减小C.。增大,£减小 D.a增大,〃增大解析:假设样本容量不变,减小a必增大夕,减小夕必增大a,假设要二者同时减小,必增大样本容量,从而答案为B。2、假设检验:例1、在比拟两个非正态总体的均值时,采纳Z检验必须满足( )A.两个总体的方差已知 B.两个样本都是大样本C.两个样本的容量要相等 D.两个总体的方差要相等解析:此题考察的是不同条件下,选用不同的检验统计量进行检验,选B。例2、对于假设Ho:口2口0,Hi:P<P0,假设抽得一个随机样本,其样本均值小于Po,则()A.肯定拒绝Ho B.有可能拒绝HoC.肯定接受Hi D.有1-a的可能性接受Ho解析:此题考察是的假设检验的拒绝域问题,答案为B。例3、对方差已知的正态总体均值的假设检验,可采纳的方法为( )A.Z检验 B.t检验C.F检验 D./检验解析:此题考察的是不同条件下,选用不同的检验统计量进行检验,选A。例4、假设总体服从正态分布,在总体方差未知的情况下,检验乩):〃=〃。,小:〃*〃。的统计量为1=±书,其中n为样本容量,S为样本标准差J=多(%-又)2,则Ho的拒绝域为( )A.11|<t„/2(n-l) B.|t|>ta/2(n-l)C.|t|>t„(n-l) D.|t|<ta(n-l)解析:此题考察是的假设检验的拒绝域问题,显然双侧检验,t分布,答案为B。例5、假设X〜N(〃卬2),Ho:〃之〃0,Hi: 且方差M已知,检验统计量半,如果有简单随机样本Xl,X2-Xn.其样本均值为G>〃0,则( )A.肯定拒绝原假设 B.肯定接受原假设C.有可能拒绝原假设 D.有可能接受原假设解析:此题考察是的假设检验的拒绝域问题,答案为B。例6、对正态总体N(n,9)中的R进行检验时,采纳的统计量是( )A.t统计量 B.Z统计量C.F统计量 D.%2统计量解析:正态总体,总体方差已知,选取Z统计量,故答案为B。例7、在假设检验中,如果仅仅关怀总体均值与某个给定值是否有显著区别,应采纳( )A.单侧检验 B.单侧检验或双侧检验C.双侧检验 D.相关性检验解析:答案为C。例8、已知X~N(u,凉),。0已知,对于假设Ho:u=uo,Hi:uWuo,抽取样本Xi,…,Xn,则其检验统计量为o解析:正态总体,总体方差已知,应选取统计量z=\[n例9、在对正态总体X~N(U,。2)的均值u的区间估量中,当置信系数1-a增大时,置信区间会。解析:置信系数1-a增大时,置信区间会减小。例10、在对总体X~N(U,。2)中u的假设Ho:U=Uo进行检验时,假设总体方差。2较大,此时Ho的接受域0解析:依题意,总体方差已知,且是双侧检验,故拒绝域为|Z|>Z〃2,从而接受域为例11、某饮料生产商声称其生产的某种瓶装饮料中营养成分A的含量不低于6克,现随机抽取100瓶该饮料,测得其营养成分A含量的平均值为5.65克,样本标准差为1.2克。试问该饮料生产商的声明是否真实可信?(可靠性取95%,Zo.o5=1.645,Zo.o25=1.96)解析:Ho:〃N6,%:〃<6Z=2^a.〜N(O,1)忑从而拒绝域为IZ|>Z°/2,BP|Z|>1.96计算得Z=5q5:6=-2.9i,从而|Z|>1.967100从而拒绝H0,即认为该饮料生产商的声明不真实。例12、已知202X年某地人均消费为6000元。202X年,从该地个人消费总体中随机取得的一个样本为:7000、7500、8000、8000、7000、9000、8000、8500、9000(单位:元)。假设该地个人消费服从正态分布。(1)求202X年该地个人消费的样本均值。(2)求202X年该地个人消费的样本方差。(3)请以95%的可靠性检验202X年该地人均消费是否比202X年有显著上涨并给出相应的原假设、备择假设及检验统计量。(to.«25(8)=2.3O6,to.o25(9)=2.26,to.o25(10)=2.228,to.os(8)=1.8595,to.os(9)=1.8331.to.o5(lO)=1.8125)解析:⑴x」之七=8000元〃,=iS2 =562500元2%:4W6000,H,:〃>6000X-u"。为真"〜Z(n-l)4n拒绝域为,之。(〃-1)=1.8595计算得,=陪鳖=8>1.8595S/5625OO4nV9^从而拒绝”。,即认为有显著上涨。例13、某培训中心采纳A、B两种培训方法对学员进行培训。从使用A培训方法和使用B培训方法的学员中分别随机抽取了10人,测得他们完成培训所需的时间分别为10,15,8,13,18,20,17,12,12,15小时和10,15,7,8,6,
13,14,15,12,10小时。假设使用A培训方法和使用B培训方法所需培训时间均服从正态分布,且方差相等。(1)求使用A培训方法和使用B培训方法的学员所需培训时间的平均值及样本方差。(2)请给出检验A、B两种培训方法所需培训时间是否有显著性差异的检验的原假设和备择假设。(3)检验A、B两种培训方法所需培训时间是否有显著性差异(显著性水平取5%)。(to.osd8)=1.734,to.o5(l9)=1.729,to.Q5(2O)=1.7247,to.o25(l8)=2.1,to.o25(l9)=2.09,to.025(20)=2.086)解析:解析:(1)均值公式:X=—Vx,.n,=l样本方差公式:s2=上£;a-分2 (此处具体计算略)(2)%:4一4=°,乩:%一4Ho选用检验统计量y孑乙吧)(%+〃,-2)其拒绝域为I止也(4+“2-2) (下面具体计算略)第七章相关与回归分析。根本知识点:一、 相关分析:.线性相关:数量的关系近似线性函数;1)正线性相关:变量是同向变化;2)负线性相关:变量是反向变化;.非线性相关:变量的关系近似非线性函数;.完全相关:变量是函数关系;1)完全线性相关:变量的关系是线性函数;2)完全非线性相关:变量的关系是非线性函数;.不相关:变量之间没有任何规律。.协方差:cov(X,K)=E(X-EX)(X-EY)=E(XY)-EX-EY总体相关系数:"碎y/DXxy/DY样本相关系数:r=Z(X,--(Z-F)_% = 运盯-'Ey- F)2日x五一庇"必『•庇v2_(Zy『Ixylxx=ZX;-%Zxy匕2」(门尸
n一元线性回归:.假设对操纵变量x的每一个确定值,随机变量的数学期望存在,则此数学期望是X的函数,称为Y关于X的回归函数;.假设一元回归函数是线性函数,则称为一元线性回归(回归直线);.回归直线$=。+云,其中b=a称为斜率,々=y-/;X称为截距。.总变差平方和=剩余平方和+回归平方和SST-SSE+SSR分解-Z(匕一P)2=Z(K—幻?+Z(g—"2总变差平方和:Y”Y2,……工的分散程度;回归平方和:X”X2,……X”的分散性引起的Y”Y2,……工的分散程度;剩余平方和:其他因素引起的分散程度。SST=lvySSR=b2lxxSSE=l.-b2ltt.判定系数:r2=—=SSTlyy.最小二乘法:是使因变量的观察值y,与估量值»的SSE(剩余平方和)到达最小来求得a和b的方法;即Q=Z(%-K)2=Z(y,-a-bx,)=min。.估量标准误差:G_lSSE- _]»一立力一」《y,一1口"Vn-2-V^2.判定系数的意义:0守0SSE意义式二1SSE=O,观察点落在回归直线上,X,Y完全线性相关r2~*lSSE—O,yi=>观察点接近回归直线,X,Y高度线性相关r2=0SSE=SSTX的变化与Y无关,无线性相关关系.给定X=x°,置信度为l-a,x0的预测区间与玲。的置信区间:治的点估量:>0=。+〃/y0±tJn-2)SxEy0y0±tJn-2)SxEy0的置信区间:多元线性回归和非线性回归:X。的预测区间1.多元线性回归:y=a+btx}+b2x2+ +bnxn2.可线性化的非线性回归:名称方程变量代换线性回归双曲函数,1y=a+b—X.1X=—Xy=a+bx对数函数y=a^-b]ogxx*=logxy=a+bx嘉函数y=Axhy=logyX=logXa=logAy=a-\-bx多项式函数y=bQ^bxx+h2x~+ hkx(%!=X,x2=x29xk=J»=a+Ax】+b2x2+ +hnxn。根本计算方法:1、相关分析及根本概念:例1、如果相关系数尸-1,则说明两个随机变量之间存在着( )A.完全反方向变动关系 B.完全同方向变动关系C.互不影响关系 D.接近同方向变动关系解析:此题考察相关系数的概念,Ao例2、当全部观察点都落在回归直线产a+bx上,则x与y之间的相关系数为(A.r=0 B.1^=1C.-l<r<l D.0<r<l解析:此题同样考察相关系数的概念,由于不确定a比。大还是小,应选B。例3、在回归分析中,估量的标准误差主要是用来检测( )A.回归方程的拟合程度 B.回归系数的显著性C.回归方程的显著性 D.相关系数的显著性解析:此题考察估量标准误差的概念,答案为A。TOC\o"1-5"\h\z例4、两个现象之间相互关系的类型有( )A.函数关系和因果关系 B.回归关系和因果关系C.函数关系和相关关系 D.相关关系和因果关系解析:此题考察两个现象之间的关系分类,答案为C。例5、如果相关系数尸0,则说明两个变量之间( )A.相关程度很低 B.不存在任何关系C.不存在线性相关关系 D.存在非线性相关关系解析:相关系数为0,只能说两个变量之间不存在线性关系,但可能存在非线性关系,故答案为C。例6、测度各实际观测点在回归直线散布状况的统计量为( )A.回归方程 B.相关系数C.回归系数 D.估量的标准误差解析:答案为D。2、回归分析例1、在直线回归方程;尸a+bxi中,假设回归系数b<0,则表示x对y的线性影响是( )A.不显著的 B.显著的C.正向影响 D.反向影响解析:此题考察对回归系数的理解,显然,答案为D。例2、在回归分析中,F检验主要是用来检验( )A.相关系数的显著性 B.单个回归系数的显著性C.线性关系的显著性 D.拟和优度的显著性解析:在回归分析中,F检验主要是用来检验线性关系,答案当然是C。例3、设一元线性回归方程为£i=a+bXj,假设已知b=2,X=2O,Y=15,则a等于)A.-28 B.-25C.25 D.28解析:由又知,此题答案为B。例4、一元回归直线拟合优劣的评价标准是( )A.估量标准误差越小越好 B.估量标准误差越大越好C.回归直线的斜率越小越好 D.回归直线的斜率越大越好解析:此题考察估量标准误差的概念,答案为A。例5、如果回归平方和SSR与剩余平方和SSE的比值为4:1,则判定系数为()A.0.2解析:由于判定系数=SSRSST(=SSR+SSE)解析:由于判定系数=SSRSST(=SSR+SSE)=4/5,故答案为D。例6、为研究某行业企业年销售额与年销售支出之间的关系,调查获得了5个企业202X年的有关数据如下:年销售支出x(万元/年)1020406080年销售额y(百万元/年)1130455560要求:(1)计算年销售支出与年销售额之间的简单相关系数;(2)以年销售支出为自变量,年销售额为因变量,建立直线回归方程;(3)估量年销售支出为50万元时企业的预期销售额。解析:(1)相关系数一一,Z(X,-廿(丫厂「)(相关计算在此略去)物(Xf—尸(2)设回归方程为j=a+其中系数的计算公式如下:匹卜””应,其中/.Zxz—xZxWz 尸⑶将x=50代入(2)中计算的回归方程,得到y值即可。例7、为研究某商品A的销售量与价格之间的关系,调查获得5个月的月销售量与月销售价格的数据如下:单价X(元/件)0.80.91.01.11.2月销售量y(千件)231514108(1)以月销售量为因变量,建立回归直线方程。(2)计算销售量与价格之间的简单相关系数。(3)当商品的价格由每件1.10元降为每件0.85元时,商品A的销售量将如何变化变化多少解析:此题计算方法,所用公式同上。例8、兴旺国家的企业为取得更大利润,不惜拨巨款用于新产品的研究和市场等项工作。为考察“研究和开展费"与企业"利润”的关系,有人对日本5家大企业进行调查,得到一组数据如表所示:研究和开展费(十亿日元)12334利润(十亿日元)1120404550要求:⑴计算研究和开展费与利润之间的简单相关系数;⑵以研究和开展费为自变量,利润为因变量,建立回归直线方程;⑶计算估量标准误差。
解析:此题(1)(2)两问计算及公式同例6,第(3)问所用公式如下:S产唇片平产211具体计算在此略去)第八章时间数列分析。根本知识点:一、 时间数列的比照分析:.现象在各个时间上的观察值称为开展水平(规模和开展的程度);.各个时期开展水平的平均数称为平均开展水平(序时平均数);.序时平均数:1)绝对数时期数列:算术平均法1/+、+,……+'=今n n绝对数时点数列:首末折半法_……+(/)3Y_ L L L (+n+ +%其中:几72,…,是时间间隔长度如果7]=n=……=,…则:_1+劣+……Y=z zn-\2)相对数或平均数时间数列的序时平均数:Y=ib.时间数列的速度分析:1)增长量=汇报期水平一前期水平;2)逐期增长量=汇报期水平一前期水平;3)累计增长量=汇报期水平一固定基期水平;4)开展速度=报告期水平
基期水平5)环比开展速度=报告期水平
前期水平6)定基开展速度=报告期水平4)开展速度=报告期水平
基期水平5)环比开展速度=报告期水平
前期水平6)定基开展速度=报告期水平
固定基期水平7)增长速度=报告期水平一基期水平基期水平=发展速度-1;8)环比增长速度=超喘*上=环比发展速度7;9)定基增长速度喘瑞也=定基发展速度7;10)平均增长量=各个逐期增长量的算术平均数z逐期增长量z逐期增长量累积增长量逐期增长量的个数观察值的个数T'11)平均开展速度=各环比开展速度的几何平均数;n水平法:Yr=累积法:匕+毋+……+?=X+b+……+♦(查表)12)平均增长速度=平均开展速度-1;长期趋势分析及预测:.影响时间数列的因素T:长期趋势;S:季节变动;C:循环变动;I:不规则变动。.时间数列的模型:乘法模型:Y=TXSXCXI;加法模型:Y=T+S+C+I;混合模型.移动平均法:适当扩大时间间隔,逐期移动,算出移动平均趋势率,排除短期波动(偶数要算两次);.线性模型法:把时间t做自变量,把开展水平Y,做因变量,用最小二乘法得趋势直线方程。季节变动分析:.季节变动得测定:1)按月(季)平均法;计算同月(季)平均数(排除随机影响);计算总月(季)平均数(全体数据的和
数据个数计算总月(季)平均数(全体数据的和
数据个数计算季节指数(同月(季)平均数
总月(季)数xlOO%);四季季节指数之和=400%;平均数=100%;全年指数的和=1200%;平均数=100%2)趋势剔除法:先排除趋势变动,再计算季节指数;算出四季(或全年)的移动平均趋势T;计算3=胃器(%)'排除趋势变动;将工按月(季)重新排列,计算同月(季)平均数。T.季节变动的调整:算出工(排除季节变动);S依据1的数据,配合趋势直线Y,=a+bt,a=(5)-初,b=-^~(t为时间顺序号)由趋势直线方程,算出调整后的趋势值。四、 循环变动的测定:剩余法:从时间数列中排除趋势变动、季节变动和不规则变动。1)排除季节变动,计算工;S2)依据Y的数据,配合趋势直线g=a+初,算出趋势值T(即0);Y/3)4)排除趋势变动,算出¥=cxi,3)4)将CXI移动平均,排除不规则运动,得到循环变动的相对数。。根本计算方法:1、时间数列的比照分析(主要包含计算各种平均数、开展速度、增长速度等)例1、已知某地区202X年的居民存款余额比1990年增长了1倍,比1995年增长了0.5倍,1995年的存款额比1990年增长了( )A.0.33倍 B.0.5倍C.0.75倍 D.2倍解析:设1990年居民存款余额为单位1,则202X年为2,设1995年为a,则1.5a=2,从而a=1.33,比1990年的1增加了0.33倍,从而选A。例2、某一国的GDP总量在202X年比202X年增长了7%,202X年比202X年增长了6%,则202X年比202X年增长了( )A.13.42% B.14.23% C.16.56%D.17.82%解析:设202X年GDP为单位1,则202X年为1.07,202X年1.07X1.06=1.1342从而答案为A。
例3、时间数列的增长量与基期水平之比,用以描述现象的相对增长速度,被称A.增长速度C.平均增长量B.环比开展速度A.增长速度C.平均增长量解析:此题考察增长速度的概念,增长速度=•二呼整,答案为A。基期水平例4、已知某时间数列各期的环比增长速度分别为11%、13%、16%,该数列的定基增长速度为(定基增长速度为( )A.11%X13%X16%C.111%X113%X116%-1B.11%X13%X16%+1D.111%X113%X116%解析:定基增长速度=解析:定基增长速度=立二为1,从而答案为C。例5、如果6年的产量依次是20、15、22、25、27、31,那么,其平均增长量是3120累积增长量解析:平均增长量=蕊"‘从而选配例6、设某种股票202X年各统计时点的收盘价如下表:统计时点1月1日3月1日7月1日10月1日12月31日收盘价(元)10.110.39.79.59.7求该股票202X年的平均价格。解析:此题是间隔时间大于1天的时点数列求平均,所采纳公式如下:10.1+10.3x2+10.3+9.710.1+10.3x2+10.3+9.79.7+9.5)y22+4+3+3x3+9.5+9.72x3(计算结果略)例7、某电信公司1998〜202X年的营业额数据如下表:年份19981999202X营业额(百万元)44.54.84试用几何平均法,计算1998〜202X年的环比开展速度。解析:几何平均法公式:解析:几何平均法公式:2,长期趋势分析及预测,季节变动分析(主要计算季节指数),循环波动分析例1、依据各季度商品销售额数据计算的各季度指数为:一季度130%,二季度120%,三季度50%,四季度100%。相对来讲,受季节因素影响最大的是( )A.一季度 B.二季度C.三季度 D.四季度解析:显然,与100%相差最多的是三季度,从而选C。例2、测定循环波动的常用方法是剩余法。例3、依据各年的季度数据计算季节指数,各月季节指数的平均数应等于100%。例4、某信托公司19977999年各季的投资收入资料如下(单位:万元):年份一季度二季度三季度四季度199751758754199865678262199976778973试用按季平均法计算季节指数。解析:季节指数=同季平均数总解析:季节指数=同季平均数总季平均数xlOO%一季度平均数
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年粤教版八年级历史上册月考试卷
- 2025年华东师大版必修3生物下册阶段测试试卷含答案
- 2025年湘师大新版必修2物理上册月考试卷
- 2025年木材加工与木工承包服务合同3篇
- 2025年沪科版九年级科学上册阶段测试试卷
- 2025年度派驻企业网络安全防护合同范本4篇
- 二零二五年度牛奶饮品行业数据分析与市场预测合同2篇
- 二零二五版明企金哨区块链应用开发合同书4篇
- 二零二五版民间借贷合同纠纷律师代理服务合同4篇
- 2025年度商业地产车位租赁与商业营销活动支持合同4篇
- 习近平法治思想概论教学课件绪论
- 宠物会展策划设计方案
- 孤残儿童护理员(四级)试题
- 梁湘润《子平基础概要》简体版
- 医院急诊医学小讲课课件:急诊呼吸衰竭的处理
- 肠梗阻导管在临床中的使用及护理课件
- 调料厂工作管理制度
- 小学英语单词汇总大全打印
- 卫生健康系统安全生产隐患全面排查
- GB/T 15114-2023铝合金压铸件
- 货物验收单表格模板
评论
0/150
提交评论