概率论与数理统计考试知识点汇总及疑难解析_第1页
概率论与数理统计考试知识点汇总及疑难解析_第2页
概率论与数理统计考试知识点汇总及疑难解析_第3页
概率论与数理统计考试知识点汇总及疑难解析_第4页
概率论与数理统计考试知识点汇总及疑难解析_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、疑难解析系统概率论与数理统计中的疑难问题目录第一章事件与概率 3-4第二章条件概率与独立性5-6第三章随机变量及其分布7-8第四章多维随机变量及其分布 9-10第五章数字特征 11-14第六章数理统计的根本概念 15-17第七章参数估计 18-21第八章假设检验22-23第一章概率论根本概念1 .什么是统计规律性?什么是随机现象?答 在一定条件下发生, 其结果是多样的,因而在现象发生前不能预知确切结果的不 确定现象,其结果在大量重复试验中呈现出一种规律性.由于这种规律是根据统计数据分析出来的,因而称为统计规律性.在一次试验或观察中结果不能预先确定,而在大量重复试验中结果具有统计规律性的 现象称

2、为随机现象.随机现象是概率论与数理统计的主要研究对象2,如何理解互逆事件与互斥事件?答 如果两个事件 A与B必有一个发生,且至多有一个发生,那么A、B为互逆事件B A.如果两个事件 A与B不能同时发生,那么 A、B为互斥事件.如测试及格与不及格是互逆也是互斥的,但测试70分和80分互斥却不互逆.区别互逆与互斥的关键是,当样本空间只有两个事件时,两事件才可能互逆.而互斥适用于多个事件的情形.互斥事件的特征是,在一次试验中两者可以都不发生,而互逆事 件必发生一个且至多发生一个 .3 .如何用事件来表达与其有关的其它事件?答首先要了解所讨论试验中事件的构成,所需表达事件与事件的关系,然后运用这些关系

3、与运算法那么将事件表达出来.例如,设S为事件0 x 5, A为事件1 x 2, B为事件0 x 2,那么0 x 2为事件B或AUB,1 x 2为事件A或BA,2 x 5为事件S B或B,0 x 1为 B A.4 .样本空间与必然事件之间有什么关系?答样本空间是随机试验 E的所有可能结果的集合,而必然事件是指随机试验中一定 会出现的结果.虽然在一次试验中只有样本空间的一个元素发生,但在把样本空间视作一 个整体时,我们说它在每次试验中都发生了.因此,可以说样本空间是必然事件.5 .在什么情况下,随机事件 A的频率可以作为它的概率的近似值?答 随机事件 A的频率fn(A)反映事件 A在屡次重复试验中

4、发生的频繁程度.当n增大时,频率在概率 P(A)附近摆动.因此,每一个从独立重复试验中测得的频率,都可 以作为概率P(A)的近似值.而且,一般n越大,近似程度越好.事实上,当n增大时,频率大量集中于包含 P(A)的一个小区间.任选区间中一值作为 概率的近似值,称为统计概率 .在解题时,当n较大时,可取统计概率为 P(A) nA/n.时,fn(A)在P(A)附近摆动,6 .概率是否可以看做频率的极限?答 这样理解是不恰当的.由于如上题所述,当n与高等数学中极限的N概念是不同的.由于概率是随机现象的可能性的赋值,对于任给的 0,存在偶然的因素,可能找不到 N(),从而得不到|fn(A) P(A)|

5、 .7 .怎样理解古典概型的等可能假设?答 等可能性是古典概型的两大假设之一,有了这两个假设,给直接计算概率带来了很大的方便.但在事实上,所讨论问题是否符合等可能假设,一般不是通过实际验证,而 往往是根据人们长期形成的“对称性经验作出的.例如,骰子是正六面形,当质量均匀分布时,投掷一次,每面朝上的可能性都相等;装在袋中的小球,颜色可以不同,只要大 小和形状相同,摸出其中任一个的可能性都相等.因此,等可能假设不是人为的,而是人们根据对事物的熟悉一一称性特征而确认的8 .概率为0的事件是否为不可能事件?概率为 1的事件是否为必然事件?答 有关概念:不可能事件的概率为0,即P( ) 0,但其逆不真;

6、同样,必然事件 的概率P( ) 1,但其逆也不真.反例:例1设A表示事件:向边长为 a的正方形区域 G任意投掷一点,此点落在区域g (g为该正方形中的一条对角线),那么P(A)g的面积G的面积02a但A却并非为不可能事件例2以B表示事件:向边长为a的正方形G上任意投掷一点,此点落在区域 g (g为正方形去掉一条对角线后所剩下的区域)P(B),那么g的面积G的面积但B并非为必然事件第二章条件概率与独立性1 .条件概率P(A|B)与积事件概率 P(AB)有什么区别?答 P(AB)是在样本空间S内,事件AB的概率,而P(A|B)是在试验E增加了新 条件B发生后的缩减样本空间 SB中计算事件 A的概率

7、.虽然都是A、B同时发生,但两者 不同的,有 P(AB) P(B) P(A|B),仅当P(B) P(S) 1时,两者相等.2 .条件概率为什么是概率?它与无条件概率有什么区别?答 由于可以验证,条件概率满足概率定义中的三个条件,所以它是概率条件概率是在试验 E的条件上加上一个新条件(如 B发生)求事件(如 A)发生的 概率.条件概率P(A| B)与P(A)的区别就是在 E的条件上增加了一个新条件 .而无条件 概率是没有增加新条件的概率 .3 .两事件A、B独立与两事件 A、B互斥这两个概念有什么关系?图1.1答 这两个概念并无必然的联系.两事件A、B独立,那么A中任一个事件的发生与另一个事件的

8、发生无关;而两事件互斥,那么其中任一个事件的发生必然导致另一个事件不发 生,所以说,两事件的发生是有影响的.可以用图形作一直观解释 .图1.1中A是左上半个正方形, B是右上半个正方形, P(A) P(B) 1/2,P(AB) 1/4 ,表示样本空间中两独立事件间关系.右图中左下半个正方形是 A,右上半个正方形是 B,P(A) P(B) 1/2,P(AB) 0 .表示样本空间中两互 斥事件间关系.读者能明确看出其中的不同4 .什么是小概率事件?它有什么实际的意义?答 小概率事件是指一次试验中发生的概率很小的事件.但从理论上讲,一个事件发生的概率不管多小,只要不断重复试验下去,事件迟早会出现的概

9、率是1.由于,假设设P(A)0,Ak为A在第k次试验中出现,那么P(Ak),P(Ak) 1kP(A1 A2L Ak) (1 ),于是在前n次试验中,A至少出现一次的概率为 P> 1 P(A1A2L An) 1 (1)n1 (n ).其实际意义是,我们可以借助它判断事情的真实性.由于根据实际推断原理,小概率事件在一次试验中几乎是不可能发生的.而某一认为概率很小的事件,居然在一次试验中发生了,人们就有理由疑心其正确性.5 .什么是先验概率和后验概率?两者间有什么关系?答 先验概率是指根据以往经验和分析得到的概率,如全概率公式 nP(A)P(Bi)P(A|Bi)1 1中的P(B),它往往作为“

10、由因求果问题中的“因出现 .后验概率是指在得到“结果 的信息后重新修正的概率,如贝叶斯公式P(Bi | A) P(A| Bi)P(Bi)/ P(A)中的 P(Bi | A),是“执果寻因问题中的“因.先验概率与后验概率有不可分割的联系,后验概率的计算要以先验概率为根底.如求P(Bi |A)要先求P(A), 一定要知道P(A|Bi).第三章随机变量及其分布1 .随机变量与普通函数有何不同?引入随机变量有什么意义?答 随机变量是在随机试验的样本空间S上,对每一个e S,给予一个实数X(e)与之对应而得到的一个实值单值函数 .从定义可以熟悉到:普通函数的取值是按一定法那么给 定的,而随机变量的取值是

11、由统计规律性给出的,具有随机性;又普通函数的定义域是一 个区间,而随机变量的定义域是样本空间.这两点是二者的主要区别.引入随机变量是研究随机现象统计规律性的需要.为了便于数学推理和计算,有必要将随机试验的结果数量化,使得可以用高等数学课程中的理论与方法来研究随机试验,研 究和分析其结果的规律性,因此,随机变量是研究随机试验的重要而有效的工具2 .超几何分布、二项分布和泊松分布之间有一种什么关系?在什么条件下有这种关 系?答超几何分布、二项分布和泊松分布都是重要的离散型随机变量的概率分布.有时,他们的概率计算会十分繁冗.当试验次数n很大时,可以推导出这三个分布间有一种近似 关系式这里,第一个等式

12、要求Ck n kMCN M' kn k CnP (1 P)CNn很大,且n/N较小,取pn很大时成立.实际使用时,n 20即可,当n 50时,k!M /N即成立.第二个等式要求效果更好.而泊松分布可通过查表计算,比拟简单.3 .连续型随机变量的 f (x)dx与离散型随机变量的 Pk在概率中的意义是否相同?答 相同.在离散型随机变量 X中,随机变量X的取值点是离散的点,Pk是X取某一 Xk时的概率.而在连续型随机变量X时,X取某一值 X的概率为 0 ;在小区间x dxx, x dx上的概率为f(x)dx,由定积分中值定理有 P f (x) dx .当对连续型随机变量离散化时,f (x)

13、dx与pk的意义是相同的,同样描述了随机变量的分布情况4 .为什么P X a0不能说明X a是不可能事件?答 由于,假设P X a 0,那么有两种可能.对离散型随机变量,P X a 0时,X a必然是不可能事件,但是,对连续型随机变量,任一点上的概率都等于零,这由P x X x dx f(x)dx,当dx 0时,P 0可以得知,所以 P X a 0不能说明X a是不可能事件.5 .不同的随机变量,它们的分布函数是否一定不同?答否,可以相同.例如,进行投篮试验时,设投中与没中等可能发生,可以令Xi1,投中,、1,投中,1,没中.或X21,没中.X1与X2是两个不同的随机变量,表现为对应法那么的不

14、同.但是它们有相同的分布函数0,X 1;F(x) 1/2,1 x 1;1,X 1.目前,俄罗斯和东欧国家一般定义左连6 .为什么分布函数 F(x)定义为右连续? 答定义左连续或者右连续只是一种习惯续;西欧和美国一般定义右连续;我国的大多数书籍也采用右连续.左连续和右连续的区别在于计算F(x)时,X x点的概率是否计算在内.对于连续型随机变量而言, 由于一点 上的概率等于零,定义左连续和右连续没有什么区别;对于离散型随机变量,如果P X x 0,那么左连续和右连续时的 F(x)值就不相同了 .因此,读者在阅读关于概率论的参考书时,要注意作者是定义左连续还是右连续,以免出错7 .离散型随机变量的函

15、数是否一定是离散型随机变量?连续型随机变量的函数是否 一定是连续型随机变量?答离散型随机变量的函数也是离散型随机变量,由于它能取有限多个或可列无限多个值.连续型随机变量的函数可以是连续型的,也可以是离散型的8 .为什么正态分布是概率论中最重要的分布?答 所谓正态分布,即正常状态下的分布,它表现为其取值具有对称性,极大局部取 值集中在以对称点为中央的一个小区间内,只有少量取值落在区间外.如人的身体特征指标(身高、体重),学习成绩,产品的数量指标等等都服从正态分布 .许多较复杂的指标, 只要在受到大量因素作用下每个因素的影响都不显著,且因素相互独立,也可认为近似服 从正态分布.又如二项分布、泊松分

16、布、 t分布在n很大时,也以正态分布为极限分布 .因 此,可以说正态分布是最重要的分布.第四章 多维随机变量及其分布1 .二维随机变量(X ,Y)的联合分布、边缘分布及条件分布之间存在什么样的关系?答 由边缘分布与条件分布的定义与公式知, 联合分布唯一确定边缘分布, 因而也唯 一确定条件分布.反之,边缘分布与条件分布都不能唯一确定联合分布.但由 f (x, y) fx(x) fY|x (y | x)知,一个条件分布和它对应的边缘分布,能唯一确定联合分布. 22例如,二维正态分布 (X,Y)N( i, 2, i2, 2,)的边缘分布是一维正态分 布22X N( 1, i ),Y N( 2, 2)

17、,与相关系数无关;而边缘分布 X,Y由于相关系数不同可以得到不同的联合分布 .但是,如果X ,Y相互独立,那么P X x,Y y P X x P Y y ,即 F(x,y) Fx(x) Fy(y).说明当X,Y独立时,边缘分布也唯一确定联合分布,从而条件 分布也唯一确定联合分布.2 .多维随机变量的边缘分布与一维随机变量的分布之间有什么联系与区别?答从某种意义上讲,可以说多维随机变量的边缘分布是一维随机变量.如二维正态分布(X,Y)N( 1, 2, 12, 2,)的边缘分布 X N( 1, ;),Y N( 2,;),也是有一 维分布的性质.但是从严格的整体意义上讲,多维随机变量的边缘分布是定义

18、在多维空间上的,而一 维分布是定义在平面域上的.例如二维随机变量 (X ,Y)关于X的边缘分布 FX (x)表示(X,Y)落在区域X x, Y上的概率,而一维随机变量 X的分布函数F(x)表示落在区间(,x上的概率,两者是有区别的.3 .为什么不能用条件概率的定义直接定义连续型随机变量的条件分布?解 在条件概率中,我们规定 P(A|B) P(AB)/P(B), P(B) 0,即分母要 0, 对离散型随机变量,我们只要遵循这一原那么, 是可以用条件概率定义直接定义条件分布的, 即P X x |Y yjP X x ,Y yj / P Y yjPij / p j ,其中 P Y yj 0, i 1,

19、2,L但是,对连续型随机变量来说,由于在任一点(x, y),都有P X x 0, P Y y 0, 所以不能用条件概率定义来定义条件分布,必须给出一个区间x X x 或y Y y ,使Px X x0或Py Y y 0,然后利用极限概念来定义条件分布.如FXY(x|y) P X x|Y ylim P X x| y Y ylim0P X x, y Y yP-Y y4 .怎样从二维随机变量 (X,Y)的概率密度来判别随机变量 X和Y的独立性?答 由于,假设f(x,y) fX(x) fY(y),那么随机变量 X和Y相互独立.所以,如果能 将f (x, y)分解成两个分别只含 x或y的非负函数的乘积,即

20、f(x, y) g(x) h(y),那么,可以确定组成(X,Y)的X,Y是相互独立的随机变量.第五章 随机变量的数字特征与极限定理1 .随机变量的数字特征在概率论中有什么意义?答我们说,知道了一个随机变量的分布函数,就掌握了这个随机变量的统计规律性.但是在实际上,要求得一个随机变量的分布函数是不容易的,而且往往也没有这个必要.随机变量的数字特征那么比拟简单易求,也能满足我们研究分析具体问题的需要,所以在概率 论中有很多的应用,同时也刻画了随机变量的某些特征,有重要的实际意义例如,数学期望反映了随机变量取值的平均值,表现为具体问题中的平均长度、平均 时间、平均成绩、期望利润、期望本钱等;方差反映

21、了随机变量取值的波动程度;偏态系 数、峰态系数那么反映了随机变量取值的对称性和集中性.因此,在不同的问题上考察不同的数字特征,可以简单而切实地解决我们面临的问题2 .在数学期望定义中为什么要求级数和广义积分绝对收敛?答 首先,数学期望是一个有限值;其次,数学期望反映随机变量取值的平均值.因此,对级数和广义积分来说,绝对收敛保证了值的存在,且对级数来说,又与项的次序无 关,从而更便于运算求值.而由于连续型随机变量可以离散化,从而广义积分与无穷级数 有同样的意义.所以,我们说要求级数和广义积分绝对收敛是为了保证数学期望的存在与 求出.3 .假设X,Y相互独立,那么 D(X Y)与D(X Y)有什么

22、不同?为什么?答 当X,Y相互独立时,D(X Y) D(X Y) D(X) D(Y).这是从数值意义 上讲的,由于 D( Y) ( 1)2D(Y) D(Y)的缘故.但是从实际意义上讲,两者是完全不 同的,D(X Y)是随机变量 X Y的方差,D(X Y)是随机变量 X Y的方差,两者没有什么联系,仅仅是方差的数值相等而已4.相关系数XY反映了随机变量答相关系数XY是用随机变量变量X和Y之间的相关程度.当IXY 0时,称X与Y不相关.当0X和Y之间的什么关系?X和Y的协方差和标准差来定义的,它反映了随机XY1时,又可分为强相关与弱相关XYI 1时,我们称 X与Y依概率1线性相关;当5.两个随机变

23、量 X与Y相互独立和不相关是一种什么样的关系?答(1)假设X、Y相互独立,那么X、Y不相关.由于 X、Y独立,那么 E(XY) E(X) E(Y),故 cov(X,Y) E(XY) E(X)E(Y) 0,从而 xy 0,所以X,Y不相关.(2)假设X,Y不相关,那么X,Y不一定独立 由于 E(X) E(Y) 0, D(X) D(Y) 1/4,cov(X,Y) 0, xy 0 知 X、Y 不相关.但 fx(x) 27TV/ , fy(y) 2jl y2/ , f (x, y) fx(x) fy"),知 X、Y 不独立.f(x,y)1/0,22x y 1,其它.(3)假设X、Y相关,那么

24、X、Y 一定不独立.可由反证法给出.(4)假设X、Y不独立,那么 X、Y不一定不相关.由于 X、Y 不独立,E(XY) E(X) E(Y),但假设 E(X) E(Y) E(XY) 0 时, 可以有cov( X,Y) 0 ,即XY 0 ,从而可以有X、Y不相关.但是,也有特殊的情形,如当(X,Y)服从二维正态分布时,X、Y不相关与X、Y独立是等价的,这是由于假设(X ,Y)服从二维正态分布, 那么 0是X、Y相互独立的充要条 件.6 .假设随机变量X的可能值在区间(a, b)上,是否有DX (b a)/22 ?答 设X为连续型随机变量,概率密度为f(x),在(a, b)外有f (x) 0 ,那么

25、bEX xf(x)dx m.又对任一常数c,有 a _2_2_2E(X c) E(X m) (c m) DX (c m) 2 一一 a b 一从而有DX E(X c),假设取c 故上式成立即2 2 b2 .DX EX (b a)/22 x (b a)/22 f (x)dx a bbab (b a)/22f (x)dx b (b a)/22 a f(x)dx (b a)/227 .两个相互独立的服从正态分布的随机变量Xi与X2之和仍是正态随机变量,那么它们的线性组合 ax1 bx2呢?答有限个相互独立的服从正态分布的随机变量之和是正态随机变量,而且具有参数可加性.即假设Xi N( 1,i2),X

26、2 N( 2,;),那么XiX2 N( 12,22).又XN( i, 12),那么 aXiN(a i,a 力,X2N( 2,力,那么 bX2N(b 2,b ;),所 以aXi bX2 - N(a 1 b 2,a ; b 2),即两个随机变量的线性组合仍为正态随机变 量,且它的参数是相应参数的线性组合.可以用分布函数法证实.n8 .设X1L Xn为n个相互独立且同分布的随机变量序列,那么其 Xi的分布情况? i 1n答 假设XiL Xn独立且服从正态分布, 那么其线性组合服从正态分布,那么Xi服从正i 1 n态分布.假设Xi,L ,Xn独立服从泊松分布.二项分布,那么Xi服从泊松分布,二项分布,

27、i 1称此性质为再生性.但并非独立同分布的随机变量和都不改变分布类型.例如X1,Xn独立且服从a, a的均匀分布.由卷积公式Z X1z 2aX2的概率密度为X1X2服从辛普生分布.fz(z)4a22a z4a202a z 00 z 2a其它9 .利用切比雪夫不等式及中央极限定理估计下面的概率:们的结果有何不同.这里nA是n次贝努里试验中成功的总次数, 率.| p| .比拟他 np是每次试验成功的概答 E() p,D(%)P(1p)/n ,故由切比雪夫不等式Pl2p(1 p)/n用中央极限定理可得nAP l- plnnAP |- p|n1 P(n/ p(1 p)nA np.np(1 p)n/ p

28、(1 p)1(2(1.n/p(1 p)(n/p(1 p)(.n/p(1 p).可以看出,用切比雪夫不等式估计,只给出了一个上限 一个具体的估计值.,而用中央极限定理,能给出10 .依概率收敛的意义是什么?答依概率收敛即依概率的 0,当n很大时,事件“除小概率事件" |xn a|1收敛.随机变量序列 Xn依概率U敛于a ,说明对于任给|Xn a|的概率接近于1.但正由于是概率,所以不排发生.所以说依概率收敛是不确定现象中关于收敛的一种说法.而高等数学中的收敛是确定的,对任给的0,只要n N ,就必有|2 a|绝无例外.11 .大数定律在概率论中有何意义?答 大数定律有很多个,还有强大数

29、定律和弱大数定律.总的来说,大数定律给出了在试验次数很大时频率和平均值的稳定性.从理论上肯定了用算术平均值代替均值,用频率代替概率的合理性.它既验证了概率论中一些假设的合理性,又为数理统计中用样本推 断总体提供了理论根据.所以说,大数定律是概率论中最重要根本定理12 .中央极限定理有何实际意义?答 我们知道,正态分布是现实生活中使用最多、最广泛、最重要的一种分布.许多随机变量本身并不属于正态分布,但它们的极限分布是正态分布.中央极限定理说明了在什么条件下,原来不属于正态分布的一些随机变量其总和分布渐近地服从正态分布.为我们利用正态分布来解决这类随机变量的问题提供了理论依据13 .大数定律与中央

30、极限定理有何异同?答 它们的相同点是, 都是通过极限理论来研究概率问题,研究对象都是随机变量序列,解决的都是概率论中的根本问题,因而在概率论有重要的意义.所不同的是,大数定律研究当n时,概率或平均值的极限, 而中央极限定理那么研究随机变量总和的分布的极限.中央极限定理成立的随机变量序列可以不服从大数定律;大数定律成立的随机变量 序列也可以不服从中央极限定理 .然而,当xn独立同分布,有大于 0的有穷方差时,大数定律和中央极理都成立.此时,大数定律断定,对0,Ex |1 n lim P | x nn i i然而括号内事件的概率有多大?大数定律未能答复,但中央极限却给出了近似解答Exi)|1 nP

31、 I-(Xin i 11 n.nP 一 |(Xi EXi)| tn i 112一1x|X2n e 2 dx第六章数理统计的根本概念1 .什么是简单随机样本?怎样抽样可以得到简单随机样本? 答 设Xi,X2,L ,Xn是来自总体 X的样本,如果满足(1) Xi,X2,L ,Xn 与 X 同分布;(2) Xi,X2,L ,Xn 相互独立,那么称为简单随机样本.此时,样本分布与总体分布的联系为 nFn(Xi,X2,L ,xn)F(xJ,i 1 其中Fn是样本分布函数,F是总体分布函数.对总体进行随机地独立的重复观测即可得到简单随机样本.随机性是指总体的每一个个体有相同的时机被抽到,因而样本对总体更具

32、代表性 .独立性是指每次抽样的结果不受 其它次抽样结果的影响.2 .为什么要引进统计量?为什么统计量中不能含有未知参数?答 引进统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易揭示问题实质,从而解决问题如果统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,因而 失去利用统计量估计未知参数的意义,这是违背我们引进统计量的初衷的3 .什么叫大样本与小样本?它们是以什么区分的?答 在样本容量固定条件下,进行的统计推断、分析问题称为小样本问题.由于样本容量固定,如果能得到有关统计量或样本函数的精确分布,就能较精确和较满意地讨论和

33、分析各种统计问题.在样本容量趋于无穷条件下,进行的统计推断、分析问题称为大样本问题.此时假设能求出有关统计量或样本函数的极限分布,也可以利用极限分布作为近似分布来作统计推断所以,大样本与小样本不是以样本容量的大小来区分的,而是以得到统计量或样本函 数的方式来区分的.事实上,小样本问题有时要求的样本容量也很大,而大样本问题有时 要求的样本容量并不大.4 .经验分布函数是否就是分布函数? 答经验分布函数是顺序统计量 * * *Xi X2 L Xn的函数0, x X1 *Fn (x) k/n, Xk x Xki, k 1,2,L ,n 1, * 1, X Xn 、一一 一 . 一一一、 .、.一 *

34、 * * 它既是实数X的函数,又是顺序统计量 Xl,X2,L ,Xn的函数.当样本取定一组样本组时,它是一个分布函数,满足分布函数的所有性质.当X取定. 后,Fn (X)的值依赖于抽样结果,即是样本的函数 .事实上,经验分布函数在取定一组样本值时,可视为一个概率分布为* P Xk 1/n, k 1,2,L ,n的离散型随机变量的分布函数. . . -一 . . * . .当样本容量充分大时,可以用经验分布函数Fn(X)代替总体分布函数.格里文科(Glivenko )定理给出*P lim sup | Fn(x) F(x)| 01 .nX一般 n 50,最好 n 100.5 .什么是自由度?如何计

35、算自由度?答 所谓自由度,通常是指不受任何约束,可以自由变动的变量的个数.在数理统计中,自由度是对随机变量的二次型(可称为二次统计量)而言的 .由于一个含有n个变量的二次型 n naijXiXj(ajaji,i,j 1,2,L ,n)i 1 j 1的秩是指对称矩阵 A (aj)n n的秩,它的大小反映n个变量中能自由变动的无约束变量的多少.我们所说的自由度,就是二次型的秩计算自由度有两种方法,举例说明如下:n例1 求统计量n解(Xii 1(Xi X)2的自由度i 1nn212Xi -( Xi)i 1n i 11(-)XiXji j n一n222X) Xi nXi 1n, 2(1 1/ n)Xi

36、i 1X AX ,其中可以通过初等变换求得XiX2M1 1/ n1/n L1/n 1 1/ n LLLLXn1/n1/n LnA的秩为n 1,所以统计量 (Xji 1例2设有pq个独立随机变量 Xj,i 1,L , p, jXiq _1/q Xij,X.jj 1求统计量SE1/ n1/ nL1 1/nX)2的自由度为n 1.1,L ,q .又令p1/ p Xj ,i 1p qX 1/ pq Xj , i 1 j 1p q_(Xj Xi. X.j X)2 的自由度.i 1 j 1解 二次型SE有pq个变量,但有线性约束条件: p(XijXi.X.jX)pX.jpXpX.jpX0,j1,L,q;i

37、 1q_(XijXi. X.j X)qXi.qXi.qXqX0,i1,L, p.j 1共有p q个约束条件,这些条件间又有关系p q(Xij Xi. X.j X) 0, i 1 j 1所以Se的自由度为pq (p q 1) (p 1)(q 1).6.设X1,X2,L ,Xn是来自总体 x的简单随机样本,工nXi是否服从正态分i 1布.答 当n充分大时,由中央极限定理对x,有ndtXi nlim P ni 1,nX 所以产近似服从正态分布./,1 n_2当n有限时,假设总体XN( , 2),那么XN( ,).第七章参数估计1.矩估计法的根本思想是什么?矩估计量是否唯一? » _ * 答

38、 当样本容量n 时,经验分布函数 Fn (x)均匀收敛于总体分布函数 F(x).所 *以在大样本下,可以用 Fn (n)代替F (x)研究统计推断问题.由于总体的原点矩 kxkdF(x),当F(x)由匕(x)代替时,得到的总体原点矩n的估计?kxkdF;(x) 1/ nXik A,恰好就是样本的同阶原点矩 .因此,用样i 1本原点矩代替总体原点矩是可行的,这是矩估计法的根本思想但在一般情况下,矩估计不是唯一的.如X(),是未知参数,可以用E(X) , 即样本一阶原点矩代替总体原点矩;也可以用D(X) ,即样本二阶中央矩代替总体二阶中央矩.顺便指出,矩法也可以用样本中央矩代替总体相应中央矩而求得

39、未知参数的.2 .什么是最大似然估计?其根本思想是什么?答最大似然估计是利用总体 X的概率密度或概密函数及样本所提供的信息所建立 的求未知参数估计量的一种方法.它建立在这样一种直观想法的根底上:假定一个随机试验E有假设干个可能结果 A,A2,L , An,如果只进行了一次试验, 而结果A出现了,那么我 们有理由认为试验的条件对“结果A出现有利,即试验中“出现Ai 的概率最大.因此,极大似然估计法的根本思想是,根据从总体X得到的样本Xi,X2,L ,Xn,取nn得联合分布律P(xi;)或联合概率密度f(xi;),构造样本似然函数 L().然后适i1i1中选取$,使L()的值到达最大,也就是使试验

40、得出结果 Xi Xi,X2 x2,L ,Xn xn的 概率为最大.3 .利用微分法求最大似然估计有哪些步骤?在一般情况下,为什么要先对似然函数 取对数?答 求最大似然估计的步骤为写出似然函数L(,X2,L »口)或1( 1, 2,L , m; Xi,X2,L , Xn).取对数ln L( ; Xi,X2,L ,Xn)或 lnL( 1, 2,L , m;x1,X2,L ,Xn).求导数,建立对数似然方程dlnL/d0或求偏导数 ln L/ i 0,i 1,2,L ,m.解对数似然方程或方程组.由于似然函数L()通常是一些含函数的连乘积形式,直接求导一般比拟困难.如果先取对数,可以化积为

41、和,使求导更为简便,同时又不影响结果.这是由于ln L是L的单调增函数,ln L与L有相同极值点,所以由似然方程和对数似然方程得到的最大点也是相 同的.4 .对于未知参数的估计量为什么希望它具有无偏性和最小方差性(优效性)?答 无偏性是指对估计量 $,有E($),即希望系统偏差不存在.这时,用大量重复估计结果的算术平均值代替待估未知参数的真值才是可信的由于无偏估计不是唯一的,在众多无偏估计中选择哪一个呢?衡量优劣的标准也有许多个,如使E |T |最小,或使E(T)2最小等等.而使D($)为最小,无疑是最为简便的.事实上,假设$为 的估计,那么其均方误差为E($)2 E$ E($) E($) 2

42、D($) E($)2.显然,D($)最小时,均方误差为最小.所以选D($)小的无偏估计量为有效(优效)估计 量.2*225 .样本方差S2与样本二阶中央矩 S2去估at 2有何异同?答 仅考虑无偏性时,用样本方差S2去估计 2比样本二阶中央矩 S*2估计2更好.由于ES22, S2是2的无偏估计;而 ES*2 上2 n 时,S*2是2的渐近n无偏估计.考虑相合性时,样本方差S2和样本二阶中央矩S*2都是2的相合估计.然而仅 考虑估计方差的大小,当总体 XN( , 2)时,S*2去估计2又比S2估计2更好.因一 2 .D(S2) D(n2(n 1)2n_*2nS224D(S2)D( 2 (n 1

43、)S2、2(n 1) 4n 12 (n 1)26 .无偏估计是不是相合估计?答无偏估计和相合估计没有一定的关系.即估计量具有无偏性未必具有相合性,反 之,亦然.日1 0 x例如:XU0,即f(x), XiL Xn为抽取的简单随机样本0 其它$1 n-1max(X1L Xn), $2 n2Xi都是的无偏估计由于 E(max(Xi)1 i n,D(max(XJ)1 i n2n由切比雪夫不等式有(n 2)(n 1)2P| $1D($i)n 1D(U max(Xi)n 11n2时,故$i222(n 1) n2-2_、 ,2 -2-Tn (n 2 )(n 1) n(n 2 ).然而P | $2| P |

44、2X1|11()-dt 1( )dt02dt|2 |21-()0 (n )所以$1为无偏相合估计$2为无偏不相合估计.$3max X i是相合估计但不是无偏估1 i n计.E($3),由于 P |$3|n 1P | max(Xi)e($3)227 .什么是区间估计?有了点估计为什么还要引入区间估计?的大小有一定参.而区间估计答点估计是利用样本值求得的参数的一个近似值,对了解参数考价值,但没有给出近似值的精确程度和可信程度,因此在实用中意义不大是通过两个或一个纺计量 和_,构成随机区间_,使此区间包含未知参数 的概率不小于事先设定的常数 1 01. 1 值越大,那么一包含 真值的概率越大,即由样

45、本值得到的区间 _,一覆盖未知能数 的可信程度越大.而_的长度越小,又反映估计的精确程度越高.所以区间估计不仅是提供了的一个估计范围,还给出了估计范围的精度与可信程度,弥补了点估计的缺乏,有广泛的实用意义.8 .怎样理解置信度1 的意义?答 置信度1有两号方式的理解._对于一个置信区间_,而言,1表示随机区间_,中包含未知参数的概率不小 于事先设定的数值1表示在样本容量不变的情况下,反复抽样得到的全100(1)% .对于区间估计的设计而言,1部区间中,包含 真值的区间不少于9 .区间估计的一般步骤是怎样的?答区间估计的一般步骤是:1 设法构造一个含有未知参数的随机变量TX1,X2,L ,Xn;

46、,其中不含其它未知参数,且T的分布为(2)对设定的置信度1 ,确定a,b,使P a T(Xi,X2,L ,Xn; ) b 1.(3)求出与a T(Xi,X2,L ,Xn; ) b等价的不等式_ 一,那么(_)为 的一 个置信度为1的双侧置信区间.而与一是样本的函数.10 .怎样处理区间估计中精度与可靠性之间的矛盾?答 区间估计量(_,一)的长度称为精度,1 称为(_)的可靠程度.我们希望长度 越短越好,精确程度就越高;1越大越好,可靠程度就越大.但在样本容量固定时,两者不能兼顾.因此,奈曼(Neyman)指出的原那么是,先照顾可靠程度,在满足可靠性 P _ 一 1 时,再提升精度.否那么,只有增加样本容量,才能解决.第八章假设检验1 .什么是显著性检验?其根本思想是什么?有什么缺陷?答显著性检验是指只考虑一个假设是否成立的检验.其原那么是,只要求犯第一类错误的概率不大于设定的(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论