高等统计学考题人大精简版.doc_第1页
高等统计学考题人大精简版.doc_第2页
高等统计学考题人大精简版.doc_第3页
高等统计学考题人大精简版.doc_第4页
高等统计学考题人大精简版.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、多项选择题(每题4分,一共20分,每题要求:选择正确答案,对选择或未选答案进行简要而清晰的原因解释。将答案填写在答题纸上,填写在试题上无效。得分规则:选对并对答案解释合理,得4分;没有对未选答案解释最多得2分;漏选得1分,选错可参考解释酌情给分;不选得0分)1.有关样本的分布,以下陈述正确的是:ABCA. 如果样本X1,Xn独立同分布来自Gamma分布,在大样本下有近似的正态分布;【对。满足中央极限定理条件】B.如果样本X1,Xn独立同分布来自N(),在大样本情况下有精确分布N();【对。独立同分布正态随机变量的均值仍是正态分布,方差值符合中央极限定理】C.如果样本X1,Xn独立同分布来自N(),即使样本量不大,也服从正态分布;【对。独立同分布正态随机变量的均值仍是正态分布】D.如果样本X1,Xn来自任意分布,在大样本情况下,由X1,Xn组成的数据有近似的正态分布;【错。如果X1,Xn强相关,则不成立;即使i.i.d情况下也不是任意的数据组成方式都是正态分布】2有关检验的p值,下面说法正确的是:C A. 一般为0,0.1之间的一个很小的概率;【错。p值是计算得出的概率,取值0-1之间】B. 接受备择假设的最小显著性水平;【错。接受备择假设说法不准确】C. 如果p值小于显著性水平,则拒绝零假设; 【对。符合假设检验规则】D. 样本统计量的分布函数。【错。p值根据检验统计量分布函数计算得出】(卷3)5有关检验的p值,下面说法正确的是:CDA. 一般为0,0.1之间一个较小的概率;【错。检验结果不拒绝原假设的情况下,p值较大】B. 接受备择假设的最小显著性水平;【错。接受备择假设说法不准确】C. 如果p值小于显著性水平,则拒绝零假设; 【对。符合假设检验规则】 D. 样本统计量的尾概率。【对。可认为p值是原假设为真时小于等于实际观测结果的概率】3.请问以下哪些方法可以用来判断数据可能背离正态分布:A. Q-Q图上,如果数据和基线之间几乎吻合;【错。正态qq图数据和基线之间几乎吻合说明数据接近正态分布】B. Kolmogrov-Smirnov正态检验中的统计量所对应的p值小于0.05;【对。ks正态检验原假设是两个数据分布一致或者数据符合正态分布,p值小于0.05拒绝原假设】C.对数据直方图做光滑后没有发现数据有很大的发散趋势;【错。发散趋势不能决定分布形态】 D.拟合优度检验,统计量的值偏小。【错。拟合优度检验可以检验分布是否正态,原假设为观测服从给定概率值的多项分布,统计量的值偏小不拒绝原假设】4若抽样误差为5,总体标准差为40,如果样本量足够大,正态分布的0.975分位数近似为2,要估计总体均值的95%的置信区间所需要的样本量大概为:A 156;B 256;C 356 ; d) 456.因x-nN(0,1),那么2=540/n,求解n=2565.关于假设检验,给定一组独立同分布的随机样本,给定显著性水平,如下理解正确的是:D A.单边检验拒绝,双边检验一定拒绝;【错,】B.双边检验接受,一定有一个单边检验是拒绝的;【错】C.单边检验拒绝,双边检验一定拒绝。【错】 D.双边检验拒绝,一定有一个单边检验是拒绝的;【对】画图解释6某汽车生产厂家为增加某型号汽车的销售量,采用促销手段,促销一个月后,分别收集了8个销售点处促销前一个月和促销后一个月该车型的销售辆,如果不考虑其他影响销售量因素,仅通过观察和分析这些样本数据,是否认为这次促销有助于提高汽车的销售量。请将合适的可用于分析该类问题的检验过程选出来:C销售点代号:1 2 3 4 5 6 7 8促销前(辆): 90 83 105 97 110 78 55 123 促销后(辆): 97 80 110 93 123 84 57 110 A. 两样本Z检验B. 两样本t检验C. 单一样本t检验D. 单一样本Z检验本问题是配对样本之间的比较,小样本,方差未知,采用单一样本的t检验,其他都不符合。7在参数估计中,要求通过样本的统计量来估计总体参数,评价统计量的标准之一是该统计量随着样本量的增大,它与它估计的总体参数越来越近,这种评价标准称为: A.无偏性 B.有效性 C.一致性 D.充分性无偏性指估计量的期望与总体参数相等充分性指估计量包含了参数的全部信息有效性指无偏估计量的方差达到C-R下界8研究人员对有糖尿病的老鼠和正常老鼠血液中某种矿物质的含量进行研究,经验表明有糖尿病的老鼠和正常老鼠血液中某种矿物质的含量测量方差相等,测得如下试验数据:糖尿病老鼠:9只,样本均值64.26,样本方差1.40正常老鼠: 7只,样本均值75.66,样本方差1.32在置信水平为0.10之下,有糖尿病的老鼠和正常老鼠血液中Fe的含量之差的置信区间为(t(0.95,14)=1.76):A. 5.68,15.56B. 8.02,19.47C.10.36,12.43D.6.53,16.32有t=X-Y-(X-Y)Sp1n+1m其中Sp2=n-1SX+(m-1)SYm+n-2代入计算75.66-64.261.76(19+17)(9-11.4+(7-1)1.329+7-2)可得。9.置信水平为,下列说法正确的是(BD ),A 在置信水平一定的条件下,提高置信估计精度需要缩小样本量;B 在置信水平一定的条件下,提高置信估计精度需要增加样本量;C 在样本量一定的条件下,提高置信估计精度,需要降低置信水平;D 在样本量一定的条件下,提高置信估计精度,需要增大置信水平。以置信区间XZ(1-/2)n为例,增大n或者增大可缩小区间长度。10某调查公司接受委托满意度调查,满意度分数在020之间,随机抽取36名消费者,平均满意分12,标准差3,在大样本的假设下,根据调查结果对总体平均满意情况的95%的置信区间,结果是:BA. 915分B. 1113分C. 1214分D. 618分因为:12-336N(0,1)可得111311一位社会学者随机抽取3000个家庭,想研究文化程度的高低与离婚率的高低是否有关,适合采用的检验方法应是( D )A. 正态分布检验 B. 分布检验 C. 拟合优度检验 D. 独立性度检验正态分布检验:检验均值是否相等,不符合题目条件t分布检验:检验均值是否相等,不符合题目条件卡方拟合优度检验:检验两种分布是否相同,不符合题目条件卡方独立性度检验:检验列联表的行与列是否独立,与题目吻合12.在假设检验中,备择假设所表达的含义总是指()A参数是正确的B变量之间没有关系C参数没有发生变化D参数发生了变化13在估计某一总体的均值时,随机抽取了n个单元作样本,用样本均值作为估计量,在构造置信区间时,发现置信区间太宽,有可能的原因是:BDA. 选择的估计量有偏B. 样本量太小C. 置信水平太大,应从0.10降低到0.05D. 精度要求太高以置信区间XZ(1-/2)n为例,增大n或者增大可缩小区间长度。14指出下列的说法哪一个是正确的(BD )A 在置信水平一定的条件下,要提高可靠性,就应该缩小样本量;B 在置信水平一定的条件下,要提高可靠性,就应该增大样本量;C 在样本量一定的条件下,要提高可靠性,就降低置信水平;D 在样本量一定的条件下,要提高可靠性,就提高置信水平。以置信区间X Z(1-/2)/n为例,增大n或者增大可缩小区间长度。15在假设检验中,备择假设所表达的含义总是指(?)A参数是正确的 B变量之间没有关系C参数没有发生变化D参数发生了变化16.某汽车生产厂家为增加某型号汽车的销售量,采用促销手段,促销一个月后,分别收集了8个销售点处促销前一个月和促销后一个月该车型的销售辆,如果不考虑其他影响销售量因素,仅通过观察和分析这些样本数据,是否认为这次促销有助于提高汽车的销售量。请将合适的可用于分析该类问题的检验过程选出来:C销售点代号:1 2 3 4 5 6 7 8促销前(辆): 90 83 105 97 110 78 55 123 促销后(辆): 97 80 110 93 123 84 57 110 A. 如果样本X1,X n独立同分布来自N(),Y1,Yn独立同分布来自N(),在大样本下有近似的正态分布,可以检验;B. 如果样本X1,X n独立同分布来自N(),Y1,Yn独立同分布来自N(),在大样本下有正态分布,可以检验;C. 如果样本X1,X n独立同分布来自N(),Y1,Yn独立同分布来自N(),有t分布,可以检验;D. 如果样本X1,X n独立同分布来自N(),Y1,Yn独立同分布来自N(),有分布,可以检验;本题为配对样本均值比较问题,只有C符合检验该问题。二、简答题:(10分3=30分)1.假设检验的零假设和备择假设的设立对于检验的结论影响不大,请问这样的理解有问题吗?请给出你的解释。答:有问题。首先,设立某种零假设即设定了检验统计量,代表着确定了零分布,即p值计算依据;另外,零假设和备择假设是不对称的,通常将简单的假设、需要被保护的假设作为零假设。2. 解释下面符号的区别: , 和(提示:请按有放回和无放回抽样分别叙述)有放回无放回:样本方差1n-1i=1n(xi-x)21n-1i=1n(xi-x)2:总体方差1Ni=1N(xi-)21Ni=1N(xi-)2:样本均值的方差2n2n(1-n-1N-1)3 统计推断与描述统计之间有哪些重要的区别?描述统计是指对采集的数据进行登记、审核、整理、归类,在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。 推断统计是研究如何利用样本数据来推断总体特征的统计学方法,其内容包括参数估计和假设检验两大类。参数估计是利用样本信息推断总体特征,假设检验是利用样本信息判断对总体的假设是否成立。4 解释p值检验的基本原理。P值即概率,在原假设为真的前提下出现观察样本以及更极端情况的概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P 0.05 为显著, P30时t分布近似于标准正态分布。10解释假设检验和置信区间估计的区别。参数估计是用统计量估计未知的参数;如果参数已知(或假设已知),需要利用统计量检验已知的参数是否靠谱,此时为假设检验。区间估计立足于大概率,通常以较大的把握程度(置信水平)1-去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。13. 中位数检验与均值t检验之间的区别与联系;-中位数检验是非参数统计方法,t检验是参数统计方法;-中位数检验适用于总体分布未知的情景,t检验需要总体正态分布的假设前提-两者都使用了代表样本中心位置的指标。14. 简述置信区间估计和假设检验之间的关系。-计算置信区间的枢轴量与假设检验的统计量是同一个量-置信区间的置信水平(1-)与假设检验的显著性水平是两个相互对立事件的概率-使用置信区间可以完成假设检验三、计算题(25分)1. Hardy-Weinberg平衡问题中,父代有两种基因M和N,M在种群中的分布为b(1,p)现在测量到了子代基因分布为:MMNN总量频数3425001871029a) 请根据这些数据求父代的p的极大似然估计;(10分)b) 请给出p的置信区间的求解公式,并解释; (15分)解:a) 根据Hardy-Weinberg平衡定律,MM、MN、NN出现的频率分别是p2、2p1-p、(1-p)2,令n为总量,x1、x2、x3代表三个单元的观测数量,本案例是多项分布的参数推断问题,似然函数是:fp=n!x1!x2!x3!(p2)x1(2p1-p)x2(1-p)2)x3对数似然是:lp=logn!-m=13logxi!+x1logp2+x2log2p1-p+x3log(1-p)2=logn!-m=13logxi!+2x1+x2logp+x2+2x3log1-p+x2log2对p求导,令导数为0,有2x1+x2p-x2+2x31-p=0求解得到p=2x1+x22(x1+x2+x3)那么极大似然估计p=2342+50021029=0.575b) 根据中央极限定理p-pp(1-p)nN(0,1)当p 未知,n 非常大时,使用p估计p,得到置信区间:p-z2p1-pn,p+z2p(1-p)n2.用possion()分布参数的极大似然估计的渐进分布求置信区间。解:如果X服从参数为的possion分布,那么PX=x=xe-Xi联合频率函数是边际频率函数的乘积,那么对数似然是l=i=1nXilog-logXi!=i=1nXilog-n-i=1nlogXi!令一阶导数为0,得l=n=1nXi-n=0那么,极大似然估计是=X 求解置信区间,需要计算I(),令f(x|)表示参数为的PMF,需要计算I=-E22logfX已知logfx=xlog-logx!可得22logfX=-x2那么I=1因此,的近似1001-%置信区间为Xz(/2)Xn3. X1, X2, ,Xn 是从两点分布Bernoulli(1,p)中抽取出来的独立同分布样本:(1).求 (1-p)2的极大似然估计(10分)。(2)(1)中的估计量是无偏估计吗?如果是有偏的,请给出(1-p)2的一个无偏估计(15分)解:(1)似然函数为:px1,x2xn=pi=1nxi(1-p)n-i=1nxi对数似然函数为:logpx1,x2xn=i=1nxilogp+n-i=1nxilog(1-p)求导并令导数为0,得到i=1nxip-n-i=1nxi1-p=0化简,得p=i=1nxin=x那么(1-p)2的极大似然估计为:(1-x)2(2)已知有Ex2=Varx+(Ex)2E(1-x)2=E1-2x+x2=1-2Ex+Ex2=1-2p+p1-pn+p2因此,(1)中估计量不是无偏估计。因为有:(1-p)2=1-p-p(1-p)。已知S2是p(1-p)的无偏估计,x是p的无偏估计,那么(1-p)2的无偏估计为1-x-S24. 是从正态分布)中抽取的独立随机变量,请回答 1)计算,S2是样本方差;(10分)2)请在所有的形式为aX1+bX2的估计量中,找到的最小方差无偏估计;(10分)解:(1)由于n-1S222(n-1)所以En-1S22=n-1解得ES22=1(2)由题EaX1+bX2=2则a+b=2a+b=2要使Var(aX1+bX2)方差最小,带入b=2-a,有VaraX1+2-aX2=a2VarX1+2-a2VarX2=(2a2-4a+4)2求(2a2-4a+4)的极小值,令导数为0,得到4a-4=0,则a=1那么,当a=1是有最小方差无偏估计X1+X2四、论述题:(25分)1. 研究者想了解某种电子设备产品在一年的各个季节里被购买的情况是否存在不同。如果用销售量来解释这一问题,对这一问题可能提出的最简单的零假设可能是什么?在这一假设之下,研究者调查了有关这种产品过去3年的销售量2070万台。表1 某种电子设备产品在过去3年中的销售量季节O(万)EOi-Ei(Oi-Ei)2春季 495517.5-22.5506.250.98夏季 503517.5-14.5210.250.41秋季 491517.5-26.5702.251.36冬季581517.563.54032.257.79总计 207020700545110.541解释表头字母的含义;O 表示第i 个季节实际销售观测数E 表示如果假定各季节销售无差异时的销售期望数Oi-Ei 观测与期望的差值(Oi-Ei)2 偏差平方(Oi-Ei)2/ Ei 偏差平方与期望数的比值2请将上面的表格填写完整。3如果,请给出你的推断过程和据此可能的结论。 由于10.54大于7.81,卡方拟合优度检验统计量落在拒绝域中,则拒绝原假设,电子设备产品在一年的各个季节里被购买的情况存在不同。2.研究者想了解某地区的医院出院人数(DISC)和床位量(BEDN),调查了21家医院数据,分为甲级(I)和乙级(II)两类如下:等级IIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIDISC91240255233315200266120228362414518389535273440431534426505322BEDN6264676970738191961001001031101271111161201221301371421如果我们感兴趣的问题是医院出院人数小于400的比例估计,请给出通过抽取样本研究这一问题的统计推断问题和估计量;2如果假定p来自先验分布beta(a,b),请先根据甲级医院估计出a和b,再给出对乙级医院p的后验估计计算公式和计算结果;3如果将床位量按(0,70,(71,110以及(110,15

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论