统计学导论习题解答课件_第1页
统计学导论习题解答课件_第2页
统计学导论习题解答课件_第3页
统计学导论习题解答课件_第4页
统计学导论习题解答课件_第5页
已阅读5页,还剩113页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

练习1.4.2解:不可取。因为这里检查的苹果是方便样本,不是随机样本,方便样本的代表性差。第二页:例1.1.3注:收集有代表性的数据,是得到正确结论的基础。1练习1.4.2解:不可取。因为这里检查的苹果是方便样本,不是练习1.4.4解:这种论证方法不可靠,因为该结论来自精心挑选的事例,它们都说明“乌鸦叫,没好兆”。这样的事例不具有代表性,由此所得的结论有很大的偏差。要考察这种说明是否正确,可以通过实验来检验。随机选取一些人,在特定一段时间内记录他们听到乌鸦叫的时刻和发生事故的时刻,分析二者之间的关系,做出推断。2练习1.4.4解:这种论证方法不可靠,因为该结论来自精心挑选练习1.4.6解:y的值分别为2,0,0,2,2,2,2,0,0,0,0,0,没有频率稳定性。注:随机现象具有频率稳定性:对于任何由一些结果组成的事件,在相同条件下重复观测,该事件出现的次数与观测总数之比的极限通常存在。3练习1.4.6解:y的值分别为2,0,0,2,2,2,2,0练习1.4.7Matlab代码:u=unidrnd(2,100,1)-1;p=mean(u)4练习1.4.7Matlab代码:4练习1.4.9解:假设每个数字出现是等可能的,在100次试验中1不出现的概率为(15/16)100=0.001574446根据小概率事件在一次试验中是几乎不会发生的,推断出该摇奖机出现各个数字的概率不是相等的。5练习1.4.9解:假设每个数字出现是等可能的,在100次试验练习1.4.10解:类似例1.4.3x=unidrnd(2,1000,1)-1;f=[];fori=1:12ifi<11n=i*10;elseifi==11n=500;elsen=1000;endy=x(1:n);f=[f;sum(y==1)/n];end6练习1.4.10解:类似例1.4.3x=unidrnd(2,第二章概率2.1随机现象及基本概念2.2概率空间2.3随机变量及特征刻画2.4常用分布简介2.5概率论中的几个重要结论2.6附录:MATLAB语言及编程简介7第二章概率2.1随机现象及基本概念7练习2.1.2(1)四个中至少有一个发生(2)恰好有两个发生(3)至少有三个发生(4)至多一个发生8练习2.1.2(1)四个中至少有一个发生(2)恰好有两个练习2.1.4表示一小时内至多有k-1次呼唤;表示一小时内有k次呼唤.9练习2.1.4表示一小时内至多有k-1次呼唤;表示一小时内有练习2.1.7解:“当掷一枚骰子时,出现‘1点’的概率是1/6”的含义:在大量重复的掷一枚骰子试验中,出现‘1点’的频率稳定于1/6,或者说出现‘1点’的频率在1/6附近变化。10练习2.1.7解:“当掷一枚骰子时,出现‘1点’的概率是1/练习2.1.8Matlab代码:x=unidrnd(6,100,1);y=unidrnd(6,100,1);m=sum((x>y))/100注:该事件出现的概率应为(1-6/36)/2=5/120.416711练习2.1.8Matlab代码:注:该事件出现的概率应为1练习2.2.1解:经过事件的运算后得到的仍然是个事件,这样我们就能计算该事件出现的概率。(概率的基本公理29页定义2.2.1)12练习2.2.1解:经过事件的运算后得到的仍然是个事件,这样我练习2.2.3证明:13练习2.2.3证明:13练习2.2.12证明:假设,那么14练习2.2.12证明:假设练习2.2.1415练习2.2.1415练习2.2.15证明:因为所以16练习2.2.15证明:因为所以16练习2.3.2在样本空间与实数集之间建立对应关系,把随机现象统一转化到实数空间上来研究,这样可以利用有关实数的数学工具,使研究更方便。(随机变量定义40页定义2.3.2)17练习2.3.2在样本空间与实数集之间建立对应关系,把随机现象练习2.3.3证明:因为为随机变量,所以也是随机变量.(主要问题:不能按照定义来做,不分情况讨论.)

18练习2.3.3证明:因为为随机变量,所以也是随机变练习2.3.4证明:设是随机变量,F(x)=P(<x)是它的分布函数。,则,由概率的性质得到所以分布函数为增函数。19练习2.3.4证明:设是随机变量,F(x)=P(<x练习2.3.5解:A={他等待30到50分钟之间}={1030}

其中表示他醒来的时刻.20练习2.3.5解:A={他等待30到50分钟之间}20练习2.3.6解:不能,因为不能用表示出现1点这个随机事件{1}.注:证明结论不成立只需举出一个反例即可.21练习2.3.6解:不能,因为不能用表示出现1点这个随机事件练习2.3.7证明:又22练习2.3.7证明:又22练习2.3.723练习2.3.723练习2.3.12(主要问题:两点分布定义)24练习2.3.12(主要问题:两点分布定义)24练习2.3.13(主要问题:积分算错!)25练习2.3.13(主要问题:积分算错!)25练习2.4.1分析:设X取出的10枚螺栓中不合格的个数.1、确定分布类型:二项分布2、确定参数n=10,p=0.1P(X>3)=1-P(X3)0.0128Matlab代码:a=1-binocdf(3,10,0.1)26练习2.4.1分析:设X取出的10枚螺栓中不合格的个数.P(练习2.4.3分析:设X在100个新生儿中男婴的人数.1、确定分布类型:二项分布2、确定参数n=100,p=0.51P(X=51)0.0796Matlab代码:a=binopdf(51,100,0.51)27练习2.4.3分析:设X在100个新生儿中男婴的人数.P(X练习2.4.5分析:设X为在10次试验中出现点数之和为8的次数.1、确定分布类型:二项分布2、确定参数n=10,p=5/36P(X=1)0.3616Matlab代码:a=binopdf(1,10,5/36)28练习2.4.5分析:设X为在10次试验中出现点数之和为8的次练习2.4.8解:29练习2.4.8解:29练习2.4.10分析:1、确定分布类型:Poisson分布2、确定参数=399/35=11.4(1)P(=0)1.1195×10-5Matlab代码:a1=poisspdf(0,11.4)30练习2.4.10分析:(1)P(=0)1.1195×(2)P(<20)=P(

19)

0.9868Matlab代码:a2=poisscdf(19,11.4)练习2.4.10(3)P(

20)=1-P(

19)

0.0132Matlab代码:a3=1-poisscdf(19,11.4)31(2)P(<20)=P(19)0.9868练习2.4.12解:该机器所生产轴的合格率为P(4.95.1)=P(0.490.51)0.9502或者

Matlab代码:normcdf(5.1,5.01,0.005)-normcdf(4.9,5.01,0.005)normcdf(0.51,0.501,0.005)-normcdf(0.49,0.501,0.005)normcdf(1.8,0,1)-normcdf(-2.2,0,1)32练习2.4.12解:该机器所生产轴的合格率为Matlab代练习2.5.2(参考79页例2.5.7)Matlab代码:x=unifrnd(0,1,100000,1);y=x.^2.*exp(x.^2);p=mean(y)输出结果:0.6296注:二元运算符.*称为“点乘”,表示两个具有相同维数的矩阵之间的一种运算,结果是一个矩阵,任一位置元素等于两矩阵对应位置元素乘积。33练习2.5.2(参考79页例2.5.7)Matlab代码:练习2.5.3(参考84页例2.5.9)Matlab的代码:y=unifrnd(0,1,1000,30);xm=(mean(y,2)-0.5)*sqrt(360);F=sum([xm<-3,xm<-2.5,xm<-2,xm<-1.5,xm<-1,xm<-0.5,xm<-0,xm<0.5,xm<1,xm<1.5,xm<2,xm<2.5,xm<3])/1000;b=normcdf(-3:0.5:3,0,1);c=abs(b-F);%计算两者的偏差的绝对值34练习2.5.3(参考84页例2.5.9)Matlab的代码:经验分布F正态分布|F-|-30.00000.00130.0013-2.50.00400.00620.0022-20.01700.02280.0058-1.50.06700.06680.0002-10.16300.15870.0043-0.50.31800.30850.009500.5200.50000.02000.5070700.69150.015510.84900.84130.00771.50.93600.93320.002820.97500.97720.00222.50.99400.99380.000230.99900.99870.000335经验分布F正态分布|F-|-30.00000.00练习2.5.4解:(1)应用切比雪夫不等式注:样本均值的方差为切比雪夫不等式36练习2.5.4解:(1)应用切比雪夫不等式注:样本均值的方差练习2.5.4(2)由中心极限定理Matlab代码:p=1-2*normcdf(-4,0,1)37练习2.5.4(2)由中心极限定理Matlab代码:371、写出计算向量x的所有元素的平均值的M文件.M文件的代码:functionm=mymean(x)%mymean(x):计算向量的均值m=x(1);forj=2:length(x)m=m+(x(j)-m)/j;end381、写出计算向量x的所有元素的平均值的M文件.M文件的代码:2、编写例2.5.2的程序代码.Matlab的代码:x=unifrnd(0,1,10000,1);E=[]fori=1:10forj=1:10ifi==1n=(j-1)*10+1;elseifi==2n=500+(j-1)*10;elsen=(i-2)*1000+(j-1)*10;endy=x(1:n);E=[E,mean(y)];endend392、编写例2.5.2的程序代码.Matlab的代码:39第三章数据的收集3.1基本概念3.2观测数据收集3.3统计分析结果中的误差来源3.4试验数据收集40第三章数据的收集3.1基本概念40练习3.1.3属性(定性)变量与数值(定性)变量(b),(d)是属性变量;(a),(c),(e),(f)是数值变量。描述个体分类特征的变量,称为属性变量描述个体数量特征的变量,称为数值变量41练习3.1.3属性(定性)变量与数值(定性)变量41练习3.1.4(a)总体:所关心的研究对象的全体。样本:由部分总体对象组成的,是总体的一部分。人们想用样本的特征估计总体的特征。(b)普查(收集总体中全部个体指标数据)的方法不适用下述情况:总体包含无穷多个个体;获取个体指标过程具有破坏性,而我们又不能破坏所有个体;成本过高。我们以通过部分个体指标数据来估计总体分布。42练习3.1.4(a)总体:所关心的研究对象的全体。42练习3.1.5统计量与参数的差别:参数是总体的某种特征,它是一个未知的我们感兴趣的数。统计量是能够由样本数据计算出来的量,人们常用一个特定的统计量来估计总体参数。(b)参数是想要了解的对象。虽然在有限总体下可通过所有个体的观测值来计算参数,但是用统计量的值代替参数可节省成本,有时能避免对总体所有个体的破坏;对于无限总体,只能通过样本得到有关参数的信息,即用好的统计量代替参数。43练习3.1.5统计量与参数的差别:参数是总体的某种特征,它是练习3.2.2这样得到的样本是方便样本。杂志向读者发放调查问卷,结果可能会得到读者中那些愿意花时间和精力填写调查问卷的读者的问卷(例如对问题有强烈主张者)。方便样本有局限性,可能缺乏代表性。44练习3.2.2这样得到的样本是方便样本。44练习3.2.3随机样本要求每个个体都以确定的概率被选到样本之中,有时很难实现,如(1)不能确定完整总体的名单;(2)得不到样本中一些个体的数据;(3)抽样中有遗漏或重复;(4)对于无限总体无法完成抽样的实施步骤;等等。45练习3.2.3随机样本要求每个个体都以确定的概率被选到练习3.2.4判断样本是根据主观判断有目的地选取样本或根据方便样本的原则选取样本,其抽样效果好坏在很大程度上依赖于抽样者的主观判断能力和经验。由于判断样本不能计算抽样误差,不能从概率意义上控制误差,并以此保证推断的准确性。而随机抽样避免了主观因素的影响,使得总体的每一个体都有特定的选入总体的概率,能够更客观的代表总体,且可利用概率论的理论估计抽样误差,保证推断的准确性。46练习3.2.4判断样本是根据主观判断有目的地选取样本或练习3.4.1确定对照组与实验组(1)两组所处的外部环境相同;(2)在实验开始时,实验组与对照组之间没有差异。随机选择学生,随机选择授课老师,在试验过程中保持实验组与对照组的外部环境一致。47练习3.4.1确定对照组与实验组47第四章数据中总体信息的初步描述4.1数据分组统计表、直方图与分布形状特征4.2分布密度形状信息的可视化4.3从样本中提取总体分布数字特征的信息48第四章数据中总体信息的初步描述4.1数据分组统计表、直练习4.1.1连续型总体变量的密度函数可以利用阶梯函数任意逼近,而根据密度函数的概率定义和频率近似概率的思想,这个阶梯函数的每个阶梯又可以用相应的频率矩形的顶边近似,所以可用频率直方图的顶边近似密度函数。49练习4.1.1连续型总体变量的密度函数可以利用阶梯函数练习4.1.2样本趋于无穷时,固定分组数的频数直方图的高度趋向于无穷或永远为0。50练习4.1.2样本趋于无穷时,固定分组数的频数直方图的练习4.1.3频率直方图和频数直方图分组频率直方图唯一差别是纵坐标的刻度,二者几何形状相似。等间隔的区间分组时,分组频率直方图与频率直方图二者几何形状相似,此时差别是纵坐标的刻度不同;不是按等间隔的区间分组时,分组频数条形图和频率直方图几何形状不相似。51练习4.1.3频率直方图和频数直方图分组频率直方图唯一练习4.1.4频数与频率表[13,19)40.073[19,25)140.255[25,31)200.364[31,37)80.145[37,43)40.073[43,49)40.073[49,55)10.01852练习4.1.4频数与频率表[13,19)40.073[19,练习4.1.4(2)组距19-13=6x=[27,23,22,38,43,24,35,26,28,18,20,25,23,22,52,31,30,41,45,29,27,43,29,28,27,25,29,28,24,37,28,29,18,25,33,25,27,25,34,32,36,22,32,33,21,23,24,18,48,23,16,38,26,21,23];g=[13,19,25,31,37,43,49,55];f=hist(x,g)/55;h=f/6;bar(g,h);53练习4.1.4(2)组距19-13=653练习4.2.1直方图与条形图的差别:条形图中,相邻竖条之间有间隔,其含义是:竖条高度所代表的量与其底边中点位置的变量值有关。条形图刻画离散变量或分类变量的观测样本数据的分类统计特征。直方图中,相邻的矩形之间没有间隔,其含义是:矩形面积所代表的量与底边构成的左闭右开区间有关。直方图刻画连续变量观测样本数据的分组统计特征。54练习4.2.1直方图与条形图的差别:54练习4.2.2可以,根据强大数定律(例2.5.4),当样本容量趋于无穷时,重复观测样本数据的频率条形图趋向于总体变量的密度图的概率为1,即可以用频率条形图来近似总体密度图。55练习4.2.2可以,根据强大数定律(例2.5.4),当练习4.2.3利用点图中各个位置点的堆积高度是否超过1来判断变量是否为离散变量或分类变量。56练习4.2.3利用点图中各个位置点的堆积高度是否超过1练习4.2.4点图与茎叶图可在样本数据采集过程中逐步制作,能够帮助研究者初步观察总体分布的形状特征;适合于显示小样本的分布特征。57练习4.2.4点图与茎叶图可在样本数据采集过程中逐步制练习4.2.5连续变量点图的特点:各个位置的堆积高度几乎都为1,这可以成为我们判断变量是否为连续变量的依据。因为在连续变量的观测样本数据中,两个样本点相等的概率为0。58练习4.2.5连续变量点图的特点:各个位置的堆积高度几练习4.2.6x=[2,3,4,6,4];bar(x);pie(x);59练习4.2.6x=[2,3,4,6,4];59练习1.4.2解:不可取。因为这里检查的苹果是方便样本,不是随机样本,方便样本的代表性差。第二页:例1.1.3注:收集有代表性的数据,是得到正确结论的基础。60练习1.4.2解:不可取。因为这里检查的苹果是方便样本,不是练习1.4.4解:这种论证方法不可靠,因为该结论来自精心挑选的事例,它们都说明“乌鸦叫,没好兆”。这样的事例不具有代表性,由此所得的结论有很大的偏差。要考察这种说明是否正确,可以通过实验来检验。随机选取一些人,在特定一段时间内记录他们听到乌鸦叫的时刻和发生事故的时刻,分析二者之间的关系,做出推断。61练习1.4.4解:这种论证方法不可靠,因为该结论来自精心挑选练习1.4.6解:y的值分别为2,0,0,2,2,2,2,0,0,0,0,0,没有频率稳定性。注:随机现象具有频率稳定性:对于任何由一些结果组成的事件,在相同条件下重复观测,该事件出现的次数与观测总数之比的极限通常存在。62练习1.4.6解:y的值分别为2,0,0,2,2,2,2,0练习1.4.7Matlab代码:u=unidrnd(2,100,1)-1;p=mean(u)63练习1.4.7Matlab代码:4练习1.4.9解:假设每个数字出现是等可能的,在100次试验中1不出现的概率为(15/16)100=0.001574446根据小概率事件在一次试验中是几乎不会发生的,推断出该摇奖机出现各个数字的概率不是相等的。64练习1.4.9解:假设每个数字出现是等可能的,在100次试验练习1.4.10解:类似例1.4.3x=unidrnd(2,1000,1)-1;f=[];fori=1:12ifi<11n=i*10;elseifi==11n=500;elsen=1000;endy=x(1:n);f=[f;sum(y==1)/n];end65练习1.4.10解:类似例1.4.3x=unidrnd(2,第二章概率2.1随机现象及基本概念2.2概率空间2.3随机变量及特征刻画2.4常用分布简介2.5概率论中的几个重要结论2.6附录:MATLAB语言及编程简介66第二章概率2.1随机现象及基本概念7练习2.1.2(1)四个中至少有一个发生(2)恰好有两个发生(3)至少有三个发生(4)至多一个发生67练习2.1.2(1)四个中至少有一个发生(2)恰好有两个练习2.1.4表示一小时内至多有k-1次呼唤;表示一小时内有k次呼唤.68练习2.1.4表示一小时内至多有k-1次呼唤;表示一小时内有练习2.1.7解:“当掷一枚骰子时,出现‘1点’的概率是1/6”的含义:在大量重复的掷一枚骰子试验中,出现‘1点’的频率稳定于1/6,或者说出现‘1点’的频率在1/6附近变化。69练习2.1.7解:“当掷一枚骰子时,出现‘1点’的概率是1/练习2.1.8Matlab代码:x=unidrnd(6,100,1);y=unidrnd(6,100,1);m=sum((x>y))/100注:该事件出现的概率应为(1-6/36)/2=5/120.416770练习2.1.8Matlab代码:注:该事件出现的概率应为1练习2.2.1解:经过事件的运算后得到的仍然是个事件,这样我们就能计算该事件出现的概率。(概率的基本公理29页定义2.2.1)71练习2.2.1解:经过事件的运算后得到的仍然是个事件,这样我练习2.2.3证明:72练习2.2.3证明:13练习2.2.12证明:假设,那么73练习2.2.12证明:假设练习2.2.1474练习2.2.1415练习2.2.15证明:因为所以75练习2.2.15证明:因为所以16练习2.3.2在样本空间与实数集之间建立对应关系,把随机现象统一转化到实数空间上来研究,这样可以利用有关实数的数学工具,使研究更方便。(随机变量定义40页定义2.3.2)76练习2.3.2在样本空间与实数集之间建立对应关系,把随机现象练习2.3.3证明:因为为随机变量,所以也是随机变量.(主要问题:不能按照定义来做,不分情况讨论.)

77练习2.3.3证明:因为为随机变量,所以也是随机变练习2.3.4证明:设是随机变量,F(x)=P(<x)是它的分布函数。,则,由概率的性质得到所以分布函数为增函数。78练习2.3.4证明:设是随机变量,F(x)=P(<x练习2.3.5解:A={他等待30到50分钟之间}={1030}

其中表示他醒来的时刻.79练习2.3.5解:A={他等待30到50分钟之间}20练习2.3.6解:不能,因为不能用表示出现1点这个随机事件{1}.注:证明结论不成立只需举出一个反例即可.80练习2.3.6解:不能,因为不能用表示出现1点这个随机事件练习2.3.7证明:又81练习2.3.7证明:又22练习2.3.782练习2.3.723练习2.3.12(主要问题:两点分布定义)83练习2.3.12(主要问题:两点分布定义)24练习2.3.13(主要问题:积分算错!)84练习2.3.13(主要问题:积分算错!)25练习2.4.1分析:设X取出的10枚螺栓中不合格的个数.1、确定分布类型:二项分布2、确定参数n=10,p=0.1P(X>3)=1-P(X3)0.0128Matlab代码:a=1-binocdf(3,10,0.1)85练习2.4.1分析:设X取出的10枚螺栓中不合格的个数.P(练习2.4.3分析:设X在100个新生儿中男婴的人数.1、确定分布类型:二项分布2、确定参数n=100,p=0.51P(X=51)0.0796Matlab代码:a=binopdf(51,100,0.51)86练习2.4.3分析:设X在100个新生儿中男婴的人数.P(X练习2.4.5分析:设X为在10次试验中出现点数之和为8的次数.1、确定分布类型:二项分布2、确定参数n=10,p=5/36P(X=1)0.3616Matlab代码:a=binopdf(1,10,5/36)87练习2.4.5分析:设X为在10次试验中出现点数之和为8的次练习2.4.8解:88练习2.4.8解:29练习2.4.10分析:1、确定分布类型:Poisson分布2、确定参数=399/35=11.4(1)P(=0)1.1195×10-5Matlab代码:a1=poisspdf(0,11.4)89练习2.4.10分析:(1)P(=0)1.1195×(2)P(<20)=P(

19)

0.9868Matlab代码:a2=poisscdf(19,11.4)练习2.4.10(3)P(

20)=1-P(

19)

0.0132Matlab代码:a3=1-poisscdf(19,11.4)90(2)P(<20)=P(19)0.9868练习2.4.12解:该机器所生产轴的合格率为P(4.95.1)=P(0.490.51)0.9502或者

Matlab代码:normcdf(5.1,5.01,0.005)-normcdf(4.9,5.01,0.005)normcdf(0.51,0.501,0.005)-normcdf(0.49,0.501,0.005)normcdf(1.8,0,1)-normcdf(-2.2,0,1)91练习2.4.12解:该机器所生产轴的合格率为Matlab代练习2.5.2(参考79页例2.5.7)Matlab代码:x=unifrnd(0,1,100000,1);y=x.^2.*exp(x.^2);p=mean(y)输出结果:0.6296注:二元运算符.*称为“点乘”,表示两个具有相同维数的矩阵之间的一种运算,结果是一个矩阵,任一位置元素等于两矩阵对应位置元素乘积。92练习2.5.2(参考79页例2.5.7)Matlab代码:练习2.5.3(参考84页例2.5.9)Matlab的代码:y=unifrnd(0,1,1000,30);xm=(mean(y,2)-0.5)*sqrt(360);F=sum([xm<-3,xm<-2.5,xm<-2,xm<-1.5,xm<-1,xm<-0.5,xm<-0,xm<0.5,xm<1,xm<1.5,xm<2,xm<2.5,xm<3])/1000;b=normcdf(-3:0.5:3,0,1);c=abs(b-F);%计算两者的偏差的绝对值93练习2.5.3(参考84页例2.5.9)Matlab的代码:经验分布F正态分布|F-|-30.00000.00130.0013-2.50.00400.00620.0022-20.01700.02280.0058-1.50.06700.06680.0002-10.16300.15870.0043-0.50.31800.30850.009500.5200.50000.02000.5070700.69150.015510.84900.84130.00771.50.93600.93320.002820.97500.97720.00222.50.99400.99380.000230.99900.99870.000394经验分布F正态分布|F-|-30.00000.00练习2.5.4解:(1)应用切比雪夫不等式注:样本均值的方差为切比雪夫不等式95练习2.5.4解:(1)应用切比雪夫不等式注:样本均值的方差练习2.5.4(2)由中心极限定理Matlab代码:p=1-2*normcdf(-4,0,1)96练习2.5.4(2)由中心极限定理Matlab代码:371、写出计算向量x的所有元素的平均值的M文件.M文件的代码:functionm=mymean(x)%mymean(x):计算向量的均值m=x(1);forj=2:length(x)m=m+(x(j)-m)/j;end971、写出计算向量x的所有元素的平均值的M文件.M文件的代码:2、编写例2.5.2的程序代码.Matlab的代码:x=unifrnd(0,1,10000,1);E=[]fori=1:10forj=1:10ifi==1n=(j-1)*10+1;elseifi==2n=500+(j-1)*10;elsen=(i-2)*1000+(j-1)*10;endy=x(1:n);E=[E,mean(y)];endend982、编写例2.5.2的程序代码.Matlab的代码:39第三章数据的收集3.1基本概念3.2观测数据收集3.3统计分析结果中的误差来源3.4试验数据收集99第三章数据的收集3.1基本概念40练习3.1.3属性(定性)变量与数值(定性)变量(b),(d)是属性变量;(a),(c),(e),(f)是数值变量。描述个体分类特征的变量,称为属性变量描述个体数量特征的变量,称为数值变量100练习3.1.3属性(定性)变量与数值(定性)变量41练习3.1.4(a)总体:所关心的研究对象的全体。样本:由部分总体对象组成的,是总体的一部分。人们想用样本的特征估计总体的特征。(b)普查(收集总体中全部个体指标数据)的方法不适用下述情况:总体包含无穷多个个体;获取个体指标过程具有破坏性,而我们又不能破坏所有个体;成本过高。我们以通过部分个体指标数据来估计总体分布。101练习3.1.4(a)总体:所关心的研究对象的全体。42练习3.1.5统计量与参数的差别:参数是总体的某种特征,它是一个未知的我们感兴趣的数。统计量是能够由样本数据计算出来的量,人们常用一个特定的统计量来估计总体参数。(b)参数是想要了解的对象。虽然在有限总体下可通过所有个体的观测值来计算参数,但是用统计量的值代替参数可节省成本,有时能避免对总体所有个体的破坏;对于无限总体,只能通过样本得到有关参数的信息,即用好的统计量代替参数。102练习3.1.5统计量与参数的差别:参数是总体的某种特征,它是练习3.2.2这样得到的样本是方便样本。杂志向读者发放调查问卷,结果可能会得到读者中那些愿意花时间和精力填写调查问卷的读者的问卷(例如对问题有强烈主张者)。方便样本有局限性,可能缺乏代表性。103练习3.2.2这样得到的样本是方便样本。44练习3.2.3随机样本要求每个个体都以确定的概率被选到样本之中,有时很难实现,如(1)不能确定完整总体的名单;(2)得不到样本中一些个体的数据;(3)抽样中有遗漏或重复;(4)对于无限总体无法完成抽样的实施步骤;等等。104练习3.2.3随机样本要求每个个体都以确定的概率被选到练习3.2.4判断样本是根据主观判断有目的地选取样本或根据方便样本的原则选取样本,其抽样效果好坏在很大程度上依赖于抽样者的主观判断能力和经验。由于判断样本不能计算抽样误差,不能从概率意义上控制误差,并以此保证推断的准确性。而随机抽样避免了主观因素的影响,使得总体的每一个体都有特定的选入总体的概率,能够更客观的代表总体,且可利用概率论的理论估计抽样误差,保证推断的准确性。105练习3.2.4判断样本是根据主观判断有目的地选取样本或练习3.4.1确定对照组与实验组(1)两组所处的外部环境相同;(2)在实验开始时,实验组与对照组之间没有差异。随机选择学生,随机选择授课老师,在试验过程中保持实验组与对照组的外部环境一致。106练习3.4.1确定对照组与实验组47第四章数据中总体信息的初步描述4.1数据分组统计表、直方图与分布形状特征4.2分布密度形状信息的可视化4.3从样本中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论