《概率论与数理统计》课程教案_第1页
《概率论与数理统计》课程教案_第2页
《概率论与数理统计》课程教案_第3页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《概率论与数理统计》课程教案主讲教师 所在单位 授课班级

专业

撰写时间 教案编号 24-0901 教案内容 概率统计数值实验 学时 2(1)掌握离散型随机变量和连续型随机变量各种常见分布随机数的生成算法,能借助Matlab软件产生各种分布的随机数函数;基本要求 (2)能借助Matlab软件求解一些简单的应用概率问题的数值模拟解;(3)能借助Matlab软件完成有关随机变量的分布拟合和参数估计的求解。教学目标教学重点

本内容可在实验室边讲边练;亦可在课堂上讲方法,课后学生自行练习,以平时作业处理,但不作考试要求。培养能力要求:掌握概率论和数理统计中的基本概念和性质并能够运用到复杂工程问题的能力要求 适当表述之中;的统计规律性;常见分布随机数的生成算法;应用Matlab软件作简单概率问题的随机模拟思想与方法;应用Matlab软件求解随机变量分布参数及分布拟合检验的过程。教学难点 常见分布随机数函数的生成思想。教学方法 提问、讲授、启发、讨论、实验工具仪器 多媒体教具、教材、教案、教学课件、考勤表、平时成绩登记表、Matlab软件教学安排 考勤、复习相关知识点、新课内容概述、组织教学、布置作业、课后小结教学过程教学组织、具体教学内容及教学方法、手段、时间分配及其它说明第一部分:古典概型实验(30内容介绍MATLAB1:计算超几何分布2:频率稳定性实验实验3:利用频率估计自然对数底e

备注将第一章知识点串接起来4:5:生日悖论实验利用MATLAB软件的图形可视功能将概率统计的内容用图形表示出来,以加深对概率的理解MATLAB常用的及与随机数产生相关的函数factorial(n):阶乘,n!,可通过阶乘来计算排列组合数1.rand(m,nm×n(0,1)式为均匀分布。2.randn(m,n):生成m×n(0,1)间,生成方式为正态分布3.randperm(m1~m4.perms(1:n1~nn!个5.取整函数系列:fix(x):截尾法取整;floor(x):退一法取整(x;向负方向舍入ceil(x):进一法取整(=floor(x)+1; 向正向舍入round(x):四舍五入法取整。6.unique(d(x):x示例:>>rand(1)%生成一个(0,1)间的随机数ans= 0.8147>>rand(2,2)%生成一个2×2阶(0,1)间的随机数矩ans=0.9134 0.09750.6324 0.2785>>randperm(5)%生成一个1~5的随机整数排ans=4 1 5 2 3>>a=[1242332];unique(a)ans= 1 2 3 4实验1:计算超几何分布的结果NDn件(zuhe.mfunction 计算如下:>>N=10;实验2频率稳定性实验随机投掷均匀硬币,观察国徽朝上与国徽朝下的频率解>>n=3000~;m=0;fori=1:nt=randperm(2); 1~2x=t-1; 0~1y=x(1); xify==0;m=m+1;endendp1=m/np2=1-p1可见当n→∞时,𝑓𝑛(𝐴)=𝑃(𝐴)实验3用频率估计自然对数en若每人随机地取走一支枪,求没有一个人拿到自己枪的概率?Ai个人拿到自已枪,事件i个人没拿到自己枪,易知:iP(𝐴𝑖)

1;P(̅)=

𝑖(i=,⋯,n)𝑛 𝑖 𝑛又记p为没有一个人拿到自己枪的概率。0𝑛𝑝 ==1 𝑃(⋃𝐴)0 1 2 由乘法公式可知

𝑖𝑖=1P(𝐴𝑖

)=

|𝐴𝑖)

1 (1≤𝑖<𝑗≤P(𝐴𝑖

)=

|𝐴𝑘)

1

(1≤𝑖<𝑗<𝑘≤𝑛)……P(𝐴1于是

𝐴2

𝐴3

⋯𝐴𝑛)=

1𝑛!𝐶𝑛 𝑛 2𝐶∑𝑃(𝐴𝑖)=1, ∑ 𝑃(𝐴𝑖= ( 𝑛 )𝑖=1 𝑛

𝑛𝑛 1𝐶3∑ 𝑃(𝐴𝑖𝐴𝑘)1≤𝑖<𝑗<𝑘≤𝑛

𝑛 ,⋯𝑛 2)P(𝐴1所以𝑛

𝐴2

𝐴3𝐶2

⋯𝐴𝑛)=

1

𝐶3 (1 )𝑛+1=1 𝑃(⋃𝐴𝑖)=1

( 𝑛 )+ (

)+⋯

𝑛! ]𝑖=1𝑛 (1) 𝑘

𝑛𝑛

𝑛𝑛 2=∑ 𝑘!𝑘=0n≈𝑒1。。并考虑估计精度与人数是否有关系,为什么。算法如下:1n个随机数的随机序列;2、检验随机列与自然列是否至少有一个配对;3、对没有一个配对的序列进行累积t;4、重复1、2、3步m次;5、估计e =𝑚𝑡具体程序及相关结果如下页图注:自然常数e≈2.7183>>n=50;t=0;forj=1:mk=0;sui=randperm(n);fori=1:nifsui(i)==ik=k+1;elsek=k;endendifk==0t=t+1;elset=t;endende=m/te=2.7313实验4:蒲丰(Buffon)投针实验,用频率估计值d的均匀直针,求针与平行线相交的概率,并计算的近似值解:设针与平行线的夹角为。。建立直x和所概率为

𝑔的面积

∫𝜋

sin𝛼𝑑𝛼 2𝑙 𝑚p= = 02

=𝜋𝑑≈𝑛𝐺的面积 𝜋2故可得的近似计算公式π≈𝑚𝑑

n为针与平行线相交的次数。解>>clear,clfn=;l=0.5;m=0;d=1;fori=1:nx=(l/2)*sin(rand(1)*pi); y=rand(1)*d/2;ifx>=ym=m+1;endendp1=m/npai=2*n*l/(m*d)实验5生日悖论实验100365n365(1)nn少有两个人生日相同这一随机事件发生的概率是多少?(2)30是多少是多少解:(1)>>clear,clfforn=1:100p0(n)=prod(365:-1:365-n+1)/365^n;p1(n)=1-p0(n);endp1=ones(1,100)-p0;n=1:100;plot(n,p0,n,p1,'--')xlabel('人数'),ylabel('概率')legend('生日各不相同的概率','至少两人生日相同的概率')axis([0100-0.11.199]),gridon生日各不相同的概率至少两人生日相同的概率10.80.6率概0.40.200 10 20 30 40 50人数

60 70 80 90 100p1(30)=0.7063,p1(60)=0.99413070.63%下面进行计算机仿真。3030301输出“0100f100>>clear,clfn=0;form=1:100 100y=0;x=1+fix(365*rand(1,30)); 30fori=1:2930forj=i+1:30ifx(i)==x(j)y=1;break;endendendn=n+y;%累计有两人生日相同的试验次数endf=n/m%计算频率第二部分:随机变量及其分布(50分钟)内容介绍MATLAB中概率分布函数二项分布实验泊松分布实验二项分布与泊松分布关系实验连续型随机变量分布实验随机变量的均值与方差逆累积分布函数实验中心极限定理实验MATLAB中概率分布函数MATLAB为常见自然概率分布提供了下列5类函数①概率密度函数(fXx点处的概率密度值②累积分布函数(fXx点处的分布函数值(X值(X和方差var(X)⑤随机数生成函数drnd(分布参数)x=normrnd(0,1))常见的分布类型名如下具体函数的命名规则是:函数名=分布类型名称+函数类型名称(pdf、cdf、、、rnd)例如,normpdfnormcdf、norminv、normstatnormrnd分别是正态分布的概率密度、累积分布、逆累积分布、数字特征和随机数生成函数。关于这5类函数的语法,请详见有关书籍 MATLABdoc详细信息,语法是doc<函数名>二项分布实验Y~b(200.3)Y分布率的值,并划出图形Matlab中输入以下命令:binopdf(10,20,0.2)x=0:1:20;y=binopdf(x,20,0.2)0.055101520结果:ans=0.0020y=0.01150.05760.13690.20540.21820.17460.10910.05450.02220.00740.00200.00050.00010.00000.00000.00000.00000.00000.00000.00000.0000Y~b(200.3)Y分布函数的值,画出函数图像Matlab中输入以下命令:binocdf(10,20,0.2)x=0:1:20;y=binocdf(x,20,0.2)ezplot('binocdf(t,20,0.3)',[0,20])结果:ans= 0.9994y=0.01150.06920.20610.41140.62960.80420.91330.96790.99000.99740.99940.99991.00001.00001.00001.00001.00001.00001.00001.00001.0000到某服务机构办事总是要排队等待的。设等待时间T是服从指数分布的随机变量(单位:分钟),概率密度为110f(t)={10𝑒10

𝑡𝑡 >00𝑡 <0设某人一个月内要到此办事10次,若等待时间超过15分钟,他就离去。求:恰好有两次离去的概率;(2)最多有两次离去的概率;(3)至少有两次离去的概率;(4)解首先求任一次离去的概率,依题意10XX~b(10,p)>>p=1-expcdf(15,10) %任一次离去的概率p1=binopdf(2,10,p) %恰有两次离去的概q=binopdf([0:2],10,p);p2=sum(q)%最多有两次离去的概率q=binopdf([0:1],10,p);p3=1-sum(q)%最少有两次离去的概率q=binopdf([0:5],10,p);p4=1-sum(q)%离去的次数占多数的概率p=0.2231p1=0.2972p2=0.6073p3=0.6899p4=0.0112泊松分布实验假设电话交换台每小时接到的呼叫次数X服从参数=3的泊松分布,求(1) 4次呼叫的概率(2) 5次的概率(3)画出分布律图像P(X=4)=

𝜆44!

34=4!𝑒35 5 3𝑘P(X≤5)=∑𝑃(𝑋=𝑘=∑𝑘!𝑘=0 𝑘=0

𝑒3在Matlab中输入以下命令:(1)p1=poisspdf(4,3)(2)p2=poisscdf(5,3)(3)x=0:1:20;y=poisspdf(x,3);plot(x,y)二项分布与泊松分布的关系例7:X~b(200,0.02),Y服从参数为4的泊松分布,划出分布率图像x=0:20;y1=binopdf(x,200,0.02);y2=poisspdf(x,4);plot(x,y1,’r.’,x,y2,’b.’)泊松定理

(用泊松分布来逼近二项分布的定理)nλ>0是一个常数,nn有

=λ,则对于任意固定的非负整数k,𝑛lim( )𝑝𝑘(1−

𝜆𝑘𝑒−𝜆n→∞ 𝑘 𝑛

𝑘!9100元,若在这一年中,投保100000.000210000份保单,问:保险公司亏本的概率是多少?80?解设X 表示这一年中发生索赔的份数,依题意,X的统计规律可用二项分布X~B(10000,0.0002)来描述。由二项分布与泊松分布的近似计算关系有(𝑛𝑝)𝑘𝑛𝐶𝑘𝑝𝑘(1−𝑛

𝑒−𝑛𝑝(0 <𝑛𝑝<10)X近似服从参数为2的泊松分布。当索赔份数超过100份时,则保险公司发生亏本,亏本的概率为100=>100)=1−≤100)=1−∑

2𝑘𝑘!

𝑒−2当索赔份数不超过20份时,则保险公司获利就不少于80万元,其概率为19=<20)==∑[p]=poisspdf([0:100],2);%101个泊松分布概率值

𝑘!

𝑒−2或 [p]=binopdf([0:100],10000,0.0002);%按二项分布计算p1=1-sum(p)%求出保险公司亏本的概率p1=0.0000>>[p]=poisspdf([0:19],2);%计算出20个泊松分布概率值或[p]=binopdf([0:19],10000,0.0002);%按二项分布计算p2=sum(p80万元的概率p2=1.0000连续型随机变量分布实验离散均匀分布的概率密度函数和累积分布函数unidpdf(X,N) unidcdf(X,N)X1NNMatlab中输入以下命令:x=1:1:10;y=unidpdf(x,10)结果:y= 0.1000 0.1000 0.1000 0.1000 0.10000.1000 0.1000 0.1000 0.1000 0.1000在Matlab中输入以下命令:x=0:1:10;y=unidcdf(x,10)结果:y = 0 0.1000 0.2000 0.3000 0.4000 0.5000 0.6000 0.70000.8000 0.9000 1.0000连续均匀分布密度函数:f=unifpdf(x,a,b)分布函数:f=unifcdf(x,a,b)例:画出均匀分布U(2,5)的概率密度函数和分布函数的图形.在Matlab中输入以下命令:x=0:0.01:7;y=unifpdf(x,2,5);z=unifcdf(x,2,5);plot(x,y,x,z)指数分布例:画出指数分布E(1)的概率密度函数和分布函数的图形. 求P(0<X<5) P(0<X<20).在Matlab中输入以下命令:x=0:0.1:5;y=exppdf(x,2);z=expcdf(x,2);plot(x,y,x,z)result1=expcdf(5,2)-expcdf(0,2)result2=expcdf(20,2)-expcdf(0,2)结果:result1= 0.910result2= 0.24正态分布例:画出正态分布N(1,4)的概率密度函数和分布函数的图形. 求在Matlab中输入以下命令:x=-5:0.1:6;y=normpdf(x,1,2);z=normcdf(x,1,2);plot(x,y,x,z)result=normcdf(6,1,2)-normcdf(1,1,2)结果:Result=0.4938例11:在同一坐标下画下列正态分布的密度函数图(1)μ=3,σ=0.5, 0.7, 1, 1.5, 2(2)σ=0.5,μ=1,2,3,4(1)命令:x=-6:0.1:6;y1=normpdf(x,3,0.5);y2=normpdf(x,3,0.7);y3=normpdf(x,3,1);y4=normpdf(x,3,1.5);y5=normpdf(x,3,2);plot(x,y1,'.',x,y2,'+',x,y3,'*',x,y4,'d',x,y5)例观察正态分布参数对密度曲线的影响。解:>>clearmu1=2.5;mu2=3;sigma1=0.5;sigma2=0.6;x=(mu2-4*sigma2):0.01:(mu2+4*sigma2);y1=normpdf(x,mu1,sigma1);%考察均值的影响y2=normpdf(x,mu2,sigma1);y3=normpdf(x,mu1,sigma1);%考察方差的影响y4=normpdf(x,mu1,sigma2);subplot(1,2,1) %plot(x,y1,'-g',x,y2,'-b')xlabel('\fontsize{12}μ1<μ2,σ1=σ2')legend('μ1','μ2')subplot(1,2,2)plot(x,y3,'-g',x,y4,'-b')xlabel('\fontsize{12}μ1=μ2,σ1<σ2')legend('σ1','σ2')0.8 0.8μ1 σ10.7μ20.7μ2 0.10 00 2 4 6

2 4 6μ1<μ2,σ1=σ2 μ1=μ2,σ1<σ2计算正态分布的累积概率值例,设X~N(4,32),P{3<X<6},P{X>3}normcdf(x,μ,σ)返回函数值F(x)=∫𝑥∞解:

𝑓(𝑡)𝑑𝑡>>p1=normcdf(6,4,3)-normcdf(3,4,3)p1=0.3781>>p2=1-normcdf(3,4,3)p2=0.6306例正态分布参数μ和σ对变量x取值规律的约束——3σ准则解:>>clear,clf %(标准)正态分布密度曲线下的面积X=linspace(-5,5,100);Y=normpdf(X,0,1);yy=normpdf([-3,-2,-1,0,1,2,3],0,1);yy=normpdf([-3,-2,-1,0,1,2,3],0,1);plot(X,Y,'k-',[0,0],[0,yy(4)],'c-.')holdon[0.5,2],[yy(6),yy(6)],'m:')plot([-1,-1],[0,yy(3)],'g:',[1,1],[0,yy(5)],'g:',[-1,-0.5],[yy(5),yy(5)],'g:',[0.5,1],[yy(5),yy(5)],'g:')[0.5,3],[yy(7),yy(7)],'b:')holdofftext(-0.5,yy(6)+0.005,'\fontsize{14}95.44%')text(-0.5,yy(5)+0.005,'\fontsize{14}68.26%')text(-0.5,yy(7)+0.005,'\fontsize{14}99.74%')text(-3.2,-0.03,'\fontsize{10}μ-3σ')text(-2.2,-0.03,'\fontsize{10}μ-2σ')text(-1.2,-0.03,'\fontsize{10}μ-σ')text(-0.05,-0.03,'\fontsize{10}μ')text(0.8,-0.03,'\fontsize{10}μ+σ')text(1.8,-0.03,'\fontsize{10}μ+2σ')text(2.8,-0.03,'\fontsize{10}μ+3σ')0.40.35-5-4-5-4-3-2-1012345μ3σμ2σμσμμ+σμ+2σμ+3σ

68.26%95.44%99.74%随机变量的数学期望和方差对于任意的分布,可用Matlab中的函数和运算编程实现stat调用格式[E,D]=分布+stat(参数)例:求二项分布参数n=100,p=0.2的数学期望和方差:解:>>n=100;>>p=0.2;>>[E,D]=binostat(n,p);结果显示:E=20D=16例绘制正态分布的密度函数、分布函数曲线,并求均值与方差解:>>clearmu=2.5;sigma=0.6;x=(mu-4*sigma):0.005:(mu+4*sigma);y=normpdf(x,mu,sigma);f=normcdf(x,mu,sigma);plot(x,y,'-g',x,f,':b')[M,V]=normstat(mu,sigma)legend('pdf','cdf',-1)0.30.2

pdfcdf0.100 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5x=μ对称的钟形曲线(μ±σ有一个拐点)x=μF(x)=0.5。M=2.5000V=0.3600逆累积分布函数逆累积分布函数就是返回给定概率条件下的自变量的临界值,实际上是分布函数的逆函数。icdf(InverseCumulativeDistributionFunction)即:在分布函数F(x)=p中已知p求其相对应的x的值inv如:X=norminv(p,mu,sgm)也有2)X=icdf(‘name’,p,A1,A2,A3),其中name为相应的函数名,如‘normal’;p为给定的概率值;A1,A2,A3为相应的参数N(0,1)0.1,0.3,0.5,0.7,0.9x的值命令:y=0.1:0.2:0.9;x=norminv(y,0,1)结果:x=-1.2816 -0.52440 0.5244 1.2816检验:y1=normcdf(x,0,1);y1=0.1000 0.3000 0.5000 0.7000 0.9000b(10,0.5)0.1,0.3,0.5,0.7,0.9x的值命令:p=0.1:0.2:0.9;x=binoinv(p,10,0.5)结果:x=3 4 5 6 7检验:y1=binocdf(x,10,0.5);结果:y1=0.1719 0.3770 0.6230 0.8281 0.9453在离散分布情形下,icdf返回使cdf(x)p的第一个值x上例中,对p=0.1,对应cdf(x)0.1的第一个值为3,故返回值为3B(10,0.5)的分布函数图像分位点定义:上α分位点:设随机变量X的分布函数为:F(x),如果实数𝑥𝛼满足P(X>𝑥𝛼)=α,则称𝑥𝛼为上α分位点例14、计算自由度为8的卡方分布的上α分位点,其中α=0.1,0.05,0.025命令:x=[0.1,0.05,0.025];x=[0.1,0.05,0.025];y=chi2inv(1-x,8)结果:y=13.361615.507317.5345例标准正态分布α分位数的概念图示。解>>%α分位数示意图(标准正态分布,α=0.05)clear,clfdata=normrnd(0,1,300,1);xalpha1=norminv(0.05,0,1);xalpha2=norminv(0.95,0,1);subplot(3,1,1)subplot(3,1,2)capaplot(data,[xalpha2,inf]);axis([-3,3,0,0.45])subplot(3,1,3)holdonholdoffxalpha1 xalpha2 xalpha3 xalpha40.40.20-30.40.20-30.40.20-3

ProbabilityBetweenLimits=0.063571-2 -1 0 1 2 3ProbabilityBetweenLimits=0.058995-2 -1 0 1 2 3ProbabilityBetweenLimits=0.031504-2 -1 0 1 2 3xalpha1=-1.6449xalpha2= 1.6449xalpha3=-1.9600 xalpha4= 1.9600中心极限定理例1利用随机数样本验证中心极限定理独立同分布的随机变量的和的极限分布服从正态分布,通过产生容量为npoissexp分布的样本,研究其和的渐近分布。算法如下:①n②将随机数样本和标准化;③重复①、②;④验证所得标准化的随机数样本和是否服从标准正态分布>>clearn=2000;s=0;y=[];lamda=4;a=lamda;fori=1:nr=poissrnd(a,n,1);%可换成r=exprnd(a,n,1);end

means=mean(r);%计算样本均值s=std(r);%计算样本标准差y(i)=sqrt(n).*(means-a)./sqrt(s);normplot(y);%分布的正态性检验title('poiss分布,中心极限定理')poiss分布,中心极限定理0.9990.9970.990.980.950.90bbaboP

0.750.5050.020.010.0030.001-5 -4 -3 -2 -1 0Data

1 2 3 4 5exp分布,中心极限定理0.9990.9970.990.9990.9970.990.980.950.900.750.5050.020.010.0030.001-6-4-202468DatabbaboP棣莫弗-拉普拉斯定理的应用Galton钉板模型和二项分布Galton钉板试验是由英国生物统计学家和人类学家Galton设计的。故而得名。CaltonDeMoivre-Laplace中心极限定理。模拟Galton钉板试验的步骤:XY中。Galtonpq=1-pp=0.5,表示向左向右的机会是相同的。urand(m,n)。rand(m,n)m×n个(0,1)m×n配合使用,这里s是一个正整数,例如>>rand('seed',1),u=rand(1,6)

du= 0.5129 0.4605 0.3504 0.0950 0.4337 0.7092seed的值,如>>rand('seed',2),u=rand(1,6)u= 0.0258 0.9210 0.7008 0.1901 0.8673 0.4185这样结果才会产生变化。将[0,1][0,p)和[p,1]u属于[0,p),让小球向右落下;u属于[p,1]n次,并用直线连接小球落下时所经过的点,这样就模拟了小球从顶端随机地落人某一格子的过程。m(m=50100500等等),计算落在im中所占的比例,这样当模拟结束时,就得到了频率用频率反映小球的堆积形状用如下动画指令制作动画:movien(n)Getframe:拷贝动画矩阵;movie(Mat,m):播放动画矩阵m次。M文件如下:解:>>clear,clf,m=100;n=5;y0=2;%设置参数ballnum=zeros(1,n+1);p=0.5;q=1-p;fori=n+1:-1:1 %创建钉子的坐标x(i,1)=0.5*(n-i+1)y(i,1)=(n-i+1)+y0;forj=2:ix(i,j)=x(i,1)+(j-1)*1;y(i,j)=y(i,1);endendmm=moviein(m); %fori=1:ms=rand(1,n);%产生n个随机数xi=x(1,1);yi=y(1,1);k=1;l=1;%小球遇到第一个钉子forj=1:nplot(x(1:n,:),y(1:n,:),‘o’,x(n+1,:),y(n+1,:),‘-.’),%画钉子的位置axis([-2n+20y0+n+1]),holdonk=k+1;%小球下落一格ifs(j)>pl=l+0;%小球左移elseend

l=l+1;%小球右移end

xt=x(k,l);yt=y(k,l);%小球下落点的坐标h=plot([xi,xt],[yi,yt]);axis([-2n+20y0+n+1])%画小球运动轨迹xi=xt;yi=yt;end

ballnum(l)=ballnum(l)+1; %ballnum1=3*ballnum./m;bar([0:n],ballnum1),axis([-2n+20y0+n+1])%画各格子的频率mm(i)=getframe; %holdoffmovie(mm,1) %播放动画一次876543210-2 -1 0 1 2 3 4 5 6 7876543210-2 -1 0 1 2 3 4 5 6 7876543210-2 -1 0 1 2 3 4 5 6 7876543210-2 -1 0 1 2 3 4 5 6 7876543210-2 -1 0 1 2 3 4 5 6 7876543210-2 -1 0 1 2 3 4 5 6 7876543210-2 -1 0 1 2 3 4 5 6 7……第三部分:数理统计数理统计Matlab统计工具箱中常见的统计命令直方图和箱线图实验抽样分布实验参数估计和假设检验实验Matlab统计工具箱中常见的统计命令1、基本统计量对于随机变量x,计算其基本统计量的命令如下:均值:mean(x) 标准差:std(x)中位数:median(x) 方差:var(x)偏度:skewness(x) 2、频数直方图的描绘A、给出数组data的频数表的命令为:[N,X]=hist(data,k) 此命令将区间[min(data),max(data)]k个小区间(data落在每一个小区间的频数NX。Bdatahist(data,k)3、参数估计A、对于正态总体,点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci]=normfit(x,alpha)alphax的参数alphamuhat是均值的区间估计,sigmaci是标准差的区间估计。B、对其他分布总体,两种处理办法:一是取容量充分大的样本,按中心极限定理,它近似服从正态分布,仍可用上面估计公式计算;二是使用特定分布总体的估计命令,常用的命令如:[muhat,muci]=expfit(x,alpha)[lambdahat,lambdaci]=poissfit(x,alpha)[phatpci]=weibfit(x,alpha)4、正态总体假设检验Az检验:[h,sig,ci]=ztest(x,m,sigma,alpha,tail)xsigma为已知方差,alpha为显著性水平,究竟检验什么假设取决于tail的取值:tail=0,检验假设“x的均值等于m”tail=1,检验假设“x的均值大于m”tail=-1,检验假设“xm”tail0,alpha5%。hh=0假设,sig为假设成立的概率,ci1alpha置信区间。Bt检验:[h,sig,ci]=ttest(x,m,alpha,tail)Ct检验:5、非参数检验:总体分布的检验Matlab统计工具箱提供了两个对总体分布进行检验的命令:Ah=normplot(x)x形显示出直线形态,而其他概率分布函数显示出曲线形态。B、h=weibplot(x)此命令显示数据矩阵xWeibullWeibull分布,则图形显示出直线形态,而其他概率分布函数显示出曲线形态。例1在同一坐标轴上画box图,并对两个班的成绩进行初步的分析比较。30法组织教学,现得期末考试成绩如下。58,92,79,92,65,56,85,73,61,71,42,89B:57,67,64,54,77,65,71,58,59,69,67,84,63,95,81,46,49,60,64,66,74,55,58,63,65,68,76,72,48,72解>>clearx=[82,92,77,62,70,36,80,100,74,64,63,56,72,78,68,65,72,70,58,92,79,92,65,56,85,73,61,71,42,89,57,67,64,54,77,65,7158,59,69,67,84,63,95,81,46,49,60,64,66,74,55,58,63,65,68,76,72,48,72];boxplot(x')10090807060504012(对称班成绩较为分散(方差大B班成绩则较集中(方差小)AB班(A25%低分段B班中值线,AB25%高分段下限)。A班的平均成绩约为70分(中值65分(中值)A班有一名同学的成绩过低(离群),而B班成绩优秀的只有一人(离群)。需要注意的是,从图中我们不能得出新教学方法一定优于传统教学方法的结论,因为我们并不知道两个班级原有的数学基础是怎样的。 例2 用模拟试验的方法直观地验证教材§6.3 假定变量X~N,用随机数生成的方法模拟对 的500次简单随机抽样, 每个样本的容量为16。利用这500×16个样本数据直观地验证样本均值 的抽样布为均值等于60、方差等于25/16 X~N622解1、用随机数生成的方法模拟简单随机抽样x=[];%生成一个存放样本数据的空表(维数可变的动态矩阵)forbyk=1:500%循环控制,循环执行下面的指令500次,本例中相当于500次抽样xx=normrnd(60,5,16,1);%生成一个来自N(60,25)的容量为16的样本(列向量)x=[x,xx];%将样本数据逐列存入数表x,可从matlab的变量浏览器(workspace)中观察这个数表end%2、计算每个样本的样本均值(1~500)xmean=mean(x);%可从变量浏览器中观察这500个数据%3500k=ceil(1.87*(length(x)-1)^(2/5));%确定分组数h=histfit(xmean,k);%绘制附正态参考曲线的数据直方图set(h(1),'FaceColor','c','EdgeColor','w')%修饰,设置直方图线条颜色与填充色%4、用这500个样本均值数据验证样本均值的均值和方差M=mean(xmean)%求(1~500)样本的样本均值的均值V=var(xmean)%求(1~500)样本的样本均值的方差例3观察:用binornd模拟5000次投球过程,观察小球堆积的情况。>>clear;clf,n=5;p=0.5;m=5000;x=[0:1:n]rand('seed',3)R=binornd(n,p,1,m);%模拟服从二项分布的随机数,相当于模拟投球m次forI=1:n+1%开始计数k=[];k=find(R==(I-1));%findR中等于(I-1)元素k中h(I)=length(k)/m;%计算落于编号(I-1)的格子中的小球频率endbar(x,h),axis([-1601])%画频率图title('\fontsize{18}\fontname{华文新魏}5000次投球小球堆积的频率图')>>f=binopdf(x,n,p),bar(x,f),axis([-1601])title('\fontsize{18}\fontname{华文新魏}B(5,0.5)理论分布图')3.抽样分布MATLABpdfcdfrnd类函数,具体分布类型函数名称如下:分布类型 MATLAB名称分布 chi2t分布 tF分布 f非中心分布 ncx2非中心t分布 nct非中心F分布 ncf例42分布的密度函数曲线解:>>%绘制不同自由度的卡方分布概率密度曲线clear,clfX=linspace(0,20,100);Y1=chi2pdf(X,1);%1Y2=chi2pdf(X,3);%3Y3=chi2pdf(X,6);%6plot(X,Y1,'-g',X,Y2,'-b',X,Y3,'-k')title('\fontsize{18}\fontname{华文新魏}不同自由度的{\chi}^2分布概率密度曲线的比较')text(0.6,0.6,'\fontsize{12}df:n=1')text(2.6,0.2,'\fontsize{12}df:n=3')text(8.6,0.09,'\fontsize{12}df:n=6')legend('df:n=1','df:n=3','df:n=6')例5 t分布的密度函数曲线。解:>>%绘制tclear,clfX=linspace(-4,4,100);Y0=normpdf(X,0,1);%标准正态分布Y1=tpdf(X,45);%自由度为45Y2=tpdf(X,4);%自由度为4Y3=tpdf(X,2);%自由度为2YY0=normpdf(0,0,1);plot(X,Y0,'.b',X,Y1,'-c',X,Y2,'-m',X,Y3,'-k',[0,0],[0,YY0],':r')title('\fontsize{18}\fontname{华文新魏}不同自由度的t分布概率密度曲线')legend('N(0,1)','df:n=45','df:n=4','df:n=2')例6 F分布的密度函数曲线。解:>>%绘制F分布概率密度曲线clear,clfX=linspace(0,6,100);Y=fpdf(X,10,5);%10,5plot(X,Y)text(1.5,0.55,'\fontsize{14}df:n1=10,n2=5')0.70.6df:n1=10,n2=0.20.100 1 2 3 4 5 6例7 自由度对F分布的密度函数曲线的影响解:>>clear,clfX=linspace(0,6,100);Y11=fpdf(X,100,10);%100,10Y12=fpdf(X,5,10);%自由度为5,10Y21=fpdf(X,10,100);%自由度为10,100Y22=fpdf(X,10,5);%10,5subplot(2,1,1)plot(X,Y11,X,Y12)legend('df:n1=100,n2=10','df:n1=5,n2=10')title('\fontsize{18}\fontname{华文新魏}F分布概率密度曲线')subplot(2,1,2)plot(X,Y21,X,Y22)legend('df:n1=10,n2=100','df:n1=10,n2=5')例8 机械零件的可靠度计算问题。NND均值为m,0.5mmδ412MPa15.6MPa,计算其可靠度。问题分析:拉杆应力表达式:S 4P2

,其中拉力P和尺寸公差d是影响S的独立正态分布随机变量,其均值和标准差皆已知: 20000N,P

2000N;d

20mm,d

0.5mm拉杆材料强度(许用应力)δ知: 412MPa, 15.6MPa 根据材料力学中的应力强度理论进行分析计算(过程略),得可靠度的结果为:0.约等于1。通过多次蒙特卡洛试验,统计可靠零件个数,求出其占总零件数的比值,即为可靠度。>>N=100000;St=0;P_mean=20000;P_sigma=2000;D_mean=20;D_sigma=0.5;Q_mean=412*10^6;Q_sigma=15.6*10^6;fori=1:Np=P_mean+P_sigma*randn(1);d=D_mean+D_sigma*randn(1);q=Q_mean+Q_sigma*randn(1);s=(4*p)/(pi*d^2);ifs<=qSt=St+1;endendSt_p=St/N;fprintf('可靠度为:%f\n',St_p)可靠度为:1.0000002. 参数估计和假设检验例9 一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障故障是完全随机的,并假定生产任一零件时出现故障机会均相同,工作人员是通过检查零件来确定工序是否出现故障的。现积累有100次故障纪录,故障出现该刀具完成的零件数如下:459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851试观察该刀具出现故障时完成的零件数属于哪种分布?>>%数据输入x1=[459362624542509584433748815505];x2=[612452434982640742565706593680];x3=[9266531644877346084281153593844];x4=[527552513781474388824538862659];x5=[77585975549697515628954771609];x6=[402960885610292837473677358638];x7=[699634555570844166061062484120];x8=[447654564339280246687539790581];x9=[621724531512577496468499544645];x10=[764558378765666763217715310851];x=[x1x2x3x4x5x6x7x8x9x10];%作频数直方图hist(x,10)[N,X]=hist(x,10)%分布的正态性检验normplot(x)N= 3 3 7 14 24 22 14 8 3 2X= 1.0e+003*0.1042 0.2146 0.3250 0.4354 0.5458 0.6562 0.76660.8770 0.9874 1.0978>>%参数估计[muhat,sigmahat,muci,sigmaci]=normfit(x)muhat=594sigmahat=204.1301muci= 553.4962 634.5038sigmaci=179.2276 237.1329刀具寿命服从正态分布,均值估计值为594,方差估计值为204.1301,均值的95%置信区间为[553.4962,634.5038],方差的95%置信区间为[179.2276,237.1329]%假设检验[h,sig,ci]=ttest(x,594)%已知刀具寿命服从正态分布,方差未知的情况下,检验寿命均值是否等于594。h= 0sig=1ci=553.4962 634.5038594理的。95%置信区间为[553.4962,634.5038]594,估计精度较高。sig10.05,不可拒绝原假设所以可以认为刀具平均寿命为594(件)第四部分:随机变量分布的关联与生成四、随机变量分布的关联与生成随机变量的取值范畴、分布函数及几何特征RV分布的关联及随机模拟生成算法原理RV的取值范畴、分布函数及几何特征连续型和离散型随机变量概率分布的取值范围和几何特征表1 连续型分布函数(密度函数)的形态与取值范畴分类表 a,b

fx 对称,a,bR

f(x)偏态,a布类名

U,bS,b

Ua,bSa,b

LN2,;a,b

N,2

JN2tn

E

2n,

n Cauchy b

E

Fn,n

Laplace,bfx fx

1fx

1 2fx度fx的几何形态

o a

x x xo ob b表2 离散型随机变量分布及其取值个数分类表的可能取值对应的分布律Pk个数

K的物理内涵k0,1knpkqn-k0,1,k

1BAnBA有限 n时即二点分

k,

k

p p

n次B试验中事件A分别取k次1 1 r

r k! k!1 2 r i ikii

1 rirknii=1

ri

kni当r1时,B1,n,p即Bn,p这里B试验指伯努利试验表2 离散型随机变量分布及其取值个数分类表(续表)的可能取值对应的分布律Pk个数

K的物理内涵~Gp,Pkqk1p,q1p,k1,2, BA~Pascalr,p又称负二项分布可列

出现的试验次数任意次B试验中,事件A首Pk

k-1 prqk1,r-1

次出现r次时的实验次数当r1时,Pascal1,p即Gp几何分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论