




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率论与数理统计实验
概率论与数理统计是研究“随机现象”数量规律的一门学科.概率论与数理统计的应用非常广泛,几乎遍及自然科学,社会科学,工程技术,军事科学及生活实际等各领域.
通过学习“概率论与数理统计”,就能用概率论的思想和观点观察、处理“随机”事件;并对“数据”发生兴趣,能善于发现、善于处理各种数据资料.
在MATLAB中,提供了专门工具箱Statistics,该工具箱有几百个专门求解概率统计问题的功能函数,使用它们可很方便地解决实际问题.
本章介绍概率统计中的相关MATLAB命令,求解概率分布、随机数和统计量的数字特征.Contents8.1.1离散型随机变量8.1.2连续型随机变量随机变量及其分布8.1随机数8.2统计量的数字特征8.3蒙特卡罗方法8.48.1随机变量及其分布随机变量有离散型和连续型两种.8.1.1离散型随机变量
离散型随机变量的概率规律可以用分布律和分布函数来描述.定义8.1
设离散型随机变量X取值xk时的概率为,则称X的所有取值及取值的概率为离散型随机变量X的分布律,记作P{X=xk}=pk,k=1,2,⋯也可列表如表8-1所示.pkk=1,2,⋯
定义8.2设X是随机变量,x为任意实数,则称函数为随机变量X的分布函数,记作
.离散型随机变量X的分布函数为常见的离散型分布:1.二项分布B(n,p)
若离散型随机变量X的分布律为
其中0<p<1,则称X服从二项分布,记作.2.泊松分布若离散型随机变量X的分布律为其中λ>0,则称X服从参数为的泊松分布,记作
泊松分布描述了大量试验中,稀有事件(即概率较小事件)出现次数的概率分布.例如,操作系统出现故障的次数、商店中贵重商品出售的件数、布匹上的瑕疵点数等,一般可以看作服从泊松分布.8.1.2连续型随机变量
连续型随机变量的概率特征,主要用概率密度函数和分布函数来描述.
定义8.3设X是在实数域或区间上连续取值的随机变量,随机变量X的分布函数为F(x).
若存在非负可积函数f(x),使得对于任意实数x,有
则称X为连续型随机变量,并称f(x)是X的概率密度函数.常见的连续型分布:1.均匀分布若随机变量X的概率密度为则称随机变量X
服从[a,b]上的均匀分布,记作.2.指数分布若随机变量X的概率密度为
其中
为常数,则称随机变量X服从参数为
的指数分布,记作.3.正态分布若随机变量X的概率密度为其中σ>0,则称随机变量X服从参数为μ,σ的正态分布,记作.
在MATLAB中,常见的分布的函数如表8-2所示.表8-2常用的分布
对每一种分布提供5类运算功能,见表8-3.表8-3概率分布的运算功能
当需要某一分布的某类运算功能时,将分布字符与功能字符连接起来,就得到所要的命令,例如表8-4.表8-4常用的概率密度函数例8.1绘制正态分布N(3,22)和泊松分布π(5)密度函数的图像.解>>x=-2:0.1:8;
>>y=normpdf(x,3,2);
>>plot(x,y,'+')
>>x=0:15;
>>y=poisspdf(x,5);
>>plot(x,y,'+')正态分布和泊松分布密度函数的图像分别如图8-1a和8-1b所示.ab图8-1密度函数图像例8.2求二项分布B(20,0.2)和泊松分布P(6)的期望和方差.解>>[M,V]=binostat(20,0.2)M=4V=3.2000>>[M,V]=poisstat(6)M=6V=6可得二项分布B(20,0.2)的期望和方差分别为4、3.2;泊松分布P(6)的期望和方差分别为6、6.
例8.3某一急救中心在长度为t的时间间隔内收到的紧急呼救次数服从参数为t/2的泊松分布,而与时间间隔的起点无关(时间以小时计),求:(1)在某一天中午12时至下午3时没有收到紧急呼救的概率;(2)某一天中午12时至下午5时至少收到1次紧急呼救的概率.解本题计算需调用函数poisscdf,格式为poisscdf(x,λ),返回(1)>>P1=poisscdf(0,3/2)P1=0.2231可知中午12时至下午3时没有收到紧急呼救的概率为0.2231.(2)>>P2=1-poisscdf(0,5/2)P2=0.9179可知中午12时至下午5时至少收到1次紧急呼救的概率为0.9179.8.2随机数常用的生成随机数的命令及调用格式如下:①
rand(m,n)生成(0,1)上均匀分布的m行n列随机数矩阵②
randn(m,n)生成标准正态分布N(0,1)的m行n列随机数矩阵③
randperm(N)生成1,2,...,N的一个随机排列④
random(‘name’,A1,A2,A3,m,n)生成以A1,A2,A3为参数的m行n列随机数矩阵,name指定分布类型(见表1)⑤
unidrnd(N,m,n)生成1,2,...,N的等概率m行n列随机数矩阵⑥
binornd(k,p,m,n)生成参数为k,p的m行n列随机数矩阵⑦
unifrnd(a,b,m,n)生成[a,b]区间上连续型均匀分布m行n列随机数矩阵⑧
normrnd(mu,sigma,m,n)生成均值为mu,标准差为sigma的m行n列正态分布随机数矩阵⑨
perms(1:n)生成一个1,2,...,n的全排列,共n!个例8.4生成随机矩阵.>>rand(1)%生成一个(0,1)间的随机数ans=0.8853>>rand(2,2)%生成一个2×2阶(0,1)间的随机数矩阵ans=0.64830.09530.46630.9678>>randperm(5)%生成一个1~5的随机整数排列ans=23514例8.5产生一个3行4列均值为2,标准差为0.3的正态分布随机数.解>>y=random('norm',2,0.3,3,4)y=1.94782.05841.42321.65751.81542.66891.99362.10461.80292.31571.60962.1730
解>>p1=normcdf(6,4,3)-normcdf(3,4,3)p1=0.3781>>p2=1-normcdf(3,4,3)p2=0.6306可得P{3<X<6}=0.3781,P{X>3}=0.6306.例8.7随机投掷均匀硬币,观察国徽朝上与国徽朝下的频率.
在命令行窗口调用fun87(3000),fun87(5000),……,fun87(10000000)得到结果如表8-5所示.表8-5国徽朝上与国徽朝下的频率
8.3统计量的数字特征
8.3.1统计图常用的统计作图命令调用格式如下:①
histogram(X,nbins)基于
X
创建直方图,用正整数
nbins
指定bin数目.②
polarhistogram(theta,nbins)在极坐标中创建一个直方图,theta指定弧度值,用正整数
nbins
指定bin数目.③
boxplot(x)
创建
x
中数据的箱线图.如果
x
是向量,
boxplot
绘制一个箱子.如果
x
是矩阵,boxplot
为
x
的每列绘制一个箱子.
例8.8生成10000个随机数并创建直方图;创建由介于0和2之间的值组成的向量,生成一个直方图,该直方图显示划分为六个bin的数据.解>>x=randn(10000,1);>>h=histogram(x)>>theta=[0.11.15.43.42.34.53.23.45.62.32.13.50.66.1];>>polarhistogram(theta,6)得到图形如图8-2所示.图8-2直方图
例8.9两个教学班各30名同学,在数学课程上,A班用新教学方法组织教学,B班用传统方法组织教学,现得期末考试成绩如下:A:82,92,77,62,70,36,80,100,74,64,63,56,72,78,68,65,72,70,58,92,79,92,65,56,85,73,61,71,42,89B:57,67,64,54,77,65,71,58,59,69,67,84,63,95,81,46,49,60,64,66,74,55,58,63,65,68,76,72,48,72在同一坐标轴上画box图,并对两个班的成绩进行初步的分析比较.解clearx=[82,92,77,62,70,36,80,100,74,64,63,56,72,78,68,65,72,70,58,92,79,92,65,56,85,73,61,71,42,89;57,67,64,54,77,65,71,58,59,69,67,84,63,95,81,46,49,60,64,66,74,55,58,63,65,68,76,72,48,72]';boxplot(x)得到图形如图8-3所示.图8-3箱线图
从图中直观地看出,两个班成绩的分布是正态(对称)的,A班成绩较为分散(方差大),B班成绩则较集中(方差小).A班成绩明显高于B班(均值比较.并且A班25%低分段上限接近B班中值线,A班中值线接近B班25%高分段下限).A班的平均成绩约为70分(中值),B班约为65分(中值).A班有一名同学的成绩过低(离群),而B班成绩优秀的只有一人(离群).(1)表示位置的统计量—平均值和中位数平均值(简称均值)描述数据取值的平均位置,记作
中位数是将数据由小到大排序后位于中间位置的那个数值.Matlab中mean(x)返回x的均值,median(x)返回中位数.8.3.2
统计量
假设有一个容量为n
的样本(即一组数据),记作
需要对它进行一定的加工,才能提出有用的信息,用作对总体(分布)参数的估计和检验.统计量就是加工出来的、反映样本数量特征的函数,它不含任何未知量.下面我们介绍几种常用的统计量.(2)表示变异程度的统计量—标准差、方差和极差标准差s定义为
它是各个数据与均值偏离程度的度量,这种偏离不妨称为变异.方差是标准差的平方s2.极差是
的最大值与最小值之差.Matlab中std(x)返回x的标准差,var(x)返回方差,range(x)返回极差.其他常见数学特征函数见表8-6.表8-6其他常见数学特征函数函数名称函数名称min(x)最小值nanmin(x)忽略样本中非数求最小值max(x)最大值nanmax(x)忽略样本中非数求最大值sum(x)元素的总和trimmean(x,p)剔除上下各(p/2)%数据后均值moment(x,n)样本n阶中心矩range(x)样本最大值与最小值之差skewness(x)样本偏度kurtosis(x)样本峰度例8.10函数max和min的使用.解>>A=magic(4)A=16231351110897612414151>>max(A)%默认求矩阵A各列元素的最大值ans=16141513>>max(max(A))%求矩阵A的最大值ans=16>>max(A,[],2)%求矩阵A各行元素的最大值ans=16111215>>[C,I]=min(A)%求矩阵A的最小值并返回下标C=4231I=4114例8.11
学校随机抽取100名学生,测量他们的身高和体重,所得数据如表8-7.解数据输入通常有两种方法,一种是在交互环境中直接输入,如果在统计中数据量比较大,这样作不太方便;另一种办法是先把数据写入一个纯文本数据文件data.txt中,格式如表8-7,有20行、10列,数据列之间用空格键或Tab键分割,该数据文件data.txt存放在matlab\work子目录下,在Matlab中用load命令读入数据.身高体重身高体重身高体重身高体重身高体重17275171621666216055155571735816655170631675317360178601737316347165661706016350172571826317159177641695516867168651756717664168501614916963171611786417766170581736717259170621725917758176681756818470169641655216459173741726916952173571736116670163571705616065165581776616963176601776717256165561664917165169621705817264169581677217576164591666316954167541796217663182691867716676169721735916965171711674716865165641685717657170571585116562172531696616958172501625217575174661676316650174641686217059表8-7学校100名学生的身高和体重clcloaddata.txthigh=data(:,1:2:9);high=high(:);%将身高数据存储在high中weight=data(:,2:2:10);weight=weight(:);%将体重数据存储在weight中shuju=[highweight];jun_zhi=mean([highweight])zhong_wei_shu=median(shuju)biao_zhun_cha=std(shuju)ji_cha=range(shuju)pian_du=skewness(shuju)feng_du=kurtosis(shuju)得到结果jun_zhi=170.250061.2700%身高和体重的均值分别为170.2500、61.2700zhong_wei_shu=17062%身高和体重的中位数分别为170、62biao_zhun_cha=5.40186.8929%身高和体重的标准差分别为5.4018、6.8929ji_cha=3130%身高和体重的极差分别为31、30pian_du=0.15450.1380%身高和体重的偏度分别为0.1545、0.1380feng_du=3.55732.6644%身高和体重的峰度分别为3.5573、2.66448.4蒙特卡罗方法
随机模拟方法,也称为蒙特卡罗(MonteCarlo)方法,是一种基于“随机数”的计算方法.它以概率统计理论为基础,通过对研究的问题或系统进行随机抽样,然后对样本值进行统计分析,进而得到所研究问题或系统的某些具体参数、统计量等.
在实际生活中,大量问题包含着随机性因素,这时进行随机模拟是一种有效的方式.随着模拟次数的增多,其精度也逐渐增高.由于需要大量反复的计算,一般用计算机来完成.蒙特卡罗方法在金融工程学,宏观经济学,计算物理学(如粒子输运计算、量子热力学计算、空气动力学计算)等领域应用广泛。
图8-4正方形的内切圆
解在一个面积为4的长方形内随机投点,该点落在此区域的概率为该区域的面积与长方形的面积比值,即p=S:4,可得S=4p.
MATLAB命令如下:p=rand(10000,2);x=2*p(:,1)-1;y=2*p(:,2);N=find(y<=2-x.^2&y.^3>=x.^2);
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 木案板企业数字化转型与智慧升级战略研究报告
- 医学级美白隔离霜行业跨境出海战略研究报告
- 减肥产品跨境合作行业深度调研及发展战略咨询报告
- 酯胶企业县域市场拓展与下沉战略研究报告
- 土方工合同范本
- 辅助器材在少儿蛙泳初级教学中的应用研究
- 橡木浴室柜企业ESG实践与创新战略研究报告
- 石场开采合同范本
- 小分子糖醇与α-淀粉酶、胃蛋白酶和胰蛋白酶的相互作用研究
- 连二亚硫酸钾企业ESG实践与创新战略研究报告
- 森林防火安全生产工作
- 护理工作十四五规划
- 产后抑郁症讲课课件
- 人工智能背景下高职五育并举的人才培养研究
- 汽车行业维修记录管理制度
- IQC检验作业指导书
- 城市自来水厂课程设计
- 重庆市2024年小升初语文模拟考试试卷(含答案)
- 2024智慧城市数据采集标准规范
- 【人教版】《劳动教育》七上 劳动项目一 疏通厨房下水管道 课件
- 2024特斯拉的自动驾驶系统FSD发展历程、技术原理及未来展望分析报告
评论
0/150
提交评论