概率分布与统计推断_第1页
概率分布与统计推断_第2页
概率分布与统计推断_第3页
概率分布与统计推断_第4页
概率分布与统计推断_第5页
已阅读5页,还剩90页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率分布与统计推断第1页,共95页,2023年,2月20日,星期五一、随机变量的概率分布1.随机变量及其概率分布(1)随机变量:随机变量是定义在样本空间Ω的实函数,常用X,Y,Z等表示。它有两个特点:变异性与随机性。按取值情况分类:离散型、连续型。(2)分布函数:设X为随机变量,x为任意实数,称F(x)=P{X≤x}为随机变量X的概率分布函数或累积概率函数,简称分布函数。第2页,共95页,2023年,2月20日,星期五若随机变量X的分布函数F(x),则对任意x1与x2(x1<x2),P{x1<X≤x2}=F(x2)-F(x1)。若X为连续型随机变量,F(x)是X的分布函数,则存在非负函数f(x),对任意x,有称f(x)为随机变量X的概率密度。第3页,共95页,2023年,2月20日,星期五2.常见的概率分布:(1)离散型:概率密度(分布律)二项分布几何分布泊松分布第4页,共95页,2023年,2月20日,星期五(2)连续型:均匀分布:概率密度函数指数分布:概率密度函数第5页,共95页,2023年,2月20日,星期五-4-2024600.050.10.150.20.250.30.350.4正态分布:密度函数:标准正态分布:N(0,1)密度函数:第6页,共95页,2023年,2月20日,星期五Χ2分布:若随机变量X1,X2,…,Xn相互独立,都服从标准正态分布N(0,1),则随机变量服从自由度为n的分布,记为:的均值为n,方差为2n.第7页,共95页,2023年,2月20日,星期五

t-分布若X~N(0,1),且相互独立,则随机变量服从自由度为n的t分布,记为T~t(n),

t分布:t(20)的密度函数曲线和N(0,1)的密度函数曲线形状相似.时,第8页,共95页,2023年,2月20日,星期五

F-分布且相互独立,则随机变量服从自由度为(n1n2)的F分布,记为F~F(n1n2)。F(10,50)密度函数曲线:第9页,共95页,2023年,2月20日,星期五3.常见概率分布的MATLAB命令运算功能符:pdf:概率密度,cdf:分布函数,

inv:逆分布函数,stat:均值与方差,rnd:产生随机数概率分布符:分布均匀几何超几何指数正态Χ2tF二项泊松字符unifgeohypeexpnormchi2tfbionpoiss(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.)第10页,共95页,2023年,2月20日,星期五例1.1

(1)[x,y]=expstat(2),求出参数为2的指数分布的均值与方差。(2)a=[2,3]

[x,y]=expstat(a),(3)a=[2,3;3,4]

[x,y]=expstat(a),构成参数为2和参数为3的指数分布的均值数组与方差数组。构成参数为2和参数为3参数为3和参数为4的指数分布的均值矩阵与方差矩阵。第11页,共95页,2023年,2月20日,星期五

(4)x=normcdf(2,1,0.5),正态分布X~N(1,0.52)累计概率F(2)

(5)c=0:0.2:1x=normcdf(c,1,0.5),正态分布X~N(1,0.52)累计概率F(0),F(0.2),…,F(1)

(6)n=10;a=[];forj=1:na(j)=unifrnd(0,1)end

第12页,共95页,2023年,2月20日,星期五例1.2设若求P{1.8<X<2.9}

若P{X<x}=0.95,求x

分别绘出σ=0.2,0.5,0.9时的概率密度图像解(1)p=normcdf(2.9,2,0.5)-normcdf(1.8,2,0.5)得:

p=0.6195

(2)x=norminv(0.95,2,0.5)得:

x=2.8224第13页,共95页,2023年,2月20日,星期五

(3)x=-2:0.01:7;y1=normpdf(x,2,0.2);

y2=normpdf(x,2,0.5);

y3=normpdf(x,2,0.8);plot(x,y1,x,y2,x,y3)gtext(‘标准差0.2’)gtext(‘标准差0.5’)gtext(‘标准差0.8’)title(‘正态分布密度曲线’)第14页,共95页,2023年,2月20日,星期五clcclearx=-2:0.01:7;y1=normpdf(x,2,0.2);y2=normpdf(x,2,0.5);y3=normpdf(x,2,0.8);plot(x,y1,'r','linewidth',2)holdonplot(x,y2,'b','linewidth',2)plot(x,y3,'g','linewidth',2)gtext('标准差0.2')gtext('标准差0.5')gtext('标准差0.8')title('正态分布密度曲线')holdoff第15页,共95页,2023年,2月20日,星期五标准差0.5标准差0.2标准差0.8正态分布密度曲线第16页,共95页,2023年,2月20日,星期五例1.3报童的抉择:报童每天从发行商处购进报纸,晚上将没卖掉的报纸退回,每份报纸进价b元,零售价a元,退价c元,且a≥b≥c,每天报纸的需求量是随机的,为获得最大利润,报童每天应购进多少报纸?建立模型,并以a=1,b=0.8,c=0.75作实证分析。假设已作市场调查,据调查数据:需求100-119120-139140-159160-179180-199200-219220-239240-259260-279280~天数3913223235201582第17页,共95页,2023年,2月20日,星期五模型分析:报童面临两个矛盾的进货方式:(1)购进太多卖不完退回赔钱(2)购进太少不够销售赚钱少影响最终收入的两个因素:进货量n,报纸需求量r。报纸需求量r是随机的;进货量n是需要做出的决策变量。第18页,共95页,2023年,2月20日,星期五模型建立与求解:报童一天的收入:一天的平均收入:调查需求量的随机规律——每天需求量为r的概率f(r),r=0,1,2…第19页,共95页,2023年,2月20日,星期五目标函数:求解:将r视为连续变量,(概率密度)第20页,共95页,2023年,2月20日,星期五令:得:由经验常识知像报纸这样的商品的需求量大致服从正态分布,n可由累积逆概率求出。第21页,共95页,2023年,2月20日,星期五r

r1,r2,…,rn

概率

p1,p2,…,pn离散型随机变量分布律:均值:方差:需求100-119120-139140-159160-179180-199200-219220-239240-259260-279280~天数3913223235201582需求r110130150170190210230250270290概率3/s9/s13/s22/s32/s35/s20/s15/s8/s2/sS=159第22页,共95页,2023年,2月20日,星期五

a=1;b=0.8;c=0.75;q=(a-b)/(a-c);r=[3,9,13,22,32,35,20,15,8,2];rr=sum(r);x=110:20:290;rbar=r*x’/rrs=sqrt(r*(x.^2)’/rr-rbar^2)n=norminv(q,rbar,s)得:rbar=199.4340,s=38.7095,n=232.0127需求量均值:199,标准差38,报童应购进232份报纸。第23页,共95页,2023年,2月20日,星期五二、样本的数字特征1.样本及其数字特征在数理统计中,将研究对象的全体称为总体,记为X,从总体中抽出的若干个体称为样本,记为X1,X2,…,Xn,样本的具体观测结果记为x1,x2,…,xn,它是完全确定的,又是随每次抽样观察而改变的一组数值。用样本构成函数,从而将分散于样本中的信息集中起来,就是统计量的概念。常用的统计量:第24页,共95页,2023年,2月20日,星期五中位数:数据由小到大排序后位于中间位置的那个数值.平均值:极差:称s为标准差,方差:设来自总体X的一组样本为:X1,X2,…,Xn(1)描述集中趋势的统计量(2)描述离中趋势的统计量第25页,共95页,2023年,2月20日,星期五(3)描述数据形态的统计量偏度:

偏度反映分布的对称性,g1>0称为右偏态,此时数据位于均值右边的比位于左边的多;

g1<0称为左偏态,情况相反;而g1接近0则可认为分布是对称的.峰度:

正态分布的峰度为3,若g2比3大很多,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一第26页,共95页,2023年,2月20日,星期五

k阶原点矩:

k阶中心矩:(4)样本的矩:第27页,共95页,2023年,2月20日,星期五将样本观察值依大小次序排列,得区间现的次数ni―频数。频率:统计样本观查值在每个小区间中出2.频数和频率:等分该区间,输出频数表:[n,y]=hist(x,k),k为等分区间数。输出频数直方图:hist(x,k)设来自总体X的一组样本为:X1,X2,…,Xn第28页,共95页,2023年,2月20日,星期五3.计算统计量的MATLAB命令均值:mean(x),中位数:median(x),标准差:std(x),方差var(x),偏度:skewness(x),峰度:kurtosis(x),原点矩:kurtosis(x,k),中心矩:moment(x,k).第29页,共95页,2023年,2月20日,星期五例2.1为设计公交车车门的高度,随机抽查了100名成年男子的身高(单位cm):x=[182,176,168,175,166,171,172,169,172,171,172,181,177,172,178,181,166,173,184,177,180,176,176,170,178,168,181,178,171,177,186,180,157,185,174,171,169,192,186,159,161,193,182,187,180,173,167,174,162,163,187,186,184,175,173,174,168,172,183,181,174,162,187,175,174,169,175,174,175,182,183,169,182,170,179,172,173,174,166,175,165,178,165,182,173,174,190,176,182,179,183,167,165,174,181,186,165,172,173,178]求出身高数据的均值、中位数,标准差、峰度,绘出频数直方图,若车门高度是按成年男子与车门顶碰头的机会不超过1%设计,求车门最低高度是多少?第30页,共95页,2023年,2月20日,星期五

x=[182,176,….];T=[mean(x),median(x),std(x),kurtosis(x)]得:T=[175.2000,174.5000,7.3691,2.7241]hist(x,7)第31页,共95页,2023年,2月20日,星期五设车门高度为h,成年男乘客身高是随机变量X,

h=norminv(0.99,175.2,7.3691)得:h=1.9234车门最低高度为:1.9234第32页,共95页,2023年,2月20日,星期五计算:即求h使:可用数值积分的方法求得;取h=185,190,…,195,计算上述积分,找出积分值大于0.99的所对应的h。第33页,共95页,2023年,2月20日,星期五Matlab中关于数值积分的命令:(1)quad函数:基于变步长simpson法计算积分。该函数调用格式:[I,n]=quad(‘fname’,a,b,Tol,trace)其中:‘fname是被积函数名

a,b是积分上下限

Tol是精度控制值,省却时取0.001Trace:控制是否显示展现积分过程,取0不展现

I:积分值

n:被积函数调用次数第34页,共95页,2023年,2月20日,星期五如:求积分ac=inline('sin(x)./x','x')s=quad(ac,pi/4,pi/2)如:求椭圆周长第35页,共95页,2023年,2月20日,星期五h=185:1:195;p=[];ab=inline('1/(7.3691*(2*pi)^0.5)*exp(-(x-175.2).^2/(2*7.3891^2))','x')fori=1:11h(i);p(i)=0.5+quad(ab,175.2,h(i));endA=[h;p]'第36页,共95页,2023年,2月20日,星期五A=185.00000.9087186.00000.9292187.00000.9461188.00000.9596189.00000.9704190.00000.9787191.00000.9851192.00000.9898193.00000.9933194.00000.9959195.00000.9977第37页,共95页,2023年,2月20日,星期五Matlab中关于数值积分的命令:(2)quad8函数:用8样条牛顿-柯特斯法计算积分。函数调用格式:[I,n]=quad8(‘fname’,a,b,Tol,trace)Tol是精度控制值,省却时取该函数可更精确的求定积分。(3)trapz函数:用梯形法计算积分,适用于被积函数为离散数据时,求函数的定积分。该函数调用格式:I=trapz(x,y)第38页,共95页,2023年,2月20日,星期五例2.2某地为了发展旅游产业及美化环境,规划将一片水域改造成一个景观湖,需测算该水域的面积,并计划沿湖修建一条观光道路。已在水域边界上测量了n个点的坐标(见表),现要求解决下列问题:

(1)做出该水域的平面图

(2)求出该水域面积的近似值

(3)求出该水域边界的周长第39页,共95页,2023年,2月20日,星期五表:湖的边界点实测坐标X215.028.652.061.875.492.9105.9Y138.518.612.45.810.623.836.838.8Y238.578.586.881.598.6114.2160.6172.8X121.1140.8157.2180.5216.8248.5279.8310.4Y125.428.718.838.650.520.45.432.8Y2176.6165.5158.6155.6186.8252.4268.8276.7X335.0360.6378.5400.1420.5448.5470.5493.1Y151.956.872.866.655.565.590.5170.4Y2275.4258.2235.2228.9198.5195.5188.1170.4第40页,共95页,2023年,2月20日,星期五A=[2,15.0,28.6,52.0,61.8,75.4,92.9,105.9;38.5,18.6,12.4,5.8,10.6,23.8,36.8,38.8;38.5,78.5,86.8,81.5,98.6,114.2,160.6,172.8;121.1,140.8,157.2,180.5,216.8,248.5,279.8,310.4;25.4,28.7,18.8,38.6,50.5,20.4,5.4,32.8;176.6,165.5,158.6,155.6,186.8,252.4,268.8,276.7;335.0,360.6,378.5,400.1,420.5,448.5,470.5,493.1;51.9,56.8,72.8,66.6,55.5,65.5,90.5,170.4;275.4,258.2,235.2,228.9,198.5,195.5,188.1,170.4];x=[A(1,:),A(4,:),A(7,:)];y1=[A(2,:),A(5,:),A(8,:)];y2=[A(3,:),A(6,:),A(9,:)];plot(x,y1,x,y2)axisequal第41页,共95页,2023年,2月20日,星期五A=[2,15.0,28.6,52.0,61.8,75.4,92.9,105.9;38.5,18.6,12.4,5.8,10.6,23.8,36.8,38.8;38.5,78.5,86.8,81.5,98.6,114.2,160.6,172.8;121.1,140.8,157.2,180.5,216.8,248.5,279.8,310.4;25.4,28.7,18.8,38.6,50.5,20.4,5.4,32.8;176.6,165.5,158.6,155.6,186.8,252.4,268.8,276.7;335.0,360.6,378.5,400.1,420.5,448.5,470.5,493.1;51.9,56.8,72.8,66.6,55.5,65.5,90.5,170.4;275.4,258.2,235.2,228.9,198.5,195.5,188.1,170.4];x=[A(1,:),A(4,:),A(7,:)];y1=[A(2,:),A(5,:),A(8,:)];y2=[A(3,:),A(6,:),A(9,:)];x1=fliplr(x);y21=fliplr(y2);x0=[x,x1];y0=[y1,y21]plot(x0,y0)axisequalfill(x0,y0,'b')Mianji=trapz(x,y2-y1)第42页,共95页,2023年,2月20日,星期五Mianji=7.3331e+004第43页,共95页,2023年,2月20日,星期五三、数据的处理1.数据矩阵的建立与常用的统计操作命令(1)由word文档建立数据矩阵(2)由excel文档建立数据矩阵(3)常用的统计操作命令

mean(A):求矩阵A的各列的均值

var(A):求矩阵A的各列的方差

std(A):求矩阵A的各列的标准差

rang(A):求矩阵A的各列的极差

cov(A):求矩阵A的各列的协方差矩阵

corrcoef(A):求矩阵A的各列的相关系数矩阵。第44页,共95页,2023年,2月20日,星期五2.向量的距离与夹角余弦(1)设两个n维向量称为向量x与y的欧氏距离。称为向量x与y的绝对距离。称为向量x与y的闵可夫斯基距离。第45页,共95页,2023年,2月20日,星期五称为向量x的2-范数。称向量x与向量y的夹角余弦第46页,共95页,2023年,2月20日,星期五(2)距离与夹角余弦的matlab命令

pdist(X)计算矩阵X每一行向量之间的欧氏距离。

pdist(X,’cityblock’)计算X每一行向量之间的绝对距离。

pdist(X,’cosine’)计算X每一行向量之间的夹角余弦。(注:实为1-夹角余弦)

dist(X,Y)计算矩阵X每一行向量与矩阵Y的每一列向量之间的欧氏距离。

mandist(X,Y)计算矩阵X每一行向量与矩阵Y的每一列向量之间的绝对距离。

sort(A):对列矩阵A的列元素从低到高排序。第47页,共95页,2023年,2月20日,星期五例3.1:2002年城镇居民家庭平均每人全年购买的主要商品数据如表所示,试比较哪两年数据差异最小,哪两年差异最大。项目19851990199519992000粮食134.76130.729784.9182.31鲜菜144.36138.7116.47114.94114.74食用油5.766.47.117.788.16猪肉16.6818.617.2416.9116.73牛羊肉2.023.282.443.093.33家禽3.243.423.974.925.44鲜蛋6.847.259.7410.9211.21水产品7.087.699.210.349.87食糖2.522.141.681.811.70数据来源:《2002年中国统计年鉴》,数据单位:kg第48页,共95页,2023年,2月20日,星期五A=[134.76,130.72,97,84.91,82.31;144.36,138.7,116.47,114.94,114.74;5.76,6.4,7.11,7.78,8.16;16.68,18.6,17.24,16.91,16.73;2.02,3.28,2.44,3.09,3.33;3.24,3.42,3.97,4.92,5.44;6.84,7.25,9.74,10.92,11.21;7.08,7.69,9.2,10.34,9.87;2.52,2.14,1.68,1.81,1.70];C=pdist(A','cosine');d1=pdist(A');d2=pdist(A','cityblock');B=[C',d1',d2'][P,i]=sort(B)第49页,共95页,2023年,2月20日,星期五B=0.00017.399915.10000.002947.118274.57000.009058.193192.32000.010960.565896.01000.002640.537263.87000.008751.872380.98000.010754.303984.65000.001912.373418.67000.002915.023822.50000.00012.76084.9900夹角余弦欧氏距离绝对距离第50页,共95页,2023年,2月20日,星期五P=0.00012.76084.99000.00017.399915.10000.001912.373418.67000.002615.023822.50000.002940.537263.87000.002947.118274.57000.008751.872380.98000.009054.303984.65000.010758.193192.32000.010960.565896.0100排序后的夹角余弦、欧氏距离、绝对距离第51页,共95页,2023年,2月20日,星期五i=101010111888599955222666377733444次序:结论:(1)1999年与2000年的数据差异最小。(2)1985年与2000年的数据差异最大。第52页,共95页,2023年,2月20日,星期五3.数据属性的处理(1)评价指标的无量纲化评价指标通常分为效益型、成本型、固定型等,效益型指标值越大越好、成本型指标值越小越好、固定型指标值既不能太大也不能太小为好。对方案进行综合评价,必须先进行指标的无量纲化处理。常见的处理方法有极差变换、线性比例变换设有m项评价指标的指标矩阵为第53页,共95页,2023年,2月20日,星期五用I1,I2,I3分别表示效益型,成本型和固定型指标集合,

用极差变换法建立无量纲的效益型矩阵B=(bij),:第54页,共95页,2023年,2月20日,星期五用线性比例法建立无量纲的效益型矩阵D=(dij)

:第55页,共95页,2023年,2月20日,星期五例3.2:(湖泊的水质的评价)近年来我国湖泊水质富营养化的问题日益严重,正确评价湖水的水质情况,有利于今后开展对湖水的污染治理和保护工作。下表2所列为我国12个湖泊评价参数实测数据,表1所列为我国对湖泊水质评价标准,试建立模型对我国的12个湖泊的水质进行评价,确定各个湖水质的等级。极贫营养贫营养中营养富营养极富营养总磷/(mg/L)<14

23110>660耗氧量(mg/L)<0.090.361.807.10>27.1透明度/m>37

12

2.4

0.55

<0.17总氮/(mg/L)

<0.02

0.06

0.31

1.20

>4.6表1湖泊水质评价标准第56页,共95页,2023年,2月20日,星期五总磷/(mg/L)耗氧量(mg/L)透明度/m总氮/(mg/L)杭州西湖13010.300.352.76武汉东湖10510.700.402.0青海湖201.44.50.22巢湖306.260.251.67滇池2010.130.500.23鄱阳湖1001.51.250.9太湖1398.690.8251.04洞庭湖1419.510.851.11洪泽湖1177.061.651.26阳澄湖409.71.3152.664洪湖457.831.651.33湖北武湖1078.11.521.075表2:全国12个湖泊的实测数据第57页,共95页,2023年,2月20日,星期五问题分析:如何归类?以距离最近原则进行归类。指标的量纲不同,数据的大小级别不同。对数据统一量纲,使用线性比例变换(12个湖泊的实测数据矩阵)第58页,共95页,2023年,2月20日,星期五A=[130,10.30,0.35,2.76;105,10.70,0.40,2.0;20,1.4,4.5,0.22;30,6.26,0.25,1.67;20,10.13,0.50,0.23;100,1.5,1.25,0.9;139,8.69,0.825,1.04;141,9.51,0.85,1.11;117,7.06,1.65,1.26;40,9.7,1.315,2.664;45,7.83,1.65,1.33;107,8.1,1.52,1.075];B=[A(:,1)./max(A(:,1)),A(:,2)./max(A(:,2)),min(A(:,3))./A(:,3),A(:,4)./max(A(:,4))]C=[1,4,23,110,660;0.09,0.36,1.80,7.10,27.1;37,12,2.4,0.55,0.17;0.02,0.06,0.31,1.20,4.6];D=[C(1,:)./max(C(1,:));C(2,:)./max(C(2,:));min(C(3,:))./C(3,:);C(4,:)./max(C(4,:))]mjd=mandist(B,D)[px,i]=sort(mjd');pp=i'第59页,共95页,2023年,2月20日,星期五B=0.92200.96260.71431.00000.74471.00000.62500.72460.14180.13080.05560.07970.21280.58501.00000.60510.14180.94670.50000.08330.70920.14020.20000.32610.98580.81210.30300.37681.00000.88880.29410.40220.82980.65980.15150.45650.28370.90650.19010.96520.31910.73180.15150.48190.75890.75700.16450.3895第60页,共95页,2023年,2月20日,星期五D=0.00150.00610.03480.16671.00000.00330.01330.06640.26201.00000.00460.01420.07080.30911.00000.00430.01300.06740.26091.0000第61页,共95页,2023年,2月20日,星期五mjd=3.58513.55233.35942.60030.40113.08053.04782.85482.09570.90570.39420.36140.19900.59073.59202.38912.35632.16341.40431.59711.65811.62541.43241.07802.32811.36171.32891.13600.83872.62452.46402.43132.23831.49131.52222.57132.53852.34561.61641.41492.08392.05111.85811.41421.90242.33182.29902.10611.58491.65441.67051.63781.44481.00092.31572.05612.02331.83031.36051.9302第62页,共95页,2023年,2月20日,星期五pp=543215432132145453214321543215453215432143521453214321543521等级杭州西湖5武汉东湖5青海湖3巢湖4滇池4鄱阳湖4太湖4洞庭湖5洪泽湖4阳澄湖4洪湖4湖北武湖4第63页,共95页,2023年,2月20日,星期五每股收益(元)每股净资产(元)每股现金流量净资产收益率(%)主营收入增长率(%)主营利润增长率(%)资产负债比率(%)海尔0.3965.6601.6507.2723.0946.2147.73海信0.3046.860-0.1304.54-4.5090.4052.79奥柯玛0.0151.6700.2300.885611.68-46.5978.85长虹0.0363.510-0.3301.040419.4626.5367.55苏泊尔0.2504.4960.1305.6135.9527.0527.47小天鹅0.2105.050-1.1604.3349.018.1759.75TCL0.0532.4830.1542.1412.23275.4665.73美的0.2205.1200.0405.0496.13172.0064.55美菱0.0725.195-0.7901.383113.41-50.0363.36格力0.3325.0601.1206.7868.9154.8475.49例3.3:(经营业绩的评价)下表为2011年第一季度10家家电类的上市公司的部分财务指标数据,要求根据这些数据对这10家公司的经营业绩做出合理的综合排名。第64页,共95页,2023年,2月20日,星期五输入原始数据矩阵X(1)用极差变换法建立无量纲的效益型矩阵B=(bij),:

B=[(X(:,1:6)-ones(10,1)*min(X(:,1:6))),max(X(:,7))-X(:,7)]./(ones(10,1)*range(X))第65页,共95页,2023年,2月20日,星期五(2)求出理想最佳和最劣方案向量U和V

U=[max(X(:,1:6)),min(X(:,7))]V=[min(X(:,1:6)),max(X(:,7))](3)计算相对偏差矩阵R和T

R=abs(X-ones(10,1)*U)./(ones(10,1)*range(X))T=abs(X-ones(10,1)*V)./(ones(10,1)*range(X))(4)求客观权向量w

r0=normc(R)t0=normc(T)w=sum(r0.*t0)/sum(sum(r0.*t0))(5)计算得分、排序

df=B*(w')[a,n]=sort(df)第66页,共95页,2023年,2月20日,星期五X=[0.396,5.660,1.650,7.27,23.09,46.21,47.73;0.304,6.860,-0.130,4.54,-4.50,90.40,52.79;0.015,1.670,0.230,0.8856,11.68,-46.59,78.85;0.036,3.510,-0.330,1.0404,19.46,26.53,67.55;0.250,4.496,0.130,5.61,35.95,27.05,27.47;0.210,5.050,-1.160,4.33,49.01,8.17,59.75;0.053,2.483,0.154,2.14,12.23,275.46,65.73;0.220,5.120,0.040,5.04,96.13,172.00,64.55;0.072,5.195,-0.790,1.3831,13.41,-50.03,63.36;0.332,5.060,1.120,6.78,68.91,54.84,75.49];B=[(X(:,1:6)-ones(10,1)*min(X(:,1:6))),max(X(:,7))-X(:,7)]./(ones(10,1)*range(X))U=[max(X(:,1:6)),min(X(:,7))]V=[min(X(:,1:6)),max(X(:,7))]R=abs(X-ones(10,1)*U)./(ones(10,1)*range(X))T=abs(X-ones(10,1)*V)./(ones(10,1)*range(X))第67页,共95页,2023年,2月20日,星期五r0=normc(R)t0=normc(T)w=sum(r0.*t0)/sum(sum(r0.*t0))df=B*(w')[a,n]=sort(df)aa=flipud(a)nn=flipud(n)第68页,共95页,2023年,2月20日,星期五

11085267943

0.69420.60060.59890.56750.51580.38580.34180.23320.21950.1079得分排名1海尔0.694212海信0.515853奥柯玛0.1079104长虹0.219595苏泊尔0.567546小天鹅0.385867TCL0.341878美的0.598939美菱0.2332810格力0.60062第69页,共95页,2023年,2月20日,星期五四、参数估计总体X的分布函数去估计某些未知参数或数字特征。参数估计问题:(一)点估计:构造统计量作为参数的估计值。1.矩估计法:用样本的k阶矩估计总体的k阶矩,得到k个方程求出k个参数第70页,共95页,2023年,2月20日,星期五例4.1设总体X的概率密度为:试求的矩估计。解:样本1阶矩:总体的1阶矩:第71页,共95页,2023年,2月20日,星期五2.极大似然估计法:设总体X的概率密度为为总体X的一组样本,为这组样本的观察值,构造似然函数:由求出第72页,共95页,2023年,2月20日,星期五(二)区间估计:求未知参数的范围,构造两个统计量使得:则称随机区间为参数θ的置信度为1-α的置信区间。

MATlAB统计工具箱中,参数估计的命令:fit

如:a=expfit(X):

指数分布参数的点估计值,

[a,b]=expfit(x,alpha):指数分布参数的区间估计值。

alpha:显著性水平第73页,共95页,2023年,2月20日,星期五例4.2有一批糖果,从中随机抽取16代,称得其重量(克)为:506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496。设袋装糖果的质量近似服从正态分布,试求总体均值和标准差的置信度为0.95的置信区间。x=[506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496];[a,b,ar,br]=normfit(x,0.05)第74页,共95页,2023年,2月20日,星期五五、假设检验对总体X的分布律或分布参数作某种假设,根据抽取的样本观察值,用数理统计的分析方法,检验这种假设是否正确,从而决定接受假设或拒绝假设.(一)单个正态总体均值检验1.已知总体X服从正态分布,方差σ2已知,对其均值μ的检验。设X1,X2,…,Xn为总体X的一组样本,第75页,共95页,2023年,2月20日,星期五(1)双边检验:原假设:备择假设:构造统计量:给定显著性水平,由计算临界值,得拒绝域第76页,共95页,2023年,2月20日,星期五(2)单边检验:原假设:备择假设:(或)构造统计量:给定显著性水平,由计算临界值,得拒绝域(或)第77页,共95页,2023年,2月20日,星期五[h,p,ci,zval]=ztest(x,m,sigma,alpha,tail)

x:检验数据,

m:原假设中的均值

alpha:显著性水平

tail:确定假设的情况

tail=0:双边检验,tail=1:右边检验(>),tail=-1:左边检验(<)

h=1:拒绝原假设,

h=0:不能拒绝原假设

p:检验成立的概率

ci:均值的置信区间

zval:统计量的值第78页,共95页,2023年,2月20日,星期五例5.1某车间用一台包装机包装奶粉,袋装奶粉的重量是一个随机变量,它服从正态分布,当机器正常时,其均值为0.5kg,标准差为0.015kg,假定标准差不变,某日开工后为检验包装机是否正常,随机抽取该机所包装的9袋奶粉,称得重量为:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512kg,问机器是否正常?(α=0.05)原假设H0:μ=0.5,备择假设H1

:μ≠0.5,显著性水平:

α=0.05第79页,共95页,2023年,2月20日,星期五x=[0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512];[h,p,ci,zval]=ztest(x,0.5,0.015,0.05,0)得:h=1,p=0.0248,ci=0.5014,0.52210,zval=2.2444因此拒绝原假设,认为包装机不正常。第80页,共95页,2023年,2月20日,星期五

2.已知总体X服从正态分布,方差σ2未知,对其均值μ的检验。使用的检验方法为t-检验。构造统计量:原假设H0备择假设H1拒绝域[h,p,ci,zval]=ttest(x,m,alpha,tail)第81页,共95页,2023年,2月20日,星期五例5.2某种电子元件,要求其使用寿命不得小于225h,现随机抽取16只该元件,测得其寿命(h)为:159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170。若该批元件寿命服从正态分布,问在显著性水平为α=0.05下,是否可认为该批元件合乎要求?解:检验方法为t-检验原假设H0:μ=225,备择假设H1

:μ<225,显著性水平:

α=0.05第82页,共95页,2023年,2月20日,星期五clcclearX=[199,280,201,232,224,379,179,264,222,362,168,250,149,260,485,190];[h,p,ci]=ttest(X,225,0.05,-1)h=0p=0.8852ci=-Inf291.5945接受原假设H0原假设H0成立的概率第83页,共95页,2023年,2月20日,星期五(二)两个正态总体均值检验1.已知总体X与总体Y服从正态分布,方差已知,对它们的均值μ1与μ2的检验原假设H0备择假设H1拒绝域统计量:第84页,共95页,2023年,2月20日,星期五2.已知总体X与总体Y服从正态分布,方差相等未知,对它们的均值μ1与μ2的检验原假设H0备择假设H1拒绝域统计量:第85页,共95页,2023年,2月20日,星期五[h,sig,ci,zval]=ttest2(x,y,alpha,tail)

x,y:检验数据,alpha:显著性水平

tail:确定假设的情况

tail=0:检验假设“x的均值等于y的均值”

tail=1:检验假设“x的均值大于y的均值”

tail=-1:检验假设“x的均值小于y的均值”

h=1:拒绝原假设,

h=0:不能拒绝原假设

sig:检验成立的概率

ci:x与y均值差的置信区间

zval:统计量的值第86页,共95页,2023年,2月20日,星期五(三)总体分布的检验1.JB检验法:[h,p,jbstat,cv]=jbtest(x,alpha)

h=1:拒绝X服从正态分布的假设。

h=0:不能拒绝X服从正态分布的假设。

jbstat:检验统计量的值。

cv:拒绝原假设的临界值。第87页,共95页,2023年,2月20日,星期五例5.3从一批滚珠中随机抽取50个,测得它们的直径(mm)为:15.0,15.8,15.2,15.1,15.9

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论