数模竞赛中的统计方法选讲课件_第1页
数模竞赛中的统计方法选讲课件_第2页
数模竞赛中的统计方法选讲课件_第3页
数模竞赛中的统计方法选讲课件_第4页
数模竞赛中的统计方法选讲课件_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

人的差异在于业余时间数模竞赛中的统计方法选讲数模竞赛中的统计方法选讲人的差异在于业余时间数模竞赛中的统计方法选讲数模竞赛中的统计方法选讲

主讲人:勾明一个原理两个特征三个分布测量数据的频率密度直方图。图1频率密度分布逐渐接近正态分布示意

其中为实数,

>0,则称X服从参数为,2的正态分布,记为N(,2),可表为X~N(,2).若随机变量

(1)单峰对称

密度曲线关于直线x=对称;

f()=maxf(x)=.正态分布有两个特性:(2)的大小直接影响概率的分布越大,曲线越平坦,越小,曲线越陡峻,正态分布也称为高斯(Gauss)分布4.标准正态分布

参数=0,2=1的正态分布称为标准正态分布,记作X~N(0,1)。分布函数表示为其密度函数表示为一般的概率统计教科书均附有标准正态分布表供读者查阅(x)的值。如,若Z~N(0,1),(0.5)=0.6915,P{1.32<Z<2.43}=(2.43)-(1.32)=0.9925-0.9066注:(1)(x)=1-(-x);(2)若X~N(,2),则设XN(,2),则P{-3<X<+3}=0.997该结果称为3原则.在工程应用中,通常认为P{|X-|≤3}≈1,忽略{|X-|>3}的值.如在质量控制中,常用标准指标值±3作两条线,当生产过程的指标观察值落在两线之外时发出警报.表明生产出现异常.99A:自动化车床管理4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851附:100次刀具故障记录(完成的零件数)MATLAB统计工具箱

[a,b]=hist(x,9);a=a/length(x);bar(b,a);

MATLAB统计工具箱

要对一组样本进行正态性检验,在MATLAB中,一种方法是用normplot画出样本,如果都分布在一条直线上,则表明样本来自正态分布,否则是非正态分布。normplot(x)MATLAB中也提供了几种更正式的检验方法:

1、函数kstest:Kolmogorov-Smirnov正态性检验,将样本与标准正态分布(均值为0,方差为1)进行对比,不符合正态分布返回1,否则返回0;该函数也可以用于其它分布类型的检验;2、函数lillietest:Lillieforstest。与kstest不同,检验目标不是标准正态,而是具有与样本相同均值和方差的正态分布。lillietest(x)ans=03、函数jbtest:Jarque-Beratest与Lillieforstest类似,但不适用于小样本的情况。

jbtest(x)ans=0

泊松(Poisson)分布P()

X~P{X=k}=,k=0,1,2,…(0)泊松分布适合于描述单位时间内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数等等。

指数分布

则称X服从参数为>0的指数分布。其分布函数为随机变量两个重要的数字特征

数学期望是衡量随机变量取值平均大小程度的一个数字特征。方差是衡量随机变量取值波动程度的一个数字特征。

定义若X~P{X=xk}=pk,k=1,2,…n,则称为r.v.X的数学期望,简称期望或均值。

若X~f(x),-<x<,

为X的数学期望。则称定义

若E(X2)存在,则称E[X-E(X)]2为r.v.X的方差,记为D(X),或Var(X).称 为r.v.X的标准差可见协方差,相关系数

协方差若r.v.X的期望E(X)和Y的期望E(Y)存在,则称Cov(X,Y)=E{[XE(X)][YE(Y)]}.为X与Y的协方差,易见Cov(X,Y)=E(XY)-E(X)E(Y).相关系数若r.v.X,Y的方差和协方差均存在,且DX>0,DY>0,则称为X与Y的相关系数.

2.相关系数的性质

(1)|XY|1;(2)|XY|=1存在常数a,b使P{Y=aX+b}=1;(3)X与Y不相关XY=0;

协方差矩阵定义设X1,…,Xn为n个r.v.,记cij=Cov(Xi,Xj),i,j=1,2,…,n.则称由cij组成的矩阵为随机变量X1,…,Xn的协方差矩阵C。即统计中常用的三种分布一、2—分布

数理统计中常用到如下三个分布:

2—分布、t—分布和F—分布。2.2—分布的密度函数f(y)曲线

3.分位点设X

~2(n),若对于:0<<1,存在满足则称为分布的上分位点。1.构造若X~N(0,1),Y~2(n),X与Y独立,则t(n)称为自由度为n的t—分布。二、t—分布2.t(n)的概率密度为3.分位点

设T~t(n),若对:0<<1,存在t(n)>0,满足P{Tt(n)}=,则称t(n)为t(n)的上侧分位点注:三、F—分布

1.构造若U

~2(n1),V~2(n2),U,V独立,则

称为第一自由度为n1,第二自由度为n2的F—分布,其概率密度为2.F—分布的分位点对于:0<<1,若存在F(n1,n2)>0,满足P{FF(n1,n2)}=,则称F(n1,n2)为F(n1,n2)的上侧分位点;注:两个特征一个原理:

小概率事件的实际不可能性原理。它的重要应用是假设检验问题(一)两类问题1、参数假设检验总体分布已知,参数未知,由观测值x1,…,xn检验假设H0:=0;H1:≠02、非参数假设检验总体分布未知,由观测值x1,…,xn检验假设H0:F(x)=F0(x;);H1:F(x)≠F0(x;)

以样本(X1,…,Xn)出发制定一个法则,一旦观测值(x1,…,xn)确定后,我们由这个法则就可作出判断是拒绝H0还是接受H1,这种法则称为H0对H1的一个检验法则,简称检验法。样本观测值的全体组成样本空间S,把S分成两个互不相交的子集W和W*,即S=W∪W*,W∩W*=假设当(x1,…,xn)∈W时,我们就拒绝H0;当(x1,…,xn)∈W*时,我们就接受H0。子集WS就称为检验的拒绝域(或临界域)。(二)检验法则与拒绝域(三)检验的两类错误

H0真而被拒绝的错误为第一类错误或弃真错误;称

H0假而被接受的错误为第二类错误或取伪错误。记p(I)=p{拒绝H0|

H0真};P(II)=p{接受H0|

H0假}对于给定的一对H0和H1,总可找出许多拒绝域,人们自然希望找到这种拒绝域W,使得犯两类错误的概率都很小。奈曼—皮尔逊(Neyman—Pearson)提出了一个原则:“在控制犯第一类错误的概率不超过指定值的条件下,尽量使犯第二类错误小”按这种法则做出的检验称为“显著性检验”,称为显著性水平或检验水平。显著性检验的思想和步骤:(1)根据实际问题作出假设H0与H1;(2)构造统计量,在H0真时其分布已知;(3)给定显著性水平的值,参考H1,令

P{拒绝H0|H0真}=,求出拒绝域W;(4)计算统计量的值,若统计量W,则拒绝

H0,否则接受H06

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论