第三章 有限数据的统计与检验_第1页
第三章 有限数据的统计与检验_第2页
第三章 有限数据的统计与检验_第3页
第三章 有限数据的统计与检验_第4页
第三章 有限数据的统计与检验_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章有限数据的统计与检验3.1数学期望与方差随机变量x及它所取的数和相应频率的乘积和,称为x的平均数(属于加权平均)也称为随机变量的数学期望或均值。

(一)离散型随机变量的数学期望定义1离散型随机变量X有概率函数

P(X=xk)=Pk(k=1,2,....)若级数绝对收敛,则称这个级数为X的数学期望=一、数学期望例3-1甲在机床上生产某产品,若一等品能赚5元,二等品赚3元,次品亏2元.甲生产时一等品、二等品及次品的概率为0.6,0.3,0.1。问生产每件产品平均能创造多少财富?数学期望为3.7。表示生产一件产品能创造3.7元。x53-2p0.60.30.1解:

(二)连续型随机变量的数学期望若称为X的数学期望。

(1)

定义设连续型随机变量X有概率密度绝对收敛,则随机变量X的数学期望是随机变量的平均数。它是将随机变量x及它所取的数和相应频率的乘积和。

例3-2计算在区间[a,b]上服从均匀分布的随机变量X的数学期望。可见均匀分布的数学期望为区间的中值。解:3.1数学期望与方差二、方差定义为变量X的方差对于离散型变量对于连续型变量例3-3计算在区间[a,b]上服从均匀分布的随机变量X的方差。3.2置信区间与显著性水平二、方差定义为变量X的方差对于离散型变量对于连续型变量用样本研究总体时,样本均值x并不等于总体均值μ,但可以肯定,只要消除了系统误差,在某一置信度下,一定存在着一个以样本均值x为中心,包括总体均值μ在内的某一范围,称为平均值的置信区间。由t的定义式得:3.2置信区间与显著性水平式中称为置信区间,其大小取决于测定的标准偏差、测定次数和置信度的选择,置信区间愈小平均值愈接近总体平均值μ。(→

μ

)表示的意义:有68.3%把握认为本钢样磷含量的真值落在0.0087±0.0011(%)范围内。下面有三种结果报告,第一种报告:例3-4对某一钢样含磷量平行测定了四次,平均值为0.0087%。己知标准误差σ=0.0022。磷含量的第二种报告表示的意义为:有95.5%把握认为本钢样磷含量的真值落在0.0087±0.0022(%)范围内。磷含量的第三种报告表示的意义为:有99.7%把握认为本钢样磷含量的真值落在0.0087±0.0033(%)范围内。1)置信度(P):例中有68.3%把握、95.5%把握和99.7%把握均称为置信度也称置信水平;2)显著性水平(α):在上面三个区间外的概率称为显者性水平。置信度(P)与显著性水平(α)的关系两者的关系为:α=1-P例:α(显著性水平)=0.05时,则p(置信度)=1-0.05=0.95,即等于95%置信度的选择应合适,一般的判断若有95%把握,则以为这种判断基本正确。在统计学中通常取95%置信度。处理分析测试的数据时,也取95%的置信度。当然并非绝对,根据具体的情况有时也取90%或99%。3.3假设检验假设检验又叫显著性检验(testofsignificance)。显著性检验的方法很多,常用的有t检验、F检验和

2检验等。尽管这些检验方法的用途及使用条件不同,但其检验的基本原理是相同的。3.4t检验t检验是用t分布函数对不同样本间均值差异性的检验方法。由于测量次数有限,σ和μ无从知道。英国统计学与化学家Gosset提出用t分布解决了这一问题。使不致因为用s代替σ而引起对正态分布的偏离。

t分布函数是由英国统计学家兼化学家Gosset提出,因当时他用“Student”的笔名发表该论文,所以又称为“学生氏分布”1)t分布曲线随自由度f变化;2)当f=∞时,t分布则为正态分布。t检验的基本原理例3-5

随机抽测10头白猪和10头黑猪经产母猪的产仔数,资料如下:白:11,11,9,12,10,13,13,8,10,13黑:8,11,12,10,9,8,8,9,10,7经计算,得白猪10头经产母猪产仔平均数X1=11头,标准差S1=1.76头;黑猪10头经产母猪产仔平均数X2=9.2头,标准差S2=1.549头。下一张

主页

退出

上一张

能否仅凭这两个平均数的差值X1-X2=1.8头,立即得出白与黑两品种经产母猪产仔数不同的结论呢?统计学认为,这样得出的结论是不可靠的。下一张

主页

退出

上一张

总体与样本的关系取样次数取样值平均值126.531.227.930.829.128.7+0.4228.728.325.129.627.928.7-0.8325.130.828.532.429.228.7+0.5429.127.924.231.728.228.7-0.5527.229.626.532.829.028.7+0.3总和28.7表明样本平均数并非总体平均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:这说明两个样本平均数之差包括了两部分:一部分是两个总体平均数的差称试验的处理效应另一部分是试验误差也就是说样本平均数的差包含有试验误差,它只是试验的表面效应。因此,仅凭就对总体平均数μ1、μ2

是否相同下结论是不可靠的。只有通过显著性检验才能获得结论。对进行显著性检验就是要分析:试验的表面效应主要由处理效应引起的,还是主要由试验误差所造成。下一张

主页

退出

上一张

这里我们做出如下假设:下一张

主页

退出

上一张

零假设备择假设对于统计量服从自由度为(n1+n2-2)t分布其中下一张

主页

退出

上一张

接受H0,差异不显著拒绝H0,差异显著拒绝H0,差异非常显著饲料种类甲乙增重量26.531.228.728.325.130.829.127.927.229.6平均值27.329.6例3-6

为了考察两种不同的饲料对鲫鱼喂养的效果,测量了其增重量(g/week),数据如下,试问两种饲料喂养效果是否存在差异?由于所以,两种饲料的喂养效果没有明显差异。差异不显著方差分析下一张

主页

退出

上一张

——F

检验t检验法适用于两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。这是因为:下一张

主页

退出

上一张

1、检验过程烦琐例如,一试验包含5个处理,采用t检验法要进行=10次两两平均数的差异显著性检验;若有k个处理,则要作k(k-1)/2次类似的检验。下一张

主页

退出

上一张

2、无统一的试验误差,误差估计的精确性和检验的灵敏性低对同一试验的多个处理进行比较时,应该有一个统一的试验误差的估计值。若用t检验法作两两比较,由于每次比较需计算一个,故使得各次比较误差的估计不统一,同时没有充分利用资料所提供的信息而使误差估计的精确性降低,从而降低检验的灵敏性。下一张

主页

退出

上一张

3、推断的可靠性低,检验的I型错误率大假设两个样本之间的I型错误率为0.05,则如果有五个样本进行两两比较,共10次,则总犯I型错误的概率由于上述原因,多个平均数的差异显著性检验不宜用t检验,须采用方差分析法。方差分析(analysisofvariance,ANOVA)是由英国统计学家R.A.Fisher于1923年提出的。例3-7为了考察5个品系的小麦之间株高是否存在差别,进行随机取样后数据如下,试分析品系间株高是否存在差别?株号品系IIIIIIIVV164.664.567.871.869.2265.365.366.372.168.23

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论