食品实验设计与数据分析第3章.ppt_第1页
食品实验设计与数据分析第3章.ppt_第2页
食品实验设计与数据分析第3章.ppt_第3页
食品实验设计与数据分析第3章.ppt_第4页
食品实验设计与数据分析第3章.ppt_第5页
已阅读5页,还剩102页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章 理论分布与抽样 分布 为了便于理解统计分析的基本原理,正确 掌握和应用统计分析方法,本章在介绍概率论 中最基本的两个概念事件、概率的基础上, 重点介绍科学研究中常用的几种随机变量的概 率分布正态分布、二项分布、波松分布以及 样本平均数的抽样分布和t分布。 下一张 主 页 退 出 上一张 1 事件与 概率 1.1 事 件 1.1.1 必然现象与随机现象 在自然界与生产实践和科学试验中,人 们会观察到各种各样的现象,把它们归纳起 来,大体上分为两大类: 下一张 主 页 退 出 上一张 必然现象:可预言其结果的,即在保持条件 不变的情况下,重复进行试验,其结果总是确 定的,必然发生的(或必然不发生)。这类现 象称为必然现象(inevitable phenomena)或确定性现象(definite phenomena)。 随机现象:另一类是事前不可预言其结果的 ,即在保持条件不变的情况下,重复进行试验 ,其结果未必相同。这类在个别试验中其结果 呈现偶然性、不确定性现象,称为随机现象( random phenomena )或不确定性现 象 (indefinite phenomena)。 下一张 主 页 退 出 上一张 随机现象或不确定性现象,有如下特点: 在一定的条件实现时,有多种可能的结果 发生,事前人们不能预言将出现哪种结果;对 一次或少数几次观察或试验而言,其结果呈现 偶然性、不确定性; 但在相同条件下进行大量重复试验时,其 试验结果却呈现出某种固有的、特定的规律性 频率的稳定性,通常称之为随机现象的统 计规律性。 下一张 主 页 退 出 上一张 1.1.2 随机试验与随机事件 1 随机试验 通常我们把根据某一研究目的 , 在一定条件下对自然现象所进行的观察或试验 统称为试验(trial)。 当一个试验如果满足下 述三个特性 , 则 称 其 为 一个 随机试验( random trial),简称试验。 下一张 主 页 退 出 上一张 (1)试验可以在相同条件下多次重复 进行; (2)每次试验的可能结果不止一个 , 并且事先知道会有哪些可能的结果; (3)每次试验总是恰好出现这些可能 结果中的一个 ,但在一次试验之前却不能 肯定这次试验会出现哪一个结果。 下一张 主 页 退 出 上一张 2 随机事件 随机试验的每一种可能结果,在一定条件下 可能发生,也可能不发生,称为随机事件( random event),简称 事 件(event),通 常用A、B、C等来表示。 (1)基本事件 我 们 把 不 能 再 分的事件称为基本事件( elementary event) , 也 称为 样本点( sample point)。 下一张 主 页 退 出 上一张 例如,从编号为1、2、3、10 的十个篮 球中随机抽取1个篮球,有10种不同的可能结果: “ 取 得 一 个 编 号 是 1” 、 “ 取得一个编 号是2”、“取得一个编号是10”,这10个事 件都是不可能再分的事件,它们都是基本事件。 由若干个基本事件组合而成的事件称为 复合 事件 (compound event)。如 “取得一个编 号是 2的倍数”是一个复合事件,它由 “ 取得一 个编号是2 ”、 “ 是4”、“是6、“是8”、“是10” 5个基本事件组合而成。 下一张 主 页 退 出 上一张 (2)必然事件 把在一定条件下必然会发生的事件称为必然事件(certain event),用表示。 例如,一个大气压下,水加热到100C ,水会沸腾;种瓜得瓜、种豆得豆 下一张 主 页 退 出 上一张 (3)不可能事件 在一定条件下不可能发生的事件称为不可能事件( impossible event),用表示。例如,在满足一定孵化条件 下,从石头孵化出小鸡,就是一个不可能事件。 必然事件与不可能事件实际上是确定性现象,它们不是随机 事件, 但 是 为了方便起见,我们把它们看作为两个特殊的随 机事件。 1.2 概 率 1.2.1 概率统计定义 研究随机试验,仅知道可能发生哪些随机 事件是不够的,还需了解各种随机事件发生的 可能性大小,以揭示这些事件的内在的统计规 律性,从而指导实践。这就要求有一个能够刻 划事件发生可能性大小的数量指标,这个指标 应该是事件本身所固有的,且不随人的主观意 志而改变,人们称之为概率(probability) 。事件A的概率记为P(A)。 下一张 主 页 退 出 上一张 概率:刻划事件发生可能性大小的数量指标概率:刻划事件发生可能性大小的数量指标 概率统计定义: 在相同条件下进行n次重复试 验,如果随机事件A发生的次数为m,那么m/n 称为随机事件A的频率(frequency);当试验 重复数n逐渐增大时,随机事件A的频率越来越稳 定地接近某一数值 p , 那么就把 p称为随机事件 A的概率。 下一张 主 页 退 出 上一张 如此定义的概率称为统计概率(如此定义的概率称为统计概率( statistics probabilitystatistics probability),或者称后),或者称后 验概率(验概率(posterior probabilityposterior probability)。)。 表3-1 抛掷一枚硬币发生正面朝上的试验记录 下一张 主 页 退 出 上一张 例如 为了确定抛掷一枚硬币出现正面朝上这个事件的 概率 ,历史上有人作过成千上万次抛掷硬币的试验。 在表31中列出了他们的试验记录。 从表3-1可看出,随着实验次数的增多, 正面朝上这个事件发生的频率越来越稳定地接 近0.5,我们就把0.5作为这个事件的概率。 在一般情况下,随机事件的概率p是不可能 准确得到的。通常以试验次数n充分大时随机事 件A的频率作为该随机事件概率的近似值。 即 P(A)=pm/n (n充分大)(3-1) 下一张 主 页 退 出 上一张 1.2.2 概率的性质 (1)对于任何事件A,有0P(A)1; (2)必然事件的概率为1,即P()=1; (3)不可能事件的概率为0,即P()=0。 2 概率 分布 事件的概率表示了一次试验某一个结果 发生的可能性大小。若要全面了解试验,则 必须知道试验的全部可能结果及各种可能结 果发生的概率,即必须知道随机试验的概率 分布(probability distribution)。为了 深入研究随机试验 ,我 们 先引入随机变量 (random variable)的概念。 下一张 主 页 退 出 上一张 2.1 随机变量 下一张 主 页 退 出 上一张 20042004年奶粉事件年奶粉事件“ “大头娃大头娃” ” 描述随机事件的变量称为随机变量。随机变描述随机事件的变量称为随机变量。随机变 量的取值在一次试验前不能确定,具有随机性。量的取值在一次试验前不能确定,具有随机性。 作一次试验,其结果有多种可能。每一种可能结作一次试验,其结果有多种可能。每一种可能结 果都可用一个数来表示,把这些数作为果都可用一个数来表示,把这些数作为变量变量x x的取的取 值值,则试验结果可用变量,则试验结果可用变量x x来表示。来表示。 【例例】 对对1010种品牌袋装奶粉进行质量检测,其种品牌袋装奶粉进行质量检测,其 可能结果是可能结果是“ “0 0种合格种合格” ”、 “ “1 1种合格种合格” ”、“ “2 2种合格种合格 ” ”、“ “”、“ “1010种袋装奶粉都合格种袋装奶粉都合格” ”。若用。若用x x表示表示 袋装奶粉合格品牌数,则袋装奶粉合格品牌数,则x x的取值为的取值为0 0、1 1、2 2、 、1010。 【例】 食品加工中高温杀菌可能结果只有两种, 即“全部杀死细菌”与“未能全部杀死细菌”。 若用 变量x表示试验的两种结果,则可令x=0表示“未 能全部杀死细菌”,x=1表示“全部杀死细菌”。 【例】 测定关中地区不同小麦品种的蛋白质含量 ,其蛋白质含量在9.3-13.5之间,如用x表示 测定结果,那么x值可以是这个范围内的任何实数 。 下一张 主 页 退 出 上一张 离 散 型 随 机 变 量:如果表示试验结果的 变量x,其可能取值为可列个 ,且 以各种确定 的概率取这些不同的值 , 则 称 x 为 离 散 型 随 机 变 量 ( discrete random variable) ; 连续 型 随 机 变 量:如果表示试验结果的变 量x ,其可能取值为某范围内的任何数值 ,且x 在其取值范围内的任一区间中取值时,其概率是 确定的,则称x为 连续 型 随 机 变 量 ( continuous random variable)。 下一张 主 页 退 出 上一张 试验结果和取此结果的概率可以一一列出。试验结果和取此结果的概率可以一一列出。 不能列出试验结果和取此结果的概率不能列出试验结果和取此结果的概率 ,只能给出一定范围和在此范围内取,只能给出一定范围和在此范围内取 值的概率。值的概率。 2.2 离散型随机变量的概率分布 要了解离散型随机变量x的统计规律,就必 须 知 道它的一切可能值xi及取每种可能值的概 率pi。 如果我们将离散型随机变量x的一切可能取 值xi ( i=1, 2 , ),及其对应的概率pi,记作 P(x=xi)=pi i=1,2, (33) 则称 (33)式为离散型随机变量x的概 率分布或分布。常用 分 布 列 (distribution series)来表示: 下一张 主 页 退 出 上一张 x1 x2 xn . p1 p2 pn 从分布列可以一目了然看出随机变量X的可能取值 及取这些值的概率。 离散型随机变量的概率分布具有pi0和pi=1这 两个基本性质。 2.3 连续型随机变量的概率分布 连续型随机变量 (如身高、体重等)的概率分布不 能用分布列来表示, 因为其可能取值是不可数的,不 能一一列出。改用随机变量x在某个区间内取值的概率 P(ax22) (dfdf1 1) t分布密度曲线如图3-11 所示 图图3-11 3-11 不同自由度的不同自由度的t t分布分布 (1)t分布受自由度的制约,每一个自由度都有一条 t分布密度曲线。 (2)t分布密度曲线以纵轴为对称轴,左右对称,且 在t0时,分布密度函数取得最大值。 (3)与标准正态分布曲线相比,t分布曲线顶部略低 ,两尾部稍高而平。df越小这种趋势越明显。df越大 ,t分布越趋近于标准正态分布。当n 30时,t分布 与标准正态分布的区别很小;n 100时,t分布基本 与标准正态分布相同;n时,t 分布与标准正态分 布完全一致。 下一张 主 页 退 出 上一张 t t分布的特点是:分布的特点是: t分布的概率分布函数为: (3-29) 因而t在区间(t1,+)取值的概率右 尾概率为1-F t (df)。由于t分布左右对称,t在 区间(-,-t1)取值的概率也为1-F t df)。 于是 t 分布 曲线 下由-到- t 1和由t 1到 + 两 个 相 等 的 概 率 之和两尾概率为 2(1-F t (df)。对于不同自由度下t分布的两尾 概率及其对应的临界t值已编制成附表3,即t分 布表。 下一张 主 页 退 出 上一张 例如,当df=15时,查附表3得两尾概率等于 0.05的临界t值为 =2.131,其意义是: P(-30df30时,时, 分布已趋向于正态分布已趋向于正态 分布。分布。 下一张 主 页 退 出 上一张 设设 为来自正态总体为来自正态总体 的一个随机的一个随机 样本,样本方差为样本,样本方差为S S 1 1 2 2 , , 为来自为来自 正态总体正态总体 的一个随机样本,样本方差为的一个随机样本,样本方差为 S S2 22 2 ,且这两个样本相互独立,则统计量,且这两个样本相互独立,则统计量 4.5 4.5 F F分布分布( F F distribution distribution) 服从第一自由度为服从第一

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论