版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、绪 论,统计学难于用简短的语言作一个明确、严谨而又全面的定义,但作为一个学科名称,中国大百科全书(数学卷)解释如下: 统计学是一门科学,它研究怎样以有效的方式收集、整理和分析带随机性的数据,在此基础上,对所研究的问题作出统计性的推断,直至对可能作出的决策提供依据或建议。 超脱了具体含义的、带随机性误差的数据的收集和分析是统计学的特点。 因而在欧美等西方国家,统计学归于 “应用数学” 类。 前苏联则把统计学定位成一门 “研究大量社会现象” 的社会科学。 国内对统计学的定位曾一度受前苏联的影响,如今则倾向于数理统计学,和欧美等西方国家一致。试验统计学(生物统计学)是农业或生物科学与统计学横向交叉所
2、形成的边缘性分支学科,就其交叉性而言,统计学所占份量要比生物或农业科学多得多,因而把它归于统计学的分支。,课程教学大纲,第一章 绪论及概率知识5 第二章 误差理论6 第三章 显著性测验7 第四章 试验设计4 第五章 方差分析6 第六章 方差分析6 第七章 回归与相关分析4 使用教材:盖均镒主编试验统计方法 中国农业出版社,第一章 绪论及概率知识,第一节 统计学发展概述 (18世纪初19世纪末二战结束) 第二节 事件及其相互关系 (随机现象及概率定义,古典、统计概型) 第三节 概率运算法则 (加法法则,乘法法则) 第四节 随机变量 (包括独立试验序列和贝努利概型),第一章要点提示,本章简要介绍统
3、计学的 发展概况,择要讲授概率论的基本常识。学习时应了解随机事件相互关系并熟悉概率运算的基本法则;重点掌握两种间断性变量的概率分布类型,即古典概型和贝努利概型;特别是要牢固树立研究随机变量的思想,为下一章学习一类特殊的连续性变量误差和抽样误差的概率分布作准备。 涉及教材内容:第一章第四节,第四章第一、二节。 作业布置:教材第三章内容(P35 P46)自习。,第一节 统计学发展概述,可按三个阶段分述如下: 一、18世纪初19世纪末 正态分布对建立统计学理论十分重要,是研究各统计量概率分布的出发点。它早在1733年就被数学家De-Moive德讨论二项分布展开式的极限形式时发现,Gauss和Lapl
4、ace在研究天文观测的误差分布时重新发现它则是1799年1809年的事。 由于后者事先并不知道De-Moive在数学领域的工作,公诸于文献交流的结果被后来的研究人员沿袭,把正态分布称之为高斯分布。而此后约100年间,虽然也有象“回归”趋势等统计方面的新发现,但总的来看,统计学理论方面的进展相当缓慢,原因是这一时期有人将正态分布的普遍性绝对化,反过来又束缚了人们的思想。,第一节 统计学发展概述,二、19世纪末二战结束 这是统计学发展史上极其重要的一个时期,以Fisher、Pearson为首的英国统计学派起主导作用,统计学中的主要分支学科都在这一时期发展和建立起来,也是现代统计学的成熟阶段。 首先
5、是1899年K. Pearson 英提出生物学方面的数据有显著偏态,不适合用正态分布来描述,而只宜用卡方分布来测验实际观察次数和理论次数之间的偏离程度,从而发现了第一个偏态分布。 1908年, K. Pearson 的学生W.S.Gosset用“Student”为笔名发表了一篇论文,提出了小样本的统计推断方法,即Student-t分布。为运用数理统计中的概率分布理论进行生物试验研究结果的统计假设测验打开了方便之们,弥补了创新研究中用正态分布来描述试验研究结果时需要已知参数或者需要大样本统计量去逼近未知参数(即大样本理论实用危机)的缺憾。,第一节 统计学发展概述,二、19世纪末二战结束 1923
6、年,R.A.Fisher英在证明了Student-t用作统计假设测验在理论上成立之后,又发现了方差比分布,即F分布。 F分布的发现催生了一门崭新的统计方法,即方差分析,使农业试验研究由简单的对比设计一跃而发展成为复因素试验的析因设计,于是反过来又促进了试验设计的发展和完善。这对生物科学研究特别是农业试验研究走出实验室迈向“希望的田野”起到了很大的促进作用。所以后来用中文板书“农业试验研究”或“试验设计”时都不再使用“实验”一词。 1946年,瑞典统计学家H. Cramer(克拉美)的统计学数学方法一书问世,这是第一部严谨而又比较系统的数理统计学著作,总结了二战以前统计学方面的主要成就。值得一提
7、的是: 正态分布及三大统计分布(卡方分布、学生氏分布、方差比分布),第一节 统计学发展概述,三、二战结束以后 二战结束以后到现在是统计学发展的第三个时期,这是一个在前一阶段蓬勃发展的基础上,随着生产和科技的进步而得到飞速发展的一个时期,主要成就可概括为以下四个方面: 应用上越来越广泛 二战以前主要是生物、农业、医学、社会经济等方面,二战后归纳到“统计质量管理”名目下的大规模工业应用取得了很大的成功,如使许多工艺水平的研究取得突破而占据领先地位的正交试验法异军突起(日本);统计学方面毕业的大学生与数学方面毕业的大学生人数相当或略多(美国) 。 数理统计理论发展与危机并存 样本容量无限增加时,统计
8、量与统计方法的极限性质理论取得重大进展,有些成果在数学上很深刻、很精细但却面临实用方面的“危机”。以至于发展有实用价值的大样本理论已成为目前数理统计学面临的一个重要课题。,第一节 统计学发展概述,三、二战结束以后 电子计算机的应用 计算量大的统计方法可以普遍使用,并且有许多现成的统计软件可资利用(如SAS、SPSS软件等),尤其是直接从数据出发探索可以应用的模型是未来统计学发展的方向之一;避开统计方法实施必须先决定统计量分布的困难,直接用“模拟”的方法决定某个抽样分布的分位点实用价值最大。 瓦尔德理论的提出和贝叶斯学派的进展 1950年,原籍罗马尼亚的美国统计学家A.wald发表了题为统计决策
9、函数的著作,它所引进的许多概念和新提法,丰富了以往的统计理论,并把统计推断的后果与经济上的得失联系起来,使之更便于直接用到经济决策领域。,第二节 事件及其相互关系,第一节 统计学发展概述 第二节 事件及其相互关系 一、随机现象 在一定条件下,有多种可能的结果发生,但事先并不能100%地肯定发生哪一种结果的现象。 随机事件:泛指随机现象的任一种可能发生的结果,简称“事件”。 用大写字母 A、B、C或A1、A2、A3表示。 随机现象有多少种可能发生的结果,就有多少个随机事件。 基本事件:指不能再分割的随机事件,否则就是复合事件。 概率论:研究随机现象统计规律性的学科。属于应用数学范围。,第二节 事
10、件及其相互关系,二、概率的三种定义 随机试验:对某随机现象进行的一次观察同时具备三条: 事先可以明确几种可能出现的结果; 不能断言将出现哪一种结果; 在相同条件下可以重复进行。 统计定义: 假定在相同或相似条件下,重复进行同一个 试验(或观察),某一事件A发生的次数a与总 观察 次 数n之比值 a/n 当n时稳定接近的值 p 就叫A的统计概率。记为P(A)= p 或简述为“频率的极限值”、 “频率的稳定值”。 此外还有概率的古典定义和几何定义。,第二节 事件及其相互关系,三、古典概型 即古典概率分布类型,是针对有以下两个特征的试验而言:只有有限个不同的基本事件;各基本事件发生的概率均等。 例1
11、.1、从随机数字表中任一位点抽得一位数字是0、 1、2、或9的概率是均等的,都为0.1。即 n =10个基本事件发生的可能性相等,若事件A由其中的 m 个基本事件组成,则 P(A)= m/n,这就是概率的古典定义。如定义A为2y8,则P(A)= 7/10 = 0.7。 弄清楚古典概率能帮助我们正确使用随机数字表。如将4个编号进行随机排序时,按照取除以4以后的余数规则,遇到9、0就不要读;再如将12个编号进行随机排序时,按照取除以12以后的余数规则,遇到97、98、99、00也不要读。,第二节 事件及其相互关系,四、统计概型 实际应用中,仅研究基本事件是不够的,还要了解复合事件及其相互关系。 事
12、件间的相互关系有包含关系、和与积的关系、互斥及对立关系等。 这些关系可以用一个最简单的随机试验模型予以说明。如右边文本所示。,观察甲、乙两粒种子发芽情况, 发芽记为“1”,没有发芽记为“0” 甲 乙 1 1 1 A = A1A2 2 1 0 B A1A2 3 0 1 B A1A2 4 0 0 C = A1A2 注: 甲发芽记为“A1”、不发芽记“A1”; 乙发芽记为“A2”、不发芽记“A2”。,第三节 概率计算法则,一、加法定理 P(A+B)=P(A)+P(B)P(AB) 例1.2 考察甲乙两人分别使用手 枪和步枪朝同一靶标射击的结果。定 义A为“甲击中”,B为“乙击中”。假 定统计次数 n
13、= 100 得P(A)= 0.6, P(B)= 0.8,P(AB)= 0.48,求: P(A+B)。 解 “A+B”意为“靶标至少被一人击中” P(A+B)= 0.6 + 0.8 0.48 = 0.92 结果表明:100次观察中只有8次 没有被击中,进一步分析如右。,靶标被击中92次又分三种情况: 两人同时击中: nP(AB)= 48 甲击中且乙未击中: nP(A) nP(AB)= 12 乙击中且甲未击中: nP(B) nP(AB)= 32 将、 的三个等式左右两 边分别累加,得到公式: nP(A)+ nP(B)nP(AB)=92 将该公式两边除以 n 就是加法法则。,第三节 概率计算法则,二
14、、乘法定理 P(AB)= P(A) P(B/A) = P(B) P(A/B) 例1.3 将0.5 kg 辛夷花籽经水 选分级,上浮部分1000 粒,播种 后发芽率仍有10%,下沉部分2500 粒,播种后的发芽率也只有80%, 两 向分组小计如右。 解 定义从3500粒种籽中随机抽取 的一粒是“下沉籽”为事件A发生, 是“发芽籽”为事件B发生,则有: P(AB)= 5/70.8 = 0.620/21,P(A)= 25003500 = 5/7 P(B)= 21003500 = 0.6 P(AB)= 20003500 = 4/7 P(B/A)= 20002500 = 0.8 P(A/B)= 2000
15、2100 = 20/21,第三节 概率计算法则,三、加法定理推论 互斥事件的加法法则: P(A+B+C+N)= P(A)+P(B)+P(C)+P(N) 对立事件的减法法则: P(A)= P() P(A)= 1 P(A) 四、乘法定理推论 事件独立的充分必要条件是: P(A1A2A3An)= P(A1)P(A2)P(A3)P(An) 在试验统计中用得多的往往 不是加法定理或乘法定理本身, 而是其推论。,第三节 概率的计算法则,例1.4 已知一批饲用小麦种出 苗率为0.8,现随机观察其中的两粒, 问:两粒出苗(A)、仅一粒出苗 (B)和两粒都不出苗(C)的概 率各为多少? 解 设籽甲出苗为A1,不
16、出苗为A1 籽乙出苗为A2,不出苗为A2 依题意,A1、A2相互独立,即: P(A1)= 0.8 , P(A1)= 0.2 P(A2)= 0.8 , P(A2)= 0.2,P(A)= P(A1A2)= 0.64 = P(A1)P(A2) P(B)= P(A1A2 + A1A2) = P(A1A2 )+ P( A1A2) = P(A1)P(A2 )+ P( A1)P(A2) = 0.80.2 + 0.20.8 = 0.32 P(C)= P(A1A2)= 0.04 = P(A1)P(A2) “至少一粒出苗的概率”有两种算法: P(A + B)= 1 P(C)= 0.96,第四节 随机变量,一、随机
17、变量及其性质 将随机事件数量化,建立起一一 对应的实数值Yi,则称之为随机变量, 简称“变量”。用符号 y 表示。 再将随机变量 y 的任意一个取值 Yi 称为“观察值”。如例1.4中的012 将随机变量 y 取任意一个实数值 Yi的概率称为概率函数。记号f( )。 再将随机变量 y 取值小于或等于 某一个实数值Yi的概率称为累积概率 函数。记号 F( )。,如表述例1.4中“A”指“两粒籽发芽” 的概率时就有三种方式: P(A)= p 或 P(A) = 0.64 P(y=Yi)= p,P(y=2)= 0.64 f(Yi)= p 或 f( 2 )= 0.64 再表述例1.4中“少于一粒籽发芽”
18、 的概率时也可有两种方式: P(yYi)= P(y1)= 10.64 F(Yi)=F(1)= f(0)+f(1)=0.36 按所取观察值变化特点的不同, 变量分间断性变量和连续性变量,第四节 随机变量,二、贝努利概型 贝努利试验(序 列)是独立试验序列 中最简单的类型。观 察一次贝努利试验时 (仅有两种可能的结 果),事件A发生的 概率与其对立事件发 生的概率所表现出来 的两点分布类型,叫 做贝努利分布。其概 率值的分割比例实际 由概率的(统计)定 义给出。 多次贝努利试验 中事件A在其中若干 次发生的概率所表现 出来的多点分布类型,叫做二项分布。其概率函数f(y)由牛顿二项式定理给出。,第一章内容小结,由研究随机现象引出随机事件、随机试验及概率的三种定义,其中以概率的统计定义最为重要; 借助于完全事件系中各互斥事件分割概率“1”的非数学语言引出概率分布,包括古典概型和介绍事件关系时列举的“统计概型”; 通过概率运算的加法法则和乘法法则的讲授引出独立试验序列,完成由事件独立性到试验独立性的过渡; 在定义随机变量的基础上规范了(累积)概率函数的表述方法,同时借助独立性假定将本章内容归结到间断性变量最重要的概率分布类型贝努利概型上,为下一章学习特殊的连续性变量误差和抽样误
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024个人借款保证合同范本
- 2024大数据服务居间合同
- 2024个人场地租赁合同范文
- 2024商业货物运送协议典范一
- 2024展厅展示合同范本正规范本
- 湖南省2023-2024学年高二地理上学期11月第二次联考试题含解析
- 2024年外墙装饰施工合作合同样本版
- 小学数学小教研活动总结400字范文
- 2024年广告发布合同规定条款
- 2024年会员专享充值卡销售合同版B版
- 病理产科 死胎 (妇产科学课件)
- 第3章 城市轨道交通车辆辅助供电系统
- 保险名单整理(P100A30C10)课件
- 植物旱害及抗旱性课件
- 国家开放大学《可编程控制器应用实训》形考任务2(实训二)参考答案
- 【QC成果】提高建筑外窗一次验收合格率2020
- GIS设备带电补气作业指导书QXL
- DB32T 4342-2022 工业企业全过程环境管理指南
- 木薯淀粉预处理及其糖化工艺初步设计
- 我的家庭贡献与责任说课课件
- 生态系统的物质循环-完整版课件
评论
0/150
提交评论