




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率第七章样本分布下第1页,课件共37页,创作于2023年2月
——
组成总体的每一个元素即总体的每个数量指标,可以看作随机变量
X的某个取值。
研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标的全体,X
的分布函数和数字特征称为总体的分布函数和数字特征.一.总体和样本总体——个体例如:一批灯泡,全体灯泡的使用寿命就是总体,每个灯泡的使用寿命是个体.它是一个随机变量(或多维随机变量).记为X.第2页,课件共37页,创作于2023年2月样本
——从总体中抽取的部分个体.称为总体
X的一个容量为n
的样本观测值,或称样本的一个实现.用表示样本,
n称为样本容量.样本空间
——样本所有可能取值的集合.
第3页,课件共37页,创作于2023年2月
在进行抽样时,样本的选取是随机的,即总体中每个实际中,如总体样数很大,而抽取的样本容量相对小,简单随机样本:进行重复抽样所得的随机样本.个体都有同等机会被选入样本。抽样通常有两种方式:一种是不重复抽样,另一种是重复抽样。如果总体单位数是无限的,抽取有限个不影响总体的分布(此时重复抽取与不重复抽取没有多大区别)。即可认为总体为无限的..(现在我们只研究简单随机样本)第4页,课件共37页,创作于2023年2月简单随机样本具有以下两个性质:(2)代表性:即
中的每一个都与(1)独立性:即中,各个随机变量的取值互不影响,这时,我们称是相互独立的随机变量.总体
有相同的概率分布.
相同分布的随机变量离散型的具有相同的概率分布律连续型的具有相同的概率密度,所以期望与方差全相同第5页,课件共37页,创作于2023年2月样本容量为n的样本是n个相互独立且与总体有相同分布记为
的随机变量(n为样本容量),是n元随机变量的一个样本观测值,
记为
构成的一个n元随机变量,一个容量为n的样本---------(1)指一个n元随机变量。从这个角度来说,(2)指某一次抽样的具体数值。从这个角度来说,第6页,课件共37页,创作于2023年2月统计量定义:为统计量,其中不含未知参数都是统计量
3.统计量的函数样本
统计量一般是样本的连续函数,由于样本是随机变量,因而它的函数也是随机变量。如:第7页,课件共37页,创作于2023年2月二.样本分布函数在实际统计工作中,数据的处理形式为表和图。统计表有简单表和分组表;统计图有频数(率)图,频率直方图和累计频率直方图。1.分组数据的统计表和频数直方图简单表就是依出现的先后次序或按其数值大小列成表格,一般用处不大。如果数据较多,可分成若干组,按各组数值大小列成表格或制图例1.观察新生女婴儿的体重(它是一个连续型随机变量)取170号按顺序测得体重如表7-1.第8页,课件共37页,创作于2023年2月此表是体重按出生顺序排序.单位为克(g)第9页,课件共37页,创作于2023年2月分组数据的频数分布表分组时一般采取等区间分组,区间长度称为组距.制作分组数据表的步骤:(1)从数据找出最大值M与最小值L,并求出它们的差.这里:L=1800,M=4280,M-L=2480(2)决定分组的界限。一般采用包含区域(L,M)的稍宽区域(a,b)为分组的界限。这里取:a=1700,b=4300,[L,M][a,b](3)决定组距(用D表示)和组数(用k表示),它们之间的关系为D=(b-a)/k,取组数时常常按照一定的经验法则,一般来说,决定组数应使每组至少有个4、5个数据,当数据很多时,只要可以反映分布的趋势,也可以每组很多数据。这里:取k=13,D
=(b-a)/k=(4300-1700)/13=200第10页,课件共37页,创作于2023年2月其中落到各组的数据个数称为组频数。第11页,课件共37页,创作于2023年2月例2将例1中前20个新生婴儿体重按大小顺序列成一简单统计表,如下表所示。25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号若进一步把20个数据分成5组(每组不包括上限)。试给出分组数据的频数分布表。解:这里取:a=2400,b=3900要分5个组,组距=(b-a)/5=(3900-2400)/5=300第12页,课件共37页,创作于2023年2月画频率分布直方图的步骤:1.求b-a3.将数据分组5.画频率分布直方图4.列频率分布表图中小长方体的面积等于对应的频率各小长方体的面积之和等于12.频率直方图和累计频率直方图组频率:是指组频数与样本容量的比值。累积频率:相应一些组频率累加起来的和。2.决定组距与组数第13页,课件共37页,创作于2023年2月25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号10090652510累积频率1025401510组频率第14页,课件共37页,创作于2023年2月累积频率直方图25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号10090652510累积频率1025401510组频率第15页,课件共37页,创作于2023年2月其上某区间上的长方形面积约等于同底的曲顶梯形面积.(只适用于连续型随机变量)故各长方形的顶点连成的曲线可近似模拟概率密度.第16页,课件共37页,创作于2023年2月经验分布函数根据观察结果来确定总体分布函数是数理统计的重要问题之一,为此我们引进经验分布函数的概念.设来自于总体X的样本的一组观察值,即对X进行n次独立重复观察,测得一组观察值.对任一实数x,用vn(x)表示事件{X≤x}出现的频数,即小于等于x的观测值xi
的个数.设函数(i=1,2,….,n)显然是随机变量将对总体X的一次观察作为一次试验,记A={X≤x},则:X的分布函数F(x)=P(X≤x)=P(A)=p.第17页,课件共37页,创作于2023年2月将对总体X的一次观察作为一次试验,记A={X≤x},则:于是,对总体X的n次观察相当于n重贝努里试验,vn(x)表示事件{X≤x}出现的频数,即n重贝努里试验中事件{X≤x}发生的次数,故有vn(x)~B(n,F(x))根据贝努里大数定律(定理5.2在n重贝努里试验中,事件A的频率是,是n次试验中A发生的次数),依概率收敛于事件A发生的概率p,即对p=P(A)=F(x)vn(x)表示事件{X≤x}出现的频数X的分布函数F(x)=P(X≤x)=P(A)=p.第18页,课件共37页,创作于2023年2月这表明,当样本容量n充分大时,可用总体X的函数来近似表示X的分布函数,所以称为X的经验分布函数.第19页,课件共37页,创作于2023年2月设是总体
的一个样本观察值,按大小则的图形就是累积频率的曲线,它是跳跃式上升顺序排列:的一条阶梯曲线。…………对任一实数x,vn(x)表示事件{X≤x}出现的频数,则:第20页,课件共37页,创作于2023年2月若观察值不重复,则每一跃度为若有重复,则按的倍数跳跃上升。
第21页,课件共37页,创作于2023年2月例.随机地观察总体,得到10个数据如下:3.2,2.5,-4,2.5,0,3,2,2.5,4,2将它们从小到大排列为:-4<0<2=2<2.5=2.5=2.5<3<3.2<4其样本分布函数为:12345678910第22页,课件共37页,创作于2023年2月三.样本分布的数字特征即样本分布的某些特征的数字,经常用它估计总体的样本平均数定义:对于样本
称
为样本平均数对某些具体的样本值其样本平均数是数字特征。(1)不考虑分组时:第23页,课件共37页,创作于2023年2月若样本的观察值已整理成分组数据(设分成组,(加权平均值)(2)考虑分组时第24页,课件共37页,创作于2023年2月例:例7.2中20个新生女婴儿的平均体重是?2.样本方差
定义:对于样本称
及分别为样本方差和样本标准差由定义有,
解:25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号第25页,课件共37页,创作于2023年2月在具体计算样本方差时常用此式若数据已分成k组,
和分别为第
组的组频数和组中值或证:使用以下公式:第26页,课件共37页,创作于2023年2月例2中的=?
=112736.84例:解:25832组频数37503450315028502550组中值3600-39003300-36003000-33002700-30002400-2700组限54321分组编号第27页,课件共37页,创作于2023年2月3.样本方差和样本平均数的简算公式.设
为样本的个观察值
(1)对任意常数,记为,则(2)对任意常数
及非零常数
,记,则适当地选取常数
使变换后的
尽量简单(对分组数据也适用,可令第28页,课件共37页,创作于2023年2月例.在例2中的分组数据,计算
及解:令a=3150,c=30085038450-3-441014210-1-225832组频数
37503450315028502550组中值54321分组编号
第29页,课件共37页,创作于2023年2月由上表得
的计算比直接计算样本平均数和方差要简便的多则
85038450-3-441014210-1-225832组频数
37503450315028502550组中值54321分组编号
第30页,课件共37页,创作于2023年2月4.几个常用统计量的分布定理7.1.设相互独立,服从正态分布,则它们的线性函数
也服从正态分布,且
(1)推论:设是取自正态总体
的样本,则(2)第31页,课件共37页,创作于2023年2月证明:(1)因
则取
由Th7.1知
的期望
方差从而
(2)对进行标准化,得到:这里只给出推论的证明:第32页,课件共37页,创作于2023年2月若
,它是数理统计中最重要的几个常用的统计量的分布之一.则称
服从具有
个自由度的
--分布,简记回顾定理4.4证明:也相互独立,且由定理4.1,若
相互独立,且定理7.2.设相互独立,均服从标准正态分布,则
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肉类购货协议书
- 现金补偿协议书
- 罢访息诉协议书
- 脱欧后备协议书
- 样板间软装销售协议书
- 和好朋友做生意协议书
- 房屋过度费补偿协议书
- 送养子女协议书
- 环境建设协议书
- 幼儿放学后托管协议书
- GB/T 38215-2019结构波纹管用热轧钢带
- 四六级英语写作考试辅导资料课件
- 交流电机理论分析
- 真石漆饰面工程检验批质量验收记录
- 妇产科手术配合课件
- (中职)中国税收:税费计算与申报项目十四 企业所得税计算与申报课件
- 心理照护教材课件汇总完整版ppt全套课件最全教学教程整本书电子教案全书教案课件合集
- 男朋友申请表
- 高中心理健康:我心换你心——心理主题:人际交往 课件(22张PPT)
- 高清元素周期表(专业版)
- 北京中考英语作文模板
评论
0/150
提交评论