




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第四章 抽样和抽样分布 第一节 随机事件及其概率 第二节 随机变量的概率分布 第三节 抽样分布 第四节 正态分布和正态逼近一.抽样样二.试验验三.样本本空间四.事件件及其概概率第一节随随机事事件及其其概率一、抽样样1.概念念从总体中中抽取部部分单位位,并进进行实际际调查,以推断总总体。2.抽样样的两种种方法:重置抽样样和不重重置抽样样两种抽样样方法重置抽样样1.概念念:也称有放放回的抽抽样,从从总体中中抽取一一个单位位,登记记后再放回回总体参参加下一一次的抽抽取,连连续试验验n次。2.重置置抽样排排列数:从总体N个单位位,抽取取样本容容量为n个单位位的重置置试验,可可能抽取取的样本本点个数数:
2、不重置抽抽样1.概念念:也称无放放回的抽抽样,每每次总体体中抽取取一个单单位,登记记后不再再放回原原总体,不参加加下一次次抽选,下一一次继续续从总体体余下的的单位抽抽取样本本单位,这样样继续进进行n次次试验。有n个单单位的样样本是由由n次连连续试验验构成的的,但因每次抽抽出不重重置,所所以实质质上等同同于同时时从总体中抽抽取n个个样本单单位。不重置抽抽样排列列数:不重置抽抽样又分分为考虑虑顺序和和不考虑虑顺序的的情况(排列与与组合)。从10个个同学中中抽三个个担任不不同职务务,有:从10个个同学中中抽三个个考察其其平均成成绩,则则:二、试验验1.概念念:在相同条条件下,对事物物或现象象所进行行
3、的观察察。例如:掷掷一枚骰骰子,观观察其出出现的点点数;产产品质量检验,考察其其是否是是合格品品等。2.试验验具有以以下特点点:可以在相相同的条条件下重重复进行行;每次试验验的可能结果果不止一个个,但试试验的所所有可能能结果在在试验之之前是确确切知道道的;在试验结结束之前前,不能能确定该该次试验验的确切切结果;1.基本本事件如果一个个事件不不能分解解成两个个或更多多个事件件,则这这个事件称称为基本本事件,也称为为样本点。通常样本本点不止止一个单单位,而而是由许许多单位位构成,这时就要要连续n次试验验的结果果构成一一个样本本点。2.样本本空间以全部样本点为为元素的的集合,称为样样本空间间。三、样
4、本本空间试验样本空间抛一枚硬币抛掷一颗骰子抽出一件产品检测一场足球比赛正面向上,反面向上1,2,3,4,5,6点合格,不合格获胜,失利,平局抛掷两枚硬币抽两件产品检测(正,正),(反,正),(反,反)练习题写出随机机试验的的样本空空间1.记录录某班一一次统计计学测试试的平均均分数2.某人人骑自行行车在公公路上行行驶,观观察该骑骑车人在在遇到第第一个红红灯停下下来以前前已经遇遇到的绿绿灯个数数。3.生产产产品,直到有有10件件正品为为止,记记录生产产产品的的总件数数。1.事件件:随机机试验的的每一个个可能结结果(任任何样本本点集合合)例如:掷掷一枚骰骰子出现现的点数数为32.随机机事件:每次试试
5、验可能能出现也也可能不不出现的的事件例如:掷掷一枚骰骰子可能能出现的的点数3.必然然事件:每次试试验一定定出现的的事件,用表示。例如:掷掷一枚骰骰子出现现的点数数小于74.不可可能事件件:每次次试验一一定不出出现的事事件,用用表示。例如:掷掷一枚骰骰子出现现的点数数大于6四、事件件及其概概率5.事件件的概率率(1)事件A的概率是是对事件件A在试验中中出现的的可能性大大小的一一种度量量(2)表示事事件A出现可能能性大小小的数值值,事件件A的概率表表示为P(A)(3)概率的的定义有有:古典典定义、统计定定义和主主观概率定定义6.概率率的统计计定义在相同条条件下进进行n次随机试试验,事事件A出现m次
6、,则比比值m/n称为事件件A发生的频率。随着n的增大,该频率率围绕某某一常数数P上下摆动动,且波波动的幅幅度逐渐渐减小,趋向于于稳定,这个频率的稳稳定值即即为事件件A的概率,记为例如,投投掷一枚枚硬币,出现正正面和反反面的频频率,随着投掷掷次数n的增大,出现正正面和反反面的频频率稳定在1/2左右试验的次数正面 /试验次数1.000.000.250.500.750255075100125第二节随随机变量量及其分分布一、随机机变量的的概念二、离散散型随机机变量的的概率分分布三、连续续型随机机变量的的概率分分布一、随机机变量的的概念1.概念随机事件件的数量量表现就就称为随随机变量量。例如:投掷两枚枚
7、硬币出出现正面面的数量量;从班班级同学中中抽10个,抽中中女生的的人数。2.分类根据取值值情况的的不同分分为离散散型随机机变量和和连续型随随机变量量(1)离离散型随随机变量量如果随机机变量X的取值都可可以逐个个列举出出来X1,X2,则X称为离散型随随机变量量离散型随随机变量量的一些些例子试验随机变量可能的取值抽查100个产品一家餐馆营业一天电脑公司一个月的销售销售一辆汽车取到次品的个数顾客数销售量顾客性别0,1,2, ,1000,1,2, 0,1, 2,男性为0,女性为1(2)连连续型随随机变量量如果X的所有可能能取值不不可以逐逐个列举举出来,而是取数轴轴上某一一区间内内的任意意点,则则称该随
8、随机变量为连续型随随机变量量连续型随随机变量量的一些些例子试验随机变量可能的取值抽查一批电子元件新建一座住宅楼测量一个产品的长度使用寿命(小时)半年后工程完成的百分比测量误差(cm)X 00 X 100X 0二、离散散型随机机变量的的概率分分布1.离散型随随机变量量X的所有可可能取值及其取这这些值的概率按顺序排排列起来来就形成成概率分布布。2.通常用下下面的表表格来表表示X = xix1 ,x2 , ,xnP(X =xi)=pip1 ,p2 , ,pn3.概率分布布的性质质:随机变量量取值的的概率是是非负的的,即pi0;随机变量量所有取取值的概概率总和和等于1,即(i1,2,n)4.离散散型随
9、机机变量的的概率分分布(实例)【例】如规定打打靶中域域得3分,中域域得2分,中域域得1分,中域域外得0分。今某某射手每每100次射击,平均有有30次中域,55次中域,10次中,5次中域外外。则考考察每次次射击得得分为0,1,2,3这一离散散型随机机变量,其概率率分布为为X = xi0 1 2 3P(X=xi)pi0.05 0.10 0.55 0.305.离散散型随机机变量的的数学特特征离散型随随机变量量的数学学期望离散型随随机变量量的方差差离散型随随机变量量的数学学期望(1)在离散散型随机机变量X的一切可可能取值值的完备备组中,各可能能取值xi与其相对对应的概概率pi乘积之和和。(2)计算公公
10、式为(3)性性质第三章所所讲的平平均数的的性质也也完全适适合于数数学期望。对对于抽样样分布通通常要考考虑多个个变量的的情况,所以以还要补补充两条条性质。n个随随机变量量代数和和的数学学期望等等于它们们的数学学期望之之和。n个独立随机变量量连乘积积的数学学期望等等于它们们数学期期望的乘乘积离散型随随机变量量的方差差(1)随机变变量X的每一个个取值与与期望值值的离差差平方的数数学期望望,记为为D(X),或Var(X),或它用来描描述离散散型随机机变量取取值的分分散程度度(2)计算公公式为离散型随随机变量量的方差差(实例)【例】投掷一枚枚骰子,出现的的点数是是个离散散型随机机变量,其概率率分布为为如
11、下。计算数数学期望望和方差差X = xi1 2 3 4 5 6P(X =xi)=pi1/6 1/6 1/6 1/6 1/6 1/6解:数学期望望为:方差为:三、连续续型随机机变量的的概率分分布连续型随随机变量量可以取取某一区区间或整整个实数轴上的的任意一一个值。它取任何何一个特特定的值值的概率率都等于于0,所以不能能列出每每一个值值及其相相应的概概率,通通常研究它它取某一一区间值值的概率率(一)密密度函数数f(x)1.f(x)表示随随机变量量X在点点x上的的概率密密度,所以称为为密度函函数。2.f(x)不是概概率。3.通常常把密度度函数的的图形称称为分布布曲线。在平面直直角坐标标系中画画出f(
12、x)的图形,则对于于任何实实数ab,P(aXb)是该曲线线下从a到b的面积f(x)xab概率是曲线下的面积(二)密密度函数数具有以以下性质质:1.密度度函数是是非负负函数,即2.随机机变量X落在区区间内内的的概率等等于它的的密度函函数在该该区间上上的定积积分。即即:其几何意意义就是是概率等等于区区间上分布曲曲线和X轴围成成的面积积。3.由于于是是必必然事件件,所以以(三)分分布函数数1.连续型随随机变量量的概率率也可以以用分布布函数F(x)来表示2.分布函数数定义为为根据分布布函数,P(aXb)可以写为为分布函数数与密度度函数的的图示1.密度函数数曲线下下的面积积等于12.分布函数数是曲线线下
13、小于于x0的面积f(x)xx0F ( x0 )(四)连连续型随随机变量量的期望望和方差差1.连续型随随机变量量的数学学期望为为2.方差为第三节抽抽样样分布基本概念念重置抽样样分布及及其数值值特征不重置抽抽样分布布及其数数值特征征一、基本本概念1.抽样样分布:从一个总总体中抽抽取样本本容量相相同的所所有可能能样本之后后,计算算样本统统计量的的值及取取该值的的相应概率率,就组组成了样样本统计计量的概概率分布,简称称抽样分分布。样本统计量总体未知参数样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量样本统计量抽样分布样本统计量所有可能值的概
14、率分布主要样本本统计量平均数比率(成数)方差.参数数和统计计量(总体指指标和抽抽样指标标)总体参数数(总体体指标)(parameter)根据全及及总体各各个单位位的标志志值或标标志属性性计算的的,反映映总体某某种属性性或特征征的综合合指标称称为全及及指标。全及指标标值具有有唯一性性。常用的全全及指标标有总体平均均数()(或总体成数数P)、总体标准准差(或总体方差差2)。统计量(抽样指指标)由抽样总总体各单单位标志志值计算算出来反反映样本特征征,用来来估计总总体的综综合指标标称为统计量量(抽样样指标)。它是一个个随机变变量。3.统计计量的特特点统计量(抽样指指标)是是随机变变量,随随着抽到到的样
15、本本单位不不同其取取值也会会有变化化。统计量是是样本变变量的函函数,用用来估计计总体参参数,因因此与总总体参数数相对应应。要了解本本班男同同学的身身高,从从总共30名男男同学中抽取取5名同同学测量量他们的的身高,用这5名同学的平平均身高高来估计计本班男男同学的的身高。样本点:样本空间间:样本统计计量:4.统计计量的计计算样本平均均数:样本方差差:样本成数数:二、重置置抽样分分布(一)样样本平均均数的分分布样本平均均数的分分布是总总体中全全部样本本平均数数的可能取值值和与之之相应的的概率组组成。下面用一一个例子子来说明明该问题题某班组5个工人人的日工工资为34、38、42、46、50元。现用重置
16、置抽样的的方法从从5人中中随机抽抽2个构构成样本本。共有有52=25个个样本。样本平均均数的均均值、方方差及标标准差:抽样平均均数的标标准差反反映所有有的样本本平均数数与总体体平均数数的平均均误差,又称为为抽样平均均误差,用表表示示。(二)两两个重要要结论:1.重置置抽样的的样本平平均数的的平均数数等于总总体平均均数,即即2.重置置抽样的的抽样平平均数的的标准差差等于总总体标准准差除以以样本单单位数的的平方根根。即样本抽样样分布原总体分分布以上两个个结论具具有普遍遍意义,其一般般推导见见课本p113。这一等式式可以看看出两项项重要事事实(1)抽样平均误误差比总总体标准准差小的的多,仅仅为其。例
17、如一个个县的粮粮食亩产产高低悬悬殊,亩亩产标准准差为80公斤,如果果随机抽抽取100亩求求平均亩亩产,那那么样本本平均亩产量的的差异就就显著减减小,平平均误差差只及总总体亩产产标准差的,即所以用样样本平均均亩产来来代表总总体平均均亩产是是更有效效的.(2)抽抽样平均均误差与与总体标标准差成成正比变变化,而与与样本容容量n的的平方根根成反比比变化。例如在同同一个总总体中,如果抽抽样单位位数扩大大原来的4倍倍,则抽抽样平均均误差就就缩小一一半,如如果抽样平均误误差增加加一倍,则样本本单位数数只需要要原来的1/4。(三)总总体成数数的估计计总体成数数p是指具有有某种特特征的单单位在总总体中的的比重。
18、在前前面我们们已经知知道,成成数是一一个特殊殊平均数,设总总体单位位总数目目是N,总体中有有该特征征的单位位数是N1。设X是0、1变量, 即:总体体单位有有该特征征,则X取1,否则取取0,则有:现从总体体中抽出出n个单位,如果其其中有相相应特征征的单位位数是n1,则样本成成数是:成数P也是一个个随机变变量,利利用样本本平均数数的分布布性质结结论,即即有:例题Eg.已已知某批批零件的的一级品品率为80,现用重重置抽样样方法从从中抽取取100件,求求样本一一级品率率的抽样样平均误误差。三、不重重置抽样样分布(一)样样本平均均数的分分布某班组5个工人人的日工工资为34、38、42、46、50元。现用
19、不重重置抽样样的方法法从5人人中随机机抽2个个构成样样本。共共有20个样本本。不重置抽抽样样本本平均数数的平均均数、方方差及标标准差:(二)两两个重要要结论:1.不重重置抽样样分布虽虽然与重重置抽样样分布不不同,但但它们的样样本平均均数的平平均数仍仍等于总总体平均均数,即:2.抽样样平均数数的标准准差也是是反映样样本平均均数与总总体平均均数的平平均误差差程度。即:所以抽样平均均数的标标准差也也可称为为抽样平平均误差差,或抽样标准误误差,不不重置抽抽样的抽抽样平均均误差等等于重置置抽样的平均误误差乘以以修正因因子n/N称称为抽样样比。(三)样样本成数数的分布布抽样平均均误差为为:对于(0,1)分
20、布的的总体,总体平平均数为为:总体方差差为:从总体中中抽取容容量为n的样本,样本成成数p的的分布实实质是样样本平均均数的分分布。有有:重置抽样不重置抽样样本平均数误差样本成数误差抽样平均均误差公公式汇编编回顾某企业生生产一批批灯泡,共10,000只,随机抽抽取500只做做耐用试试验。测测算结果果平均使使用寿命命为5,000小时,由历史史经验得得知总体体标准差差为300小时时,500之中中发现10只不不合格。求平均数数和成数数的抽样样平均误误差。第四节正正态分布布和正态态逼近一、正态态分布二、正态态分布再再生定理理三、中心心极限定定理四、抽样样分布的的正态逼逼近一、正态态分布(一)正正态分布布概
21、述:1.定义义一个连续续型随机机变量X,如果果其密度度函数为为那么我们们称X服服从参数数为x和正态分布布。连续型随随机变量量的一种种重要分分布,它它是统计计推断的基础2.密度度函数f(x)的性质质(1)对对称性;(2)非非负性;(3)最最大值;(4)拐拐点;f(x)(5)x和的意义;位置参数数形状参数数(1)变变动平均均数(2)变变动标准准差改变分布布中心位置;表现为图图形的平平移。分布疏密程度表现为图图形的拉拉伸或压压缩(二)正正态分布布函数的的标准化化1.标准准正态分分布定义义数学期望望为0,方差为为1的正正态分布布,称为为标准正态分分布。用用N(0,1)来表示示。变量X服服从标准准正态分分布记为为:标准正态态分布其其几何意意义是将将分布曲曲线的中中心移到原原点,使使得离差差化为以以为为单单位的相相对离差。2.标准准正态分分布的特特点:(1)分分布的平平均数(数学期期望)为为0;(2)分分布的方方差为1。(3)密密度函数数为:(4)分分布函数数:3.非标标准正态态分布标标准化(1)为为什么要要把不同同的正态态分布变变换为具具有相同同参数的的标标准正态态分布:N(0,1)?为了计算算的方便便!计算算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度城市郊区土地承包使用权转让协议
- 二零二五年度土地流转承包与农产品加工合作协议
- 2025年度武术培训机构学生传统武术传承协议
- 2025年度智慧城市建设项目无偿股权转让合同
- 二零二五年度房屋拆迁补偿合同书
- 二零二五年度体育场馆资产抵押担保协议
- 2025年度汽车租赁合同主体变更申请文件
- 2025年度新能源充电桩销售提成及配套设施合同
- 2025年度车辆不过户责任划分及免责条款合作协议
- 2025年度有机农产品养殖场合伙经营协议
- 医学教材 《狂犬病暴露预防处置工作规范(2023年版)》解读课件
- 2024年中国混凝土泵输送管市场调查研究报告
- 买卖合同法律知识及风险防范培训课件
- 第八章施工期环境保护方案及措施
- 中药奶茶介绍
- 储罐自力式氮封阀设计规范
- (六枝)电厂贮灰场工程施工组织设计
- 消除艾梅乙工作专班制度汇编手册修订版艾滋病梅毒乙肝
- 2022-年安徽省普通高校分类考试招生和对口招生文化素质测试语文试题
- 2024-2030年中国阳澄湖大闸蟹行业市场发展监测及投资前景展望报告
- GB/T 9799-2024金属及其他无机覆盖层钢铁上经过处理的锌电镀层
评论
0/150
提交评论