高等数学61 随机样本_第1页
高等数学61 随机样本_第2页
高等数学61 随机样本_第3页
高等数学61 随机样本_第4页
高等数学61 随机样本_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、6. 1 随机样本随机样本第六章第六章 数理统计的基本概念数理统计的基本概念一一、总体和子样、总体和子样: :数理统计中数理统计中, , 通常把研究对象的全体称为通常把研究对象的全体称为总体总体 , ,构成总体的每一个成员称为构成总体的每一个成员称为个体个体 . .注注 在实际问题中在实际问题中, , 往往不需要研究总体的一切往往不需要研究总体的一切属属性性, , 而需要研究总体的某项数量指标而需要研究总体的某项数量指标, , 因此因此, ,可以把研究对象的某项数量指标的全体看作总可以把研究对象的某项数量指标的全体看作总体体, , 把每个数值作为个体把每个数值作为个体 . .对于选定的某个数量

2、指标而言对于选定的某个数量指标而言, , 每个个体的取值每个个体的取值是不同的是不同的, , 因而因而 X 是一个随机变量是一个随机变量, , X 的分布完的分布完全描述了总体中这一数量指标的分布情况全描述了总体中这一数量指标的分布情况 . . 由于由于在处理实际问题的时候在处理实际问题的时候, , 人们所关心的只是数量人们所关心的只是数量指标指标, , 因此把总体与数量指标因此把总体与数量指标 X 等同起来等同起来, , 把数把数量指标量指标 X 的分布称为的分布称为总体的分布总体的分布 . .总体总体有限总体有限总体无限总体无限总体(按照按照总体中的总体中的个体数量个体数量)因对于无限总体

3、或具有破坏性的试验因对于无限总体或具有破坏性的试验, , 无法进行无法进行 逐一试验逐一试验, , 所以一般采用所以一般采用抽样调查抽样调查的方法的方法 . .从总体中抽取一个个体进行一次观察并记录结果从总体中抽取一个个体进行一次观察并记录结果, ,在相同条件下对总体在相同条件下对总体 X 进行进行 n 次次重复重复、独立独立的观的观察察 , 将将 n 次试验结果按试验的次序记为次试验结果按试验的次序记为 X1 , X2 , , Xn . 因试验间是独立重复的因试验间是独立重复的, 所以可认为所以可认为X1 , X2 , , Xn 相互独立相互独立, 且与且与 X 具有相同分布具有相同分布 .

4、1、定义、定义6.1:与总体与总体 X 同分布同分布, 则称则称( X1 , X2 , , Xn )为总体为总体若若 X1 , X2 , , Xn 是独立同分布的随机变量是独立同分布的随机变量, 且且X 的的简单随机样本简单随机样本 . 样本中含有分量的个数样本中含有分量的个数 n 称为该称为该样本样本的的容量容量 .当当 n 次观察一经完成次观察一经完成 , 就可得到一组实数就可得到一组实数 x1 , x2 , , xn , 它们依次是随机变量它们依次是随机变量X1 , X2 , , Xn 的的观察值观察值, 称为称为样本值样本值 .注注 对于有限总体对于有限总体, , 采用放回抽样就得到简

5、单随采用放回抽样就得到简单随机样本机样本 , 但放回抽样使用不方便但放回抽样使用不方便 , 故当总体故当总体中个体数中个体数 N 比样本容量比样本容量 n 大得多时大得多时, 将不放将不放回抽样近似看作有放回抽样回抽样近似看作有放回抽样 .对于无限总体对于无限总体来说来说, , 抽取一个个体并不影响抽取一个个体并不影响其分布其分布, 所以常采用不放回抽样所以常采用不放回抽样 . 例如例如, 检检验一大批产品的质量时验一大批产品的质量时 , 常常是从中抽取常常是从中抽取 n个样品来进行试验个样品来进行试验, 以此来推断总体的情况以此来推断总体的情况 .2、简单随机样本的分布函数、简单随机样本的分

6、布函数:总体总体 X 的一个简单随机样本的一个简单随机样本, 则则( X1 , X2 , , Xn )若若 F(x)是总体是总体 X 的分布函数的分布函数, X1 , X2 , , Xn 是是的的分布函数为分布函数为12=1(,) =() ,nniiF xxxF x若若 X 是连续型的是连续型的, 其密度函数为其密度函数为 f (x) , 则则( X1 , X2 , , Xn )的联合密度函数为的联合密度函数为12=1(,) =() .nniif xxxf x二二、子样分布、子样分布: :在实际应用中在实际应用中, , 作为研究对象的总体作为研究对象的总体 X 永远是永远是未知的未知的. .

7、即使是由以往的经验知道总体即使是由以往的经验知道总体 X 的分的分布布, , 但其某些参数也是未知的但其某些参数也是未知的 . . 这就需要对总这就需要对总体进行抽样调查体进行抽样调查, , 从而作出适当的估计从而作出适当的估计 . . 通常通常的作法是取得一组样本值的作法是取得一组样本值 , , 根据样本值对总体根据样本值对总体分布进行了解与分析分布进行了解与分析 . . 这就需要了解子样中数这就需要了解子样中数据分布情况据分布情况, , 即子样分布的情况即子样分布的情况 . . 1、子样的频数分布和频率分布、子样的频数分布和频率分布: :例例6.1 从纺织车间抽取从纺织车间抽取 7 匹布匹

8、布, , 检查每匹布上的检查每匹布上的疵疵点数点数, , 得到一组子样值得到一组子样值 ( 0, 3, 2, 1, 1, 0, 1 ) . 把这把这 7 个子样值按从小到大的顺序排列个子样值按从小到大的顺序排列, 相同相同的数合并的数合并, , 并记录下重复的次数并记录下重复的次数, , 就获得如表就获得如表所示的频数表所示的频数表 . . 将其称为将其称为频数分布频数分布 . .X 0 1 2 3频数频数 2 3 1 1频数是子样中各个不同数值出现的次数频数是子样中各个不同数值出现的次数 , , 而而频率是指频数除以子样容量频率是指频数除以子样容量 . . X 0 1 2 3频率频率 2/7

9、 3/7 1/7 1/7例例6.1的频率分布可用下表表示的频率分布可用下表表示 .例例6.2 一自动化车床连续用刀具加工某种零件一自动化车床连续用刀具加工某种零件, ,从换上新刀具到刀具损坏为止加工的零件个数从换上新刀具到刀具损坏为止加工的零件个数称为刀具的寿命称为刀具的寿命, , 现记录现记录100把刀具的寿命把刀具的寿命 : :344 352 340 351 353 348 353 349 351 355350 345 352 349 355 341 351 355 352 348353 348 341 346 349 350 351 348 353 362338 355 352 356

10、350 351 349 357 348 358353 346 352 350 352 345 347 354 351 347346 343 347 343 357 349 353 345 350 358354 344 349 340 345 359 348 356 346 357359 349 355 354 344 353 346 351 354 352352 344 347 363 355 342 366 352 350 347346 349 350 360 346 358 350 345 349 355将所得数据由小到大依次排列将所得数据由小到大依次排列, 相同的合并相同的合并, 即可得

11、子样频数分布与频率分布即可得子样频数分布与频率分布:X 350 351 352 353 354 355 356 357 358 359 360 频数频数 8 7 9 7 4 7 2 3 3 2 1频率频率 0.08 0.07 0.09 0.07 0.04 0.07 0.02 0.03 0.03 0.02 0.01X 362 363 366频数频数 1 1 1频率频率 0.01 0.01 0.01X 338 340 341 342 343 344 345 346 347 348 349 频数频数 1 2 2 1 2 4 5 7 5 6 9频率频率 0.01 0.02 0.02 0.01 0.02

12、 0.04 0.05 0.07 0.05 0.06 0.09一般地一般地, , 子样值子样值(x1 , x2 , , xn)中数据可以按由中数据可以按由小到大依次排列小到大依次排列, , 把相同的数合并把相同的数合并, , 并指出其并指出其12,n xxx设设子子样样中中不不同同的的数数值值为为12, l m mm相相应应的的频频数数为为其其中中12=1, =lliixxxmn .且且频数频数 . .子样的频率分布子样的频率分布X x1* x2* xn* 频数频数 mi m1 m2 ml子样的频数分布子样的频数分布X x1* x2* xn* 频数频数 mi / n m1/n m2/n ml /

13、n注注 频率等于频数频率等于频数 mi 除以除以 n .2、经验分布函数、经验分布函数: :(1) 定义定义:设子样值为设子样值为 (x1 , x2 , , xn) , 对任意实数对任意实数 x , 子样子样值中小于或等于值中小于或等于 x 的个数记为的个数记为 m(x) , 则称则称( )( ) =nm xFx n为子样的为子样的经验分布函数经验分布函数 . .经验分布函数与随机变量的分布函数具有相同的经验分布函数与随机变量的分布函数具有相同的性质性质, , 如如 非降性、右连续性非降性、右连续性, , Fn( - -) = 0 , Fn( + +) = 1 .(2) 经验分布函数的具体表达

14、形式经验分布函数的具体表达形式: :11121223 0 , , , ( ) = , nxxmxxxnm + mxxxnFx 12+1 , , 1 , kkkl m + m + mxxxnxx (3) 经验分布函数的图形经验分布函数的图形: :1OFn(x)xx2*x1*xl*1m n2m nlm n经验分布函数的图形是一梯形曲线经验分布函数的图形是一梯形曲线 , , 可以看出可以看出它类似于离散型随机变量的分布函数它类似于离散型随机变量的分布函数 . .例例6.3 在例在例6.1中子样的中子样的经验分布函数的表达式为经验分布函数的表达式为 0 , 02 , 0175( ) = , 12 76

15、 , 23 7 1 , 3nxxFxx xx 其其图形如下图图形如下图: :1OFn(x)173717x12327limsup( )( )= 1 .nnxPFxF x+ + - - + + - - 定理定理6.1(格利汶科格利汶科(W.Glivenko)定理定理):经验分布函数经验分布函数 Fn(x) 以概率以概率 1 关于关于 x 一致收敛于一致收敛于总体分布函数总体分布函数 F(x) , 即即3、直方图、直方图: :完成直方图的完成直方图的步骤步骤:对总体对总体X作作n次观测次观测, , 得到得到n个数据个数据 x1 , x2 , , xn , (1) 找出这找出这n个数据中的最小最大值个

16、数据中的最小最大值, 分别设为分别设为x1*=minx1, x2, , xn, xn*=maxx1, x2, , xn,从中插入从中插入 k - -1 个分点个分点: :(2) 取区间取区间( a , b , 使使 a 略小于略小于 x1*, b 略大于略大于 xn* ,a = a0 a1 a2 ak- -1 ak = b将区间分成将区间分成 k 个子区间个子区间(a0 , a1 , (a1 , a2 , , (ak- -1 , ak 称称 ai - -ai- -1 为第为第 i 组组距组组距, (ai - -ai- -1)/2为第为第 i 组的组的组中值组中值 . 各组组距可以相等各组组距可

17、以相等, 也可以不等也可以不等 . 子区间的个数子区间的个数 k 一般可取一般可取8 15个个, 太多或太少太多或太少均不易显示出分布特征均不易显示出分布特征 . 另外另外, 每个区间的端每个区间的端点应比所给数据的有效数字多一位点应比所给数据的有效数字多一位 .(3) 计算数据落入各区间的频数计算数据落入各区间的频数 ni 及频率及频率 f i :以以 f i / (ai -ai - -1) 为高作为高作 n 个小矩形个小矩形, 每个小每个小(4) 在在 x 轴上截取各子区间轴上截取各子区间, 并以各子区间为底并以各子区间为底 , fi = ni / n ( i =1,2, ,k )矩形的面

18、积矩形的面积 Si = (ai -ai - -1) f i / (ai -ai - -1)= f i ,即即 Si 等于数据落入第等于数据落入第 i 个小区间的概率个小区间的概率, 且有且有=1=1=1=1= 1ninnniiiiiiinnnSf nnn这样就得到了直方图这样就得到了直方图 .当样本容量当样本容量 n 充分大时充分大时, 随机变量随机变量 X 落入落入(ai - -1 , ai 内的频率近似等于其概率内的频率近似等于其概率, 即即f i P ai - -1 X ai , i =1,2, , k .利用直方图便可大致看出随机变量利用直方图便可大致看出随机变量 X 的分的分布规律布规律 .例例6.4 作出作出例例6.2的直方图的直方图 .所给出的样本观测值中最小是所给出的样本观测值中最小是338, 最大

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论