关于随机性的游程检验_第1页
关于随机性的游程检验_第2页
关于随机性的游程检验_第3页
关于随机性的游程检验_第4页
关于随机性的游程检验_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.3 关于随机性的游程检验,在实际中,经常需要考虑一个序列中的数据出现是否与顺序无关,这关系到数据是否独立. 几乎所有经典统计方法在理论上都要求样本是随机样本,即要求重复观察到的一组变量值在统计上相互独立。 参数统计很难考察这一问题,但从非参数的角度考察时,若数据出现趋势,周期性规律,就不能表示数据是独立的。这些问题可以转化为 01 序列或类型出现顺序的随机性问题。 游程检验就是检验数据出现顺序是否随机,其出发点是检验样本的独立性,一个两分的总体,如按性别区分的人群,按产品是否有毛病区分的总体等等,随机从中拍取一个样本,样本也可以分为两类:类型1和类型2. 凡属类型1的记做0,类型2的记做1

2、 当样本按某种顺序排列(如按抽取时间先后排列)时,一个或者一个以上相同符号连续出现的段,就被称作游程,也就是说,游程是在一个两种类型的符号的有序排列中,相同符号连续出现的段,一、游程,在数据出现顺序是否随机的检验中,一个典型的序列就是二元0/1序列出现顺序的随机性问题 在一个二元序列中,0和1交替出现,一个由0或1连续构成的串称为一个游程(run),一个游程中数据的个数称为游程的长度。 一个序列里游程个数用r表示, r表示0和1交替轮换的频繁程度。容易看出, r是序列中0和1交替轮换的总次数加1,假如我们掷一个硬币,这是一个伯努利试验,将正面向上记做1,将反面向上记做0,例如我们得到一列这样的

3、结果: 00000001111110000111100,如果称连在一起的0或1为游程,则上面这组数中有3个0游程,2个1游程,一共是5个游程 (r=5) 这里0的总个数为 m=13,1的总个数为 n=10. 记总的试验次数为 n,有 n=m+n,如果 0/1 序列中0和1出现的顺序规律性不强,随机性强,则0和1出现不会太集中,也不会太分散。换句话说,可以通过0和1出现的集中程度度量序列随机性的大小。 若序列随机,则游程的个数不能太多,也不能太少。游程长度也不应太长或太短。相应地,就会出现游程个数检验和游程长度检验。 在固定序列长度 m和n时,可以通过游程的个数 r 过多或过少来定义假设检验的拒

4、绝域,二、随机游程的检验,mood (1940) 提出关于这一问题的检验 假设检验: 随机抽取一个样本,其观察值按某种顺序排列,如果研究所关心的问题是:被有序排列的两种类型符号是否随机排列,则可以建立双侧备择,如果关心的是序列是否具有某种倾向,则应建立单侧备择,注: 1. 为了对假设作出判定,被收集的样本数据仅需定类尺度测量,但要求进行有意义的排序,按一定次序排列的样本观察值能够被变换为两种类型的符号(比如 二元0/1序列,2. 在h0为真的情况下,两种类型符号出现的可能性相等,其在序列中是交互的。相对于一定的 m和n,序列游程的总数应在一个范围内。 若游程的总数过少,表明某一游程的长度过长,

5、意味着许多0 或许多1 连在一起,序列存在成群的倾向; 若游程总数过多,表明游程长度很短,意味着 0 和1交替出现得太频繁,序列具有混合的倾向。 因此,无论游程的总数 r 过多或过少,都表明序列不是随机的,二、检验统计量,检验统计量为: r 游程个数,例如,对于序列 1100001110110000111100, r=8,游程长度分别为 2,4,3,1,2,4,4,2 极端情况: 000001111111 r = 2 0101010101010 r = 2min(m,n)+1 所以,2 r 2min(m,n)+1 极端情况都说明数据不具有随机性,那么 r 服从什么分布呢,r 的分布,三、确定

6、p值,四、总结 随机性的游程检验,例2.5 假如我们掷一个硬币,将正面向上记做1,将反面向上记做0,例如我们得到一列这样的结果: 00000001111110000111100,假定在 r软件中,x代表上面的数据,则游程个数可由语句 n=length(x); k=1; for (i in 1: (n-1) if (xi!=xi+1)k=k+1 得到。 而“0”的个数 m 和“1”的个数 n 可由下面语句得到: m=sum(1-x); n=sum(x,五、 随机性的游程检验的应用,1. 检验两个总体的位置参数是否相同,例题:检验 x 和 y 分布函数是否相同 在我国的工业和商业企业中随机抽取22

7、家企业进行资产负债率行业差异分析,其1999年底的资产负债率()如下: 问:两个行业的负债水平是否有显著性差异,解:排序寻找游程,如果原假设成立,则两个行业的负债水平的分布是相同的,将其混合后,应能较为充分、均匀地混合,游程数r应该比较大 反之当游程数r较小,则说明两个总体的分布可能不同,因此是一个左边检验,11111,2,1111,222,111,222222 共有6各游程,2. 检验单样本的随机性,从生产线上抽取产品检验,是否应采用频繁抽取小样本的方法。 在一个刚刚建成的制造厂内,质检员需要设计一种抽样方法,以保证质量检验的可靠性。生产线上抽取的产品可以分成两类,有瑕疵,无瑕疵。检验费用与受检产品数量有关。一般情况下,有毛病的产品如果是成群出现的,则要频繁抽取

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论