




已阅读5页,还剩15页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 统计数瓣质量闻题一整潮撬蓿我匿统计界,也秀社会番弊所关注,所 以避年来辩冀瑾论上瀚讲究探讨始终保持热赢统计数据瓣摄问题本质上 是误整阕题,薅减小误差最莺要躲是排除数据中的舅常俊, 辩予爨常照懿认谈苓罨稳惑,褪懿缡起寒不岁 孚鼹释一一广义髯常毽 释狭义舅常繁。基于菜转藏闵,学者嚣l 受关液狭义异常禳懿捡骏阕趱,狭 义异常僮又秣秀离群德,鼹一擞数撂孛与其余数据糨魄爨显不一致懿数 据。根据窀 f j 在整体数据孛掰处鹣位疑,又努势异常犬缀穰巽常小蠖 本文针对双参数黼b n l l 分布场合离群值的检验问题,在异常大德税鼯 常露、馕麓融存在豹情滗下,跌参数静檄大儆然嵇计煎建发,先猩形状参数 嫩溅黧酶情滋下,梅逡统计鬣并绘逡冀精确的分布;鞭将就统计量捻广戮 墩来躲斡情鬣,霆骧橇模羧鹣方法给融其分俊患。这样双参数黼孤箍分布 场合下异常德鹃阕麓褥戮稷好遗麓决。 关键谈:双参数麟b 姨努帮;异常簸;擞大僦然旗计;撩骏;隧橇 模拟 a b s t r a c t 刁陆e p r o b l e m 西t h e q u 啦i 移横s t 8 t i 8 t i e a l d 融a n 嘶a i 龃n t m u o 诅$ l y p u z 或e s t h e n 8 t i o 荆矗 或氇七主s 馏,孤t 妇删v 姻t 增氇t t e n 蛀o n 8 蠡。璐lc i r c i e s s ot h er e s e a r 文o n 娃l et l l e o r y m 越n t a j n 8h o tr e c e n t ut h ee s 8 鳓c eo ft h ep r o b l e m 觚e c t i 醒t h eq u a l i t yo f8 t 砒i s t i c a ld a t 拄 i st | e 琶r r c a 触8 e dm a j n l y 姆t 1 砖o u t l i 群8 s oe l i m i n 蚺l a gt h 船o u t l i e r si st h em 0 8 t i l 1 p o r t a 嚣毫 a l t h o n g ht h e 髑霍蛳t i 8o 致吼l 诅i e r s 豁ed 羽镪电堪t od 弼窃曙n tp 甜s o n ,g e n 钟丽l y 端地a k i n 舀 t h e r e 聪t w 母巍 辍l 卜巍珏醚s e 珏8 e 黻藏珏瓣ws e 矬s e 粉e 砖鑫s 撇攮e8 馥媾赧s a yi 拄掰醇 a t t e n t i o no nt h et e s t i n go ft h en 舯r 删o n e 8 t h en 龇r o wo u t h e r sa l s o 砌1 硝s m l yd a t 黼, w 毯c h 甜ed 爨搬e n t 蠡o mo 七h e 鹉o b v i o u s 差yt h eo u 镪e 辩岛b = 。e a nd 量v i d e 洳t o 台啪k i 玎d 即p e r a 吐t 鲢e f 8 搬d 氧 瞅o l 琏l i e r s i nt h i 8p a p e r ,w ed 龇瓣t h ep r o b 】e mo f t e s t i n gt h ed 拽妇硝t h 缸p p e ro u t l 融8 蝴dl r o 娃t 艇e r s 搬t 椰p 躲甜l e t e rw 赫u 越麟a 薹矬p l 档,b 蚓孵o nt h em l eo ft h ep 馘8 l n e t e r s 。 a 毫 蠡掰8 箍姆懿娃舞8 t i c 蘸越di 卺8 懿盎熊磷s t r 淹毽t 圭。祛嚣糟西瑚w 巍e mj 8 轴撼锛m ,t 瓤龃粥甥砖雠心 t h e8 t a t i g t i ct oa p p l yt ot s i t u 乳t i o nw h e nm i su n k n o 啊l 8 皿d 埘v ei t sp e r c e n t i l e 、枷u e 8 b y 撇。越静e 艚bm e 穗。d 。a sa 掩8 破t ,t h 船p r o b e m 。ft e 8 t 汝gt h eo u t 王i e r si n 胁p 材艇e t e r 硎醚b 落le x 8 氆p l e si s 鳓l 硼畦辩i m e 琢 k 镪懈静r d sjt 瓣p 猷拽m e 秘秘麓b 蟠d 溉r 瓢l 耄融;绷娆娜;m l 嚣; t e s a 垂o n t 静a 甜l o i l 华中理范大学学饿论文原创挂声凑和徒璃授权说壤 廉创镊声嬲 本人郑重声明:所呈交的学位论文,魑本人在导师指导下,独焱谶行研究工作 所取得的研究成果。除文中融缀标明引用的内窬外,本论文不包含任何其他个人或 集体融疑发表或撰写过的研究成果。对本文的研究做出贡献的个人和熊体,均已程 文孛激绢确方式标餐。本声镄瓣法律缝荣凌本入承摇。 馆搿签名: 毯糍:嚼6 年r 琏汹黠 学谯论文蔽权使怒授毂毒 本辫彼论文作者完全了解学校有关保留、使用学位论文的规定,鞠;学校有权 保留并向国家有关部门或机构遴交论文的复印件和电子版,允许论文被套阅和借 阅。本人授权华中师范大学可以将本学位论文的企部或部分内容编入有关数据库进 行梭索,可以采用影印、缩印绒扫捕等复制警段保存和汇编本学位论文。 作奢签名:嘲筝7 鹤期:6 可月枷罐 ? 导师戡。护却 西期:o 年,塌如日 零人已经认真阕读“c 矗l l s 高校学位论文奄文数据库发布章程”,蠲意将零入的 学位论文提交“c a l i s 高校学位论文全文数据滕”中全文发布,并可按“章程”中的 规定常髓相关权益。回亟逾塞堤褒埴进蜃i 豳出燕;旦二生;旦三重熬窥! 镗爱签名:专冬韧 黯籀:驴3 年岁月瑶 硕士举住论文 m a s t e r l st i i e s l s 一引言 统计数据质量问题一直困扰着我国统计界,也为社会各界所关注,所 以近年来对其理论上的研究探讨始终保持热点但研究的重点主要是在健 全统计法律制度和完善工作程序等方面毫无疑问,这确实是提高统计数 据质量的重要方面,但统计数据质量问题本质上是误差问题,即所提供的 统计数据与客观的社会经济现象实际的数量特征之间的差距问题如果数 据中混进了异常值,就会使相应统计分析误差增大,小则出差错,大则出 事故因此,在利用统计数据进行统计分析之前,有必要对其进行异常数 据的检验 何谓异常数据? 学者们认识不尽相同,在文献【3 】中作者从它们的内 涵关系出发将其归纳为两种,分别称为广义及狭义异常值 定义1 ( 广义定义) :在所获统计数据中相对误差较大的观察数据称之为广 义异常值,或称为奇异值 定义2 ( 狭义定义) :一批数据中有部分数据与其余数据相比明显不一致的 称为狭义异常值,或称为离群值 在对统计数据的质量进行评估时,虽然能运用计算机对数据间的逻辑 关系进行检查和纠正,然而面对混杂在大量原始数据中的异常数据却难以 较准确地判断尤其是广义定义上的异常值对于狭义定义下的异常值, 由于它们对统计分析的结果反应灵敏及数学上的处理相对较简单,近年 来,国内外不少学者从不同角度对其给出了一些方法特别是在电子产品 的可靠性研究、机械制造业的可靠性疲劳试验、橡胶工业的试验以及其它 行业对产品质量等的统计分析中,其相关的数据均可视为“寿命数据” 指数分布,w e i b u u 分布以及对数正态分布在对这种数据的描述中占据了 十分重要的地位本文基于w e i b u l l 分布给出一种狭义异常值的检验方法 由定义2 ,异常值就是离群值,将所获统计数据按从小到大的次序进 行排列后,异常值必处在两侧的位置上,不外乎是下述三种情形之一: ( 1 ) 仅有异常小值( 但不一定唯一) ; ( 2 ) 仅有异常大值( 但不一定唯一) ; ( 3 ) 既有异常小值又有异常大值 对异常值研究的文献很多,但检验的统计量往往只适用于在( 1 ) 和( 2 ) 场合 下假崩所含昴常值怒唯一的情况,却不适用于异常小德和异常大值都存在 酶情影,瑟凝害异常小值又骞晏常大僮静情形在实际搜集戆统计数援中是 存在的+ 同时由于数据的屏蔽性的存在,时常会遇到m a 蹦蜷效应 异判 正) 秘s w 蝴p i d g 效应正翔异) 。翅对予一个滋态撵零为3 ,4 ,7 ,8 l o ,9 4 9 ,5 i , 检验为d 。一堡 二她二堕一熹 f ( ) 燃 【o 髫墨e 其审a o 为测度参数,m o 鸯形状参数,该势布记为渺线m x 器l 遴l :设。( 1 嚣獬 s 娜为寒国双参数聪蹦1 分雍酸a ,嘲懿容 塑海n 鹃浆r 个次序缆计爨,剥盖,m 的掇大骰然估计( 醚) 囊下述方撰 组给出: 三+ 董。螂翰;镪砸驴”r 蠕砧) = ;眨塌+ 如一) 喝l 诫:出于双1 ) o 然黼数簿: 。( 2 ) o 懿容量涛n 懿次窿缝计量,剐对任意酶l s 蠢 r s 枯,嚣 f :堡芝竺堑型。雄”酚( 茹孙。o ) 妒一2 ) 匿喝+ ( ”一是) s 列 迸;渣葶l 理2 辩 鳖掣。鲨! 掣二型呐砷 q 1 尝兰生一燃! 三量t 一x 2 ( 2 知) ;薹,妊一l + 1 ) 嗡一曝l ) q 2 盘璺照鲢_ = 二= x 2 ( 2 爷秘) 置镣l 与铂独立,掰戳 一f ( 2 驴姊,2 定义3 :设。( 1 ) ,z ( 2 ) ,z ( 札) 为来自总体分布f ( 霉;口) 的样本容爨为n 的次 痒统计爨,蕊为仅依赖予。,。( 。扩一,。的期婺芦的点慧计,裂称等为 风在点处的跳跃度 莲 竺嘲 竺” 琰一 沣一喝 旷嚷 壹燮卜 垂嚣 三异常值的检验 下丽分祷况考惑试验步骤; l ,澎状参数m 已知 这种情况我们可以直接根据文献【1 】对指数分布给出的“取中逐步推 移检验法”对w 矾u 1 1 分獭异常值进行检验 蓄先,拳用所给样本数据确定中段“燕常数据”由于假定所取样本数 据中溉有舅零零又有舅常太僮,那么舅常簸必链子蓑痔麓数缀酶秀端。壹 观上,异常值的存在必然使a 的点估计产斑跳跃,因而使a 的点估计产生 最大跳跃的点最有可能撼异常数据的起始点,文献【1 】针对指数分布的随机 模拟结果支持了这一观点这样,对左侧丽畜,若垒 盟较大,我们可以认为 z ( i ) 茹( 2 l 一。,则 认势,震瘩乎a 下嚣溉+ 。十1 ) 海异常夫毽,扶 蠢# 时。+ 1 ) ,鬈锋) 臻为舅常大 使否则,继续在容量为r 2 十2 的样本茹( 咐1 ) ,茹( 叶2 ) ,2 ( 叶n + 1 ) ,。一,机+ 2 ) 基 础上考察害堂,矗至找到异常值魄起始点,同时知此项以赠的所番数 据均为异常大值 考察茹机) 是否舞募常小德,撼梯零嚣,。缸l t ,髫奴+ 。番成来自双参 数骶- b t l l l 分布酶容爨为您十l 懿次滓统计鳖,毒这他十1 个样本我嬲阕榉 有m 的极大似然估计哦,类比n 构造统计量: m沁+ 1 ) 霄; 。一一蕊 1 x 、1 刖慨 。0 一+ l w 辩给定酶貔,有k 满足穗一p 冀k ) 著贮h ,茭| j 认势,在水平8 下z h l 为异常小值,从而搿( 1 ) ,前( 。) 均为舜常大值否则,继续在容量 魏如+ 2 懿样本。瓤一l ,茹融矿,茹r ,竹。) 基础上考察;垒曼,鲎至我裂棼常 使的起始点,同时知此顼以前的所有数据均为异常小值 在我镪溪m 。n t 扑g 躯b 方法蘸羧一。潭筑o 5 ,o 。9 ,e 。l ,o 潞,o o l 耩滋下 霹、罡的分布靛分饭点之藏,我们先弓l 避枢轴量的定义。 定义:从8 的一个点旗计成发,构造一个与# 懿个黼数g ( 袭, 骥褥g 酶分布在大榉本场合,胃黻是g 豹渐进分布) 是邑翔酶,与# 无 荧的。通常称这种蕊数g p ,为椴轴蜃 下蘑我露l 证咀上述避、贮是橙辘量。 定理:设z ( ,) 嚣 群( 。瞄,= t 瑚粥,鲁= 差慧一 o 9 6 5 2 聪( o 9 5 ,2 1 ) :1 0 9 6 5 ,因此。为最小的异常大值,即。( 2 4 ) ,。( 2 5 ) 均为 异常大值 考察。是否为最大的异常小值,考察样本o 0 1 ,4 ,7 ,1 0 ,1 7 ,1 9 ,2 5 ,3 1 ,3 4 , 4 5 ,5 2 ,6 1 ,6 4 ,7 6 ,8 7 ,1 0 1 ,1 1 6 ,1 4 1 ,1 8 1 ,2 0 1 ,2 4 0 ,2 5 1 ,2 6 7 , m 的m l e 估计僦:o 8 3 3 8 ,k = 4 1 0 8 2 0 ,k 1 = 4 2 8 8 7 0 ,对于给定的= o 9 5 , 喾一。呲 脚o s ,。) = o 。0 6 2 0 ,因此m 、为最大的异常小值 附录 m a t l l b 程序 模拟聪、贮在水平。= o 9 9 ,o _ 9 5 ,o 9 ,o 1 ,o 0 5 to 0 1 处的分位点,以 r 2 = 1 5 为铡; r 2 嚣1 5 ; 礼粼r 2 + 1 ,钟 = l :l 。= 岫e i 打竹d ( 1 ,1 ,f 1 6 = e i 礤蜒z ) ; 。= 霉。 b ( 2 ) ; 茹= = s d r t ( 篁) ; ,wj = l :您 e n d 曩 ) :。可( 砷,掣( n 1 ) 嚣( 1 ) :2 + 茹( 1 ) ; ,计= 2 :啦 正常样衣容量 考察样本容量 叫) ;随机生成样本 霉_ z m 排序 计算 糙 样本分成两部分, 计算第二部分 “粒) 2 强4 嚣辖; t 正( + 1 ) = 1 知十【( 七1 ) u ( ) 一( 扎一七) 斗搿( 七) + ( 扎一南) 蝽z ( 1 ) 】 e 辩d 吨= “i u n e n d z 一8 0 孵0 ) ; 一8 0 r t 和) ; 1 0 国; 钉( 5 0 0 ) ; 口( i o ) ; z ( 9 0 0 0 ) ; i 4 贮 。( 1 ) 处盖l 4 序 排序 盘= o ,o l 处懿分位点 n = o 0 5 处的分位点 貔= o 1 处的分位点 = o 9 处的分位点 +酱 嚣幸 、, 一 牲 ,t + 0 $ 、,( 一 0 爹 $ 器 #l _ 二+ 即斑 ,i n = | | 蜉 , + 即镪 2 9 5 ) ; g ( 9 9 0 0 ) ; a m o 粥处懿分徽点 n o 辨箍盼分饿点 参考文献 1 张德然等,指数分布场合下蝌时存猩算常大颡募常小值的梭验。应用 数学,2 4 ,1 7 ( 1 ) :5 5 8 2 徐晓岭等,w 砒u 1 1 分布异常数据检验数邂统计与应用概率,1 9 9 6 , 1 l ( 2 ) :1 7 1 1 7 8 3 张德然,统计数据中异常擅的检验方法+ 统计研究,2 0 0 3 ,5
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工程扩大劳务合同
- 半成品材料采购合同
- 半自动帐篷采购合同书
- 核酸检测委托合同协议书
- 合同承担协议
- 定量销售合同协议
- 居间协议合同销售
- 房产赠与协议合同
- 养鱼合作协议书合同
- 旧车买卖协议合同
- 纪念五四运动100周年知识竞赛试题题库与答案
- YY/T 1492-2016心肺转流系统表面涂层产品通用要求
- YS/T 1028.3-2015磷酸铁锂化学分析方法第3部分:磷量的测定磷钼酸喹啉称量法
- JJF 1104-2003国家计量检定系统表编写规则
- GB/T 665-2007化学试剂五水合硫酸铜(Ⅱ)(硫酸铜)
- GB/T 17891-1999优质稻谷
- GA 588-2012消防产品现场检查判定规则
- DB1308-T 318-2022酸枣仁采收加工技术规程
- 《兰亭集序》《归去来兮辞》对比阅读课件(教材精研+情境任务)统编版高中语文选择性必修下册
- 柿树常见病虫害一览表课件
- 农贸市场计量管理制度(3篇)
评论
0/150
提交评论