




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第25卷第1期 航 天 器 环 境 工 程2008年2月 S P A C E C R A F T E N V I R O N M E N T E N G I N E E R I N G 41数据挖掘分类方法在冲击谱试验中的应用冯雪梅,卢来洁,马爱军,刘洪英(中国航天员科研训练中心,北京 100094摘要:冲击谱试验随机性强,难度较大。文章利用数据挖掘中分类方法提取数据背后隐藏的有用知识,通过数据预处理、构建冲击谱试验数据仓库、决策树分析、评估比较,最终总结出一套针对不同产品、不同试验工况的冲击谱试验调试方法。这可为以后产品的冲击环境试验提供有力的技术支持,进一步提高冲击谱试验的质量和试验中产品
2、的安全性。关键词:数据挖掘;分类分析;冲击谱试验 中图分类号:TB123;V416.2 文献标识码:A 文章编号:1673-1379(200801-0041-031 引言数据挖掘就是从大量的、不完全的、有噪声的、模糊且随机的实际应用数据中提取隐含在其中的预先未知但又是潜在有用的信息和知识的过程1。分类是数据挖掘中常用的技术。它将建立一个分类模型,该模型能够根据数据的属性将数据分派到不同的组中。这样可以利用该模型来分析已有数据,并预测新数据将属于哪一个组。冲击谱试验主要是模拟爆炸冲击环境的力学试验。模拟爆炸冲击试验的环境复杂,影响因素较多,随机性强,试验难度较大2,试验调试往往依赖于试验人员的经
3、验。通过对冲击谱机试验数据进行整理,构建冲击谱机数据仓库,并利用数据挖掘工具(SPSS Clementine ,采用决策树(Decision Tree 分析方法,从试验训练数据集中找出隐藏、未知而有用的规律,总结出一套针对不同产品、不同试验工况的冲击谱试验调试方法。2 数据预处理高质量的决策依赖于高质量的数据,因此数据预处理是数据挖掘过程中的重要步骤。在构建冲击谱试验机数据仓库过程中使用的数据是经过预处理(即去掉坏的数据,消除数据之间的矛盾,来自不同数据源的数据的集成,数据的转换的历史数据,可以提高所获规则的可靠性3。对冲击谱试验数据源作必要的整理,包括以下内容:(1 数据获取整理记录冲击谱试
4、验机的历史试验及调试数据。(2 数据取样按冲击谱试验的不同试验规范、产品质量分类,取样以类为单位。(3 数据筛选滤除不希望包括进来的试验数据,去除数据中的噪音并纠正其不一致。例如由于加速度传感器粘贴不当或传感器零漂所产生的“脏数据”等,将超出冲击试验规范一定范围的试验数据排除于取样范围之外;当属性出现缺少值、奇异值或数据存在不一致时,采用数据分箱、人机交互检查以及回归等方法检测。(4 数据转换将数据转换成适合于挖掘的形式。3 分类分析分类是利用训练数据集通过一定的算法而求得分类规则。常用的算法是神经网络和决策树。神经网络的优点是该算法对复杂问题能进行很好地预测,对噪声数据的承受能力比较强,以及
5、它的泛化性较好;其缺点是需要很长的训练时间及大量的参数,而且解释性差,即无法解释如何得出结果和使用了什么规则。决策树是建立在信息论基础之上对数据进行分类的一种方法。这种方法相对比较简收稿日期:2007-08-28;修回日期:2007-12-03作者简介: 冯雪梅(1974-,女,工程师,主要从事计算机测控技术研究工作。联系电话:(01066365643-801;E-mail: fengxuemei507 。HY FSOF TWA REC O.,LT D42 航 天 器 环 境 工 程 2008年第25卷单,其最大的优点就是易于理解,比较直观4。本文采用SPSS Clementine 中的决策树
6、C5.0算法和CART 算法进行分类分析。C5.0算法是ID3算法、C4.5算法的修订版,适用于处理大资料集,采用Boosting 方式提高模型准确率,软件的计算速度比较快,占用的内存资源比较少。CART 算法自20世纪80年代以来就开始发展,由Friedman 等人提出,是基于树结构产生分类和回归模型的过程,是一种产生二元树的技术。CART 与C5.0算法的最大差别在于其在每一个节点上都是采用二分法,也就是一次只能够有两个子节点;而C5.0算法则在每一个节点上可以产生不同数量的分支。根据试验规范、产品重量、夹具重量、温湿度环境等信息分类,预测各个调试参数(谐振板厚度,谐振板上、板下阻尼材料参
7、数,标尺高度等,如图1所示。图1 决策树图Fig.1 Decision tree4 数据评价通过数据评价可以选择出最好的分类模型。由于在数据挖掘过程中发现试验室温湿度环境与试验结果有关联,因此在进行分类分析中,将数据输入项分为两类:第一类以试验规范、产品重量、夹具重量、备件前后为输入;第二类除包含第一类内容以外,增加环境温度和湿度输入。利用C5.0算法和CART 算法进行分类分析,得到不同的分类模型结果。使用公共的标准例如提升图,对不同数据挖掘模型进行定量比较和评价。图2图5分别为对谐振板厚度,谐振板上、板下阻尼材料参数,标尺高度分类结果的提升图。(a 无温湿度 (b 含温湿度输入注:Best
8、 ;$C. 谐振板;$R. 谐振板图2 谐振板分类结果评估图Fig.2 Evaluation chart of resonance board(a 无温湿度 (b 含温湿度输入注:Best ;$C. 板下材料;$R. 板下材料图3 板下材料分类结果评估图Fig.3 Evaluation chart of materials under the board(a 无温湿度 (b 含温湿度输入注:Best ;$C. 板上材料;$R. 板上材料图4 板上材料分类结果评估图Fig.4 Evaluation chart of materials on the board(a 无温湿度 (b 含温湿度输入注
9、:Best ;$C. 标尺高度数;$R. 标尺高度数图5 提升高度分类结果评估图Fig.5 Evaluation chart of height提升表中绘制的是累积提升值与样本百分比的关系,即构造/培训样本。其基准值(即评估每个模型的底限是1,它表示当从样本中随机抽取记录的百分点时能成功地“击中”现有客户。提示值衡量的是当来自数据中的某一记录使一个现有客户的降序预测概率能被百分点反映时,预测模型“击中”现有客户的成功可能性(准确度有多高。如上图所示,每个模型的提升值均大于1,在100%时收敛于1。由于每个预测模型都能以有效精HY FSOF TWA REC O.,LT D度预测目标变量,因此可以
10、说它们都是有效的。从图2图5中可以看出:第1期 冯雪梅等:数据挖掘分类方法在冲击谱试验中的应用 43(1 对于谐振板厚度和谐振板下阻尼材料,采用C5.0算法和CART 算法都可以得到很好的分类预测结果,且环境温湿度与分类结果无关;(2 对于谐振板上阻尼材料和标尺高度,采用C5.0算法可以得到更好的分类预测结果,且分类输入因素应考虑环境温湿度的影响。分类模式往往表现为一棵分类树,根据数据的值从树根开始搜索,沿着数据满足的分支往上走,走到树叶就能确定类别,以供试验人员进行试验调试使用。图6显示的是谐振板下阻尼材料的分类树结构。图6 板下材料的分类树结构Fig.6 Classification tr
11、ee models of materials under the board5 结论将数据挖掘技术应用于试验技术研究中,通过对冲击谱试验数据的分类分析,总结出一套适用于产品冲击谱试验的调试方法,改变了以往依赖试验人员经验的状况。研究结果可为以后产品的冲击环境试验提供有力的技术保障,进一步提高冲击谱试验的质量和冲击谱试验中产品的安全性。参考文献(References 1 Han Jiawei, Kamber Micheline. Data mining:concepts and techniquesM. USA: Morgan Kaufmann Publishers, 2001: 70-1812 马爱军, 冯雪梅, 卢来洁, 等. 一种冲击谱试验机的研制J. 航天医学与医学工程
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 拖拉机售后服务网络考核试卷
- 种子批发商产品组合策略与优化考核试卷
- 2024年汽车地毯资金需求报告代可行性研究报告
- 房产增值收益调整与分配变更管理协议
- 2025年中国变速箱压铸件行业市场前景预测及投资价值评估分析报告
- 房地产项目土地开发与地籍测绘全方位合作协议
- 生物技术实验室共建与人才培养及科研项目管理合同
- 网络媒体广告内容审查标准服务协议
- 2025年中国北京农业行业市场前景预测及投资价值评估分析报告
- 网络文学作品有声化改编权许可及衍生品开发合同
- 写字楼租赁技巧培训
- T-CEEAS 003-2024 养老合规师职业技能评价标准
- 钢筋混凝土蓄水池设计方案
- 2025年保密知识试题库带答案(考试直接用)
- 伊斯兰教完整版本
- 【MOOC】大学物理-力学、电磁学-重庆大学 中国大学慕课MOOC答案
- 挡土墙施工图设计说明(完整版)
- 面试官认证培训
- 【课件】科技与文化-决定建筑形式+课件高中美术人教版(2019)选择性必修4+设计
- 诊所药品自查报告
- 2024年保安员证考试题库及答案(共240题)
评论
0/150
提交评论