(纺织工程专业论文)基于多元统计的纱线质量综合评价应用研究.pdf_第1页
(纺织工程专业论文)基于多元统计的纱线质量综合评价应用研究.pdf_第2页
(纺织工程专业论文)基于多元统计的纱线质量综合评价应用研究.pdf_第3页
(纺织工程专业论文)基于多元统计的纱线质量综合评价应用研究.pdf_第4页
(纺织工程专业论文)基于多元统计的纱线质量综合评价应用研究.pdf_第5页
已阅读5页,还剩60页未读 继续免费阅读

(纺织工程专业论文)基于多元统计的纱线质量综合评价应用研究.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

学位论文的主要创新点 一、本文提出“负指标”的概念,应用于因子分析对不同纱线质 量的优劣综合评价,通过理论上的充分证明,从而实现了评价指标体 系的一致,使得因子分析综合表达式中各因子权重系数与事实相符, 评价结果更趋合理、科学。 二、充分证明了经过最大方差化旋转的因子分析优于主成分分析。 三、将判别分析用于聚类分析评价结果的量化校验,说明了聚类 分析的有效性,再通过均值比较对由聚类分析产生的分类结果进行了 说明。 捅要 多元统计分析是数理统计学多年来迅速发展起来的一个分支。特别在计算机 非常普及的今天,多元统计分析已广泛地应用到社会科学和自然科学的许多领域 中。特别是在经济、金融、医药等领域应用比较广泛,目前,也有不少纺织研究 者正在将多元统计分析方法利用到诸如纺织工业布局、纺织生产、纺织材料性能 评价等领域,尤其是借助社会科学统计软件包- - s p s s 对纺织实验所采集数据的处 理与分析,将更能使纺织研究者的工作有的放矢,用统计分析得到的结论去指导 工作。 现有纱线质量的评价主要集中在从某种指标的单个评价,本文通过对多个变 量进行综合处理的多元统计分析方法,建立了纱线质量的综合评价模型。第一步, 确定纱线质量评价指标体系,在相同实验条件下采集相关数据;第二步,对纱线 质量评价数据利用主成分分析和因子分析进行综合评价;第三步,考虑到在综合 评价得分中,有望大指标也有望小指标,即有的指标值是越大越好,有的指标值 是越小越好,因此,对主成分分析和因子分析中得到的不符合实际情况的望小指 标,采用“负指标”的方法,使得所有指标均为望大指标;第四步,从理论和实 际上说明了经过旋转的因子分析优于主成分分析,而未经旋转的因子分析和主成 分分析的一致性;第五步,用聚类分析方法对各个样本的纱线进行相似性聚类, 并用判别分析方法对相关结果加以校验。最后,通过均值比较对由聚类分析产生 的分类结果进行说明。 量 关键词:主成分分析;因子分析;聚类分析;判别分析;均值比较;纱线质 a b s t r a c t m u l t i v a r i a t es t a t i s t i c a la n a l y s i si sab r a n c ho fm a t h e m a t i c a ls t a t i s t i c s ,w h i c hh a s b e e nr a p i d l yd e v e l o p e df o rm a n yy e a r s e s p e c i a l l yt o d a y , c o m p u t e r sa r ev e r yp o p u l a r , m u l t i v a r i a t es t a t i s t i c a la n a l y s i sh a sb e e nw i d e l yu s e di nm a n yf i e l d ss u c ha ss o c i a l s c i e n c ea n dn a t u r a ls c i e n c e c u r r e n t l y , t h e r ea l em a n yt e x t i l er e s e a r c h e r si st ou s e m u l t i v a r i a t es t a t i s t i c a la n a l y s i sm e t h o d st ot h el a y o u t , s u c ha st h et e x t i l ei n d u s t r y , t e x t i l ep r o d u c t i o n , t e x t i l em a t e r i a l s ,t h ea r e a so fp e r f o r m a n c ee v a l u a t i o n ,e s p e c i a l l y u s i n gs o c i a ls c i e n c e s t a t i s t i c a lp a c k a g e - s p s s ,t h ed a t ac o l l e c t e do nt h et e x t i l e l a b o r a t o r yp r o c e s s i n ga n da n a l y s i so ft e x t i l er e s e a r c h e r sc a l lw o r km o r et a r g e t e d , w i t h t h es t a t i s t i c a la n a l y s i st og u i d eo u rw o r k 1 h ec u r r e n te v a l u a t i o no ff a b r i cq u a n t ym a i n l yf o c u s e s0 1 1s i n g l ea s p e c t ,s oi n t h i sp a p e re s t a b l i s h e dac o m p r e h e n s i v ee v a l u a t i o nm o d e lo ff a b r i cq u a l i t yb a s e do n t h en u m b e ro fv a r i a b l e sf o rt h em u l t i v a r i a t es t a t i s t i c a la n a l y s i s i ti st h ef i r s ts t e pt o d e t e r m i n et h ef a b r i cq u a l i t ye v a l u a t i o ns y s t e m , c o l l e c tr e l e v a n td a t a , i nt h es a m e e x p e r i m e n t a lc o n d i t i o n s ;s e c o n d l y , i ti sa n a l y s i s e dt h e f a b r i cq u a l i 锣d a t ab yt h e p r i n c i p a lc o m p o n e n ta n a l y s i sa n df a c t o ra n a l y s i s ,n l et h i r ds t e p ,u s i n gt h em e t h o do f n e g a t i v ei n d i c a t o r s ,s ot h a ta l li n d i c a t o r sa r eg r e a ti n d i c a t o r s ,t a k i n gi n t oe v a l u a t i o n s c o r e ,t h ee x p e c t e ds m a l li n d i c a t o r si st h eb i g g e rt h eb e t t e r , a n ds o m ei n d i c a t o r so f v a l u ei ss m a l l e rt h eb e t t e r , s ot h es m a l lt a r g e t sg e to nf a c t o ra n a l y s i sd o e sn o tm e e t e x p e c t a t i o n s n l ef o u r t hs t e p ,r o t a t e df a c t o ra n a l y s i si sb e t t e rp r i n c i p a lc o m p o n e n t a n a l y s i s ,f a c t o ra n a l y s i si sa c c o r d i n gt op r i n c i p a lc o m p o n e n ta n a l y s i s t h ef i f t hs t e p ,i t i st h e f a b r i cq u a l i t yi n d e xo fs i m i l a r i t yf o rq u a n t i t a t i v ee v a l u a t i o nt ou s ec l u s t e r a n a l y s i sa n dd i s c r i m i n a t ea n a l y s i s f i n a l l y , t h r o u g hm e a nc o m p a r i n gc l u s t e r sa r e e x p l a i n e d k e yw o r d s :p r i n c i p a lc o m p o n e n ta n a l y s i s ;f a c t o ra n a l y s i s ;c l u s t e ra n a l y s i s ; d i s c r i m i n a t ea n a l y s i s ;c o m p a r em e a n s ;f a b r i cq l l a l 毋 第一章前言1 1 1 国内外研究状况1 1 1 1 纱线质量检测1 1 l2 纱线质量评估2 l 。1 3 纱线质量评价模型的建立2 1 1 4 主成分分析方法与综合评价5 1 1 5 因子分析方法与综合评价6 1 2 课题研究的意义7 1 3 课题研究主要内容7 l4 课题研究的主要创新点8 第二章综合评价中的主成分分析方法改进9 2 1 主成分分析含义9 2 2 主成分分析的数学模型1 0 2 3 主成分分析中的“负指标”1 2 2 4 用主成分分析综合评价纱线质量的计算步骤1 3 第三章综合评价中的因子分析方法改进1 7 3 1 因子分析的含义1 7 3 2 因子分析数学模型1 7 3 3 因子载荷矩阵彳1 8 3 3 1 估计因子载荷矩阵彳1 8 3 3 2 因子载荷矩阵么中元素的涵义1 8 3 3 3 因子载荷矩阵彳的相关量的涵义1 9 3 4 因子个数的确定1 9 3 5 因子旋转2 0 3 5 1 因子旋转的方法2 0 3 5 2 两个因子正交旋转矩阵的求解过程2 1 3 6 因子得分2 2 3 7 、因子分析综合评价的流程图2 3 3 8 因子分析综合评价体系基本结构2 3 3 9 用因子分析综合评价纱线质量的计算步骤2 3 3 1 0 两种综合评价方法的比较川2 8 3 1 0 1 因子分析与主成分分析之间的联系2 8 3 1 0 2 因子分析优于主成分分析2 9 第四章聚类分析、判别分析、均值比较与综合评价3 l 4 1 聚类分析3 1 4 1 1 聚类分析的种类3 1 4 1 2 各种聚类方法选择的原则3 2 4 1 3 聚类分析中要注意的问题3 3 4 1 4 用聚类分析对纱线质量进行分类3 3 4 1 5 聚类分析结果及讨论3 4 4 2 判别分析3 5 4 2 1 判别分析的涵义3 5 4 2 2 判别分析结果及讨论3 5 4 3 均值比较3 6 第五章结论3 9 参考文献4 l 在读期间发表的学术论文4 5 附录4 7 附录1 样本值4 7 附录2 主成分分析与未旋转的因子分析综合评价结果对比4 9 附录3 计算过程5 1 致谢5 5 第一章前言 第一章前言 随着纺织工业的不断进步与发展,纱线质量水平不断提高,市场对纱线质 量的要求也日趋提高,相应纱线质量的检测手段与方法也有了很大的飞跃,检 测仪器更先进,检测精度更高,愈来愈反映纱线质量的真实水平,仪器检验的 作用和地位愈来愈显重要。在纱线贸易中,用户常常提出所要求的一些新物理 指标,从原来的品质指标、重量不匀率、黑板条干开始改变为强力、棉结、毛 羽、条干等指标方面,因此,客观评价产品质量具有重要的现实意义。 而且,现代纺织具有效率高、系统性强、能综合完成多方面任务的特点, 并逐步呈现多元化的趋势。在纺织系统分析过程中,需要对多个变量进行分析, 由于变量个数众多带有动态性,并且彼此之间存在着一定的相关性,使得对有 用数据信息的提取变得十分复杂。同时,在高维空间中研究纱线的质量好坏又 势必会增加分析问题的复杂性,对纱线质量综合评价的定量化分析是现代纺织 研究的重要课题,而定量化分析离不开多元统计分析,多元统计分析在此领域 中的作用,显得越来越重要。 1 1 国内外研究状况 1 1 1 纱线质量检测 对于纱线的质量检测主要有两种方法,即感官检测法和仪器检测法。感官 检测法主要根据检验人员的目光和触觉对纱线质量进行判断,或者把试样与标 准样照进行比较评定。这种方法简单迅速,但是检测结果与检验人员的感觉和 经验有关,带有主观因素的影响,各检验人员之间可能存在较大的系统偏差。 仪器测试可以摆脱人为因素对测试结果的影响,并且可以得到测试结果的数字 指标来客观评价纱线的质量好坏。 到目前为止,用于纱线质量检测的仪器主要经历了机械式、电容式和光电 式几个阶段。机械式检测仪存在着测试过程复杂、测试速度慢、测试精度低以 及台间测试误差大等不足。电容式检测仪在一定程度上弥补了上述不足,所以 一度成为纱线质量检测的佼佼者。但是,电容式测试仪也存在着不容忽视的不 足之处,主要是测试精确性受测试条件( 大气状态、试样的历史回潮条件、调湿 处理的时间等) 和纱线混纺状况的影响;电容式条干仪的条干值c v 只考虑了纱 线不匀程度的平均值,对于纱线上出现的不同特征的规律性不匀波,往往得不 到应有的反映,即忽视了纱线不匀的离散特征;因种种因素的影响( 包括仪器 本身精度、测试条件及方法水平等) 导致了不同电容式条干仪的测试结果存在 较大的台间误差,限制了测试结果的可比性。光电法检测是近年来随着计算机 图像处理技术的不断发展而出现的一种新型测试技术,其具有测试速度快,测 试精度高、测试结果不受测试条件影响等优点,所以受到越来越多的关注。 刘长伴n 3 用c c t 纱线综合质量评价系统测试了纱线的各种外观性能和力学 性能,包括纱线的直径、条干不匀、毛羽分布、常发性疵点分布、纱线的动态 断裂强力、纱线的摩擦及磨损性能、合纤纱的热伸长、收缩性能等。同时对c c t 与其它测试方法的相关性作了系统的定量研究,最终找出相关方程作为二者的 相互转换公式,使其实用性更强。最后,借助多元统计中的主成分分析方法, 以c c t 测试结果为分析指标,对纯棉纱线作综合质量评定,最终找出“外观质 量因子 和“力学性能因子”两个综合指标。 1 1 2 纱线质量评估 纺纱系统是一个多工序、多流程流水式的作业过程,因此影响质量的因素 诸多,如果一个工序、一个环节控制不善,均会影响到最终产品质量的提高, 陈国亮口3 从生产管理等方面提出评估纱线质量的因素,如原料、工艺设计、设 备的机械状态、车间的温湿度、员工的工作责任心与员工的技能素质、纺纱关 键部位专件、器材的应用等关键环节均会影响到纱线质量的提高。温宇1 通过 纱线质量的国家标准与国际先进质量的对比,提出了纱线质量的评估应该采用 物理指标与实物质量相结合的方法,树立用户满意为最高质量标准的思想。徐 曼h 1 从仪器检测和布面检测两方面,对纱线质量的全面检测进行了综合评定。 1 1 3 纱线质量评价模型的建立 目前,对于产品质量的综合评价模型,众多学者进行了一系列的研究,如 郭云涛嘲从系统角度给出了质量评价的三维空间,提出了综合评价的概念和思 路,但其并未指出具体的方法。王中华嘲利用模糊理论建立了质量综合评价模 型,但其对指标权重的处理不够客观且建立的评价模型不够全面等。本文在前 人研究的基础上,基于多元统计的方法对纱线质量进行综合评价,就评价模型 的数学方法使用及其评价结果展开讨论。吴花平m 引入信息论中的熵值指标权 2 第一章前言 重法,将模糊综合评判法的主因素突出型、加权平均型和全面制约性三种方法 结合,构建了综合评价模型。 ( 1 ) 评价指标的选择 建立纱线质量综合评价的数学模型,首先是控制纱线质量的指标选择。影 响纱线质量的常用指标有平均伸长率、最低伸长率、强力、条干c v 值、粗节、 细节和棉结,而影响强力的因素有又原料、成纱细节、棉结、条干c v 值等晒 们 o 强力是成纱的基本保证。无论是纺纱或织造均对强力有相当要求,如果纺 纱时强力低,则纺纱过程难以提高效率,挡车工劳动强度增大;若机织时强力 低,则影响织造效率和布面质量。 纱线条干均匀度是纱线质量的基本要素之一,它是纺纱生产系统工艺和机 械因素的综合体现。数据以条干c v 值表示一定长度内纱线短片段的不匀,同 时数据生成常发性纱疵细节、粗节和棉节,与条干c v 值有一定的相关性,对 高速织造和布面显现有较大影响。 棉节对棉纱质量的影响很严重,它直接影响成纱、针织布及坏布的质量。 对于织造来说,首先它影响效率,容易形成断头,在针织上还易造成断针。其 次是对染色质量影响较大。人们对产品质量要求越来越高,尤其对布面的外观 质量重视程度提高,布面染色性能成为布面外观质量的一个重要指标,而棉结 的存在直接影响染色效果,造成染疵。 ( 2 ) 评价模型的选择 主观评价模型 主观评价是通过人的手对织物的触摸所引起的感觉并结合对织物的外观印 象来作出评价,通常又称为感官评定。在主观评价时,一般是集中在适当的熟 练人员,在一定的环境条件下对织物进行检验,每一检验人员根据其经验对织 物风格优劣给予评定。评定结果可以用以下两种方法进行表示。 分档评定法一 对织物某项手感的基本特性以人为选定的尺度进行分档评分,最后得出该 批织物中各个试样的某项值。但这一方式评分较复杂,而且在检验过程中,评 价尺寸往往会不自觉地在逐渐改变,以致各人评分结果将其综合时往往不稳定。 秩位评定法一 该方法是先由数名检验人员按各自的感觉效果对纱线质量作出判断,对纱 线质量的好坏由高到低的顺序排队,排队顺序号即为秩位数,为纱线试样总数。 然后将各个检验人员对每个纱线打出的秩位数相加得到他们的总秩位数,最后 天津工业学硕士学位论文 根据总秩位数对这些纱线质量的优劣作出相对比较。 主观评价因为其具有简便、快速的优点而广泛应用,但其不可避免地存在 下面的问题、无法排除主观任意性,判断结果因人、因时而异,局限性大、缺 乏定量的描述,结果可比性差,很难结合纺织技术指导和改善纱线的质量。 客观评价模型 马克思曾经指出:“- - f - j 科学只有在成功地运用数学时才算达到了真正完 美的地步”。当科学的研究处于低级阶段时,主要是对事物进行定性分析;当 研究处于高级阶段时,就逐渐转向对事物作定性分析的基础上进行定量分析, 对纺织领域的研究同样也要进行定量分析。 灰色系统模型 灰色系统是部分信息已知,部分信息未知的系统。灰色理论基于关联度收 敛原理、生成数、灰导数、灰微分方程等观点和方法建立微分方程模型,能更 好地描述系统内部的本质。灰色系统理论用灰色模块建模,而不直接用原始数 据序列,而是从原始数据中去寻找这种内在规律。其将所有随机变量看作是一 定范围内变化的灰色量,将随机过程看成一定范围内变化的、与时间有关的灰 色过程,用数据处理的方法,将杂乱无章的原始数据整理成规律较强的生成数 列再进行研究。该方法的不足之处即没有物理原型,不清楚系统的作用机制, 很难判断信息的完备性,只能凭逻辑推理、某种观念意识、某种准则对系统的 结构、关系进行论证,然后再建立某种模型。而这些模型只能看作是原系统的 代表、同构,由于模型不是唯一的,这种代表或同构就只能在某一方面、从某 一角度、在某一准则下成立。 袁肖鹏n 们等运用灰色控制理论、探讨同一毛坯织物,经不同染整工艺加工 的全毛华达呢成品织物的质量。该模型的建立,使用常规测试的数据,可以预 测织物综合手感值,并进行了精度检验且获得很好的预测结果,为灰色模型在 纺织界的应用提供广阔的前景。 人工神经网络技术 神经网络是由大量处理单元神经元广泛互连而成的网络。它是在人类对其 大脑工作机理认识的基础上,以人脑的组织结构和活动规律为背景,反映了人 脑的某些基本特征,可以说是对人脑的某种抽象、简化和模仿。简单地讲,它 是一个数学模型,可以用电子线路来实现或用计算机来模拟人的自然智能。它 是从人脑的生理结构出发来研究人的智能行为,模拟人脑信息处理的功能,它 是根植于神经科学、数学、统计学、物理学、计算机科学及工程等学科的一种 技术。神经网络是巨量信息并行处理和大规模平行计算的基础。它既是高度非 4 第一章前言 线性动力学系统,又是自适应系统,可用来描述认知决策及控制的智能行为, 它具有存储和应用经验知识的自然特性。它与人脑相发展,已在智能控制、模 式识别、计算机视觉、非线性优化、信号处理等方面取得巨大成功和进展,成 为人工智能研究的重要领域之一。 江南大学的王鸿博 1 1 阐述了神经网络技术在预测浆纱质量方面的应用情 况。采用原纱的各项性能指标捻度、断裂强力、最低强力、断裂伸长率、耐磨 次数、毛羽指数作为原纱质量指标,经过上浆后的各项可织性指标增强率、减 伸率、毛羽降低率、增磨率作为浆纱质量指标。以浆纱增强率预测模型为例, 分析数据的选取问题。采用单项指标模型输入层原纱项主要指标捻度、断裂强 力、最低强力,单个隐含层的神经元,输出层项指标增强率,利用神经网络建 立浆纱质量预测模型,浆纱增强率预测指标与实际指标误差很小。 多元统计方法一 多元统计分析是最近3 0 年发展起来的统计数学中的个重要分支,在计算 机非常普及的今天,多元统计分析已广泛地应用到社会科学和自然科学的许多 领域中。特别是在经济、金融、医药等领域应用比较广泛,在纺织领域也得到 广泛应用。 关于多元统计分析在纺织领域的应用,已经有不少学者做了很多工作。成 玲n 扣1 4 3 利用数理统计中的假设检验、回归分析等方法研究了如纤维的长度、纱 线的细度、构成纱线的纤维种类等影响纱线的动态强力的主要指标间显著性差 异;杨晓波n 5 针对纺纱张力指标建立了时间序列预测和控制的a r 模型,达到 实时控制纺纱张力的目的;张毅n 6 1 用正交试验方法对影响纱线质量的毛羽指标 因素如纤维的长度、纺纱方式和纱线的捻度进行了工艺优化分析;也有学者对 评定针织纱线质量的各个指标进行了相关性分析,利用主成分分析法在众多指 标当中提取几个反映纱线品质的综合指标,以进行纱线质量的比较与评价n 刀; 也有采用相关性分析揭示纱线质量指标之间关系,利用主成分分析法确立外观 质量因子和力学性能因子这两个反映纱线性能的综合质量因子。并且在对纱线 综合质量因子作定量排序的基础上,建立纱线综合质量评价系统n 引:同时,有 学者用因子分析法得出浆纱毛羽指数和浆膜完整率、浆膜完整率与纱线耐磨次 数以及浆纱强度和浆液渗透率间存在相关性的回归方程,由此获得综合评价公 式n 钔;甚至还有就数理统计中的协方差、均值、方差等具体概念应用到影响纱 线质量指标的分析中,从而得到一些相关结论一1 。 1 1 4 主成分分析方法与综合评价 主成分分析法最早是作为多元数据的降维处理技术而提出的,在自然、生 5 天津工业学硕士学位论文 物医学、管理、经济等领域均有广泛的应用。在社会经济问题的分析中两个最 有名的例子是:s t o n e 在1 9 7 4 年对美国的1 9 2 9 1 9 3 8 年1 7 项国民经济统计指 标所作的主成分分析和y s c o t t 在1 9 6 1 年对英国1 5 7 个城镇的发展水平进行的 主成分分析。前者发现完全用三个经济指标来概括原来的1 7 项指标,从而大大 简化了数据分析结构;后者将原始测量的5 7 个指标降到了5 个综合变量( 主成 分) 。主成分分析法后来逐渐被推广应用于样品的分类与排序。英国著名统计学 家m k e n d a l l 早在1 9 3 9 年就对对英国4 8 个郡的1 0 种主要农作物进行了主成分 分析,用第一主成分对各地的“生产能力水平”进行排序与分类胁1 。 自二十世纪八十年代以来,随着我国经济效益综合评价理论与实践的发展, 不断有人将主成分分析法应用于各类专题的综合评价,使之成为目前应用最广 的一种多元统计综合评价方法。 目前对主成分综合评价模型大体上有两种观点:一是只用第一主成分进行 评价,英国统计学家m k e n d a l l 认为:第一主成分能够最大限度地反映样本间 的差异,是概括指标差异信息的最佳线性函数汹1 。因此,只能用第一主成分对 样本进行综合排序。我国也有部分学者持这种观点汹用1 ,南开大学孟生旺老师 从几何投影的角度阐明:在多指标综合评价中,只用第一主成分综合原始数据 时保留信息最多。因而也就只能以第一主成分值作为综合评价值才合理。另一 种观点则认为不仅要充分重视第一主成分,而且也要顾及其它主成分在综合评 价中所起的作用。他们的做法是先按累积方差贡献率不低于某一阀值( 比如8 5 ) 的原则确定前几个主成分,然后取所选主成分的线性加权平均值进行评价,所 用权数是各主成分的方差贡献率( 这也是国内用主成分分析进行综合评价的应 用研究案例中的通用做法) 慨魏跏。 1 1 5 因子分析方法与综合评价 国内有不少文献将因子分析法应用于各类问题的综合评价分析。根据我们 掌握到的文献数量看,其应用之多之广绝对不亚于主成分分析法。如胡帆、何 晓群、赵喜仓等将之应用于经济效益综合评价,谭旭青将之应用于建立教学质 量评估指标体系,黄明儒等对其一般原理进行了分析,赵西将因子分析法应用 于城市工业主体结构研究,何亚斌、张伦俊、甘寿国等将之应用于城市社会经 济水平的综合评价,张峦将因子分析应用于财务状况综合评价指标的选择,罗 永长将之应用于企业技术开发能力评价模型,赵黎明与乔建生应用因子分析对 科学基金综合评价指标体系优化进行研究,昊元奇将之应用水稻种子活力的综 合评价,王琳娜与刘爱玲则应用因子分析法对卫生事业状况进行了综合评价。 上述这些文献中大多对因子分析法评价模型进行了设计。基本精神是相同 6 第一章前言 的,都是主张将多个公共因子或公共得分进行加权平均,权数为方差贡献率, 很少对原始指标进行处理或方法改进,也很少结合聚类分析、判别分析等方法 对因子分析综合评价结果进一步讨论、研究。 1 2 课题研究的意义 纱线的质量控制是纺织生产当中的重要环节,因为纱线的质量好坏直接影 响后面各道加工工序的顺利进行及最终产品的质量品质。传统的对纱线的质量 检验主要包括纱线的条干不匀、断裂强力、断裂伸长率、断裂功以及纱线表面 的毛羽、粗细节分布等。这些纱线的质量指标对于织物的织造过程、织物的外 观以及后整理都有非常大的影响,而目前对于纱线质量的综合评价没有一个统 一的标准和方法叭3 。因此,纱线质量的综合评价方法研究对于人们客观认识纱 线质量具有积极的意义。 从上面的一系列分析可以看出,在这些评价模型中,几乎都是指标的单一 分析阱1 ,只解决了某一方面的问题:尤其在利用多元统计进行纱线质量的综合 评价时,将上述指标进行独立检测、分析,也很少就主成分分析法、因子分析 法及其它方法进行适用条件分析、理论推导证明,或几个方法的综合比较分析, 而是拿来就用,这势必会造成结果、结论的片面性以及理论应用上的缺陷。 因此,有必要以纱线质量的综合评价为例,对多元统计中的主成分分析、 因子分析、聚类分析进行推导证明,以便为后用者提供理论依据。 1 3 课题研究主要内容 本文旨在把多元统计分析在纱线质量评判中的应用进行系统化、具体化, 首先介绍多元统计分析的几种常用的方法,在阐述方法的同时着重这些方法之 间的密切联系;进而说明这些方法在应用时应注意的问题,本文结合实际例子 来加以论证。其次是根据样本的指标值,利用因子分析方法来对各个样本的综 合情况进行评价,并对纱线质量进行分级。最后用聚类分析方法就各个样本的 质量指标相似性进行定量化的综合评价,并以判别分析方法对相关结果加以校 验。这里主要是针对纱线质量评判而言,利用多种多元统计分析方法对数据进 行不同的分析,根据不同的分析结果可以指导从事此项工作者做更多细致的工 作。本文中的应用价值,在于对纱线质量进行综合评价提供了一种科学、合理 的方法。 7 天津工业学硕士学位论文 由于各种数学方法各有侧重,只用一种方法评价纱线质量难免失于偏颇, 所以研究中准备采用5 种方法,即主成分分析法、因子分析法、聚类分析法、 判别分析法和均值比较法。用主成分分析和因子分析分别对纱线质量进行量化 排序,然后用聚类分析对用因子分析得到的因子进行分类,再用判别分析的预 测结果证明聚类分析的有效性,再利用均值比较对类别进行说明,以达到对纱 线质量进行综合评价的目的,又达到分析找出影响纱线质量的因素。 1 4 课题研究的主要创新点 一、本文提出“负指标”的概念,应用于因子分析对不同纱线质量的优劣 综合评价,通过理论上的充分证明,从而实现了评价指标体系的一致,使得因 子分析综合表达式中各因子权重系数与事实相符,评价结果更趋合理、科学。 二、充分证明了经过最大方差化旋转的因子分析优于主成分分析。 三、将判别分析用于聚类分析评价结果的量化校验,说明了聚类分析的有 效性,再通过均值比较对由聚类分析产生的分类结果进行了说明。 8 第二章综合评价中的主成分分析方法改进 第二章综合评价中的主成分分析方法改进 每个事物现象都表现为多个方面,需要有多个指标来描述、刻画事物的质 和量,这些构成指标体系的多个指标各有侧重地解释着同一个事物的质,必然 存在着多重共线性,为了将这些指标反映的内容综合起来,寻找一个简单的综 合指标,多元统计分析能帮助在不损失信息的情况下,通过变换和构造模型, 剔除指标间相互制约的成分,使复杂数据简单化,比如,主成分分析、因子分 析以及对应分析等方法。 2 1 主成分分析含义 主成分分析是将多指标化为少数几个综合指标的一种统计方法。主成分分 析是从原始变量中导出少数几个主分量,使他们尽可能多地保留原始变量的信 息,且彼此互不相关。主成分分析的应用目的是数据的压缩。它常被用来寻找 判断某种事物或现象的综合指标,从而更加深刻地揭示事物的内在规律1 。 主成分这个概念由k a r lp e a r s o n 在1 9 0 1 年提出,但当时只进行了非随 机变量的讨论,1 9 3 3 年h o t e l l i n g 则将此概念推广到了随机变量中。其原理 可看直观的例子:假如有一个二维数据表,表中数据点的分布如图2 - 1 ( a ) 所 示,呈椭圆形,重心是g ,很明显,在沿甜,轴的方向上,数据的离差最大,因 此,所反映的数据信息也最多,这个方向被称为数据变异的最大方向。如果将 原点平移到g ,并作旋转变换,即得到一个正交坐标系“g u ,可以看出,若省 略”,轴,将数据点在u ,轴上投影,就会得到一个简化的一维数据系统。即降维 的核心思想就是省却变异不大的变量方向。又如,一个三维数据点的分布是饼 形的,如图2 一l ( b ) ,其变异较大的方向为u l u :,而地方向的变异很小,即在该 方向各样本点取值没有很大差别,就可以不考虑甜,方向。若以甜,作为新坐标 系,则原三维空间的数据点就可以在二维平面上得以显示,如图2 - 1 ( c ) 所示。 推广到更一般的情形,设原数据是p 维的,主成分分析的过程实际上就是对原 坐标系进行平移和旋转变换,是新坐标系的原点与数据点的重心重合,新坐标 系的第一轴与数据变异的最大方向对应,第二轴与第一轴正交,并对应于数据 变异的第二大方向,依次类推。若这些主轴( 尼维,k p ) 能十分有效的表示 原始数据的变异情况,则原p 维空间就降维为k 维。 9 天津工业学硕士学位论文 j k 2 甜2甜1 次 0 爸 x 2 jl 2 厂。 、,o 、二一 : 图2 一l 降维处理方法示意图 在纺织中,经常遇到的是多指标问题。由于指标个数过多,并且彼此之间 存在着一定的相关性,因而观测到的数据在一定程度上反映的信息有所重叠, 同时也增加了分析问题的复杂性。主成分分析在纺织中主要用于简化数据结构、 纱线质量综合评价等方面。 2 2 主成分分析的数学模型 通常数学上的处理是将原来的p 个指标做线性组合, 作为新的综合指标。 如果将选取的第一个线性组合即第一个综合指标记为只,一般自然希望e 中 尽可能多地反映原来指标的信息,而所谓e 的信息就是用鼻的方差来表示,即 v a r ( f 1 ) 越大,则表示e 包含的信息越多,如果一个变量的所有取值都是一样 的,则无需对这个变量进行研究,它所含的信息认为是零信息,因此在所有的 线性组合中所选取的第1 主成分应该是方差最大的。如果第1 主成分不足以完 全代表p 个指标的信息,再考虑选第2 个线性组合e ,即第2 个主成分,依 次类推可以造出第3 ,第4 ,第p 个主成分。这些主成分间互不相关, 且方差递减。 设有,z 个样本,每个样本由p 个指标五,x 2 ,彳口描述,记 x = ( x l ,x 2 ,x 口) r ( 2 2 1 ) 其中x j = b ,x 2 ,勤) r ,j = 1 ,2 ,p 。设x 的协方差矩阵为, 用数据矩阵x 的p 个向量x l ,x 2 ,x p 作线性组合可得 只= 口f y ,口j = 【口1 f ,口2 f ,口州) ,f = 1 , 2 ,p ( 2 2 2 ) 使得相应的方差陆( e ) = 肋( 口- 奶= 衫勋,尽可能的大,且组合系数满足 口口j = 1 ,i = 1 , 2 ,p ( 2 2 3 ) 1 0 第二章综合评价中的主成分分析方法改进 ( 2 2 2 ) 中的系数由下列原则确定: 1 ) c o v ( e ,弓) = o ( i _ ,i ,j f = l ,2 ,p ) ,即e 与,不相关。 2 ) e 是五,x 2 ,x p 的以上组合中方差最大的,其次为岛,e ,t ,即 y 撕( 互) y 撕( 疋) p a r ( g ) 。 ( 2 2 4 ) 3 ) 新的综合指标的总方差保持不变,即 哳( 五) = 肋( 互) ( 2 2 5 ) i = ii - - i 如上决定的综合指标互,疋,兄分别称为第一主成分,第二主成分, 第p 主成分。由( 2 2 4 ) 和( 2 2 5 ) 可以看出,用前面的一部分主成分 互,五,疋( 七 p ) ,就可以反映原指标所包含的较大部分的信息量,而且主成 分之间是互不相关的。这样就可以用少数的几个互不相关的主成分代替原始指 标来分析解决问题。 那么如何求出原指标的主成分呢? 由( 2 2 2 ) 知核心是求出组合的系数。这是 一个条件极值问题,即 m a x v a r ( f i ) = m a x a j y _ , a f8 t a t a = 1 ( 2 2 6 ) 利用拉格朗日乘数法知,令 f ( a f ) = a t z a f 一见( 口? q 一1 ) ( 2 2 7 ) 令 掣:2 勋,一2 2 a ,:0 , o ,a ,i 、 ( 2 2 8 ) 掣:口h _ 1 - 0 , 一一 d 以 得 髋嚣 亿2 根据特征根、特征向量的定义可知:旯是的特征根,是对应的规范正交 特征向量,记p 个特征根从大到小依次为 五以0 ,u = ( ,砧:,甜,) 是的对应的规范正交特征向量, 则 只= 甜工,砧f = 函。,”:,一,甜 ,i = 1 ,2 ,p ( 2 2 1 0 ) 天津工业学硕士学位论文 v a r ( y , ) = 五, ( 2 2 1 1 ) 这样,想求出主成分,只需求出协方差阵的特征根及相应的标准正交特 征向量即可,但协方差矩阵会受到指标量纲和数量级的影响,故选择基于相 关系数矩阵的主成分分析。 但为了达到降维的目的,通常选择k ( k v a r ( f i ) 以 一 口( 尼) = 等一= 号一 ( 2 2 1 2 ) 艺v a r ( f t ) 五 一 l = i i - i 累计方差贡献率表示前面k 个主成分累积提取了x 1 ,x 2 ,x 口多少信息。 一般来说,如果前k 个主成分的贡献率达到8 0 ,表明前k 个主成分基本包含 了全部测量指标所具有的信息,这样既减少了变量的个数又便于对实际问题的 分析和研究。 由于主成分之间互不相关,一般采用加权算术平均来作为综合评分,即 f = 丑互+ 如e + + 以疋 ( 2 2 1 3 ) 各评价对象的表现由主成分反映,可用主成分计算各样本的综合评价值, 进而对各样本进行排序和比较。 2 3 主成分分析中的“负指标” 在用主成分分析中常出现有的指标是越大越好,有的指标是越小越好,即指 标不一致,为了达到评价的一致性,在研究中引用“负指标 ,即将越小越好的 指标前添一个“负号 ,使其也成为越大越好的指标,下面在理论上给予证明。 定理1 :协方差阵是半正定的对称阵。 说明1 :标准化后的变量即为相关系数矩阵r ,故火也是半正定的对称阵。 定理2 :半正定的对称阵的特征根都大于等于0 。 说明2 - 由( 2 2 1 3 ) 式f = 互+ 如e + + 五v k ,可知f 越大,就希望 每个e 越大,又由( 2 1 6 ) 式e = l i l t 五+ “2 j 五+ + 甜x p = z ,;x ,可知e 越 大,就希望每个甜,越大。 定理3 :设r 是x = ( x i ,五,x ,) r 的相关系数矩阵, 如名p 0 1 2 第二章综合评价中的主成分分析方法改进 是r 的特征根,( “,“:,u ,) 是对应的规范正交特征向量,则主成分e 与x ,之 间的相关系数为 p 厉z ,= 五,( i ,j = 1 , 2 ,夕) ( 2 3 1 ) 说明3 :由( 2 3 1 ) 式可以看出刻画了第7 个变量对于第j 个主成分的重 要性,即u 。与e 和x ,的相关系数成正比。由说明2 可知,若e 和x ,的相关 性增大,则f 最终变大。 当引入“负指标后使得所有指标均为增的趋势,即原始指标都是具有同增 趋势的量,则x ,变大,每个e 也增大。当然也可以引入“负指标 使得所有 指标均为减的趋势,那么相应的综合统计量f 就会越小越好。 2 4 用主成分分析综合评价纱线质量的计算步骤 为了了解主成分分析的一般方法,先看关于纱线质量的综合评价问题。而 影响纱线质量的常用指标有平均伸长率、最低伸长率、强力、条干c v 值、粗节、 细节和棉结,因此本文分别用u s t e r 条干均匀度仪、y 3 3 1 捻度机、y g 0 2 9 f 台式 全自动强力仪等设备对随机抽取5 0 批不同批次的3 8 4 6 t e x 针织纱线进行了上述 指标的测试,试验试样:5 0 个不同厂家生产的3 8 4 6 t e x 针织纱线,试验温度: 2 0 2 ,试验相对湿度:6 5 2 ,数据见附录1 ,下面对这5 0 个样本 进行评价。 ( 1 ) 计算原指标的相关系数矩阵r r = f ) ( 2 4 1 ) 其中勺2 赤,西2 击言( 毛毛一x j - 去豁,根艄 1 ) 式可得相关系数矩阵,结果如表2 - 1 所示。 表2 - 1 原指标的相关系数矩阵 平均伸长率最低伸长率强力条干c v 值粗节细节棉结 平均伸长埠1 0 0 06 3 16 5 2- 1 1 81 0 61 5 10 9 1 最低伸长璋 6 3 11 0 0 0 6 5 0 一2 5 41 9 1 2 2 5 1 1 2 强力6 5 26 5 01 0 0 01 8 41 6 20 6 70 0 5 条干c v 值一1 1 82 5 4- 1 8 41 0 0 08 9 10 9 05 4 5 粗节 - 1 0 61 9 1- 1 6 28 9 11 0 0 0 0 0 05 8 8 细节1 5 12 2 50 6 70 9 00 0 01 0 0 00 1 0 棉结0 9 11 1 20 0 55 4 55 8 80 1 01 0 0 0 ( 2 ) 求解相关矩阵r 的特征根和特征向量和主成分的累计方差贡献率 根据代数中关于对称矩阵的特征根、规范正交特征向量的计算方法,再根据 天津工业学硕士学位论文 ( 2 2 1 2 ) 式可得累计方差贡献率,结果

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论