版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
PAGE58PAGE57纱线质量控制研究分析第一章前言 11.1课题研究的背景 21.1.1纱线质量检测 21.1.2纱线质量的品质评定 21.1.3纱线质量的综合评价模型 31.1.4主成分分析方法与综合评价 61.1.5因子分析方法与综合评价 71.2课题研究的意义 71.3课题研究主要内容 8第二章主成分分析方法与纱线质量的综合评价 92.1主成分分析的数学思想 92.2主成分分析的数学模型及理论推导 102.3利用主成分分析法进行综合评价的步骤 132.4利用主成分分析法综合评价纱线质量 142.5小结 18第三章基于因子分析的四种综合评价纱线质量处理方法对比 193.1因子分析的含义 193.2因子分析的数学模型及理论推导 193.2.1因子分析的数学模型 193.2.2因子载荷矩阵中各元素的涵义 203.2.3因子载荷矩阵的相关量的涵义 213.2.4因子个数的确定 223.2.5因子旋转 223.2.7因子得分 243.3利用因子分析法进行综合评价的步骤 253.4利用因子分析法综合评价纱线质量 253.4.1利用原始指标,引进负因子,综合评价纱线质量 253.4.2利用负指标,综合评价纱线质量 313.4.3利用倒因子,综合评价纱线质量 333.4.4利用倒指标,综合评价纱线质量 353.5小结 39第四章综合评价的主成分分析和因子分析方法比较 414.1综合评价时因子分析与主成分分析的异同 414.1.1两种方法的相似之处 414.1.2两种方法的不同之处 414.2因子分析与主成分分析之间的联系 424.3因子分析与主成分分析方法综合评价时存在的不足 43第五章聚类分析与综合评价 455.1聚类分析中样品间的距离 455.2聚类分析的种类 465.2.1系统聚类法 465.2.2动态聚类法 465.2.3智能聚类法 475.3各种聚类方法的选择 475.4聚类分析中要注意的问题 485.5聚类结果的检验 485.6用聚类分析对纱线质量进行分类 485.7小结 51第六章结论与展望 536.1结论 536.2展望 54参考文献 57在读期间发表的学术论文 59附录 60附录1样本值 60附录2样本值的统计量描述 61附录3标准化后的原始指标数据 62附录4SPSS的实现过程 63摘要综合评价是指将评价对象的多个方面的信息加以汇聚,从整体上以定量形式确定评价对象的优劣水平与次序的过程。综合评价技术作为一种定量分析方法被广泛应用于经济、社会、教育、技术、产品质量等多个领域,并起到重要作用。综合评价问题中常常需要处理多个指标的观测数据,且这些指标之间还存在着一定的相关性,很自然地,对多个变量指标进行综合处理的多元统计分析方法便成为解决综合评价问题的重要方法之一。特别是在计算机非常普及的今天,随着SPSS、SAS等统计分析软件的推广应用,使得多元统计分析方法在各类综合评价实践中的应用成为现实。目前,也有不少纺织研究者正在将多元统计分析方法应用到诸如纺织工业布局、纺织生产、纺织材料性能评价和产品质量综合评价等领域,尤其是借助统计分析软件包SPSS,对纺织实验所采集数据的处理与分析,将更能使纺织研究者的工作有的放矢,用统计分析得到的结论去指导实际工作。现有纱线质量的评价主要集中在对某种指标的单个评价,本文以50批不同批次的38.46tex针织纱线为研究背景,以多元统计分析中的主成分分析法、因子分析法和聚类分析为理论基础,借助SPSS统计软件,通过对多个变量指标进行综合处理,建立了纱线质量的综合评价模型。分别利用主成分分析和因子分析法对纱线质量进行了综合评价,给出了各个样本纱线质量优劣的综合排名;考虑到在综合评价中,有望大型指标也有望小型指标,通过分析,说明了在利用主成分分析法进行综合评价时,一般不必做目标趋同化处理,而在利用因子分析法进行综合评价时,必须做目标趋同化处理,为此,文中提出了负因子和负指标、倒因子和倒指标的概念,这四个概念对应于四种目标趋同化处理方法,通过论述,得出结论:利用负指标最为科学、方便,利用负因子有时需要具体问题具体分析,但对于本文中的纱线质量综合评价,二者的结论完全相同,利用倒指标与利用负指标所得结论略有不同,但差别一般不大,不过利用倒指标有一定的局限性,而利用倒因子最不科学;利用因子分析法,确立了强力因子、外观因子,捻度因子为反映纱线性能的质量因子,并给出了各个样本的三个质量因子的得分和排序;最后,用三种聚类分析方法对各个样本的纱线进行相似性聚类,三种聚类分析方法得出的聚类结果差别不大,再结合因子分析法的得分排序,验证了聚类结果的可靠性。关键词:纱线质量;综合评价;主成分分析;因子分析;聚类分析;SPSS软件第一章前言纱线的质量控制是纺织生产当中的重要环节,纱线质量的好坏直接影响后面各道加工工序的进行及最终产品的质量,对其品质检测既是对纺纱工艺的评价,又能为后道织造工艺和织物性能的预测提供有用的信息,为生产和商贸的优质、优价提供依据[1]。本课题研究的是针织用纱线。因此,根据生产要求,纱线要具有较好的强度和伸长率,以便成形和弯曲成圈;捻度均匀且偏低,以便成纱力矩平衡,便于织造;条干均匀,纱疵少,以防影响织物外观。对纱线的质量检验主要包括断裂伸长率、强力、条干不匀、捻度不匀、粗细节、棉结分布等众多量化指标,因为需要对多个变量进行分析,而变量个数众多且带有动态性,并且彼此之间存在着一定的相关性,故众多的指标给纱线质量的综合评定工作带来了不便[2]。同时,在高维空间中研究纱线质量的好坏又势必会增加分析问题的复杂性,对纱线质量综合评价的定量化分析是现代纺织研究的重要课题。在数学上,综合评价是指将评价对象的多个方面的信息加以汇聚,从整体上以定量形式确定评价对象的优劣水平与次序的过程。它在到经济、社会、教育、技术、产品质量等多个领域都有重要的应用。综合评价的最大难点在于多指标性,一般情况下,只有在一维空间中,才能使排序评价成为可能,我们必须将多个指标问题综合成一个单一指标的形式,称之为评价函数或目标值,而产生综合指标目标值的主要方法是对各项指标加权平均求和。在做综合评价时,综合评价模型中会出现三类数据:指标值、目标值和权重值。指标值一般可由调查或实验得到数据,客观性较强,但由于各个指标的特性和实际意义不同,有的是越大越好的正向指标,称之为望大型目标,有的是越小越好的逆向指标,称之为望小型目标,因此在确定综合指数的目标值时,有时必须将目标做趋同化处理,即通过对有关数据做适当的处理,使得所有指标要么是望大型指标,要么是望小型指标,实现评价指标体系的一致性,同时,权重的选择在综合评价中也起着举足轻重的作用。在综合评价问题中,一般各指标彼此之间具有一定的相关性,因此,解决由指标之间的相关性所造成的信息重叠问题和降维问题,在多指标综合评价中显得尤为重要,而多元统计的主成分分析法和因子分析法恰恰都是寻求从高维空间到低维空间的映射方法,其目的是达到降维的效果,以便用几个较少的综合指标来综合所研究的总体各方面的信息,且使这几个综合指标所代表的信息不重叠,特别是随着电子计算机的发展及SPSS等统计分析软件的推广应用,多元统计方法目前成为解决综合评价问题的重要方法之一,对纱线质量进行综合评价便是其在产品质量方面的一个应用[3-4]。1.1课题研究的背景1.1.1纱线质量检测对于纱线的质量检测主要有两种方法,即感官检测法和仪器检测法[5]。感官检测法主要根据检验人员的目光和触觉对纱线质量进行判断,或者把试样与标准样照进行比较评定。这种方法简单迅速,但是检测结果与检验人员的感觉和经验有关,带有主观因素的影响,各检验人员之间可能存在较大的系统偏差。仪器测试可以摆脱人为因素对测试结果的影响,并且可以得到测试结果的数字指标来客观评价纱线的质量好坏。到目前为止,用于纱线质量检测的仪器主要经历了机械式、电容式和光电式几个阶段。机械式检测仪存在着测试过程复杂、测试速度慢、测试精度低以及台间测试误差大等不足。电容式检测仪在一定程度二弥补了上述不足,所以一度成为纱线质量检测的佼佼者,但是,电容式测试仪也存在着不容忽视的不足之处,主要是测试精确性受测试条件(大气状态、试样的历史回潮条件、调湿处理的时间等)和纱线混纺状况的影响。电容式条干仪的条干CV值,只考虑了纱线不匀程度的平均值,对于纱线上出现的不同特征的规律性不匀波,往往得不到应有的反映,即忽视了纱线不匀的离散特征;因种种因素的影响(包括仪器本身精度、测试条件及方法水平等)导致了不同电容式条干仪的测试结果存在较大的台间误差,限制了测试结果的可比性。光电法检测是近年来随着计算机图像处理技术的不断发展而出现的一种新型测试技术,其具有测试速度快,测试精度高、测试结果不受测试条件影响等优点,所以受到越来越多的关注。1.1.2纱线质量的品质评定纱线是纺纱厂的产品,又是织布厂和针织厂的原料。为了在企业内部和企业之间作为考核纱线品质和交付验收的依据,国家主管部门特批准和颁布各种纱线的品质指标。有国家技术监督局颁布的国家标准,有纺织工业部颁布的部标准或专业标准,还有地方和企业标准。在品质标准中,评定纱线的等级,基本上都是根据物理指标和外观疵点来进行。不过不同种类和不同用途的纱线,所要考核的具体项目也不同,例如中长涤粘混纺纱线的品质,有单纱线断裂强度和重量不匀率来评定,纱线的品级由条干均匀度评定。而精梳毛织物,一般属于高档纺织品,对于织物的手感风格要求较高,毛纱线的等级,也是根据物理指标和外观瑕疵来评定,物理指标,除支数和强度外,重量不匀率、断裂强度和捻度不匀率,也是重要考核项目。外观疵点,规定检验的项目有粗细节的数量、条干的均匀度及纱疵等。强力是成纱的基本保证。无论是纺纱或织造均对强力有相当要求,如果纺纱时强力低,则纺纱过程难以提高效率,挡车工劳动强度增大;若机织时强力低,则影响织造效率和布面质量。有两种测试纱线强度的仪器和表示纱线强度的方法:单纱强度和断裂强度。加捻作用是影响纱线结构的最重要的因素。短纤维之间所以能够具有一定物理机械性质的纱线,加捻起着决定作用。纱线的细度不匀,会导致纱线的捻度分布不均匀,而捻度不匀也会影响纱线质量。纱线条干均匀度是纱线质量的基本要素之一,它是纺纱生产系统工艺和机械因素的综合体现。数据以条干CV%值表示一定长度内纱线短片段的不匀,同时数据生成常发生纱疵细节、粗节和棉节,与条干CV%值有一定的相关性,对高速织造和布面显现有较大影响。棉节对棉纱质量的影响也很严重,它直接影响成纱、针织布等的质量。对于织造来说,首先它影响效率,容易形成断头,在针织时还易造成断针。其次是对染色质量影响较大。人们对产品质量要求越来越高,尤其对布面的外观质量重视程度提高,布面染色性能成为布面外观质量的一个重要指标,而棉节的存在直接影响染色效果,造成染疵。每一批纱线的质量可以根据有关纱线的品质标准来评定,但纱线往往是由断裂伸长率、强力、条干不匀、捻度不匀、粗、细节、棉结分布等众多量化指标组成的,若有多批纱线,又该如何评价每一批纱线的相对优劣呢?这就需要利用综合评价模型来处理了。1.1.3纱线质量的综合评价模型目前,对于产品质量的综合评价模型,众多学者进行了一系列的研究,如郭云涛[5]从系统角度给出了质量评价的三维空间,提出了综合评价的概念和思路,但其并未指出具体的方法。王中华[6]利用模糊理论建立了质量综合评价模型,但其对指标权重的处理不够客观,建立的评价模型不够全面等。吴花平[7]引入信息论中的熵值指标权重法,将模糊综合评判法的主因素突出型、加权平均型和全面制约性三种方法结合,构建了综合评价模型。本文在前人研究的基础上,基于多元统计的方法对纱线质量进行综合评价,就评价模型的数学方法使用及其评价结果展开讨论。主观评价模型主观评价是通过人的手对织物的触摸所引起的感觉并结合对织物的外观印象来作出评价,通常又称为感官评定。在主观评价时,一般是集中在适当的熟练人员,在一定的环境条件下对织物进行检验,每一检验人员根据其经验对织物风格优劣给予评定。评定结果可以用分档评定法和秩位评定法两种方法进行表示。分档评定法是指对织物某项手感的基本特性以人为选定的尺度进行分档评分,最后得出该批织物中各个试样的某项值。但这一方式评分过程较复杂,而且在检验过程中,评价尺寸往往会不自觉地在逐渐改变,以致各人评分结果将其综合时往往不稳定。秩位评定法是先由数名检验人员按各自的感觉效果对纱线质量作出判断,对纱线质量的好坏由高到低的顺序排队,排队顺序号即为秩位数,为纱线试样总数。然后将各个检验人员对每个纱线打出的秩位数相加得到他们的总秩位数,最后根据总秩位数对这些纱线质量的优劣作出相对比较。主观评价因为其具有简便、快速的优点而广泛应用,但其不可避免地存在一些问题,无法排除主观任意性,判断结果因人、因时而异,局限性大,缺乏定量的描述,结果可比性差,很难结合纺织技术指导和改善纱线的质量等。(2)客观评价模型马克思曾经指出:“一门科学只有在成功地运用数学时才算达到了真正完美的地步”。当科学的研究处于低级阶段时,主要是对事物进行定性分析;当研究处于高级阶段时,就逐渐转向对事物作定性分析的基础上进行定量分析,对纺织领域的研究同样也要进行定量分析。在进行综合评价时,目前应用比较多的客观评价模型有:灰色系统模型;人工神经网络技术;多元统计方法等。灰色系统是部分信息已知,部分信息未知的系统。灰色理论基于关联度收敛原理、生成数、灰导数、灰微分方程等观点和方法建立微分方程模型,能更好地描述系统内部的本质。灰色系统理论用灰色模块建模,而不直接用原始数据序列,而是从原始数据中去寻找这种内在规律。其将所有随机变量看作是一定范围内变化的灰色量,将随机过程看成一定范围内变化的、与时间有关的灰色过程,用数据处理的方法,将杂乱无章的原始数据整理成规律性较强的生成数列再进行研究。该方法的不足之处是没有物理原型,不清楚系统的作用机制,很难判断信息的完备性,只能凭逻辑推理、某种观念意识、某种准则对系统的结构、关系等进行论证,然后再建立某种模型。而这些模型只能看作是原系统的代表、同构,由于模型不是唯一的,这种代表或同构就只能在某一方面、从某一角度、在某一准则下成立。袁肖鹏[8]等运用灰色控制理论、探讨同一毛坯织物,经不同染整工艺加工的全毛华达呢成品织物的质量。该模型的建立,使用常规测试的数据,可以预测织物综合手感值,并进行了精度检验且获得很好的预测结果,为灰色模型在纺织界的应用提供广阔的前景。神经网络是由大量处理单元神经元广泛互连而成的网络。它是在人类对其大脑工作机理认识的基础上,以人脑的组织结构和活动规律为背景,反映了人脑的某些基本特征,可以说是对人脑的某种抽象、简化和模仿。简单地讲,它是一个数学模型,可以用电子线路来实现或用计算机来模拟人的自然智能。它是从人脑的生理结构出发来研究人的智能行为,模拟人脑信息处理的功能,它是根植于神经科学、数学、统计学、物理学、计算机科学及工程等学科的一种技术。神经网络是巨量信息并行处理和大规模平行计算的基础。它既是高度非线性动力学系统,又是自适应系统,可用来描述认知决策及控制的智能行为,它具有存储和应用经验知识的自然特性。它与人脑相发展,已在智能控制、模式识别、计算机视觉、非线性优化、信号处理等方面取得巨大成功和进展,成为人工智能研究的重要领域之一。江南大学的王鸿博[9]阐述了神经网络技术在预测浆纱质量方面的应用情况。采用原纱的各项性能指标:捻度、断裂强力、强力、最低强力、断裂伸长率、耐磨次数、毛羽指数作为原纱质量指标,经过上浆后的项可织性指标增强率、减伸率、毛羽降低率、增磨率作为浆纱质量指标。以浆纱增强率预测模型为例,分析数据的选取问题。采用单项指标模型输入层原纱项主要指标捻度、断裂强力、最低强力,单个隐含层个神经元,输出层项指标增强率,利用神经网络建立浆纱质量预测模型,浆纱增强率预测指标与实际指标误差很小。多元统计方法是一种综合分析方法,它能够在多个研究对象和多个指标互相关联的情况下分析出它们的统计规律,它是从经典统计学中发展起来的一个分支。在计算机非常普及的今天,多元统计分析已广泛地应用到社会科学和自然科学的许多领域中。特别是在教育、农业、经济、金融、医药、气象、环境科学、考古等领域应用比较广泛,在纺织领域也得到广泛应用。关于多元统计分析在纺织领域的应用,已经有不少学者做了很多工作。徐先林等[2]利用主成分分析法和回归分析研究了纱线质量的综合指标评定;成玲等[10-12]利用数理统计中的假设检验、回归分析等方法研究了如纤维的长度、纱线的细度、构成纱线的纤维种类等影响纱线的动态强力的主要指标间显著性差异;杨晓波[13]针对纺纱张力指标建立了时间序列预测和控制的AR模型,达到实时控制纺纱张力的目的;刘长伴[14]用正交试验方法对影响纱线质量的毛羽指标因素如纤维的长度、纺纱方式和纱线的捻度进行了工艺优化分析;也有学者对评定针织纱线质量的各个指标进行了相关性分析,利用主成分分析法在众多指标当中提取几个反映纱线品质的综合指标,以进行纱线质量的比较与评价[15];也有采用相关性分析揭示纱线质量指标之间关系,利用主成分分析法确立外观质量因子和力学性能因子这两个反映纱线性能的综合质量因子,并且在对纱线综合质量因子作定量排序的基础上,建立纱线综合质量评价系统[16];同时,有学者用因子分析法得出浆纱毛羽指数和浆膜完整率、浆膜完整率与纱线耐磨次数以及浆纱强度和浆液渗透率间存在相关性的回归方程,由此获得综合评价公式[17];甚至还有就数理统计中的协方差、均值、方差等具体概念应用到影响纱线质量指标的分析中,从而得到一些相关结论[18-22]。1.1.4主成分分析方法与综合评价主成分分析法最早是作为多元数据的降维处理技术而提出的,在自然、生物医学、管理、经济等领域均有广泛的应用。在社会经济问题的分析中两个最有名的例子是:Stone在1974年对美国的1929-1938年17项国民经济统计指标所作的主成分分析和M.Scott在1961年对英国157个城镇的发展水平进行的主成分分析。前者发现完全用三个经济指标来概括原来的17项指标,从而大大简化了数据分析结构;后者将原始测量的57个指标降到了5个综合变量(主成分)。主成分分析法后来逐渐被推广应用于样品的分类与排序。英国著名统计学家M.Kendall早在1939年就对对英国48个郡的10种主要农作物进行了主成分分析,用第一主成分对各地的“生产能力水平”进行排序与分类[23-25]。自二十世纪八十年代以来,随着我国经济效益综合评价理论与实践的发展,不断有人将主成分分析法应用于各类专题的综合评价,使之成为目前应用最广的一种多元统计综合评价方法。目前对主成分综合评价模型大体上有两种观点:一是只用第一主成分进行评价,英国统计学家M.Kendall认为:第一主成分能够最大限度地反映样本间的差异,是概括指标差异信息的最佳线性函数。因此,只能用第一主成分对样本进行综合排序。我国也有部分学者持这种观点[26-28],南开大学孟生旺老师从几何投影的角度阐明:在多指标综合评价中,只用第一主成分综合原始数据时保留信息最多,因而也就只能以第一主成分值作为综合评价值才合理。另一种观点则认为不仅要充分重视第一主成分,而且也要顾及其它主成分在综合评价中所起的作用。他们的做法是先按累积方差贡献率不低于某一阀值(比如80%)的原则确定前几个主成分,然后取所选主成分的线性加权平均值进行综合评价,所用权数是各主成分的方差贡献率(这也是国内用主成分分析进行综合评价的应用研究案例中的通用做法)[29-30]。1.1.5因子分析方法与综合评价国内有不少文献将因子分析法应用于各类问题的综合评价分析。根据我们掌握到的文献数量看,其应用之多之广绝对不亚于主成分分析法。如胡帆、何晓群、赵喜仓等将之应用于经济效益综合评价,谭旭青将之应用于建立教学质量评估指标体系,黄明儒等对其一般原理进行了分析,赵西将因子分析法应用于城市工业主体结构研究,何亚斌、张伦俊、甘寿国等将之应用于城市社会经济水平的综合评价,张峦将因子分析应用于财务状况综合评价指标的选择,罗永长将之应用于企业技术开发能力评价模型,赵黎明与乔建生应用因子分析对科学基金综合评价指标体系优化进行研究,昊元奇将之应用水稻种子活力的综合评价,王琳娜与刘爱玲则应用因子分析法对卫生事业状况进行了综合评价,邹鲜红与黄健柏[[31]应用因子分析法研究我国医药制造业区域技术创新能力,李传哲[32]等将之用于水质综合评价。上述这些文献中大多对因子分析法的综合评价模型进行了设计。基本精神是相同的,都是主张将多个公共因子的得分进行加权平均,权数为方差贡献率。但在遇到需要做目标趋同化处理时,很少对原始指标或因子进行处理,也没有对方法进行改进,也很少将聚类分析的结果和因子分析综合评价结果进一步进行讨论、研究。本文在这些方面进行了研究和分析。1.2课题研究的意义纱线的质量控制是纺织生产当中的重要环节,因为纱线的质量好坏直接影响后面各道加工工序的顺利进行及最终产品的质量品质。传统的对纱线的质量检验主要包括纱线的条干不匀、捻度不匀、断裂强力、断裂伸长率以及纱线表面的毛羽、粗细节、棉结分布等。这些纱线的质量指标对于织物的织造过程、织物的外观以及后整理都有非常大的影响,而目前对于纱线质量的综合评价没有一个统一的标准和方法[33-34]。因此,纱线质量的综合评价方法研究,对于人们客观认识纱线质量具有积极的意义。从上面的一系列分析可以看出,在这些评价模型中,许多都是将上述指标进行独立检测、分析,都是对指标的单一分析[35],只解决了某一方面的问题;尤其在利用多元统计进行纱线质量的综合评价时,很少就主成分分析法、因子分析法及其它方法进行适用条件分析,理论推导证明,或几个方法的综合比较分析,而是拿来就用,尤其是在涉及到需要将指标做目标趋同化处理时,更是没有一个统一的方法,这势必会造成结果、结论的片面性以及理论应用上的缺陷。本文以纱线质量的综合评价为例,对多元统计中的主成分分析、因子分析和聚类分析进行了理论上的推导证明,并对各个综合评价结果予以比较和分析,讨论了目标趋同化问题,以便为后用者提供理论依据和较为系统、科学的方法。1.3课题研究主要内容本文旨在把多元统计分析在纱线质量综合评价中的应用进行系统化、理论化、具体化。首先,介绍多元统计分析的几种常用的方法,在阐述方法的同时,着重研究这些方法之间的密切联系,进而说明这些方法在应用时应注意的问题;其次,是根据样本的指标值,分别利用主成分分析法和因子分析方法来对各个样本的综合情况进行评价,并对纱线质量进行分级;同时,对目标趋同化问题进行了讨论,并指出,利用主成分分析法进行综合评价时,不必做目标趋同化处理,而利用因子分析法做综合评价时,必须做目标趋同化处理,目标趋同化的方法有四种:负因子和负指标、倒因子和倒指标,得出结论:利用负指标最为科学,利用负因子有时需具体问题具体分析,但对于本文,二者的结论完全相同,而利用倒指标与利用负指标所得结论虽差别不是很大,但利用倒指标有一定的局限性,利用倒因子最不科学;通过将主成分分析法和因子分析法进行比较,说明了经过最大方差旋转的因子分析法优于主成分分析法;最后,用聚类分析方法就各个样本的质量指标相似性进行了聚类,并结合因子分析的得分排序,验证了聚类结果的可靠性。本文结合综合评价纱线质量这一实际例子,利用多种多元统计分析方法对有关数据进行不同的分析,论证和阐述了以上各个问题,得出的结论可以指导从事此项工作者做更多细致的工作。本文的应用价值,在于对纱线质量进行综合评价提供了一种系统、科学、相对合理的方法。由于各种数学方法各有侧重,只用一种方法评价纱线质量难免失于偏颇,所以研究中采用三种方法,即主成分分析法、因子分析法和聚类分析法。用主成分分析和因子分析分别对纱线质量进行量化排序,然后用聚类分析对纱线进行了相似性分类,再用因子分析的得分排序验证了聚类分析的可靠性,虽三种方法各有侧重,但最后得到的结论基本一致,与实际情况也比较相符,说明评价结果比较可靠,达到了对纱线质量进行综合评价的目的,对指导实际生产有一定的参考价值。第二章主成分分析法与纱线质量的综合评价第二章主成分分析方法与纱线质量的综合评价主成分分析法是利用多指标之间的相关性,通过对原始指标相关矩阵内部结构的研究,能在变差信息损失较少的前提下,得到既综合总体各个方面的信息又彼此不相关的新指标,称之为主成分,主成分分析法的这个特点正适合用来解决综合评价中由指标之间的相关性所造成的信息重叠,于是主成分分析法被广泛应用于各类综合评价中。主成分综合评价法具有“降维的简化作用”,“权重的非人为性”,“评价方法的模式化”等优点,但在实际应用过程中,其评价结果往往有不尽人意之处,需要对其改进。本章就来利用主成分分析法,综合评价纱线质量。2.1主成分分析的数学思想主成分分析是将多指标化为少数几个综合指标的一种统计方法。主成分分析是从原始变量中导出少数几个主分量,使他们尽可能多地保留原始变量的信息,且彼此互不相关。主成分分析的应用目的是数据的压缩。它常被用来寻找判断某种事物或现象的综合指标,从而更加深刻地揭示事物的内在规律[36-42]。主成分这个概念由KarlPearson在1901年提出,但当时只进行了非随机变量的讨论,1933年Hotelling则将此概念推广到了随机变量中。其原理可看直观的例子:假如有一个二维数据表,表中数据点的分布如图2-1所示,呈椭圆形,重心是,很明显,在沿轴的方向上,数据的离差最大,因此,所反映的数据信息也最多,这个方向被称为数据变异的最大方向。如果将原点平移到,并作旋转变换,即得到一个正交坐标系,可以看出,若省略轴,将数据点在轴上投影,就会得到一个简化的一维数据系统。降维的核心思想就是省却变异不大的变量方向。又如,一个三维数据点的分布是饼形的,如图2-1,其变异较大的方向为,而方向的变异很小,即在该方向各样本点取值没有很大差别,就可以不考虑方向。若以作为新坐标系,则原三维空间的数据点就可以在二维平面上得以显示,如图2-1所示。推广到更一般的情形,设原数据是维的,主成分分析的过程实际上就是对原坐标系进行平移和旋转变换,使新坐标系的原点与数据点的重心重合,新坐标系的第一轴与数据变异的最大方向对应,第二轴与第一轴正交,并对应于数据变异的第二大方向,依次类推。若这些主轴(维,)能十分有效的表示原始数据的变异情况,则原维空间就被降维为维。00在纺织工程中,经常遇到的是多指标问题。由于指标个数过多,并且彼此之间存在着一定的相关性,因而观测到的数据在一定程度上反映的信息有所重叠,同时也增加了分析问题的复杂性。主成分分析在纺织工程中主要用于简化数据结构、纱线质量综合评价等方面。2.2主成分分析的数学模型及理论推导假设我们所讨论的实际问题中,有个样本,每个样本由个指标描述,得到原始资料矩阵,记(2-2-1)其中。通常数学上的处理是将原来的个指标做线性组合,作为新的综合指标。如果将选取的第一个线性组合即第一个综合指标记为,一般自然希望中尽可能多地反映原来指标的信息,而所谓的信息就是用的方差来表示,即越大,则表示包含的信息越多,如果一个变量的所有取值都是一样的,则无需对这个变量进行研究,它所含的信息认为是零信息,因此在所有的线性组合中所选取的第1主成分应该是方差最大的。如果第1主成分不足以完全代表个指标的信息,再考虑选第2个线性组合,即第2个主成分,依次类推可以造出第3,第4,……,第个主成分。这些主成分间互不相关,且方差递减。即求主成分就是寻找的个线性函数,其中,,即(2-2-2)使得相应的方差尽可能的大,这里表示的协方差矩阵,但为不使,要求组合系数满足(2-2-3)(2.2.2)式中的系数由下列原则确定:(1),即与不相关。(2)是的以上组合中方差最大的,其次为,即(2-2-4)(3)新的综合指标的总方差保持不变,即(2-2-5)如上确定的综合指标分别称为第一主成分,第二主成分,…,第主成分。由(2.2.4)和(2.2.5)可以看出,用前面的一部分主成分,就可以反映原指标所包含的较大部分的信息量,而且主成分之间是互不相关的,即已反映的原始变量的信息不再在中出现,以此类推。这样就可以用少数的几个互不相关的主成分代替原始指标来分析解决问题,而这几个主成分就构成新的评价指标体系。那么如何求出原始指标的主成分呢?由(2.2.2)知,核心的问题是求出线性合的系数。这是一个条件极值问题,即(2-2-6)利用拉格朗日乘数法知,令(2-2-7)令(2-2-8)得(2-2-9)由于,所以,故根据特征根和特征向量的定义可知:是的特征根,而的属于特征根的模为1的特征向量,我们把的与对应的特征根记为,则可以证明的所有特征根都大于零,事实上,对任意,由于,所以是正定的,从而。设的个特征根从大到小依次为,由于,故,即下面考虑第二主成分对于特征向量需要求出满足的条件,由于所以必须有,即要求正交,类似地,可以推得为满足,必须有正交,又,故为了满足主成分分析的要求,求出的特征向量后,还需将其正交化和单位化,即求出的特征向量必须是规范正交特征向量。设是对应的规范正交特征向量,则是的对应的规范正交特征向量所对应的矩阵,且有,,(2-2-10),(2-2-11)这样,想求出主成分,只需求出协方差阵的特征根及相应的规范正交特征向量即可,但协方差矩阵会受到指标量纲和数量级的影响,一般需要先对原始指标数据进行标准化处理,以消除指标量纲和数量级的影响,即实际上是选择基于相关系数矩阵的主成分分析。为了达到降维的目的,通常选择()个主成分,确定主成分个数的原则是用较少的主成分获取足够多的原始信息,如果特征根小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大。一般可以用特征根大于1作为纳入标准,但通常又要使前个主成分的累积方差贡献率80%,因为累计方差贡献率表示前面个主成分累积提取了原始指标多少信息。一般来说,如果前个主成分的贡献率达到80%,表明前个主成分基本包含了全部测量指标所具有的信息,这样既减少了变量的个数又便于对实际问题的分析和研究。所以实际上就是在和之间进行权衡:一方面要使尽可能的小,另一方面使尽可能的大,最终确定选取个主成分。由(2.2.11)式可知,特征根可以被看成是主成分影响力度的指标,代表引入该主成分后可以解释平均多少原始变量的信息。因而定义前个主成分的累计方差贡献率为(2-2-12)人们在对某个系统做综合评价时,都会遇到如何选择评价指标体系和如何对这些指标进行综合评价的困难,一般情况下,选择好评价指标体系后通过对各指标加权平均的办法来进行综合评价。但如何对指标加权是一项具有挑战性的工作,指标加权的原则是根据指标的重要性,而指标在评价中的重要性往往会带有一定的主观性,这多少会影响综合评价的客观性和准确性,由于主成分分析法能从选定的指标体系中归纳出大部分信息,根据主成分提供的信息来确定权重进行综合评价,不失为一个可行的方法。由于主成分之间互不相关,一般采用加权算术平均来作为综合评价目标值的评分,而权重取各个主成分的方差贡献率,即评价函数的目标值为因为各个主成分的方差贡献的总和是一个常数,而对评价函数的目标值乘以一个常数对排序没有什么影响,所以为计算简便,这里我们用每个主成分的方差贡献值代替它的方差贡献率来简化目标值的表达式即(2-2-13)各评价对象的表现由主成分反映,可用(2.2.13)计算各样本的综合评价目标值,进而对各样本进行排序和比较。利用主成分分析法进行综合评价,具有“降维的简化作用”,“权重的非人为性”,“评价方法的模式化”等优点。2.3利用主成分分析法进行综合评价的步骤⑴将所采集到的原始数据标准化,以消除量纲的影响和指标数量级的差别。设个样本个指标的观测值矩阵为,则标准化后的矩阵记为,其中,,。⑵求出的协方差矩阵即的相关系数矩阵,显然为对称阵。⑶求出相关系数矩阵的个特征根,且其满足,和相应的规范正交的特征向量,根据各指标对主成分的累计方差贡献率确定主成分的个数。⑷求出综合评价的目标值。利用下式计算各个样本的主成分及综合评价的目标值的得分并排序,再根据实际问题进行分析和综合评价。(2-3-1)(2-3-2)这里需强调的是:的表达式(2.3.1)式中的各个指标值,必须是标准化后的指标值。2.4利用主成分分析法综合评价纱线质量鄂尔多斯集团以强大的实力和规模成为中国出口名牌企业和中国行业排头兵企业,进入全国520户重点企业和中国企业500强之列,羊绒产业是集团的事业基础,纯绒针织纱的质量优劣直接影响其后续产品的品质和定价,为此,企业需要对大批的纯绒针织纱的综合质量进行客观评价和科学分类。本文所采用的纯绒针织纱的有关数据是导师徐先林教授与鄂尔多斯羊绒集团进行项目合作时,由鄂尔多斯集团提供的。随机抽取鄂尔多斯集团的50批不同批次的38.46tex纯绒针织纱,用YG136条干均匀度仪、Y331A捻度机、YG029F台式全自动强力仪等设备对下列纱线指标进行测试:平均断裂伸长率、最低断裂伸长率、强力、捻度CV值、条干CV值、企标粗节和企标棉结。实验条件为:温度,相对湿度,测得试验数据见附录1。根据专业知识我们知道,平均断裂伸长率、最低断裂伸长率和强力都是越大越好的望大型指标,而捻度CV值、条干CV值、企标粗节和企标棉结都是越小越好的望小型指标。下面利用主成分分析法,对附录1中这50个样本进行综合评价。利用SPSS软件,具体操作过程见附录4,可得相关系数矩阵,结果如表2-1所示。表2-1原指标的相关系数矩阵平均伸长率最低伸长率强力捻度CV值条干CV值粗节棉结平均伸长率1.0000.6680.693-0.244-0.188-0.1610.046最低伸长率0.6681.0000.650-0.020-0.254-0.191-0.112强力0.6930.6501.000-0.071-0.184-0.1620.005捻度CV值-0.244-0.020-0.0711.0000.1730.121-0.046条干CV值-0.188-0.254-0.1840.1731.0000.8910.545粗节-0.161-0.191-0.1620.1210.8911.0000.588棉结0.046-0.1120.005-0.0460.5450.5881.000由表2-1知,平均断裂伸长率、最低断裂伸长率、强力这三个指标间具有较强的相关性,而条干CV值、企标粗节和企标棉结之间也具有较强的相关性,说明这几个指标间的数据有重叠,可以利用主成分分析进行综合评价。根据代数中关于对称矩阵的特征根、规范正交特征向量的计算方法,可以求得规范正交的特征向量,再根据(2.2.12)式可知只要提取前三个主成分、、,累计方差贡献率就达到83.02%,求解结果如表2-2所示。表2-2特征根、特征向量、累计方差贡献率指标-0.4020.432-0.089-0.4180.3470.237-0.3930.4120.1370.139-0.0490.9270.4570.5290.0800.4420.3780.0350.2910.454-0.220特征根2.8171.9561.038累计方差贡献率40.24%68.19%83.02%由表2-2可得到,相关系数矩阵所对应的前三个特征根、其对应的规范正交的特征向量和累计方差贡献率。由(2.3.1)式得(2-4-1)利用(2.2.13)式和表2-2中的特征根,可得综合统计量目标值的表达式为再结合(2.4.1)式可得综合统计量的目标值与标准化后的各个指标(具体数据见附录3)间的关系为(2-4-2)由(2.4.2)式可以看出,平均断裂伸长率、最低断裂伸长率、强力系数为负,其值越小,纱线质量越不好,相应的F值越大,而捻度CV值、条干CV值、粗节和棉结的系数为正,其值越大,纱线质量越不好,相应的F值越大,反之,就有纱线质量越好,F值越小,若F按升序排列,就可以得到纱线质量由优质到劣质的排序,很显然这与实际问题是一致的。所以,利用主成分分析法进行综合评价时,一般不需要对原始指标做目标趋同化处理,这主要看综合评价目标值的表达式中,各个指标系数的符号是否能与实际问题中各个指标的含义相一致。事实上,若一开始就对原始指标做目标趋同化处理,即先将平均断裂伸长率、最低断裂伸长率、强力这三个指标取负号,将目标趋同化且标准化后的原始变量记为,三个主成分记作,则完全类似可得到目标趋同化以后的相关系数矩阵的特征根、特征向量、累计方差贡献率,见表2-3。表2-3特征根、特征向量、累计方差贡献率指标0.402-0.4320.0890.418-0.347-0.2370.393-0.412-0.1370.139-0.0490.9270.4570.5290.0800.4420.3780.0350.2910.454-0.220特征根2.8171.9561.038累计方差贡献率40.24%68.19%83.02%由表2-3及(2.3.1)式得(2-4-3)又显然有,而,代入(2.4.3)式得与(2.4.1)式相比较,可见目标趋同化以后的各个主成分的表达式没发生任何变化,从而利用(2.4.1)式得到的综合统计量的目标值的得分也相同,故利用主成分分析法,一般不需要做目标趋同化处理。最后计算出50个样本点的综合目标值得分,给予纱线质量好坏的定量化描述,得分越小,表明纱线质量越好,由此就纱线质量问题,便可对样本点进行比较、排序分析,具体结果如表2-4所示。表2-4利用主成分分析得到的纱线质量的综合评价目标值的得分及排序样本得分排名样本得分排名12.2037262.623924.824427-2.141830.6728285.21454-1.4820293.654153.75423010.35496-1.4121310.942971.3932321.64348-4.58933-2.28179-0.392434-0.542210-6.103356.3647112.1236361.1431120.31253713.4150130.542738-4.441014-2.711639-3.3313158.5148404.3343161.553341-3.0214172.0335422.694018-7.86243-2.9515192.323844-4.291120-5.50445-10.32121-4.153946-4.887221.103047-0.4123235.784648-4.79824-5.11649-1.8719250.452650-5.325根据表2-4可知,各个纱线性能品质的综合排序,由综合统计量目标值的得分,45号样品的值最小,说明质量最好,排名在前面的还有18号、10号、20号和50号样品,而37号样品的的值最大,相比该样品为质量最差的,而排在最后的还有30号、15号、35号和23号样品,与附录1的原始数据相对照,结论与实际情况基本相符。由表2-4,利用主成分法得各个纱线质量从优质到劣质的综合排序为:。在(2.3.1)的表达式中,根据系数的大小,一般可以分析各主成分分别代表哪些能力方面的综合指标,但是,从表2-2也可以看出,主成分、主成分在,,,,这些指标上的权重都较大,使得这两个主成分不易区分到底反映什么样的指标,不易命名,也不便分析各个主成分的含义及其与原始指标的内在关系,说明主成分分析法还有缺陷,另外,若是特征向量,则也是特征向量,这就为综合评价增加了某种不确定性,所以主成分分析法存在不足,需利用因子分析法进一步讨论,事实上,现在的SPSS软件没有主成分分析的功能,而是直接给出的因子分析法的结果,在实际应用中,需要利用主成分分析与因子分析的关系,导出主成分分析的结果,具体关系在第四章中详细讲解。主成分分析与因子分析具有密切的联系,主成分分析法是因子分析的基础,因子分析的中的重要步骤之一就是因子的提取,而因子的提取最常用的方法就是主成分分析法。2.5小结本章介绍了利用主成分分析法进行综合评价的思想和步骤,并对纱线质量进行综合评价,得出以下结论。利用主成分分析法给出了纱线质量综合评价的得分排序(见表2-4)。说明了利用主成分分析法进行综合评价时,一般不用做目标趋同化处理。指出了利用主成分分析法进行综合评价的不足之处,需要进一步利用因子分析法来研究。第三章基于因子分析的四种综合评价纱线质量处理方法对比3.1因子分析的含义因子分析是由CharlesSpearman在1904年首次提出,并在其后半生一直致力于发展此理论,使之最终成为了现代统计学的重要分支。因子分析在某种程度上可以被看成是主成分分析的推广和发展,或者说是一种自然延伸,它对问题的研究更加深入,研究相关系数矩阵或协方差矩阵的内部依赖关系,它将多个变量综合为少数几个公因子,以再现原始变量与公因子之间的相关关系,也是多元统计分析中降维的一种方法[36-43]。因子分析是通过研究多个变量间相关系数矩阵的内部依赖关系,找出能综合所有变量的少数几个随机变量,这几个随机变量是不可测量的,通常称为公因子。然后根据相关性的大小把变量分组,使得同组内的变量之间的相关性较高,但不同组的变量相关性较低。各个公因子间互不相关,所有变量都可以表示成公因子的线性组合。因子分析的目的就是减少变量的数目,用少数因子代替所有变量去分析整个问题。3.2因子分析的数学模型及理论推导3.2.1因子分析的数学模型设有个样本,每个样本由个指标来描述,且每个指标都已标准化,即每个指标的样本均值为零,方差为1。正交因子模型为(3-2-1)其中是由标准化的可观测评价指标分解出来的相互独立的公因子,它们是不可观测的,其含义要根据具体情况来解释。是各对应指标所特有的因子,称为特殊因子,表示中所不能被公因子解释的部分,是第个指标在第个公共因子上的系数,称为因子载荷。(3.2.1)可用矩阵形式表示为(3-2-2)其中,,,,且不可观测随机向量和满足:(1),(2),即各个公因子不相关且方差为1。(3),即各个公因子与特殊因子是不相关的。(4)。因为故标准化后的变量的正交模型具有的性质为(3-2-3)另外,根据代数的知识可以证明[32],因子模型中的载荷矩阵与相关系数矩阵的特征根及其对应的规范正交的特征向量所构成的正交阵有以下关系(3-2-4)3.2.2因子载荷矩阵中各元素的涵义因为所以中的元素实际上就是第个指标与第个公因子的相关系数,它表示指标与相关的程度,所以中第行元素反映了第个指标依赖于各公因子的程度,而中第列元素反映了第个公因子与各个指标间的关联程度。通常可根据的大小来解释公因子的涵义,称为第个指标在上的因子载荷,从而称为因子载荷矩阵。3.2.3因子载荷矩阵的相关量的涵义中第行元素的平方和称为指标的共同度,即(3-2-5)由于(3-2-6)即(3-2-7)可见共同度反映了指标对个公因子的依赖程度,越大表示指标的信息被个公因子所概括的程度越高。中第列元素平方和表示第个公因子对指标所提供的方差贡献总和。即(3-2-8)由(3.2.5)可知(3-2-9)可见的值越大,反映了对指标的影响越大,衡量了公因子重要性。3.2.4因子个数的确定公共因子个数的确定可按以下两种方法确定:前个公因子的累积方差贡献率80%;或者只提取特征根大于的公因子。这两种方案在实际应用中视情况而定。3.2.5因子旋转在求出因子的载荷矩阵后,还必须对公因子进行合理的解释,而因子的解释通常带有一定的主观性,所以需要通过因子旋转来减少主观因素的影响。公因子是否易于解释,取决于因子载荷矩阵的结构,由(3.2.6)式可知,若均接近于或,则公因子就易于解释,因此需要对因子载荷矩阵进行旋转,使得旋转后的因子载荷矩阵的每一列的元素的绝对值的距离尽可能拉开,也就是尽可能使其中有的元素接近于,有的元素接近于。对因子载荷矩阵的旋转常用的方法是:最大方差旋转法。所谓最大方差旋转法是指选择正交矩阵,使得旋转后的因子载荷矩阵的所有列的元素的平方的相对方差之和达到最大。设旋转后的因子载荷矩阵为,则(3-2-10)令,(3-2-11)除以是为了消除原变量对公因子的依赖程度不同的影响,则的第列元素平方和的相对方差定义为(3-2-12)取是为了消除符号不同的影响,则所有列的元素平方的相对方差定义为 。(3-2-13)而个公因子的旋转正交矩阵是利用两两配对旋转得到的,所以共需进行次旋转,这是完成了第一轮旋转,记第一轮旋转后的因子载荷矩阵为,然后再进行第二轮旋转,仍需进行次旋转,记第二轮旋转后的因子载荷矩阵为,依次旋转下去,则可得到一个因子载荷矩阵数列,则相应得到一个相对方差之和数列,是单调增加且有界()数列,所以一定收敛到某一常数。因子旋转的过程比较复杂,下面只以两个因子的正交旋转为例进行求解。例:设已知旋转前的因子载荷矩阵,求一个正交旋转矩阵,使得旋转后的因子载荷矩阵的相对方差(3-2-14)达到最大。解:记,,,,,,,,则相对方差等价变形为(3-2-15)令(3-2-16)得(3-2-17)根据极值理论知:要求出极大值点,需计算二阶偏导数,二阶偏导数为(3-2-18)则(3-2-19)由于的周期为,所以的解,则与同号,令,则等价于,记旋转角,(3-2-20)则使得取得极大的旋转角(3-2-21)求解完毕。3.2.7因子得分因子分析模型将原个指标表示为个公因子与特殊因子的线性组合,因而公因子能反映原始指标的内部依赖关系。有时候需要用公因子代表原始指标反映样本情况,而公因子是不可观测的,因此,要反过来将个公因子表示成原个指标的线性组合,即(3.2.22)由(3.3.2)来计算各样本的因子得分,但(3.2.1)中方程的个数小于指标个数,因此无法精确地将因子表示为原指标的线性组合,只能进行估计。常用的是Thomson回归估计法[32],通过最小二乘估计得到因子综合目标值得分表达式为(3-2-23)其中,为因子载荷矩阵,为原始指标相关矩阵的逆矩阵。若对因子载荷矩阵进行了旋转,便可以得到旋转后的因子载荷矩阵。3.3利用因子分析法进行综合评价的步骤⑴将所采集到的原始数据标准化,以消除量纲的影响和指标数量级的差别。设个样本个指标的观测值矩阵为,则标准化后的矩阵记为。⑵求出的相关系数矩阵,为对称矩阵且主对角线上的元素都为1.⑶利用主成分分析法,求初始的因子载荷矩阵。先求出相关系数矩阵的特征值和特征向量,设为特征根,为其对应的规范正交的特征向量构成的矩阵,再根据累计方差贡献率,确定因子个数,则为初始的因子载荷矩阵。⑷因子旋转。根据初始的因子载荷矩阵每一列元素的特点,看是否可以确定各个公因子的含义,从而对其命名,若不易命名,一般采用最大方差旋转法,进一步对其旋转,直至易命名,最后得旋转后的因子载荷矩阵。⑸确定因子得分矩阵。利用Thomson回归估计,得因子得分函数矩阵,从而可求出各个公因子的表达式(3-3-1)⑹利用(3.3.1)式及综合评价函数的目标值的表达式(3-3-2)计算各个样本的及的得分,再根据实际问题进行分析和排序。3.4利用因子分析法综合评价纱线质量3.4.1利用原始指标,引进负因子,综合评价纱线质量利用负因子指得是,先不做目标趋同化处理,直接利用原始指标进行因子分析,再把得到的有关因子变成负因子,然后做综合评价。我们先考察一下,利用因子分析法进行综合评价时,能否与利用主成分分析法时一样,先不做目标趋同化处理,就可以直接利用(3.3.2)做综合评价了呢?利用SPSS软件,对附录中的附录表1进行数据分析,具体操作过程见附录4,依次得到以下结果。表3-1原指标的相关系数矩阵1.0000.6680.693-0.244-0.188-0.1610.0460.6681.0000.650-0.020-0.254-0.191-0.1120.6930.6501.000-0.071-0.184-0.1620.005-0.244-0.020-0.0711.0000.1730.121-0.046-0.188-0.254-0.1840.1731.0000.8910.545-0.161-0.191-0.1620.1210.8911.0000.5880.046-0.1120.005-0.0460.5450.5881.000表3-2KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量0.670Bartlett的球形度检验近似卡方168.469自由度21显著性水平0.000从对表3-1相关系数矩阵的观测可知:平均伸长率、最低伸长率和强力之间具有较强的相关性;条干CV值、粗节和棉结之间具有较强的相关性;捻度CV值与其它指标相关性较弱,总之,各指标间有一定的相关性,由此可对纱线质量的特点有初步认识。由表3-2知:KMO充足样本测量统计量为0.67,略小于0.7,但接近0.7,说明各个变量间的信息重叠程度较高,同时巴特尔球形检验的显著水平为0.000,远远小于0.05,从而拒绝各个变量独立的假设,即认为指标间具有较高的相关性,此结论和相关系数矩阵提供的信息是相一致的。故利用因子分析法对纱线质量进行综合评价是合理的。表3-3变量共同度指标变量共同度0.8280.7880.7880.9530.8760.8870.692由表3-3知:几乎所有变量中所含原始信息被提取的公因子所表示的程度都在80%以上,故提取的公因子对各个变量的解释能力是较强的。表3-4累计方差贡献率因子特征根累计方差贡献率%12.81740.24321.95668.19231.03883.02240.48189.89150.33894.71560.26898.54870.102100.000由表3-4知:前三个特征根大于1,且前三个特征根的累计方差贡献率达到了83%,说明只提取前3个公因子就足以描述纱线质量的好坏。表3-5旋转前的因子载荷矩阵表3-6旋转后的因子载荷矩阵指标-0.6740.604-0.091-0.7020.4860.242-0.6600.5770.1400.234-0.0690.9450.7670.5290.0820.7420.5780.0360.4890.635-0.224指标0.878-0.020-0.2390.870-0.1470.0910.887-0.045-0.008-0.0580.0500.973-0.1660.9050.170-0.1230.9260.1170.0540.810-0.183表3-7因子转换矩阵成份1231-0.7080.6870.16220.6870.723-0.06730.164-0.0640.984表3-5是未经过旋转的因子载荷矩阵,可以看出,第一公因子除了捻度CV值指标外,几乎在其他所有指标上都有较高的载荷,第二公因子的含义也很模糊,所以不易命名,因此需对因子进行旋转,采用方差最大法对因子进行旋转,得到旋转后的因子载荷矩阵,见表3-6。由表3-6知:第一公因子在平均断裂伸长率、最低断裂伸长率和强力上有较大载荷,从纱线强度方面反映了纱线的质量,因此命名为强力因子;第二公因子在条干CV值、粗节和棉结上有较大载荷,从外观上反映了纱线质量的好坏,因此命名为外观因子;第三公因子在捻度CV值上有较大载荷,从捻度均匀度方面反映了纱线的质量,因此命名为捻度因子。这一结论与最初的表3-1的相关系数矩阵所得到的相关性是一致的,每一个公因子正好代表其中相关性大的一类指标,也是指标信息重叠较多的一类。旋转后的因子载荷矩阵是由旋转前的因子载荷矩阵经过因子正交旋转变换得到的,这三个矩阵间满足关系式(3.2.9),而正交旋转变换矩阵的形式如表3-7所示。为了将公因子用各个指标变量表示出来,利用Thomson回归估计,得因子得分函数系数矩阵,见表3-8。表3-8因子得分函数系数矩阵指标0.3670.065-0.1460.385-0.0070.1720.3910.0440.0750.066-0.0270.9120.0060.3780.1040.0220.3930.0570.0650.368-0.206由表3-8及(3.3.1)式,得各个公因子与标准化后的原始指标(见附录3)之间关系为如下的表达式(3-4-1)(3-4-2)(3-4-3)若不考虑目标趋同化,将上三个式子带入(3.3.2)式,得目标值表达式为(3-4-4)由于、和三个指标越大,纱线质量越好,是望大型指标,而、、和四个指标越大,纱线质量越不好,是望小型指标,(3.4.4)式中七个指标的系数都是正数,这样就评价纱线质量而言,根本无法对排序,或者说若利用它进行综合评价,显然会得到矛盾,所以在应用因子分析法做综合评价时,必须做目标趋同化处理。事实上,通过最大方差旋转,旋转后的因子载荷矩阵的每一列元素的绝对值向0或1两极分化,使得每一个公因子都只反映部分变量而忽略其它变量,从而旋转后的因子载荷矩阵中的负权系数的绝对值向0接近,换句话说,中每一列绝对值相对较大的元素均为正数,这样利用得分矩阵及(3.3.1)和(3.3.2)式,得到的综合统计量目标值的表达式中,各个指标的系数必然都是正数,利用它对需要做目标趋同化处理的实际问题进行综合评价,必然会出现矛盾,故在应用因子分析法做综合评价时,必须做目标趋同化处理。、和为望大型指标,、、和是望小型指标,而强力因子正好综合了、和这三个望大型指标的信息,外观因子正好综合了、和这三个望小型指标的信息,因此相应于因子分析法,就会对应出现有的因子得分越大越好,有的因子得分越小越好,本文中,EMBEDEquation.3为强力因子,越大越好,为外观因子,为捻度因子,都是越小越好,在做综合评价时,为了更好地处理综合统计量的目标值,经上分析,就必须做目标趋同化处理,我们采用望小型目标,引入负因子:,可得综合统计量的目标值的表达式(3-4-5)结合(3.3.2)、(3.3.3)、(3.3.4)及(3.3.5)式和表3-4中的特征根,可得到综合统计量目标值与各个指标之间的关系为:(3-4-6)将标准化后的原始指标数据(见附录3)代入上式,最后计算出50个样本点的各个公因子得分及综合统计量目标值得分,给予纱线质量好坏的定量化描述,、和的系数都是负数,而、、和的系数都是正数,显然得分越小,表明纱线质量越好,由此便可对样本点就纱线质量进行排序,具体结果如表如表3-9。表3-9引进负因子后的纱线质量及综合目标值的得分排序样本排名排名排名排名样本排名排名排名排名15031174726482342452284612402726132617349143443281148232944220828291519503755324923304545485061429201231124030207134219213247339428254169334372927933124633341636141510781873531444446114618434136353915361232213230372250149138352511384110218141730383944621311534494048401843283516362836344121935141719374532422725473818923354339166241930383939443751316203172244561722142427646241141022203424254723273122232947414448403381924226534938221026251041111350115371由表3-9知:若只考察纱线的力学性能,由于50号纱线的得分最高,故其质量最好,而1号纱线得分最低,其质量最差;若只考察纱线的外观性能,45号纱线的得分最低,故其质量最好,而37号纱线的得分最高,其质量最差;若只考察纱线的捻度均匀度,37号纱线的得分最低,故其质量最好,而29纱线的得分最高,其质量最差。对照附录2和附录1的原始指标数据,可以看出,结论与实际非常吻合。若综合考虑各个因素,以便对纱线质量进行综合评价,类似地,根据的得分和排序,可以得出,50号和45号纱线综合质量最好,而30号和37号纱线质量最差,同原始指标数据所体现的纱线质量好坏进行对比,可以看出,综合目标值排序的结论与实际情况基本相符。在实际应用中,客户可以参考各个公因子及综合质量目标值的排名,根据其最终用途和要求,合理选择纱线,同时生产纱线的厂家,也可以给纱线合理定价。但需要注意的是,一般情况下,若需要做目标趋同化处理的公因子所综合的指标既有望大型指标,又有望小型指标,就需要具体问题具体处理了。我们有必要给出适合任何情况的更为方便、科学的处理方法。3.4.2利用负指标,综合评价纱线质量利用负指标,即先将所搜集到的原始数据做目标趋同化处理,再进行因子分析和综合评价。一般,若采用望小型目标,则可以将望大型目标的有关指标原始数据取负号,则取负号后的指标就变成望小型指标了,反之类似。根据所采集到的数据,本文采用望小型目标方法,为了使综合评价的望大、望小型目标一致,先将、和三个望大型指标的数据取负,得、和,为了记号上的前后一致和讨论方便,仍将之记作、和,借助SPSS软件,跟3.4.1的过程类似,可依次得到以下各表。表3-10引进负指标后的相关系数矩阵1.0000.6680.6930.2440.188-0.1610.0460.6681.0000.6500.0200.254-0.191-0.1120.6930.6501.0000.0710.184-0.1620.0050.2440.0200.0711.0000.1730.121-0.0460.1880.2540.1840.1731.0000.8910.5450.1610.1910.1620.1210.8911.0000.588-0.0460.112-0.005-0.0460.5450.5881.000表3-11KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量0.670Bartlett的球形度检验近似卡方168.469自由度21显著性水平0.000表3-12变量共同度表3-13累计方差贡献率指标变量共同度0.8280.7880.7880.9530.8760.8870.692因子特征值累计方差贡献率%12.81740.24321.95668.19231.03883.02240.48189.89150.33894.71560.26898.54870.102100.000表3-14旋转前的因子载荷矩阵表3-15旋转后的因子载荷矩阵指标0.674-0.6040.0910.702-0.486-0.2420.660-0.577-0.1400.234-0.0690.9450.7670.5290.0820.7420.5780.0360.4890.635-0.224指标0.8780.0200.2390.8700.1470.0910.8870.0450.0080.0580.0500.9730.1660.9050.1700.1230.9260.117-0.0540.810-0.183表33-16因子得分函数矩阵指标0.367-0.0650.1460.3850.007-0.1720.391-0.044-0.075-0.066-0.0270.912-0.0060.3780.104-0.0220.3930.057-0.0650.368-0.206表3-17引进负指标后的纱线质量及综合目标值的得分排序样本排名排名排名排名样本排名排名排名排名1503117472648234245228461240272613261734914344328114823294422082829151950375532492330454548506142920123112403020713421921324733942825416933437292793312463334163614151078187353144444611461843413635391536123221323037225014913835251138411021814173038394462131153449404840184328351636283634412193514171937453242272547381892335433916624193038393944375131620317224456172214
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年家教会谈合同范本
- 2024贷记卡抵押合同范本范文
- 2024年工厂安全生产责任承包合同
- 2024年城市公共交通运营补充协议
- 2024年创意设计共营合同
- 2024-2025学年新教材高中生物第5章基因突变及其他变异第2节染色体变异学案新人教版必修21
- 2024-2025学年新教材高中物理第九章静电场及其应用2库仑定律2教案新人教版必修3
- 全国版2025届高考历史二轮复习热点押题五“中国古代史”中外关联含解析
- 2024年合肥工业学校食堂经营权转让合同
- 2024年工厂物流配送劳动合同
- 有理数运算说课
- 《第10课跳跃:跳单双圈》PPT课件(甘肃省市级优课)-科学课件
- 小学数学教师职称评审答辩题(高段)
- 大学生生涯规划与职业发展知到章节答案智慧树2023年鲁东大学
- 葫芦岛鹏翔生物科技(集团)有限公司年产农药系列产品3700吨、年产胡椒环2000吨建设项目环评报告
- 地理规范化学习要求
- 民营医院职称岗位工资级岗位招聘分级表
- 《堤防工程施工规范》(SL260-2014)
- 人工智能在中学英语教学中的应用探索共3篇
- 证据清单模板
- 木工制作校本课程开发纲要
评论
0/150
提交评论