【毕业学位论文】(Word原稿)洗衣产品的物理化学属性与洗涤效果的模型研究-统计教育学_第1页
【毕业学位论文】(Word原稿)洗衣产品的物理化学属性与洗涤效果的模型研究-统计教育学_第2页
【毕业学位论文】(Word原稿)洗衣产品的物理化学属性与洗涤效果的模型研究-统计教育学_第3页
【毕业学位论文】(Word原稿)洗衣产品的物理化学属性与洗涤效果的模型研究-统计教育学_第4页
【毕业学位论文】(Word原稿)洗衣产品的物理化学属性与洗涤效果的模型研究-统计教育学_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

洗衣产品的 物理化学属性 与洗涤效果的模型研究 首都师范大学 摘要 优化洗衣产品 的配方的主要目的是要在降低 成本、减少对环境的污染等 条件下,生产出洗涤效果更好的产品 。 本文利用洗衣产品溶于水后的的溶液的一些物理化学属性及洗涤功效的数据,研究溶液属性和产品功效之间的关系,建立它们之间的模型,找出对洗涤功效起到显著作用的因素,使得可以根据建立的模型找到最优的 洗衣产品 配方。面对洗衣产品中多种可能起作用的物理化学属性以及种类繁多的污渍,需要运用处理高维数据的方法进行研究。我们用最小角回归(逐步回归 (交叉验证 (法对数据进行分析,建立的各个污渍与溶液属性间的数学模型,并给出几点对优化洗衣产品配方的建议。 关键词: 洗衣产品 物理化学属性 ;洗涤效果; 最小角回归 (逐步回归 (交叉验证( 引言 随着科技的快速发展,人们在研究问题的时候需要考虑的因素越来越多。但是由于试验的成本比较高,或者周期比较长,所以不能通过试验来获取足够多的试验数据。甚至需要研究的因 子数可能远远多于试验数据。于是就需要利用 合理的数据分析思路和分析方法,从有限的数据中搜寻诸多变量中真正 起关键作用的因素, 以便 在后续试验中对这些关键变量进行深入研究,从而大大减少试验的成本, 从而充分利用已有的资源创造出更多的价值 。 在 洗衣产品 产品配方开发中 就 遇到了很多此类问题 , 人们往往需要通过几十个观测数据,研究几百个因素对 洗衣产品 的洗涤效果的影响,进而找到最佳的产品配方。 所以,我们希望从这些实际的问题入手,利用适当的统计 方法 (例如,法 , 法) 分析数据, 从现有的数据 中分析出 对洗涤效果真正起作用的 因素,从而在后续的试验中对他们进行深入研究,而对那些对洗涤效果影响并不显著的因素,则可以适当省去对它们的各种试验 。 目前,大部分国内企业在新产品开发与优化方面的投入很少。生产的产品往往成本高而质量差。这不仅影响了企业的长远发展,也严重影响了整个行业的健康发展。之所以会出现这样的现象,一方面是因为企业担心研发成本较高,所以削减研发投入;另一方面是因为试验方法和数据分析方法落后。所以我们选择某公司的洗衣产品为研究对象,用高维数据分析方法分析其组成成分与洗涤效果的关系 ,进而获得最优 的配比方案。由于这种试验方法和数据分析方法可以用较 少的试验数据分析大量因素对产品质量的影响,所以可以极大地降低试验成本,同时可以为产品的进一步优化提供模型支持。如果此方法可以广泛应用到产品开发中,必然可以为产品质量的提高和成本的降低提供强大的支持,促进企业又好又快发展。 目录 一、研究内容和目的 1 二 、数据说明及处理 1 1 1 2 三、模型建立 2 2 3 3 5 10 四、现实意义与建议 13 1 十八 种污渍中存在类似的污渍 13 衣产品 去污能 力的分析及难、易处理污渍的判定 14 3 自变量之间的交互作用 14 理化学属性 11 5 一些比较特殊的污渍 15 五、 模型有待改进的地方 15 参考文献 16 附录(原始数据及建模结果总汇) 16 一、研究内容和目的 洗衣产品 是通过其中的化学成分溶于水后改变水溶液的物理化学性质来实现去污的作用的,因此通过测量洗衣产品溶于水 后的溶液的一些属性就可以了解产品去污的功效。 此篇论文的主要内容 是建立溶液属性和产品功效之间的模型,然后找出能够最大化产品功效的溶液的属性, 从而 对产品的功效做出比较可靠的预测。 根据这些属性 在不同污渍上的预测结果 和化工技术知识 ,相关的洗涤用品公司 就可以找出最优的配方。 我们的具体内容就是将 步回归和线性回归等 统计方法 利用于现有数据上,拟合出较合理的统计模型 ,并提出一些合理的建议 。 二、数据说明及处 理 1、 数据说明 : 此篇论文所使用的数据为某洗涤产品的 21 个 物 理化学属性 及功效数据 ,样本量为 86,其中有部分 物理化学属性 中存在缺失值。 每一个产品的 21 个属性作为输入变量 ( 产品在 18 种污渍上的功效作为输出变量 (2、 数据处理 : 数据的标准化 : 我们首先将数据标准化,以避免量纲和数据间数量级不同而带来的计算 误差。 缺失值处理 : 数据中 失值 ,我们对此 进行了 以下 处理。由于 缺失值只有 6 个,我们选用填充 平均值的方法处理。但 失数 据达 32 个,填补均值的方法并不合理。我们利用不含缺失值的 54 组数据 进行分析时发现 多数输出变量 的模型中并不显著, 而且通过验证发现 其它输入变量之间有较强的线性关系, 所以 作用可以用其他输入变量解释。综上,我们选择将 数据删去,在模型中不出现 ,用其余 19 个自变量建立模型 。 检验输出变量的相关性 : 由于 输出 变量有 18 个,我们第一步是检验他们之间的线性关系, 若其中有一些输出变量间有较强的线性关系,则可以通过 某些输出 变量的模型 来解释与其有较强线性关系的 其他 输出 变量 ,从而达到简化建模过程的目的 。 我们用 法检验输出变量间的相关性。通过检验得知,可以不做的输出变量是: 要做的 输出变量是 其余的 13 个输出 变量 ,因为可以不做的输出 变量能被要做的变量表出时 乎都达到 上。例如, 性表出时, 以,下面我们就对这 13 个输出变量进行建模。 3、 数据分析方法 : 挑选变量 时, 我们选择用 方法(具体操作方法见建模过程) ,这样可以使选出的变量更稳健 ,以避免对现有数据的过拟合而产生的问题 。 我们在 做 程中 ,运用了 最小角回归( 和逐步回归( 来具体挑选变量 。 其中 法 是目前较新的一种回归方法,它 可以 大大 提高运算速度,也可以减小复 共 线性的影响。 另外, 我们 还运用 了 较成熟的 法与 法进行补充和综合,尽可能将显著的变量都选出。 三、 模型建立 1、 模型假设: 出于模型在实际中的合理性, 我们考虑所有输入变量的线性项, 再 根据模型的需要选择它们的平方项及交互作用项 。 2、 建模的 重要统计指标和 主要原则: 选择模型的统计指标: 选择模型的主要原则: (1)一次比二次项重要,二次项比 交 互项重要,以此类推 。 (2)如果某二次项出现在模型中,那么至少其中的一个 一次项也出现 。 3、建模过程: 第零步:用所有变量(包括 19 个一次项, 19 个二次项, 171 个交互项)进行 逐步回归 (挑出一些 显著的 变量备选 。 但我们发现选出的变量基本都是 交互项,而相应的一次项却经常没有被 选到。 从数学理论上来分析,一次项只有 19 个,而二次项和交互项共有 190 个。显然, 若将所有的一次项二次项及交互项(共 209 个)都加入模型进行挑选的话,则 取到交互项的概率更大,所以出现 在第零步中取到的几乎都是交互项是容易理解的, 但是, 它们相应的一次项却没有被选到,这就违背了我们 选择模型的两个原则。为了 确保显著的一次项能够进入模型 ,我们采取了下面的做法。 以下的第一步到第三步都采用了如下的挑选方法: (1)逐步回归( 行 10 中 具体做法是:将数据随机分成 10 份,每次用其中 9 份数据进行回归。 每次回归时,随机抽取 30%的数据作为检验集,剩下的 70%的数据作为实验集进行回归分析。 (2)出显著的变量 。 综合 (1).(2)果,作为每一步的结果 。 第一步:在 19 个一次项中,用上述方法进行挑选 ,先挑选出显著的一次项,以避免在第零步出现的问题。 第二步:将选到的一次项中加入所有的 19 个二次项,用上述方法进行挑选 。 第三步:将第二步中选到的变量里加入第一步选到的一次项生成的交互项,用上述方法进行挑选 。对于此步挑选出的交互项,为了满足在上面提到的 效应排序原则 ,我们检验了这些交互项与其他一次项和二次项之间的相关性,如果交互项与某个一次项或二次项有较强的相关性,则我们选择将一次项或二次项代替此交互项进入模型。 第四步: 经过上面的三步, 有时可能得到的模型并不理想。也许是因为在 第零步得到的 两个一次项 之一或都不在模型中的交互项中 有一些的确 是显著的 , 所有我们将这些变量加入模型,并手动加入它们的一次项 进行回归分析,删去不显著的变量,得到最终的模型 。 下面,我们以 例说明我们的具体步骤: 1 将所有一次项、二次项和交互项加入到模型中,运用 选 出一些显著的 交互项: 选 。 2 分 别用 逐步 回归( 行 10 选出一次项,选出: 3 用线性回归选出显著的一次项:选出的 变量 均在上面已选出的一次项中 4 将选出的一次项和所有二次项再进行 2, 3 两步,选出显著的二次项: 5 将前四步选出的变量进行线性回归,删除不显著的变量。并将显著的二次项和交互项对应的未出现的一次项 (入模型,得 到结果: t |t|) * * * * * * * 0 * * * . 1 0 of 3 0 |t|) * * * * * * 0 * * * . 1 9 of 4 9 |t|) * * * * * * * 0 * * * . 1 0 of 3 0 |t|) * * * * * * * 0 * * * . 1 容易理解输入变量在回归方程中的系数绝对值越大,则它对输出变量的影响就越大。若输入变量在回归方程中的系数为正的,则说明该输入变量对输出变量起到正面的作用,如上表中的 在实际生产过程中应适当增加 比例;而若输入变量在回归方程中的系数为负的,则说明该输入变量对输出变量起到负面的作用,如上表中的 在实际产品设计过程中应适当减少 比例。 但有时往往情况并没有上面所陈述的那么简单,有一些输入变量的一次项与输出变量为正相关,但它的某个交互项 却与输出变量为负相关,或有一些输入变量的一次项与输出变量为负相关,但它的某个交互项却与输出变量为正相关,如上表中的 正相关, 负相关,而 正 相关。这时,显然 于 起到正面作用, 身对 到负面作用 , 但它与交互作用却对 到正面作用,所以在实际的产品设计过程中, 对于 找到最好的配比。 四、现实意义与建议: 1、 18 种污渍中存在类似的污渍: 在 18 个输出变量的相关性检验中,我们可以看到有些变量之 间存在明显的相关关系,在之后建模的过程中,我们也发现跟某几个输出变量相关的自变量都十分相似。所以,我们认为在这 18 种污渍(输出变量)中,有些污渍是同类污渍,例如, 以,在之后的 洗衣产品 去污能力的实验中,就 可以仅取此类污渍中的一种,这样做不但可以降低实验成本,而且也可以达到实验目的。 2、对 洗衣产品 去污能力的分析及难、易处理污渍的判定: 在建立模型时, 需要用较多变量拟合,且拟合效果不够理想( 间) 。由此我们可以看出, 洗衣产品 在去除这类污渍上的效果不是很好,这两类污渍也可能为比较难去除的污渍(例如油渍),该公司应该改进配方以增加对这类污渍的去污效果。 而在建模过程中, 模型比较理想,能够用较少变量建立拟合程度比较好的模型。这说明,进入模型的几个 物理化学属性 对这类污渍有显著的效果,该 洗衣产品 对这类污渍有较强的去污能力。 可能为比较容易去除的污渍,例如苹果、西瓜等果汁类污渍。 3、 自变量之间的交互作用: 在挑选自变量时,我们发现有些交互项非常显著,但其对应的两个一次项却不显著,例如, 型中的 项。这说明有些 物理化学属性 对去污效果影响不大,但它们中两个一起起到了很明显的作用。所以,在考量影响 洗衣产品 去污能力时,不单要考虑典型的几种 物理化学属性 ,还应关注两种或多种 物理化学属性 的共同作用,确保准确找出真正对 洗衣产品 去污有明显影响的因素。 另外,我们还发现有一些交互项在好几个输出变量里都起到了显著作用,如: 模型中显著, 模型中显著 , 模 型中显著,这说明 物理化学属性 以适当比例配比对多种污渍都会有比较显著的交互作用,所以在进行洗涤用品的开发过程中可以合理搭配这些物理,以达到更好的去污效果。 4、 对去污力影响相对较弱的的 物理化学属性 : 在建模的过程中,有些自变量基本没有进入模型,例如 性项和二次 项分别只出现了一次,其对应的交互项均未出现。这说明 洗衣产品 去除实验中的 18 种污渍的效果并不好。 第一,有可能是因为 身就是对 洗衣产品 去污能力没有很大影响的 物理化学属性 , 例如 能为对气味产生影响的因素,使经过洗涤的衣物留下香味。这时,从洗涤效果和成本的角度考虑, 洗衣产品 配方中 可以适当减少此类物理化学属性 的物质,或者建立无香和有香型多种配方,以满足不同顾客的不同需求。 第二, 能对去除除实验中 18 中污渍以外的污渍有较强的影响。这样,即使 处理一般污渍影响不大,但可能对一些特殊的难去除的污渍有较强的去污能力。那么,在选择 洗衣产品 配方时, 应被给予足够的重视。 5、 一些比较特殊的污渍 : 我们在建模的结果中还发现,有一些 输出变量( 污渍 ),如 其显著的输入变量( 物理化学属性 )与其他输出变量中显著的输入变量有较大差别,即选到的输入变量都是在大部分其他输出变量中不太显著的。这也许是因为污渍一些与其它污渍有较大差别的污渍。这时,在设计洗衣产品配方时,应特别考虑这些污渍,假如他们在日常 生活中并不常见,如:机油等,而去除这些污渍相应的配方的成本又比较高,则可以考虑在一般的洗涤产品中忽略这些污渍,而另外推出一些产品专门去除这种污渍,来满足一些特殊顾客的需求。 五、 模型有待改进的地方 : 第一,由于只用 线性模型 并不合理 ,所以我们 又 加入了自变量的 二次项和交互项进行建模。我们还可以尝试其他方法使得模型可以拟合的更好,例如再加入自变量的立方项,对自变量进行变换等。 第二, 由于在 86组数据中,自变量 2个,且它们与其他自变量的相关性较强,所以我们选择将 们还可以尝试其他填充方法处理这两个变量的缺失值,以利用上已有的 54个数据,也确保自变量的完整性,使模型更加合理。 第三,在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论