在线层次聚类算法_第1页
在线层次聚类算法_第2页
在线层次聚类算法_第3页
在线层次聚类算法_第4页
在线层次聚类算法_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1/1在线层次聚类算法第一部分层次聚类算法的原理和概念 2第二部分基于距离的层次聚类算法 4第三部分基于连通性的层次聚类算法 7第四部分层次聚类算法的不同度量标准 9第五部分层次聚类算法的优势和局限性 11第六部分层次聚类算法中树状图的构建和解读 13第七部分层次聚类算法在实际问题中的应用 16第八部分层次聚类算法的优化方法 19

第一部分层次聚类算法的原理和概念关键词关键要点主题名称:层次聚类算法概述

1.层次聚类算法是一种自下而上或自上而下的聚类算法,通过逐步合并或拆分簇来构建层次结构。

2.层次聚类算法可分为凝聚层次聚类和分裂层次聚类,前者从单个数据点开始,逐步合并相似簇,而后者从整个数据集开始,逐步拆分簇。

3.层次聚类算法的输出是一个树状图(树形图),称为树状图或层级图,其中簇以嵌套方式组织。

主题名称:距离计算

层次聚类算法的原理和概念

层次聚类算法是一种以自底向上的方式聚合数据的聚类技术。它将数据点逐步合并到更大的簇中,直到所有数据点都属于一个簇为止。

原理

层次聚类算法的核心思想是计算数据点之间的相似度或距离,并根据这些度量创建层次树形结构(称为树形图)。树形图的根节点代表所有数据点组成的单一簇,而叶节点代表单个数据点。

算法从计算每个数据点之间的相似度或距离矩阵开始。然后,它使用此矩阵根据一定的相似度或距离阈值来合并最相似的点。合并后的簇形成一个新的簇,该簇具有自己的相似度或距离度量。

此过程一直持续,直到所有数据点都属于一个簇为止。合并过程中形成的簇以树形图的形式表示,称为树形图。树形图的每个节点代表一个簇,而边代表簇之间的合并关系。

概念

层次聚类算法涉及以下重要概念:

距离度量:用于计算数据点之间相似度或距离的度量标准。常用的度量包括欧几里德距离、曼哈顿距离和余弦相似度。

合并准则:用于确定合并具有最大相似度或最小距离的数据点或簇的准则。常用的合并准则包括单连结、全连结和平均连结。

树形图:层次聚类算法的结果,它以树形结构表示簇的层级合并过程。树形图的根节点代表所有数据点组成的单一簇,而叶节点代表单个数据点。

截断水平:确定树形图中要将簇划分的水平。截断水平可以根据所需的簇数或对数据结构的特定见解来选择。

算法

层次聚类的常见算法包括:

单连结聚类:合并具有最小距离的簇。

全连结聚类:合并具有最大距离的簇。

平均连结聚类:合并具有平均距离的簇。

Ward's法:合并最小化簇内方差的簇。

优点

层次聚类算法具有以下优点:

*易于理解和解释:它们以树形图的直观方式呈现簇的层次关系。

*可控性:截断水平的选择允许用户控制簇的粒度。

*可推广性:它们可以应用于各种数据类型和尺寸的数据集。

缺点

层次聚类算法也存在一些缺点:

*计算成本高:计算相似度矩阵和树形图的过程可能对于大数据集来说过于耗时。

*对噪声敏感:噪声数据点或异常值可能导致不准确的簇结构。

*确定最佳簇数困难:选择适当的截断水平以确定最佳簇数可能具有挑战性。

应用

层次聚类算法广泛应用于各种领域,包括:

*生物信息学:识别基因表达模式和蛋白质功能。

*计算机视觉:图像分割和对象识别。

*文本挖掘:文本聚类和主题建模。

*市场细分:确定客户群和识别市场机会。

*欺诈检测:识别异常交易和可疑活动。第二部分基于距离的层次聚类算法关键词关键要点【单链接法】:

1.计算每个簇中任意两个样本之间的最小距离,并用该距离表示簇之间的距离。

2.在所有成对簇中,找到最小距离的一对簇,并将其合并为一个新的簇。

3.重复步骤2,直到所有样本都被合并到一个簇中。

【完全链接法】:

基于距离的层次聚类算法

层次聚类算法是一种自底向上的聚类技术,它使用一系列嵌套的划分来构建层次结构。基于距离的层次聚类算法主要根据对象之间的距离相似性度量来确定簇。

算法过程

1.初始化:将每个对象作为一个单独的簇。

2.计算距离矩阵:计算成对对象之间的距离或相似性度量,形成一个距离矩阵。

3.找出最相近的簇:找到距离矩阵中最小的值,它代表距离最近的两组簇。

4.合并簇:将这两个最接近的簇合并为一个新的簇。

5.更新距离矩阵:更新距离矩阵,反映新合并的簇与其他簇之间的距离。

6.重复步骤3-5:重复步骤3-5,直到所有对象都属于同一簇或达到预定义的停止条件。

距离度量

基于距离的层次聚类算法使用各种距离度量来计算对象之间的相似性:

*欧几里德距离:计算对象在多维空间中的直线距离。

*曼哈顿距离:计算对象在多维空间中沿着轴的总距离。

*切比雪夫距离:计算对象在多维空间中沿任一轴的最大距离。

*余弦相似度:计算对象之间的角度相似性,反映它们的相似方向。

聚类方法

基于距离的层次聚类算法使用不同的方法来合并簇:

*单链接:将簇中最近的两个对象之间的距离用作簇之间的距离。

*全链接:将簇中所有对象之间最大距离用作簇之间的距离。

*平均链接:将簇中所有对象之间平均距离用作簇之间的距离。

*质心法:使用簇中所有对象的平均值作为簇的质心,并使用质心之间的距离作为簇之间的距离。

优点

*方便使用:易于理解和实现。

*可视化:可以使用树状图或分支图可视化簇层次结构。

*无需预定义簇数:算法自动确定最佳簇数。

缺点

*时间复杂度:计算距离矩阵和执行合并操作可能需要大量计算时间。

*敏感度:距离度量和聚类方法的选择会影响聚类结果。

*难以处理大数据集:距离矩阵的存储和计算对于大数据集来说可能是不可行的。

应用

基于距离的层次聚类算法广泛用于数据挖掘、模式识别和信息检索等领域。一些常见的应用包括:

*分组客户细分

*市场调查中的模式识别

*文本文档的聚类

*生物数据的分析第三部分基于连通性的层次聚类算法关键词关键要点基于连通性的层次聚类算法

主题名称:单连法(SL)

1.将距离最小的两个簇合并为一个新簇。

2.簇之间的距离等于簇中距离最小的两个数据点之间的距离。

3.优点:能够产生形状紧凑的簇;缺点:对异常值敏感,容易产生链状效应。

主题名称:全连法(CL)

基于连通性的层次聚类算法

基于连通性的层次聚类算法是一种自底向上的聚类算法,通过逐步合并相似度最高的对或簇来构建层次聚类树状图。该算法主要分为三类:

单连接法(SLINK)

*合并准则:将簇中距离最近的一对数据点或簇之间的距离作为簇间距离。

*优点:产生凸簇,对噪声数据点不敏感。

*缺点:易形成链状结构,簇间界限模糊。

全连接法(CLINK)

*合并准则:将簇中距离最远的一对数据点或簇之间的距离作为簇间距离。

*优点:产生的簇较为紧凑,簇间界限清晰。

*缺点:对噪声数据点敏感,易产生孤立簇。

平均连接法(UPGMA)

*合并准则:将簇中各个数据点或簇到另一个簇中所有数据点的平均距离作为簇间距离。

*优点:综合了单连接法和全连接法的优点,兼具紧凑性和凸性。

*缺点:在某些情况下,可能产生非凸簇。

层次聚类树状图

基于连通性的层次聚类算法会生成一个层次聚类树状图,其中每个节点表示一个簇,而分支表示这些簇合并的方式。树状图中的叶节点对应于原始数据点,而根节点代表所有数据点的集合。

算法流程

1.初始化:将每个数据点作为单独的簇。

2.计算距离矩阵:计算所有对或簇之间的距离。

3.选择合并准则:确定如何计算簇间距离。

4.查找最相似的簇:找到距离最小的对或簇。

5.合并簇:将选定的对或簇合并为一个新的簇。

6.更新距离矩阵:更新受合并簇影响的距离。

7.循环步骤2-6,直到所有数据点合并。

优点

*直观易于理解。

*可提供层次结构,允许在不同粒度上分析聚类。

*不需要预先指定簇数。

缺点

*计算量大,特别是对于大型数据集。

*聚类结果受距离度量和合并准则的影响。

*难以为簇分配明确的标签。

应用

基于连通性的层次聚类算法广泛应用于以下领域:

*生物信息学:基因序列聚类、蛋白质组学数据分析

*图像处理:图像分割、对象检测

*市场细分:客户群聚类、产品分析

*文本挖掘:文档聚类、主题提取

*社会网络分析:社区检测、影响者识别第四部分层次聚类算法的不同度量标准关键词关键要点度量标准选择在层次聚类算法中的作用

主题名称:距离度量

1.距离度量衡量两个对象之间差异的数值,是层次聚类算法的关键组件。

2.常见的距离度量包括欧几里得距离、曼哈顿距离和马氏距离,用于度量数值数据的差异。

3.针对离散数据或高维数据,可使用余弦相似度、杰卡德相似度等度量标准。

主题名称:连锁方法

层次聚类算法的不同度量标准

层次聚类算法通过迭代地合并最相似的簇来构建层次树状结构。这些算法需要一个度量相似性的度量标准,该度量标准确定了两个簇之间距离或相似性的程度。不同的度量标准会导致不同的聚类结果。

最常用的度量标准包括:

1.欧几里得距离

欧几里得距离是两个数据点之间直线距离的平方根。它适用于数值属性,并且在簇具有球形或高斯分布时表现良好。

2.曼哈顿距离

曼哈顿距离是两个数据点之间在每个维度上绝对差值的总和。它适用于具有非对称分布的属性,并且在簇具有矩形形状时表现良好。

3.切比雪夫距离

切比雪夫距离是两个数据点在所有维度上绝对差值的最大值。它适用于具有极端值或异常值的数据,并且在簇具有不规则形状时表现良好。

4.夹角余弦相似度

夹角余弦相似度是两个向量的点积与它们的幅值乘积的比值。它适用于二进制或类别数据,并且在簇具有相似方向时表现良好。

5.杰卡德相似度

杰卡德相似度是两个集合的交集大小除以它们的并集大小。它适用于二进制或类别数据,并且在簇具有重叠时表现良好。

6.轮廓系数

轮廓系数衡量每个数据点与其所在簇和相邻簇之间的距离。它适用于数值属性,并且可用于评估聚类结果的质量。

7.Davies-Bouldin指数

Davies-Bouldin指数衡量簇之间平均距离与簇内平均距离之比。它适用于数值属性,并且可用于选择最佳的簇数。

选择度量标准

选择合适的度量标准取决于数据类型、簇的预期形状和聚类算法的目标。一些一般准则包括:

*数值属性:使用欧几里得距离、曼哈顿距离或切比雪夫距离。

*二进制或类别数据:使用夹角余弦相似度或杰卡德相似度。

*不规则簇形状:使用切比雪夫距离或Davies-Bouldin指数。

*评估聚类质量:使用轮廓系数。

通过仔细考虑这些度量标准,可以优化层次聚类算法以获得最佳的聚类结果。第五部分层次聚类算法的优势和局限性层次聚类算法的优势

*可视化表示:层次聚类算法通过树形图(树状图)来呈现层次结构,便于理解和解释数据中的群集结构。

*高度可解释性:树状图直观地显示了群集的形成过程,允许用户理解群集与原始数据的关联性。

*处理大量数据:层次聚类算法通常利用近似技术,使其可以在合理的时间内处理大型数据集。

*鲁棒性:这些算法对异常值和噪声数据具有鲁棒性,因为它采用自底向上的方法。

*可扩展性:随着新数据的添加,可以通过更新树状图轻松扩展群集结果。

层次聚类算法的局限性

*计算量大:对于大型数据集,层次聚类算法的计算量可能非常大。

*高度依赖于距离度量:群集结果对所选择的距离度量高度敏感。

*难以确定最佳群集数量:树状图不提供确定最佳群集数量的标准方法。

*确定性较差:群集结果可能会因算法的随机初始化而异。

*空间复杂度高:层次聚类算法需要存储所有数据的距离矩阵,从而导致较高的空间复杂度。

特定层次聚类算法的优势和局限性

单链法

*优势:对噪声数据鲁棒,可以识别链状结构。

*局限性:容易产生细长和不稳定的群集,对异常值敏感。

全链法

*优势:产生紧凑且well-separated的群集,对异常值不敏感。

*局限性:可能产生孤立的群集,不适合发现链状结构。

平均链法

*优势:在单链法和全链法之间取得平衡,产生相对稳定且well-separated的群集。

*局限性:在某些情况下,群集可能不是连通的。

加权平均链法

*优势:通过对不同的观察赋予不同的权重来引入灵活性,从而能够根据距离和相似性度量进行加权。

*局限性:权重的选择可能影响群集结果。

Ward's法

*优势:最小化群集内方差,产生球形且紧凑的群集。

*局限性:可能难以识别非球形群集。

选择层次聚类算法

选择最佳的层次聚类算法取决于数据的特点和具体的分析目标。一般来说:

*选择单链法或平均链法处理噪声数据。

*选择全链法或加权平均链法处理紧凑且well-separated的群集。

*选择Ward's法处理球形且紧凑的群集。第六部分层次聚类算法中树状图的构建和解读关键词关键要点主题名称:层次聚类树状图的构建

1.树状图构建过程:通过一系列聚合操作(如Ward方法、平均连锁法等)逐步将数据点合并成层次化的簇,直到所有点被聚合到单一簇中。

2.距离矩阵计算:在构建树状图之前,需要计算数据点之间的距离或相似度矩阵,以确定聚合顺序。

3.枝节长度:树状图中枝条的长度表示数据点或簇之间合并时距离的增加。

主题名称:树状图的解读

层次聚类算法中树状图的构建

1.距离矩阵的建立

层次聚类算法首先计算样本间的距离矩阵,其中距离衡量样本之间的相似性或差异性。常用的距离度量包括欧氏距离、曼哈顿距离和余弦相似度。

2.聚类初始化

将每个样本视为一个单元素簇,并计算簇之间的距离。此时,每个样本本身就是一个簇。

3.簇合并

根据预先定义的聚类准则(例如单链、全链或平均链)找到距离最小的两个簇,并将其合并为一个新的簇。

4.距离矩阵更新

合并后的簇与其他簇之间的距离需要更新。更新的方法取决于所选的聚类准则。

5.迭代合并

重复步骤3和步骤4,直到所有样本都合并到一个簇中,形成一个称为层次聚类树的层级结构。

树状图的解读

1.层次结构

树状图显示了簇合并的层次结构。树状图的根节点是包含所有样本的单一簇,叶节点是每个单独的样本。内部节点表示多个簇的合并。

2.簇合并距离

每个内部节点对应着一个簇合并事件。合并距离表示当时被合并的两个簇之间的距离。

3.簇合并阈值

可以选择一个簇合并阈值来确定需要合并的簇。超过阈值的合并将被阻止,从而产生具有指定簇数的树。

4.样本相似性

树状图可以用来识别相似的样本。叶节点彼此靠近的样本通常更相似,而叶节点相距较远的样本则更不相似。

5.簇特征

通过观察树状图的形状,可以推断不同簇的特征。例如,形状紧凑的簇可能代表具有相似特征的样本,而形状松散的簇可能代表具有更大差异性的样本。

聚类准则

1.单链聚类

单链聚类根据两个簇中距离最小的两个样本之间的距离来定义簇之间的距离。这种方法倾向于生成细长的簇。

2.全链聚类

全链聚类根据两个簇中距离最大的两个样本之间的距离来定义簇之间的距离。这种方法倾向于生成紧凑的簇。

3.平均链聚类

平均链聚类根据两个簇中所有样本成对距离的平均值来定义簇之间的距离。这种方法在单链和全链聚类之间取得了平衡。

选择最佳聚类准则

选择最佳聚类准则取决于数据的性质和特定的研究目标。单链聚类适用于识别数据中的层次结构,而全链聚类适用于识别紧凑的簇。平均链聚类通常是一种通用选择,因为它在单链和全链聚类之间提供了折衷。第七部分层次聚类算法在实际问题中的应用关键词关键要点市场细分和客户群划分

1.层次聚类算法可以根据消费者的行为、偏好和需求等特征将目标市场细分为不同的客户群。

2.通过识别具有相似特征的客户,企业可以定制营销活动,提供量身定制的产品和服务,提高客户满意度和忠诚度。

3.层次聚类在制定差异化定价策略、优化客户关系管理和提高销售效率方面发挥着至关重要的作用。

文本挖掘和文档分类

1.层次聚类算法在文本挖掘中用于根据内容或主题将文档分类为不同的组。

2.通过自动分析文本中的模式和关联,它可以帮助研究人员、记者和信息专业人员从大量数据中提取有意义的见解。

3.层次聚类在识别主题趋势、制定内容策略和改善信息检索系统方面具有广泛的应用。

基因组学和生物信息学

1.层次聚类算法在基因组学研究中用于识别基因表达模式、表观遗传变化和疾病标记。

2.通过将基因或样本分组为不同的类,它可以帮助科学家揭示生物学过程、诊断疾病和开发新的治疗方法。

3.层次聚类在精准医学、个性化治疗和药物发现中发挥着重要的作用。

图像处理和计算机视觉

1.层次聚类算法在图像处理中用于分割图像、识别对象和检测异常。

2.通过将图像元素分组为相似的区域,它可以简化图像分析,提高特征提取和模式识别任务的准确性。

3.层次聚类在自动驾驶、医疗成像和远程传感等领域有着重要的应用。

社交网络分析和社区检测

1.层次聚类算法在社交网络分析中用于识别社区、群组和意见领袖。

2.通过将用户分组为具有相似连接模式和行为的集群,它可以揭示网络结构、预测用户偏好并制定社交媒体营销策略。

3.层次聚类在影响者识别、社区管理和欺诈检测方面发挥着关键作用。

网络安全和异常检测

1.层次聚类算法在网络安全领域用于检测异常行为、识别威胁和跟踪攻击者。

2.通过将网络流量分组为具有相似特征的模式,它可以识别可疑活动、触发警报并减轻安全漏洞。

3.层次聚类在网络入侵检测、恶意软件分析和欺诈预防中扮演着至关重要的角色。层次聚类算法在实际问题中的应用

层次聚类算法因其直观性、可解释性和广泛的适用性而被广泛应用于实际问题。以下是一些常见的应用领域:

生物信息学

*基因表达模式聚类:识别具有相似表达模式的基因组,有助于了解生物过程。

*蛋白质序列聚类:将具有相似功能或结构的蛋白质分组,用于蛋白质分类。

*系统发育重建:构建生物进化史的系统发育树,了解物种之间的关系。

文本挖掘

*文档聚类:将主题相似的文档分组,用于文本分类和摘要。

*词汇聚类:识别具有相似含义的单词集,有助于自然语言处理。

*情感分析:将文本按情绪极性聚类,用于情绪识别和情感分析。

医学和生物医学

*疾病分类:将具有相似症状或病程的疾病分组,用于疾病诊断。

*药物发现:识别具有相似化学结构或作用机制的药物,用于药物筛选。

*患者分层:将具有相似治疗需求或预后的患者分组,用于个性化医疗。

市场营销和客户关系管理

*细分市场:将客户按购买习惯、人口统计或行为特征聚类,用于市场细分和目标营销。

*客户流失预测:识别具有流失风险的客户,用于客户留存和忠诚度管理。

*产品推荐:根据客户的购买历史和偏好推荐相似产品,用于个性化推荐系统。

图像处理和模式识别

*图像分割:将图像分割为具有不同特征的区域,用于目标检测和场景理解。

*对象识别:将图像中的对象分组,用于对象识别和跟踪。

*模式发现:识别数据集中的模式和趋势,用于数据可视化和异常检测。

社交网络分析

*社群发现:识别具有相似社交联系或兴趣的社群,用于社区检测和影响力分析。

*用户画像:根据用户的社交活动和行为模式对用户进行分组,用于社交媒体营销和个性化推荐。

*意见领袖识别:识别在社交网络中有影响力的用户,用于舆情监测和品牌宣传。

金融和投资

*股票聚类:将具有相似市场表现的股票分组,用于投资组合管理和风险评估。

*欺诈检测:识别具有可疑交易模式的账户,用于欺诈预防和反洗钱。

*信用评分:将具有相似信用特征的借款人分组,用于信用风险评估。

其他应用

*地理空间聚类:识别具有相似地理位置或特征的区域,用于空间规划和资源分配。

*时间序列聚类:将具有相似时间序列模式的时间序列分组,用于异常检测和预测建模。

*异常检测:识别与正常数据模式不同的数据点,用于欺诈检测和数据质量控制。第八部分层次聚类算法的优化方法关键词关键要点重采样技术

1.利用自助采样或置换采样等重采样技术创建多个训练集,缓解训练数据偏差的影响,提升聚类结果的鲁棒性。

2.通过集成多个聚类结果,可以获得更稳定且代表性的聚类划分,提高聚类算法的性能。

核函数优化

1.核函数的选择和超参数优化对于层次聚类算法至关重要,不同的核函数会产生不同的相似度度量。

2.核函数的宽度和惩罚因子可以通过交叉验证或网格搜索等方法进行优化,提升聚类算法的性能。

距离度量选择

1.不同的距离度量(如欧氏距离、余弦相似度等)会导致不同的聚类结果,选择最合适的距离度量可以提高算法的精度。

2.基于数据集特点和聚类目标,选择和优化合适的距离度量,可以有效提升层次聚类算法的性能。

链接准则改进

1.传统的链接准则(如单链接、完全链接、平均链接等)存在局限性,导致聚类结果不准确。

2.改进的链接准则,如加权链接、Voronoi链接等,可以考虑距离和簇大小等因素,提高聚类算法的准确率。

停止准则优化

1.传统的停止准则(如阈值法)可能无法有效终止聚类过程,导致聚类结果过度或不足。

2.基于信息论、统计学或图论的停止准则,可以更准确地确定聚类过程的最佳停止点,提高算法的运行效率和聚类质量。

并行化实现

1.层次聚类算法计算量大,并行化实现可以大幅缩短计算时间,尤其是对于大型数据集。

2.利用多核CPU或GPU并行计算,可以高效地处理聚类任务,提高算法的实用性。层次聚类算法的优化方法

层次聚类算法在实际应用中存在一些优化问题,主要表现在效率低、准确度不够理想等方面。针对这些问题,研究者们提出了多种优化方法,主要包括以下几种:

1.块层次聚类算法

块层次聚类算法(BlockHierarchicalClustering,BHC)是一种减少计算量的层次聚类算法。该算法将数据对象划分为多个块,每个块内的数据对象距离较近。在计算聚类距离时,只考虑块与块之间的距离,而不是每个对象之间的距离,从而大大降低了计算复杂度。

2.抽样层次聚类算法

抽样层次聚类算法(SamplingHierarchicalClustering,SHC)是一种通过抽样来降低计算量的层次聚类算法。该算法从数据集中随机抽取一部分样本,对样本进行层次聚类,然后将样本的聚类结果推广到整个数据集。SHC算法可以有效降低计算时间,但是会牺牲一定的准确度。

3.近似层次聚类算法

近似层次聚类算法(ApproximateHierarchicalClustering,AHC)是一种通过近似计算来提高效率的层次聚类算法。该算法使用近似算法来计算聚类距离,而不是精确算法。AHC算法可以大大提高计算速度,但是会带来一定的误差。

4.平行层次聚类算法

平行层次聚类算法(ParallelHierarchicalClustering,PHC)是一种利用并行计算来提高效率的层次聚类算法。该算法将数据并行分布到多个计算节点上,每个节点分别对自己的数据进行层次聚类。最后,将各个节点的聚类结果合并得到最终的聚类结果。PHC算法可以有效利用多核处理器或分布式计算环境来提高计算速度。

5.增量层次聚类算法

增量层次聚类算法(IncrementalHierarchicalClustering,IHC)是一种适用于动态数据场景的层次聚类算法。该算法可以不断地更新聚类结果,当有新的数据对象加入或已有数据对象发生变化时,IHC算法只对受影响的部分进行更新,而不是重新计算整个聚类树。IHC算法适合于处理大规模动态数据。

6.专用硬件加速

除了算法优化外,还可以使用专用硬件来加速层次聚类算法的计算。例如,可以使用图形处理单元(GPU)或现场可编程门阵列(FPGA)来并行计算聚类距离。专用硬件加速可以大幅提高层次聚类算法的计算速度。

7.优化距离度量

层次聚类算法的准

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论