




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据仓库与数据挖掘第一章概论本章内容数据仓库概述数据挖掘简介数据挖掘的主要任务数据仓库与挖掘的区别与联系30五月20242数据仓库概述数据仓库(DataWarehouse)技术是为了有效地把操作型数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称。其目的是构建面向分析的集成化数据环境,为企业提供决策支持(DecisionSupport)。被誉为数据仓库之父的美国著名信息工程学家WilliamH.Inmon将数据仓库定义为一个面向主题(subjectoriented)的、集成(integrated)的、随时间变化(timevariant)的、但信息本身相对稳定(non-volatile)的数据集合,用于对管理决策过程的支持。数据仓库概述数据仓库主要具有以下四个特征。1.面向主题数据仓库都是基于某个明确主题,仅需要与该主题相关的数据,如顾客、供应商、产品销售方。数据仓库关注决策者的数据建模与分析,而不是单位的日常操作和事务处理。2.集成性通常,构建数据仓库将多个异构数据源使用数据清理和数据集成技术整合为一致性数据。在此过程中会有一些ETL操作,要统一源数据中所有的矛盾之处,如字段的同名异义、单位不统一和字长不一致等问题。数据仓库概述数据仓库主要具有以下四个特征。3.随时间变化数据仓库一般关注的是历史数据,其数据是定期从操作型应用系统中批量载入的,这使得数据仓库中的数据总是拥有时间维度。4.稳定性操作型数据库中的数据通常实时更新,其数据是不稳定的。数据仓库的数据主要用于决策分析,其涉及的数据操作主要是大量历史数据的查询和定期更新。如操作型数据库中的数据可以随时被更新和访问,可以从中抽取若干年(如5-10年)数据构建数据仓库,数据仓库建成后一般不会被修改,具有相对稳定性。因此数据只需要数据的初始化装入和数据访问两种操作。数据仓库的稳定性和时变性并不矛盾。从大的时间段看,它是变化的,但从小的时间范围看它是稳定的。数据仓库概述数据仓库与数据库的对比:数据库数据仓库面向应用面向主题数据是详尽的数据是综合的和历史的保存业务数据保存过去和现在的数据数据是可更新的数据不可更新对数据的操作是重复的对数据的操作是启发式的操作需求事先可知操作需求临时决定数据非冗余数据时常冗余查询基本是原始数据查询基本是经过加工的数据事务处理需要的是当前的数据决策分析需要过去和现在的数据很少有复杂计算有很多复杂计算支持事务处理支持决策分析数据仓库概述分别面向数据库和数据仓库,OLTP主要是在网络环境下面向交易的事务处理,以快速的事务响应和频繁的数据修改为特征,是用户利用数据库快速处理具体业务;而OLAP则支持复杂的分析操作,侧重于对分析人员和高层管理人员的决策支持,协助决策者从多方面和多角度,以多维的数据形式观察企业的状态并了解企业的变化。OLTP和OLAP是两类不同的应用,它们各自的特点如表1-2所示。数据仓库概述OLTP和OLAP对比OLTPOLAP以数据库为基础以数据仓库为基础细节性数据综合性数据当前数据历史数据数据经常更新不更新但周期性刷新一次处理的数据量小一次处理的数据量大对响应时间要求高响应时间合理用户数量大用户数量相对较小面向操作人员支持日常操作面向决策人员支持决策需要面向应用,事务驱动面向分析,分析驱动数据仓库概述一个典型的数据仓库系统通常包括数据源、数据存储与管理、OLAP服务器以及前端工具与应用4个部分。1.数据源数据源是数据仓库系统的基础,即系统的数据来源,通常包括企事业单位的各种内部信息和外部信息。AvinashKaushik在《WebAnalytics》一书中将数据的来源分为点击流数据(Clickstream)、运营数据(Outcomes)、调研数据(Research/Qualitative)和竞争对手数据(CompetitiveData)四部分数据。数据仓库概述一个典型的数据仓库系统通常包括数据源、数据存储与管理、OLAP服务器以及前端工具与应用4个部分。2.数据的存储与管理数据的存储与管理是整个数据仓库系统的核心。数据仓库的组织管理方式决定了它有别于传统数据库的特性。数据仓库在现有业务系统的基础上,对数据进行抽取、清理和集成,按主题重新组织,最终确定数据仓库的物理存储结构,同时组织存储数据仓库元数据。按数据的覆盖程度和存储规模,数据仓库分为企业级数据仓库和部门级数据仓库。数据仓库概述一个典型的数据仓库系统通常包括数据源、数据存储与管理、OLAP服务器以及前端工具与应用4个部分。3.OLAP服务器OLAP服务器对需要分析的数据按照多维数据模型进行重组,以支持用户从多角度多层次分析数据,实现决策支持。4.前端工具与应用
前端工具主要包括各种数据分析工具、报表工具、查询工具、数据挖掘工具以及各种基于数据仓库的开发应用。数据仓库概述数据仓库应用:1.决策支持
数据仓库系统提供了各种业务数据,用户利用各种访问工具从数据仓库中获取业务运营情况数据,以便进行决策分析。2.客户分类与评价
以客户为中心的业务决策的核心是细分市场,即把客户划分为不同类型然后有针对性的进行市场营销。数据仓库系统中积累了大量客户相关数据作为分类与评价的依据,可以很方便快捷地实现客户评价与分类。3.市场自动化决策支持帮助企业制定产品和市场策略,客户分类评价为企业指出了目标客户的范围,市场自动化则帮助企业实现促销管理。数据仓库概述基于Hadoop/Spark的数据仓库技术数据仓库是一种解决方案,在真正实现时,必须依赖于数据工具平台。目前,以Hadoop/Spark为代表的大规模数据处理技术已成为新一代数据仓库平台的基础设施组件,在此基础上构建的平台具有高模块化、松耦合和并行化特点,针对不同应用领域及其需求,通过组件之间灵活组合与高效协作,提供定制化的数据仓库平台,并结合数据挖掘与机器学习组件,构建强大的数据分析生态系统。当前流行的基于分布式系统架构的数据仓库工具有Hive、SparkSQL等。数据仓库概述1.基于Hive的数据仓库技术
Hive是一种底层封装了Hadoop的数据仓库处理工具,用来进行数据提取、转化和加载。Hive数据仓库工具能将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,将SQL语句转变为MapReduce任务来执行。Hadoop和MapReduce是Hive架构的基础。2.基于SparkSQL的数据仓库技术
由于Hive中把HiveSQL转换成MapReduce然后提交到集群中去执行,尽管简化了编写MapReduce程序的复杂性,但是MapReduce这种计算模型执行效率比较慢。SparkSQL是Spark的一个组件,用于结构化数据的计算,它在结构上和Hive类似,但底层不再使用MapReduce,而是使用Spark。从长远看,Hive负责数据仓库存储,进行数据多维度查询,SparkSQL负责高速计算。知识是人类对客观世界的观察和了解,是人类对客观世界是什么、为什么、应该怎么做的认知,知识推动人类的进步和发展。人类所作出的正确判断和决策,以及采取正确的行动都是基于智慧和知识。数据是反映客观事物的数字、词语、声音和图像等,是可以进行计算加工的“原料”。数据是对客观事物的数量、属性、位置及其相互关系的抽象表示,适合于保存、传递和处理。TheExplosiveGrowthofData-------fromterabytestopetabytes数据挖掘简介数据挖掘简介30五月202416与日俱增的数据量数据挖掘简介自动数据收集工具和成熟的数据库技术使得大量的数据被收集,存储在数据库、数据仓库或其他信息库中以待分析。主要的数据来源与领域:Web,e-commerce,transactions,stocks,…Science:Remotesensing,bioinformatics,scientificsimulation,…Societyandeveryone:news,YouTube172016年每分钟产生的海量数据“数据丰富,信息贫乏”数据挖掘简介面对大量的数据,迫使人们不断寻找新的工具,对规律进行探索,为决策提供有价值的信息。数据挖掘有助于发现趋势,揭示已知的事实,预测未知的结果。人们迫切希望能够对海量数据进行分析挖掘,发现并提取隐含在数据中的有价值信息。30五月202418WhyDataMining?Wearedrowningindata,butstarvingforknowledge!
“Necessityisthemotherofinvention”解决办法:数据仓库(DataWarehouse)和在线分析处理(OLAP)数据挖掘—在大量数据中发现有用的知识、模式、规律、约束等数据库技术的演化1960s及之前:文件系统1970s:层次数据库和网状数据库1980s:各种高级数据库系统(扩展的关系数据库,面向对象数据库等)面向应用的数据库系统(spatial数据库,时序数据库,多媒体数据库等)1990s:数据挖掘,数据仓库,多媒体数据库,Web数据库2000s流数据管理和挖掘数据挖掘及应用Web技术(XML,数据集成)andglobalinformationsystems20数据挖掘简介数据挖掘(DataMining)是人工智能和数据库领域研究的热点问题,是指从大量有噪声的、不完全的、模糊和随机的数据中,提取出隐含在其中的、事先不知道但具有潜在利用价值的信息的过程。这个定义包括几层含义:数据必须是真实的、大量的并且含有噪声的;发现的是用户感兴趣的可以接受、理解和运用的知识;仅支持特定的问题,并不要求放之四海而皆准的知识。与数据挖掘的含义类似的还有一些术语如从数据中心挖掘知识、知识提取、数据/模式分析等。30五月202421WhatIsDataMining?Datamining(knowledgediscoveryfromdata)数据挖掘--从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构;数据挖掘大部分的价值在于利用数据挖掘技术改善预测模型。AlternativenamesKnowledgediscovery(mining)indatabases(KDD),knowledgeextraction,data/patternanalysis,dataarcheology,datadredging,informationharvesting,businessintelligence,etc.并非所有东西都是数据挖掘查询、专家系统、小型的科学计算、统计22数据挖掘(DataMining,DM),是从大量的、有噪声的、不完全的、模糊和随机的数据中,提取出隐含在其中的、人们事先不知道的、具有潜在利用价值的信息和知识的过程。这个定义包含以下几层含义:数据源必须是真实的、大量的、含噪声的;发现的是用户感兴趣的知识;发现的知识要可接受、可理解、可运用;不要求发现放之四海皆准的知识,仅支持特定的问题DataInformationKnowledgeWisdomWhatIsDataMining?数据挖掘简介并非所有的东西都是数据挖掘基于数据仓库的OLAP系统OLAP系统专注与数据的汇总,而数据挖掘系统可以对数据进行多种复杂的处理。机器学习系统,数据统计分析系统
这些系统所处理的数据容量往往很有限信息系统
专注于数据的查询处理。相比于上述系统,数据挖掘系统关注更广的范围
是一个多学科的融合。30五月202424数据挖掘简介ThisisaviewfromtypicalmachinelearningandstatisticscommunitiesInputDataPatternInformationKnowledgeDataMiningDataPre-ProcessingPost-ProcessingDataintegrationNormalizationFeatureselectionDimensionreductionPatterndiscoveryAssociation&correlationClassificationClusteringOutlieranalysis…………PatternevaluationPatternselectionPatterninterpretationPatternvisualization数据分析与数据挖掘数据分析(DataAnalysis,DA)是数学与计算机科学相结合的产物,是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。数据分析和数据挖掘都是基于搜集来的数据,应用数学、统计和计算机等技术抽取出数据中的有用信息,进而为决策提供依据和指导方向。数据分析有广义与狭义之分。广义的数据分析包括了狭义数据分析和数据挖掘。30五月202426数据分析与数据挖掘30五月202427数据分析与数据挖掘30五月202428数据挖掘的主要任务数据挖掘是通过分析每个数据,从大量数据中寻找其规律的技术。30五月202429数据挖掘:知识挖掘的核心DataCleaningDataIntegrationDataWarehouseKnowledgeTask-relevantDataSelectionDataMiningPatternEvaluation数据挖掘的主要功能分类数据挖掘的主要功能分类数据挖掘的主要任务数据挖掘的主要任务有关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等。(1)关联规则挖掘由RakeshApwal等人首先提出。两个或两个以上变量的取值之间存在的规律称为关联。(2)预测建模是指根据已知的数据构建出一个数据模型,然后应用这个模型对未知数据的所属分类进行预测,主要包括分类和回归两类问题。30五月202431数据挖掘的主要任务(3)聚类是把数据按照相似性归纳成若干类别,使得同一类中的数据彼此相似,不同类中的数据尽量相异。(4)离群点指全局或局部范围内偏离一般水平的观测对象。离群点等异常值会对数据分析与挖掘产生不良影响。30五月202432数据挖掘的数据源作为一门通用的技术,只要数据对目标应用是有用的,数据挖掘就可以用于任何类型的数据。对于挖掘的应用,数据的基本形式主要有数据库数据、数据仓库、事务数据库和其它数据源。(1)数据库系统是由一组内部相关的数据和用于管理这些数据的程序组成,通过软件程序对数据进行高效的存储和管理,并发、共享或分布式访问,并保证数据的完整性和安全性。30五月202433数据挖掘的数据源(2)数据仓库是依照分析需求、分析维度和分析指标进行设计的,它是数据库的一种概念上的升级。(3)事务数据库的每个记录代表一个事务,例如一个航班的订票、顾客的一个交易等。(4)其它类型数据时间相关的数据和序列数据,数据流,空间数据,Web数据(HTML等)等30五月202434数据库系统与数据仓库数据库管理系统(DatabaseManagementSystem,DBMS)是一种操纵和管理数据库的大型软件,主要关注数据库的创建、维护和使用。数据仓库(Datawarehouse)是面向主题的、集成的与时间相关且不可修改的数据集合。数据库主要用于事务处理,数据仓库主要用于数据分析,用途上的差异决定了两种架构的特点不同。30五月202435关系型数据库、事务型数据库、面向对象的数据库数据仓库/多维数据库空间数据(如地图信息)工程数据(如建筑、集成电路信息)文本和多媒体数据(如文本、图像、音频、视频数据)时间相关的数据(如历史数据或股票交换数据)万维网(如半结构化的HTML、结构化的XML以及其他网络信息)36常见的数据挖掘对象数据挖掘使用的技术作为一个应用驱动的领域,数据挖掘吸纳了诸如统计学、机器学习、数据库和数据仓库、数据可视化、算法、高性能计算和许多应用领域的先进技术。30五月202437数据挖掘与机器学习30五月202438从数据分析的角度来看,数据挖掘与机器学习有很多相似之处,但不同之处也十分明显,例如:数据挖掘并没有机器学习探索人的学习机制这一科学发现任务,数据挖掘中的数据分析是针对海量数据的,等。从某种意义上说,机器学习的科学成分更重一些,二数据挖掘的技术成分更中一些。数据挖掘与机器学习学习能力是智能行为的一个非常重要的特征,不具备学习能力的系统很难称之为一个真正的智能系统,而机器学习则希望系统能够利用经验来改善自身的性能。经验通常以数据的形式存在,因此机器学习不仅涉及对人的认知学习过程的探索,还涉及对数据的分析处理。由于几乎所有的科学都要面对数据分析任务,因此机器学习已经影响到计算机科学的众多领域,甚至计算机科学之外的很多学科。机器学习是数据挖掘中的一个重要工具,然而数据挖掘不仅要研究拓展、应用一些机器学习的方法,还要通过许多非机器学习技术解决数据仓储、大规模数据、数据噪声等实践问题。机器学习在数据挖掘上的方法通常只是“从数据学习”然而机器学习不仅仅用在数据挖掘上,一些机器学习的子领域甚至与数据挖掘关系不大,如增强学习与自动控制等。数据挖掘从目的而言的,机器学习是从方法而言的,两个领域有较大交集,但不能等同。数据挖掘与机器学习典型的数据挖掘与机器学习过程:一个典型的推荐类应用,需要找到“符合条件”的潜在人员。首先需要挖掘客户特征,然后选择一个合适的模型来进行预测,最后从用户数据中得出结果。Datamining(knowledgediscoveryfromdata)数据挖掘存在的主要问题1.数据类型多样化
数据挖掘通常会涉及各种不同的数据类型,即使相同类型的数据也可能具有不同的数据结构。因此,对这些不同数据类型和不同结构的数据进行一致化是一项极具挑战性的工作。2.噪声数据
在数据获取、存储与加工过程中,经常会出现数据中包含噪声、数据缺失甚至数据错误的情况。数据缺失会影响数据挖掘的性能,而噪声和错误可能会导致错误的结果。同时,数据来源复杂,时效性也得不到保证。数据挖掘存在的主要问题3.高维度数据
数据挖掘常常会涉及高维度数据。传统算法在数据量小、数据维度低的情况下有较好的表现,但是随着数据量和数据维度激增的情况,必须要采用其他策略解决。4.数据挖掘的可视化
数据挖掘通常会得到隐藏在数据中的规律或模式,但这些规律和模式不容易理解和解释。因此,往往要对分析挖掘的规律进行可视化。1商用工具商用工具主要由商用的开发商提供,通过市场销售,提供相关的服务。与开源软件相比,商用软件更强大、软件性能更加成熟稳定。主要的商用数据挖掘工具有SASEnterpriseMiner、SPSSClementine和IBMIntelligentMiner等。2开源工具开源软件的最大优势在于免费,而且让任何有能力的人参与并完善软件。相对于商用工具,开源软件工具更容易学习和掌握。常用的开源工具有R语言、Python、Weka和RapidMiner等。30五月202443数据挖掘常用工具SASEnterpriseMinerSPSSClementineIntelligentMinerQUEST1商用工具数据挖掘常用工具SASEnterpriseMinerSASEnterpriseMinerEnterpriseMiner是一种通用的数据挖掘工具,按照“抽样-探索-修改-建模-评价”的方法进行数据挖掘,它把统计分析系统和图形用户界面(GUI)集成起来,为用户提供了用于建模的图形化流程处理环境。1商用工具数据挖掘常用工具SPSSClementineClementine是SPSS公司开发的数据挖掘工具,支持整个数据挖掘过程,即从数据获取、转化、建模、评估到最终部署的全部过程,还支持数据挖掘的行业标准CRISP-DM。1商用工具数据挖掘常用工具RWekaMahoutRapidMinerPythonSparkMLlib2开源工具数据挖掘常用工具RR是用于统计分析和图形化的计算机语言及分析工具,提供了丰富的统计分析和数据挖掘功能,其核心模块是用C、C++和Fortran编写的。2开源工具数据挖掘常用工具WEKAWEKA是一个基于JAVA环境下免费开源的数据挖掘工作平台,集合了大量能承担数据挖掘任务的机器学习算法,包括对数据进行预处理,分类,回归、聚类、关联规则以及在新的交互式界面上的可视化。2开源工具数据挖掘常用工具MahoutMahout是ApacheSoftwareFoundation(ASF)旗下的一个开源项目,在机器学习领域提供了一些可扩展的经典算法的实现和数据挖掘的程序库。它可以实现很多功能,包括聚类、分类、推荐过滤、频繁子项挖掘等。2开源工具数据挖掘常用工具PythonPython是一种功能强大的、开源的、解释性、面向对象计算机编程语言,内建有各种高级数据结构,支持模块和包,支持多种平台并可扩展。Python语言简洁、易学习、易阅读,并在数据统计、机器学习方面得到广泛应用,是人工智能研究领域中一个非常重要的工具。2开源工具数据挖掘常用工具Python语言Python是一款用于数据统计、分析、可视化等任务,以及机器学习、人工智能等领域的高效开发语言。利用Python进行数据挖掘的优势1.爬取数据需要Python2.数据分析需要Python3.Python语言简单高效30五月202453利用Python进行数据挖掘的优势30五月202454Python数据挖掘常用类库Python的第三方模块很丰富,而且语法非常简练,自由度很高。30五月202455Python数据挖掘常用类库Scikit-learnScikit-learn简称sklearn,是一组简单有效的工具集。sklearn依赖于Python的NumPy,SciPy和matplotlib库,它封装了大量经典以及最新的机器学习模型。作为一款用于机器学习和实践的Python第三方开源数据库,具备了出色的接口设计和高效的学习能力。内容应用算法回归(regression)价格预测、趋势预测等线性回归,SVR等降维(DimensionReduction)可视化PCA,NMF等分类(Classification)异常检测、图像识别等KNN、SVM等聚类(Clustering)图像分割、群体划分等K-means,谱聚类等Python数据挖掘常用类库Scikit-learn中的数据集在机器学习过程中,需要使用各种各样的数据集,Scikit-learn内置有一些小型标准数据集,不需要从某个外部网站下载任何文件,一些常用的数据集见表数据集名称调用方式数据描述鸢尾花数据集load_iris()用于多分类任务的数据集波士顿房价数据集load_boston()用于回归任务的经典数据集乳腺癌数据集load_breast_cancer()用于二分类任务的数据集体能训练数据集load_linnerud()用于多变量回归的数据集酒的数据集load_wine用于分类Python数据挖掘常用类库Scikit-learn的主要功能分类回归聚类数据降维模型选择和数据预处理数据仓库与数据挖掘的区别与联系数据仓库和数据挖掘的概念都是在20世纪90年代前后为支持企业决策问题提出,但又是两个相对独立的知识体系构成,因此既有区别又有联系。1.概念的内涵不同
数据仓库是一个综合的历史数据集合,其核心是数据,而数据挖掘则是对大量数据进行深入分析的一个过程,其核心是数据库中的知识发现。因此,数据仓库是数据挖掘的一个对象,但数据挖掘的对象又不止数据仓库。反过来,数据仓库的分析工具也不仅仅限于数据挖掘工具,还有OLAP多维分析工具以及其他统计分析工具。数据仓库与数据挖掘的区别与联系2.解决的问题不同
数据仓库概念是为了解决数据集成、数据组织和存储管理问题而提出,因为数据仓库的数据其实是传统数据库总已经存在的冗余数据,只是为了支持决策而将其从数据库中分离出来,经抽取、转换和集成后加载到数据仓库中。而数据挖掘是为了对数据进行深入分析而提出,主要解决如何从大量数据中发现隐含的知识。3.使用的技术不同
数据仓库的数据组织和存储管理主要使用数据库及其相关技术,而数据挖掘针对发现数据中隐含的知识主要使用机器学习和模式识别等人工智能技术。数据仓库与数据挖掘的区别与联系数据仓库和数据挖掘都是为支持企业的管理决策这一中心目标而提出,因此,二者面向支持决策互为补充,具体体现在以下几个方面。1.数据仓库为数据挖掘提供了更广泛的数据源。2.数据仓库为数据挖掘提供了新的数据支撑平台。数据仓库被设计为只读方式,其集成需要专门的ETL工具,因此,它对数据查询有强大的支持能力,使决策者挖掘出更深入更有价值的知识,而且,数据仓库存储了不同粒度的综合集成数据,可以更有效支持多层次和多种知识的挖掘。3.数据挖掘为数据仓库提供了更好的决策支持工具。建立数据仓库的目的是为了决策支持,而数据挖掘正好能对数据仓库中的数据进行深入分析,发现隐藏在数据中的事先未知的潜在有用的模式,以提供决策支持。数据仓库与数据挖掘的区别与联系数据仓库和数据挖掘都是为支持企业的管理决策这一中心目标而提出,因此,二者面向支持决策互为补充,具体体现在以下几个方面。4.数据挖掘为数据仓库提出了更高的要求。当把数据仓库作为数据挖掘对象时,为了提供更好更丰富的数据,数据仓库的设计和数据组织方法不仅要能满足OLAP要求,还需考虑数据挖掘方面的特别要求。5.数据挖掘为数据仓库提供了广泛的技术支撑。数据挖掘的可视化技术和统计分析等技术都为数据仓库提供了强有力的决策支持。数据仓库与数据挖掘的结合,为企业提供了更好的决策支持,同时促进了数据仓库和数据挖掘理论的发展。数据科学计算平台——Anaconda30五月202463Anaconda是一个集成的Python数据科学环境,简单的说,Anaconda除了有Python外,还安装了180多个用于数据分析的第三方库,而且可以使用conda命令安装第三方库和创建多个环境。相对于只安装Python而言,避免了安装第三方库的麻烦。网站:
/help/anaconda/数据科学计算平台——AnacondaJupyterNotebook(Julia+Python+R=Jupyter)基于Web技术的交互式计算文档格式,支持Markdown和Latex语法,支持代码运行、文本输入、数学公式编辑、内嵌式画图和其他如图片文件的插入,是一个对代码友好的交互式笔记本。30五月202464数据科学计算平台——Anaconda确认勾选将Python添加到系统环境变量
数据科学计算平台——AnacondaAnacondaNavigator数据科学计算平台——Anaconda
conda:一个工具,用于包管理和环境管理,其中:
包管理与pip类似,管理python第三方;
环境管理能够允许用户使用不同版本的Python,并能灵活切换数据科学计算平台——AnacondaWin+R:运行CMD命令;conda–V:显示python版本,说明环境变量设置成功;condaupgrade-
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 天津电子信息职业技术学院《岩土钻孔工程》2023-2024学年第二学期期末试卷
- 湖北省武汉市光谷实验等四校2024-2025学年中考模拟押题卷(金卷二)英语试题试卷含答案
- 惠州卫生职业技术学院《杂技艺术鉴赏》2023-2024学年第二学期期末试卷
- 濮阳石油化工职业技术学院《文化产品创新设计》2023-2024学年第二学期期末试卷
- 唐山幼儿师范高等专科学校《基础医学概论Ⅱ3(微生物学)》2023-2024学年第二学期期末试卷
- 河北师范大学汇华学院《审计基础》2023-2024学年第二学期期末试卷
- 湖北省咸宁市马桥中学2024-2025学年初三下学期5月模拟考试物理试题含解析
- 南阳师范学院《工业设计史》2023-2024学年第二学期期末试卷
- 浙江省杭州某中学2024届高考物理二模试卷含解析
- 人员劳动合同(2025年版)
- 外固定架课件
- 结业证书文档模板可编辑
- 《雷锋叔叔你在哪里》教学案例
- DB32-T 2798-2015高性能沥青路面施工技术规范-(高清现行)
- DBS62∕002-2021 食品安全地方标准 黄芪
- 译林版五年级英语下册 Unit 6 第4课时 教学课件PPT小学公开课
- API-620 大型焊接低压储罐设计与建造
- 部编统编版五年级下册道德与法治全册教案教学设计与每课知识点总结
- 浙江省杭州市介绍(课堂PPT)
- 路面及绿化带拆除和修复方案
- 001压力管道安装安全质量监督检验报告
评论
0/150
提交评论