




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、精选学习资料 - - - 欢迎下载数据挖掘概念概念与技术data miningconcepts and techniques习题答案第 1 章引言1.1 什么为数据挖掘?在你的回答中,针对以下问题:1.2 1.6 定义以下数据挖掘功能:特点化.区分.关联和相关分析.猜测聚类和演化分析;使用你熟识的现实生活的数据库,给出每种数据挖掘功能的例子;解答:特点化为一个目标类数据的一般特性或特性的汇总;例如,同学的特点可被提出,形成全部高校的运算机科学专业一年级同学的轮廓,这些特征包括作为一种高的年级平均成果gpa: gradepoint aversge的信息,仍有所修的课程的最大数量;区分为将目标类数
2、据对象的一般特性与一个或多个对比类对象的一般特性进行比较;例如,具有高gpa 的同学的一般特性可被用来与具有低 gpa 的一般特性比较;最终的描述可能为同学的一个一般可比较的轮廓, 就像具有高gpa 的同学的75% 为四年级运算机科学专业的同学,而具有低gpa 的同学的65%不为;关联为指发觉关联规章,这些规章表示一起频繁发生在给定数据集的特 征 值的 条 件; 例 如, 一 个数 据 挖掘 系 统可 能 发觉 的 关联 规 就为 :majorx、“computingscience”ownsx、“personal computer ” support=12%、 confid ence=98%其
3、中, x 为一个表示同学的变量;这个规章指出正在学习的同学,12%(支持度)主修运算机科学并且拥有一台个人运算机;这个组一个同学 拥有一台个人电脑的概率为 98% (置信度,或确定度) ;分类与猜测不同,由于前者的作用为构造一系列能描述和区分数据类型或概念的模型(或功能),而后者为建立一个模型去猜测缺失的或无效的.并且通常为数字的数据值;它们的相像性为他们都为猜测的工具 : 分类被用作猜测目标数据的类的标签,而猜测典型的应用为猜测缺失的数字型数据的值;聚类分析的数据对象不考虑已知的类标号;对象依据最大花蕾内部的相似性.最小化类之间的相像性的原就进行聚类或分组;形成的每一簇可以被看作一个对象类;
4、聚类也便于分类法组织形式,将观测组织成类分层结构,把类似 的大事组织在一起;数据延边分析描述和模型化随时间变化的对象的规律或趋势,尽管这可 能包括时间相关数据的特点化.区分.关联和相关分析.分类.或猜测,这种分析的明确特点包括时间序列数据分析.序列或周期模式匹配.和基于相像性的数据分析1.3 1.9 列举并描述说明数据挖掘任务的五种原语;解答:用于指定数据挖掘任务的五种原语为:精品学习资料精选学习资料 - - - 欢迎下载任务相关数据:这种原语指明给定挖掘所处理的数据;它包括指明数据库.数据库表.或数据仓库,其中包括包含关系数据.挑选关系数据的条件.用于探究的关系数据的属性或维.关于修复的数据
5、排序和分组;挖掘的数据类型:这种原语指明白所要执行的特定数据挖掘功能,如特点化.区分.关联.分类.聚类.或演化分析;同样,用户的要求可能更特别,并可能供应所发觉的模式必需匹配的模版;这些模版或超模式(也被称为超规章)能被用来指导发觉过程;背景学问:这种原语答应用户指定已有的关于挖掘领域的学问;这样的学问能被用来指导学问发觉过程,并且评估发觉的模式;关于数据中关系的概念分层和用户信念为背景学问的形式;模式爱好度度量:这种原语答应用户指定功能,用于从学问中分割不感爱好的模式,并且被用来指导挖掘过程,也可评估发觉的模式;这样就答应用户限制在挖掘过程返回的不感爱好的模式的数量,由于一种数据挖掘系统可能
6、产生大量的模式;爱好度测量能被指定为简易性.确定性 .适用性.和新奇性的特点;发觉模式的可视化:这种原语述及发觉的模式应当被显示出来;为了使数据挖掘能有效地将学问传给用户,数据挖掘系统应当能将发觉的各种形式的模式展现出来,正如规章.表格.饼或条形图.决策树.立方体或其它视觉的表示;1.4 1.13 描述以下数据挖掘系统与数据库或数据仓库集成方法的差别:不耦合.松散耦合. 半紧耦合和紧密耦合;你认为哪种方法最流行,为什么?解答:数据挖掘系统和数据库或数据仓库系统的集成的层次的差别如下;不耦合:数据挖掘系统用像平面文件这样的原始资料获得被挖掘的原始 数据集,由于没有数据库系统或数据仓库系统的任何功
7、能被作为处理过 程的一部分执行;因此,这种构架为一种糟糕的设计;松散耦合:数据挖掘系统不与数据库或数据仓库集成,除了使用被挖 掘的初始数据集的源数据和储备挖掘结果;这样,这种构架能得到数据库和数据仓库供应的敏捷.高效.和特点的优点;但为,在大量的数据集中,由松散耦合得到高可测性和良好的性能为特别困难的,由于很多这种系统为基于内存的;半紧密耦合:一些数据挖掘原语,如聚合.分类. 或统计功能的预运算,可在数据库或数据仓库系统有效的执行,以便数据挖掘系统在挖掘- 查询 过程的应用;另外,一些常常用到的中间挖掘结果能被估计算并储备到数据库或数据仓库系统中,从而增强了数据挖掘系统的性能;紧密耦合:数据库
8、或数据仓库系统被完全整合成数据挖掘系统的一 部份,并且因此供应了优化的数据查询处理;这样的话,数据挖掘子系统被视为一个信息系统的功能组件;这为一中高度期望的结构,由于它有利于数据挖掘功能.高系统性能和集成信息处理环境的有效实现;精品学习资料精选学习资料 - - - 欢迎下载从以上供应的体系结构的描述看,紧密耦合为最优的,没有值得顾虑的技术和执行问题;但紧密耦合系统所需的大量技术基础结构仍旧在进展变化,其实现并非易事;因此,目前最流行的体系结构仍为半紧密耦合,由于它为松散耦合和紧密耦合的折中;1.5 1.14 描述关于数据挖掘方法和用户交互问题的三个数据挖掘挑战;第 2 章数据预处理2.1 2.
9、2 假设给定的数据集的值已经分组为区间;区间和对应的频率如下;年龄频率15200515450152030020501500508070080110运算数据的近似中位数值;解答:先判定中位数区间:44n=200+450+300+1500+700+44=3194; n/2=1597200+450+300=950<1597<2450=950+1500;2050 对应中位数区间;我们有: l 1=20 ,n=3197 , freq l =950 , freq median =1500 , width =30 ,使用公式( 2.3 ):n / 2freq l3197 / 2950median
10、l1width203032.97freq median1500median=32.97 岁 ;2.2 2.4 假定用于分析的数据包含属性age;数据元组的age 值(以递增序) 为: 13,15, 16, 16 ,19, 20,20 , 21, 22,22 , 25,25, 25, 25,30,33, 33, 35, 35, 35, 35, 36, 40, 45 , 46 , 52, 70;(a) 该数据的均值为什么?中位数为什么?(b) 该数据的众数为什么?争论数据的峰(即双峰.三峰等);(c) 数据的中列数为什么?(d) 你能(粗略地) 找出数据的第一个四分位数( q1)和第三个四分位数(
11、 q3)吗?(e) 给出数据的五数概括;(f) 画出数据的盒图;(g) 分位数分位数图与分位数图的不同之处为什么?解答:(a) 该数据的均值为什么?中位数为什么?1n精品学习资料精选学习资料 - - - 欢迎下载均值为:xx i809 / 2729.9630 (公式2.1 );中位数应为第14精品学习资料精选学习资料 - - - 欢迎下载n i 1个,即x14=25= q2 ;(b) 该数据的众数为什么?争论数据的峰(即双峰.三峰等);这个数集的众数有两个: 25 和 35 ,发生在同样最高的频率处,因此为双峰精品学习资料精选学习资料 - - - 欢迎下载众数;(c) 数据的中列数为什么?数据
12、的中列数为最大术和最小为的均值;即:midrange =70+13/2=41.5 ;(d) 你能(粗略地) 找出数据的第一个四分位数( q 1)和第三个四分位数( q3 )吗? 数据集的第一个四分位数应发生在25% 处,即在 n+1/4=7处;所以:q1 =20;而第三个四分位数应发生在75%处,即在3×n+1/4=21处;所以: q 3=35(e) 给出数据的五数概括;一个数据集的分布的5 数概括由最小值.第一个四分位数.中位数.第三个四分位数. 和最大值构成;它给出了分布外形良好的汇总,并且这些数据为:13. 20.25.35 .70 ;(f) 画出数据的盒略;(g) 分位数分位
13、数图与分位数图的不同之处为什么?分位数图为一种用来展现数据值低于或等于在一个单变量分布中独立的变量的粗略百分比;这样,他可以展现全部数的分位数信息,而为独立变量测得的值(纵轴)相对于它们的分位数(横轴)被描画出来;但分位数分位数图用纵轴表示一种单变量分布的分位数,用横轴表示另一 单变量分布的分位数;两个坐标轴显示它们的测量值相应分布的值域,且点依据两种分布分位数值展现;一条线(y=x )可画到图中,以增加图像的信息;落在 该线以上的点表示在y 轴上显示的值的分布比x 轴的相应的等同分位数对应的值的分布高;反之,对落在该线以下的点就低;2.3 2.7使用习题2.4 给 出的age 数据回答以下问
14、题:a 使用分箱均值光滑对以上数据进行光滑,箱的深度为3;说明你的步骤;评述对于给定的数据,该技术的成效;b如何确定数据中的离群点?c对于数据光滑,仍有哪些其他方法?解答:a 使用分箱均值光滑对以上数据进行光滑,箱的深度为3;说明你的步骤;评述对于给定的数据,该技术的成效;用箱深度为3 的分箱均值光滑对以上数据进行光滑需要以下步骤:步骤 1:对数据排序; (由于数据已被排序,所以此时不需要该步骤;)步骤 2:将数据划分到大小为3 的等频箱中;箱 1: 13, 15, 16箱 2:16 , 19, 20箱 3: 20, 21, 22箱 4: 22, 25, 25箱 5:25 , 25, 30箱
15、6: 33, 33, 35箱 7: 35, 35, 35箱 8: 36, 40, 45箱 9: 46 , 52, 70步骤 3:运算每个等频箱的算数均值;步骤 4:用各箱运算出的算数均值替换每箱中的每个值;箱 1: 44/3, 44/3 , 44/3 箱 2: 55/3 , 55/3, 55/3箱 3: 21, 21, 21箱 4:24,24,24箱 5:80/3,80/3,80/3箱 6:101/3,101/3 ,101/3箱 7: 35, 35, 35箱 8: 121/3 , 121/3 , 121/3 箱 9: 56, 56, 56 b 如何确定数据中的离群点? 聚类的方法可用来将相像的
16、点分成组或“簇”,并检测离群点;落到簇的集外的值可以被视为离群点;作为挑选,一种人机结合的检测可被采纳,而运算机用一种事先打算的数据分布来区分可能的离群点;这些可能的离群点能被用人工精品学习资料精选学习资料 - - - 欢迎下载轻松的检验,而不必检查整个数据集;c对于数据光滑,仍有哪些其他方法?其它可用来数据光滑的方法包括别的分箱光滑方法,如中位数光滑和箱边界光滑;作为挑选,等宽箱可被用来执行任何分箱方式,其中每个箱中的数据范畴均为常量;除了分箱方法外,可以使用回来技术拟合成函数来光滑数据,如通过线性或多线性回来; 分类技术也能被用来对概念分层, 这为通过将低级概念上卷 到高级概念来光滑数据;
17、2.4 2.10如下规范化方法的值域为什么?(a) min-max规范化;(b) z-score 规范化;(c) 小数定标规范化;解答:a min-max规范化;值域为new_min、new_max ; b z-score 规范化;值域为 old _min mean/ ,old_max mean/ ,总的来说,对于全部可能的数据集的值域为 , +;c小数定标规范化;值域为 1.0、 1.0 ;2.5 2.12 使用习题2.4 给出的age 数据,回答以下问题:(a) 使用 min-max 规范化将age 值 35 变换到 0.0 , 1.0区间;(b) 使用 z-score 规范化变换age
18、值 35, 其中age 的标准差为12.94 岁 ;(c) 使用小数定标规范化变换age 值 35 ;(d) 对于给定的数据,你情愿使用哪种方法?陈述你的理由;解答:(a) 使用 min-max 规范化将age 值 35 变换到 0.0 , 1.0区间; min a=13 , max a =70 , new _min a=0.0 , new _max a=1.0 ,而v=35 ,aaav'vmin anew _ maxnew _ minnew _ minmax amin a3513 1.00.00.00.38607013(b) 使用 z-score 规范化变换age 值 35,其中 a
19、ge 的标准差为12.94 岁 ;a1315216192202122242527302334353640454652702780929 .96327精品学习资料精选学习资料 - - - 欢迎下载n2i 1aaian161.2949 , a2a12.7002精品学习资料精选学习资料 - - - 欢迎下载精品学习资料精选学习资料 - - - 欢迎下载或ns2ai 1aian精品学习资料精选学习资料 - - - 欢迎下载精品学习资料精选学习资料 - - - 欢迎下载167.4986 ,sa2sa12.9421精品学习资料精选学习资料 - - - 欢迎下载v=35v 'va3529.9635.
20、0370.39660.400a12.700212.7002s或v 'va3529.9635.0370.38920.39sa12.942112.9421精品学习资料精选学习资料 - - - 欢迎下载(c) 使用小数定标规范化变换age 值 35 ;由于最大的肯定值为70,所以j=2 ; v'vj10350.35210精品学习资料精选学习资料 - - - 欢迎下载(d) 对于给定的数据,你情愿使用哪种方法?陈述你的理由;略;2.6 2.14 假设 12 个销售价格记录组已经排序如下:5, 10,11,13, 15,35,50, 55, 72 , 92 , 204, 215 ;使用如
21、下每种方法将其划分成三个箱;(a) 等频(等深)划分;(b) 等宽划分;(c) 聚类;解答:(a) 等频(等深)划分;bin15、10、11、13bin115、35、50、55(b) 等宽划分;bin172、91、204、215每个区间的宽度为:215-5/3=70bin15、10、11、13、15、35、50、55、72bin191bin1204、215(c) 聚类;我们可以使用一种简洁的聚类技术:用2 个最大的间隙将数据分成3 个箱;bin15、10、11、13、15bin135、50、55、72、91bin1204、2152.7 2.15使用习题2.4 给出的 age 数据,(a) 画出
22、一个等宽为10 的等宽直方图;(b) 为如下每种抽样技术勾画例子:srswor , srswr ,聚类抽样,分层抽样;使用大小为5 的样本和层“青年”,“中年”和“老年”;解答: a 画出一个等宽为10 的等宽直方图;精品学习资料精选学习资料 - - - 欢迎下载876543210152535455565b为如下每种抽样技术勾画例子:srswor , srswr ,聚类抽样,分层抽样;使用大小为5 的样本和层“青年”,“中年”和“老年”;元组:t 113t 1022t 1935t 215t 1125t 2035t 316t 1225t 2135t 416t 1325t 2236t 519t 1
23、425t 2340t 620t 1530t 2445t 720t 1633t 2546t 821t 1733t 2652t 922t 1835t 2770srswor 和 srswr :不为同次的随机抽样结果可以不同,但前者因无放回所以不能有相同的元组;srsworn=5srswrn=5t 416t 720t 620t 720t 1022t2 035t 1125t2 135t 2652t2 546聚类抽样:设起始聚类共有6 类,可抽其中的m 类 ;sample1sample2sample3sample4sample5sample6 t 113t620t 1125t 1633t 2135t2 6
24、52t 215t720t 1225t 1733t 2236t2 770t 316t821t 1325t 1835t 2340t 416t922t 1425t 1935t 2445t 519t 1022t 1530t 2035t 2546精品学习资料精选学习资料 - - - 欢迎下载sample2sample5t 620t 2135t 720t 2236t 821t 2340t 922t 2445t 1022t 2546分层抽样:依据年龄分层抽样时,不同的随机试验结果不同;t 113youngt 1022youngt 1935middle aget 215youngt 1125youngt 20
25、35middle aget 316youngt 1225youngt 2135middle aget 416youngt 1325youngt 2236middle aget 519youngt 1425youngt 2340middle aget 620youngt 1530middle aget 2445middle aget 720youngt 1633middle aget 2546middle aget 821youngt 1733middle aget 2652middle aget 922youngt 1835middle aget 2770seniort 416youngt 1
26、225youngt 1733middle aget 2546middle aget 2770senior2.8 55555555555555555555555555精品学习资料精选学习资料 - - - 欢迎下载第 3 章数据仓库与olap技术概述3.1 3.4 假 定 biguniversity的数据仓库包含如下4 个维:studentstudent_name、 area_id 、major、status、university,coursecourse_name、department, semestersemester、 year 和 instructordept、rank ; 2 个度量:c
27、ount 和 avg_grade ;在最低概念层,度量avg_grade 存放同学的实际课程成果;在较高概念层,avg_grade 存放给定组合的平均成果;(a) 为该数据仓库画出雪花形模式图;(b) 由 基 本 方 体 student、course、semester、instructor开 始 , 为 列 出biguniversity每个同学的cs 课程的平均成果,应当使用哪些特别的olap 操作;(c) 假如每维有5 层(包括all ),如“ student<major<status<university<all”,该立方体包含多少方体?解答:a) 为该数据仓库画出
28、雪花形模式图;雪花模式如下列图;b) 由 基 本 方 体 student、 course、 semester、 instructor开 始 , 为 列 出biguniversity每个同学的cs 课程的平均成果,应当使用哪些特别的olap 操作;这些特别的联机分析处理(olap )操作有:i. 沿课程( course)维从course_id “ 上卷”到department ;ii. 沿同学( student)维从student_id “ 上卷”到university ;iii. 取 department= “ cs ” 和 university= “ big university ”,沿课程
29、( course)维和同学(student)维切片;iv. 沿同学( student)维从university 下 钻到student_name ;c) 假如每维有5 层(包括all ),如“ student<major<status<university<all”,该立方体包含多少方体?这个立方体将包含54 =625 个方体;精品学习资料精选学习资料 - - - 欢迎下载course维表univ事实表student维表精品学习资料精选学习资料 - - - 欢迎下载精品学习资料精选学习资料 - - - 欢迎下载course_id course_name departme
30、ntsemester维表semester_id semester yearinstructor维表instructor_iddept rankstudent_idstudent_idcourse_idstudent namesemester_idarea_idinstructor_idmajorcountstatusavg_gradeuniversityarea维表area_id city province country题 3.4 图 题 3.4 中数据仓库的雪花形模式精品学习资料精选学习资料 - - - 欢迎下载第四章4.1 2021-11-294.2 有几种典型的立方体运算方法,4.3
31、题 4.12 考虑下面的多特点立方体查询:按 item , regio n, month 的全部 子集分组,对每组找出2004 年的最小货架寿命,并对价格低于100 美元.货架 寿命在最小货架寿命的 1.251.5 倍之间的元组找出总销售额部分;d) 画出该查询的多特点立方体图;e) 用扩充的sql 表示该查询;f) 这为一个分布式多特点立方体吗?为什么?解答:a 画出该查询的多特点立方体图;r 0 r1 1.25*minshelfand 1.5*minshelf b 用扩充的 sql 表示该查询;selectitem、 region、 month、 minshelf、sumr1frompur
32、chase whereyear=2004cube byitem、 region、 month:r1such thatr1.shelf 1.25*minshelf andr1.shelf 1.5*minshelf and r1.price<100精品学习资料精选学习资料 - - - 欢迎下载c 这为一个分布式多特点立方体吗?为什么?这不为一个分布多特点立方体,由于在“such that ”语句中采纳了“”条件;4.4 2021-11-29精品学习资料精选学习资料 - - - 欢迎下载第五章4.5 2021-11-29精品学习资料精选学习资料 - - - 欢迎下载5.1 aprio ri 算
33、法使用子集支持度性质的先验学问;5.2 5.2.2 节介绍了由频繁项集产生关联规章的方法;提出了一个更有效的方法;5.3 数据库有5 个事物;设min_sup=60% ,解min_conf=80 ; tid购买的商品释t100m、 o、 n、 k、 e、它y为t200d、 o、 n、 k、 e、什y t300m、 a、 k、 e么t400m、 u、 c、 k、 y比t500c、 o、 o、 k、 i、 eg) 分别使用aprio r i 和 fp 增长算法找出全部的频繁项集;比较两种挖5 掘过程的效率;.h列举全部与下面的的元规章匹配的强关联规章(给出支持度s 和2置信度 c),其中, x 为
34、代表顾客的变量,item 为表示项的变量(如 “a ”.“ b ” 等):.xtransaction、 buysx、 item 1 buysx、 item 2buysx、 item 3 s、 c2解答:(a) 分别使用aprio ri 和 fp 增长算法找出全部的频繁项集;比较两种挖掘节过 程的效率;的aprio ri 算法:由于只有5 次购买大事,所以肯定支持度为5×min_sup=3 ;方法更(提示:考虑将习题5.1b 和习题 5.1c 的性质结合到你的设计中;)精品学习资料精选学习资料 - - - 欢迎下载m3o3n2k5m3e4o3c1y3l1k5c2d1e4a1y3mo1m
35、k3mk3ok3l2oe3c3ke4ky3me2my2ok3oke3精品学习资料精选学习资料 - - - 欢迎下载oe3oy2key2精品学习资料精选学习资料 - - - 欢迎下载ke4u1ky3c2ey2i1l3oke3fp-growth :数据库的第一次扫描与aprio ri 算法相同,得到l 1;再按支持度计数的递减序排序,得到:l=k:5、e:4、 m:3、 o:3、 y:3;扫描没个事务,按以上l 的排序,从根节点开头,得到fp- 树;rootk:5e:4m:1m:2o:2y:1精品学习资料精选学习资料 - - - 欢迎下载o:1y:1精品学习资料精选学习资料 - - - 欢迎下载y
36、:1题 5.3 图 fp 增长算法项条件模式基条 件 fp 树产生的频繁模式精品学习资料精选学习资料 - - - 欢迎下载yk、e、m、o:1, k、e、o:1 , k、m:1 ok、e、m:1, k、e:2k、e:2, k:1mk:4ek:3 k:3 , e:3k:3k:4k、y:3k、o:3, e、o:3, k、e、o:3k、m:3k、e:4精品学习资料精选学习资料 - - - 欢迎下载效率比较:aprio ri算法的运算过程必需对数据库作多次扫描,而fp- 增长算法在构造过程中只需扫描一次数据库,再加上初始时为确定支持度递减排序的一次扫描,共计只需两次扫描;由于在aprio ri 算法中
37、的自身连接过程产生候选项集,候选项集产生的运算代价特别高,而fp-增长算法不需产生任 何候选项;(b) 列举全部与下面的的元规章匹配的强关联规章(给出支持度s 和置信度 c),其中, x为代表顾客的变量,item 为表示项的变量(如“a ”.“ b ”等):xtransaction、 buysx、 “ k ” buysx、 “o”buysx、“ e” s=0.6、 c=1 xtransaction、 buysx、 “ e ” buysx、“ e”buysx、“ k ” s=0.6、 c=1 或也可表示为k、o essupport=0.6或 60%、cconfid ence=1 或 100%精品
38、学习资料精选学习资料 - - - 欢迎下载e、o kssupport=0.6或 60%、cconfid ence=1 或 100%5.4 (实现项目)使用你熟识的程序设计语言(如c+ 或 java ),实现本章介绍的三种频繁项集挖掘算法:第 6 章分类和猜测6.1 简述决策树分类的主要步骤;6.2 6.11 下表由雇员数据库的训练数据组成;数据已泛化;例如,age “ 31 35”表示年龄在3135 之间;对于给定的行,count 表 示 department,status,ag e和 salary 在该行具有给定值的元组数;departmentsalesstatusseniorage3135
39、salary46k50kcount30salesjunior263026k30k40salesjunior313531k35k40systemsjunior212546k50k20systemssenior313566k70k5systemsjunior263046k50k3systemssenior414566k70k3marketingsenior364046k50k10marketingjunior313541k45k4secretarysenior465036k40k4secretaryjunior263026k30k6i) 如何修改基本决策树算法,以便考虑每个广义数据元组(即每一行)
40、的 count ?j) 使用修改过的算法,构造给定数据的决策树;k) 给定一个数据元组,它的属性department , age 和 salary 的值分别为 “ systems”,“ 26 30”,和“ 46k 50k ”;该元组 status 的朴实贝叶斯分类为什么?l) 为给定的数据设计一个多层前馈神经网络;标记输入和输出层节点;m) 使用上面得到的多层前馈神经网络,给定训练实例(sales, senior ,3135, 46k50k),给出后向传播算法一次迭代后的权重值;指出 解答:你使用的初始权重和偏倚以及学习率;(a) 如何修改基本决策树算法,以便考虑每个广义数据元组(即每一行)的count ?(b) 使用修改过的算法,构造给定数据的决策树;(c) 给 定一 个数 据元 组, 它的 属性department , age 和 salary 的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园眼科知识讲座
- 幼儿园高热的护理措施
- 幼儿园卫生保健工作总结
- 如何加强项目安全管理
- 企业社会责任研讨会合同
- 忠诚于人民的教育事业
- 手工皂买卖协议
- 三高病人护理
- 抵押合同修改协议
- 《章法之美》教学课件-2024-2025学年湘美版(2024)初中美术七年级下册
- Unit 4 Eat Well(大单元教学设计)2024-2025学年七年级英语下册同步备课系列(人教版2024)
- 钕铁硼项目可行性分析报告(模板参考范文)
- 2024年天翼云认证运维工程师考试复习题库(含答案)
- 盆底生物反馈治疗肛门直肠功能障碍性疾病中国专家共识(2024版)解读
- 广州广东广州市卫生健康委员会直属事业单位广州市皮肤病医院招聘22人历年参考题库(频考版)含答案解析
- 《低压智能断路器检测规范》
- 甘肃开放大学2024年《信息技术与信息管理》形考作业1-4答案
- 春天的故事课文课件
- 2024年土地储备项目合作开发合同3篇
- 《奥马哈系统在老年髋部骨折患者出院后延续性护理中的应用研究》
- 《钢结构安装施工》课件
评论
0/150
提交评论