数据挖掘概念与技术-课后题答案汇总汇总_第1页
数据挖掘概念与技术-课后题答案汇总汇总_第2页
数据挖掘概念与技术-课后题答案汇总汇总_第3页
数据挖掘概念与技术-课后题答案汇总汇总_第4页
数据挖掘概念与技术-课后题答案汇总汇总_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、DataMiningConcepts and第 1 章 1.1 1.2 1.6 聚 征 般 低 75% 特 征条例一据系能发现的关联规则为: “computing science”)“computer”) support=12%,confidence=98%X 生 型 或概念的模型(或功能),而后者是建立一个模型去预测缺失的 测的工具: 似 区分、关联和相关分析、分类、或预测,1.3 1.9 、 1.4 耦 为 始 掘 如聚合、分类、或统计功能的预计算 掘- 部 紧密耦合是最优的,没有值得顾虑的技术 1.5 第 2 章 2.1 2.2 ; ; 我们有:L =20,1N=3197() =950,

2、median=1500,width=30l式(2.3 N /2freq /2 950 L lfreq1 median 2.2 2.4 是:1315,16,1619,2020,21,2222,2525,25,2530,33,33,35,35,35,35,36,40,45,46,52,70。(a) (b) (c) (d) Q Q 13(e) (f) (g) (a) 1 /27 2.1 N x xNii1 x =25=Q 。142(b) 两个: 和 35(c) midrange=(70+13)/2=41.5。(d) Q Q 13 25% Q =20。1 3(N+1)/4=21 处。所以:Q 3(e)

3、 5 13、20、25、35、70。(f) (g) y=x y x 2.3 2.7 2.4 (a) 3(b) (c) (a) 3 3 1 2 3 箱 113箱 422箱 735箱 21619箱 52525箱 836箱 3:箱 6:箱 9:46,52, 3 4箱 1:,44/3, 箱 2:55/3 箱 3:21,21,箱 424箱 735箱 5箱 6101/3箱 8:,121/3 箱 95656 (b) 如 (c) 光 均 线性或多线性回归。分类技术也能被用来对概念分层, 到2.4 (a) (b) z-score (c) (a) new_max。 (b) score 值域是(old _min,+

4、。(c) 值域是1.0,1.0)。2.5 2.4 值 ,1.0 值 35 值35。 值 ,1.0 =13, =70,new_min =0.0 v=35,AAAAv v_ _ _A AAAAA 131.0 0.0 0.0 13 值 35 15 2 16 192 21 2 22 4 A 2 33 4 35 36 29.963 NAAi , 2Ai12ANA s 2或Ni1NAAAi 167.4986,s2As Av A v Av A v s 0.39或sA 值35。vv j=2。 0.35102j 2.6 个销售价格记录组已经排序如下:51011131535,50,55,72,92,204,215

5、(a) (b) (c) 解(a) (b) 5,10,11,13,15,35,50,55,72(c) 2 3 5,10,11,13,15 2.7 2.4 (a) (b) SRSWOR, 5 解答:(a) 876543210(b) SRSWOR 抽 5 T T T19 T 1101112131415161718T T2 T21 T22 T23 T24 T25 T26 345678T T T927 和 SRSWR T1011T26T20T21T25 6 m TTTTTT16T3T4T5T13T14T15T18T19T20T23T24T25T10TT1025T19 T20 T21 T22 T23 11

6、011121314151617182345T T 624T T725 T26 T27 8T T9T17 T27 T252.8 3.1 3.4 4 area_id , status, university) , , 和 instructor(dept, rank);2 和 avg_grade。 (a) (b) 由 基 本 方 体 student, instructor 开 始 , 为 列 出 的(c) 5 all 由 基 本 方 体 student, instructor 开 始 , 为 列 出 这些特殊的联机分析处理(i.ii.course course_id department。沿学生(

7、student_id“上卷”到 university。取 department=“CS”和 university=“ University(coursestudentiii.iv.沿学生( university student_name。 5 all 5 题 图 题 4.1 4.2 4.3 题 考虑下面的多特征立方体查询:按item ,regio ,有 美 f) (a) R0R1(1.25*min(shelf)and1.5*min(shelf) (b) 用 selectfrom e that R1.shelf (R1.Shelf (c) that 4.4 4.5 5.1 Apriori 5.2

8、 5.2.2 方。 5.3 5 ,解释它为什么比。 I, 和 5. s 和置 c中,X item AB2.x transaction, item ) item ) item )s, 1232(a) 和 节的方法更过 5 5min_sup=3。 5.1(b)5.1(c) M 3 1 3O 3N 2 2K 5E 4M 3 3 2 3O 3C Y 3L K 5 C L 3 C 3 2 21122 3D 1E A 1Y3 3 4U 1 3C 2 2I L 33 L 1计数的递减序排序,得到: (E:4), (Y:3) L FP-题 图 树项 ,YOME, ri FP- ri (b) s cX item

9、 B ”x transaction, “) O) “E) c=1x transaction, “E) “) ) c=1K,O 或 60%,c(confidence)=1 或 或 60%,c(confidence)=1 或 5.4 C+或 Java第 6 章 6.1 6.2 “3135 e和 salary salesjuniorjuniorjuniorjuniorjuniorjunior53146Ksales263126K31Ksales21secretarysecretary312634136343141K462646i) count?j) department 和 salary “syste

10、ms263046K50K status l) 使用上面得到的多层前馈神经网络,给定训练实例( ,3(a) 的count?(b) (c) 给 , 和 salary 的 “systems263046K50K status ; 30,salary=46K50K); r)=234923/113 ; ; 30,salary=46K50K); P(junior)=113/165=0.68; P(senior)=52/165=0.32; P(X|junior)P(junior)=0.017960.68=0.01221280=0=P(X|senior)P(senior); X 。 X=(department=system,age=2630,salary=46K50K) 。当 status=senior 30+5+3+10+4=52 ;当 status=junior 时 , 元 组 总 数 为 : ,P(junior)=113/165=0.68; status=senior age=2630 区间,所以:P(X|seni

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论