记忆基础理解Memory-basedreasoningMBR1.ppt_第1页
记忆基础理解Memory-basedreasoningMBR1.ppt_第2页
记忆基础理解Memory-basedreasoningMBR1.ppt_第3页
记忆基础理解Memory-basedreasoningMBR1.ppt_第4页
记忆基础理解Memory-basedreasoningMBR1.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第六章 記憶基礎理解 (Memory-based reasoning, MBR),定義:用人工智慧的方式,以現有資料庫對新資料進行分類與預測。,記憶基礎理解 (Memory-based reasoning, MBR),記憶基礎理解記憶基礎理解可以應用的行業: 詐欺案件判斷。 顧客反應預測。 醫療服務追蹤。 問卷資料分類。,如何進行 (學習階段),如何進行 (預測階段),解決問題的三個主題,選擇適當的歷史資料 關鍵:資料的範圍必須能涵蓋原始資料 抽樣方法: 找出具效率的方式代表歷史資料 減少歷史資料庫的記錄數量 (圖9.3、9.4) 設定距離函數、組合函數、和鄰近資料的組數 (K值),案例研究 新聞報導分類,案例研究 新聞報導分類,選擇測試資料組 : 49,652則新聞稿, 每一則平均2700字與8個編碼 2. 設定距離函數 利用一個叫 “相關回饋(Relevance Feedback)” 的測試標準, 比對任何文件的相似度 (參見課本) ; B與A的距離: d(A, B) = 1 - Score(A, B) / Score(A, A),案例研究 新聞報導分類,3. 設定組合函數 為未分類的新聞找出最相似者,案例研究 新聞報導分類,3. 設定組合函數 為未分類的新聞評分 (門檻值為1),案例研究 新聞報導分類,4. 設定鄰近資料組數 1 11組 若要配置在單一編碼, 則選擇 較少組數較合適,案例研究 新聞報導分類,5. 結果(200則, 半數同意才合格),案例研究 新聞報導分類,測量評分的效用:反查(Recall)與準度(Precision),距離函數,關鍵特性: 1. 明確界定(Well-defined) : d(A, B) = 0 2. 區辨性(Identity) : d(A, A) = 0 3. 可互換性(Commutability) : d(A, B) = d(B, A) 4. 三角不等式(Triangle Inequality) : d(A, C) = d(A, B)+d(B, C) 絕對值 : |A-B| ; 平方差 : (A-B)2 ; 標準化絕對值 : |A-B|/(最大差值),組合函數,民主方式 (投票方式) 讓最近似的K個鄰近資料以投票的方式選出答案。 加權投票 著重在“加權” 最適用問題:類別變數 加權對於結果和信心水準只有小幅度影響,在部份鄰近資料比較近,而部份比較遠的情況下,加權才會有較大的效果。 加入迴歸分析,例 子,一次建立一個單變數的距離函數,例 子,例 子,採用標準化絕對值與將三種距離加總,例 子,同理也可對薪水做距離矩陣 加總 : dsum(A,B)=ds(A,B)+do(A,B)+di(A,B) 標準化加總 : dsum(A,B)/maxdsum(A,B) 歐幾里德距離 : SQTR(ds(A,B)2+do(A,B)2+di(A,B)2),例 子,每一點在三種距離函數下的最近似組合,例 子,加入新顧客,例 子,使用MBR與投票來判斷新顧客是否會流失與信心水準,例 子,使用MBR與加權來判斷新顧客是否會流失預測,組合函數,加入迴歸分析 處理數值或順序變數 最適用問題:連續數值 迴歸分析:將數據去適配到某些已知的函數,然後運用函數推算出未知值。 實例:以通貨膨脹率推算股市漲跌 (圖9.8 , 圖9.9),其他距離函數,其他資料型態的應用 五位數郵遞區號 dzip(A, B) = 0 前3碼一樣 dzip(A, B) = 1 前3碼不一樣 dzip-refined(A, B)=0.0 dzip-refined(A, B)=0.1 ex. “20008” “20015” dzip-refined(A, B)=0.5 ex. “95050” “98125” dzip-refined(A, B)=1.0 ex. “02138” “90024”,如何獲得最佳結果,選擇正確的訓練資料組 增加罕見分類項的資料數量 距離函數 鄰近資料數量(k值)的考量 無一定數量的限制 組合函數 類別性資料加權投票 連續性數值結合迴歸分析與最似鄰近方法,MBR的優點,結論容易推測 能運用在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论