版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 Comparing Performance of 2 Models: Independent Test Sets q To test if performance difference is statistically significant: d = e1 e2 - d N(dt,t where dt is the true difference - Since D1, D2 are independent, their variance adds up: = + + 2 2 2 2 t 1 2 1 2 2 e1(1 e1 e2(1 e2 = + n1 n2 - At (1- confid
2、ence level, d =d ±Z t /2 t 41 An Illustrative Example q Given: M1: n1 = 30, e1 = 0.15 M2: n2 = 5000, e2 = 0.25 d = |e2 e1| = 0.1 (2-sided test q 0.15(1 0.15 0.25(1 0.25 + = 0.0043 = 30 5000 d q At 95% confidence level, Z/2=1.96 d = 0.100 ± 1.96 × 0.0043 = 0.100 ± 0.128 t => In
3、terval contains 0 => difference may not be statistically significant 42 Comparing Performance of 2 Classifiers: Same Test Sets with CV q Each learning algorithm may produce k models: - L1 may produce M11 , M12, , M1k - L2 may produce M21 , M22, , M2k If models are generated on the same test sets D1,D2, , Dk (e.g., via cross-validation - For each set: compute dj = e1j e2j - dj has mean dt and variance t k 2 - Estimate: q = 2 t t (d j j
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 南充天虹市政工程有限公司OAforT 财务集成应用案例
- 0-3岁宝宝早教儿歌大全
- 镇江2024年江苏镇江市第四人民医院招聘高层次紧缺人才3人笔试历年典型考点(频考版试卷)附带答案详解版
- 移动通信设备选型与应用考核试卷
- 稀土金属在汽车工业的应用考核试卷
- 锅炉及辅助设备在工业智能化系统中的应用考核试卷
- 鞋跟修理与加固考核试卷
- 微纳米加工工艺-洞察分析
- 土地整治项目管理-洞察分析
- 微生物组与免疫应答关系-洞察分析
- 湖南省湘西州吉首市2023届九年级上学期期末素质监测数学试卷(含解析)
- 2023-2024学年湖北省武汉市东西湖区三年级(上)期末数学试卷
- GB/T 31771-2024家政服务母婴护理服务质量规范
- 2023-建筑施工技02课件讲解
- 期末试卷:福建省厦门市集美区2021-2022学年八年级上学期期末历史试题(原卷版)
- 美容院2024年度规划
- 装饰装修巡查记录表
- 公司安全生产事故隐患内部报告奖励工作制度
- 艾滋病预防知识讲座
- 零售服务质量提升
- 《4 平平安安回家来》 说课稿-2024-2025学年道德与法治一年级上册统编版
评论
0/150
提交评论