版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
INTRODUCTIONTO
MachineLearning
2ndEditionETHEMALPAYDIN©TheMITPress,2010alpaydin@.tr.tr/~ethem/i2ml2eLectureSlidesfor.CHAPTER8:
NonParametricMethods.之前的方法均假定数据取自一个(或几个)已知的概率分布或混合分布非参数的方法:让数据自己说话,不对输入密度作任何假设.8.1IntroductionParametric: singleglobalmodelsemiparametric:smallnumberoflocalmodels优点:将概率密度、判别式和回归函数均归约为估计一些参数缺点:假设并非总是成立,不成立时可能导致很大的误差特点:获得模型之后,训练数据不再被需要LectureNotesforEAlpaydın2010IntroductiontoMachineLearning2e©TheMITPress(V1.0)4.Nonparametric:SimilarinputshavesimilaroutputsFunctions(pdf,discriminant,regression)changesmoothlyKeepthetrainingdata;“letthedataspeakforitself”Givenx,findasmallnumberofclosesttraininginstancesandinterpolatefromtheseAkalazy/memory-based/case-based/instance-basedlearning.非参数方法:不存在全局模型,局部模型只受近邻实例的影响算法:使用合适的相似性度量找出相似的实例通过插值得到正确的输出不同的算法在第1和3项有所不同特点:一直存储着训练训练数,标识每一个新实例均需要训练数据缺点:耗存储空间,耗计算时间(因为每新实例均需要重复一次算法).回顾求导F(x)dF(x)/dx≈(F(x+h)-F(x))/h现在F(x)是一个CDF那么,对应的密度函数怎么求?若假定已经有IID样本注意只考虑x其CDF的估计如上。此时,对应的密度函数又如何估计?.8.2非参数密度估计由8.2衍生出来的估计密度的方法有HistogramEstimatorNaiveestimatorKernelEstimatorK-NearestNeighborEstimator…….8.2.1直方图估计子DividedataintobinsofsizehGivenanoriginxoandabinwidthh任意区间[xo+mh,xo+(m+1)h)内优点:一旦bin确定下来,bin内的样本计数完成,就不再需要存储样本集了。新样本的密度估计取决于其所处的bin缺点:需要选取xoandh,且两者对估计的结果影响大.10.Naiveestimator避免选取起点,但要保留所有样本缺点:每个样本对每个区域的影响(权函数)是“hard”(0or1),因而所得估计不连续,且在xt±h/2处有跳跃..12.8.2.2KernelEstimator平滑的权函数,得到平滑的估计原权函数:核函数(以高斯核为例):.14.每个样本对所有点的密度估计有影响核函数的性质h的选择h也可以适应性地变化.8.2.3k-NearestNeighborEstimator通过调整近邻系数k控制光滑度,以适应数据的局部密度。估计时不考虑N个样本,仅考虑其中的k个也可以核化.17.Kernelden
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 公司道歉信合集六篇
- 押金协议书范本-共10篇
- 三年级上册第七单元备课教案 口语交际
- 星空剧场租赁合同三篇
- 透明明亮的玻璃工作室三篇
- 团队合作与项目式学习计划
- 开展中外文化交流促进品德教育计划
- 沿海船坞设施建设与维护合同三篇
- 调试合同范本
- 香精制造承揽合同三篇
- 2024-2025学年浙教版八年级上册科学期中模拟卷
- 高中物理必修一前两章测试题(含答案)
- (正式版)HGT 6313-2024 化工园区智慧化评价导则
- 智能制造工程生涯发展报告
- 二级公立医院绩效考核三级手术目录(2020版)
- 国际贸易SimTrade外贸实习报告
- 导师带徒实施办法6、30
- 《Fishing with Grandpa》RAZ分级阅读绘本pdf资源
- 水稳施工方案(完整版)
- 跨海大桥施工方案
- MATLAB语言课程论文 基于MATLAB的电磁场数值图像分析
评论
0/150
提交评论