版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、PATTERN RECOGNITIONAND MACHINE LEARNINGCHAPTER 1: INTRODUCTION第一章内容目录模式识别与学习的基本问题多项式曲线拟合实例学习中的基础理论概率论决策论信息论ExampleHandwritten Digit Recognition相关的基本概念训练集合x1,,xN目标向量 t函数: y(x)特征提取预处理推广性(举一反三)监督学习: 分类,回归(regression)无监督学习: 聚类,概率密度估计,可视化reinforcement learning模式识别与学习的基本问题监督学习: 分类,回归(regression)输入变量: x,目标
2、变量: t给定训练样本: x,t目标:(学习出x 和t的函数关系)给定x t模式识别与学习的基本问题学习数据用函数或其它模型表示数据算法:解释数据结果:数据衡量算法:推广能力理论原则:拟合训练数据+最简模型Polynomial Curve Fitting问题描述输入变量: x目标变量: t生成过程: 实际问题中是未知的给定训练样本: x,tPolynomial Curve FittingPolynomial Curve Fitting目标:给定新的x , 线性模型:的t 值利用训练样本,估计模型的参数方法:误差平方和最小:Sum-of-Squares Error Function0th Ord
3、er Polynomial1st Order Polynomial3rd Order Polynomial9th Order PolynomialPolynomial Curve Fitting哪一个最好?训练误差测试误差过训练均方误差(root-mean-square)Over-fittingRoot-Mean-Square (RMS) Error:Polynomial Curve Fitting过训练的相关因素模型复杂度Polynomial CoefficientsPolynomial Curve Fitting过训练的相关因素模型复杂度训练样本数Data Set Size:9th Ord
4、er PolynomialData Set Size:9th Order PolynomialPolynomial Curve Fitting过训练的相关因素模型复杂度训练样本数学习方法最大似然贝叶斯方法RegularizationPenalize large coefficient valuesRegularization:Regularization:Regularization:vs.Polynomial Coefficients问题思考哪些问题是哪些问题是学习能够解决的?学习不能解决的?哪些问题影响学习的效果?Probability TheoryApples and Oranges P
5、robability TheoryMarginal ProbabilityJoint ProbabilityConditional Probability Probability TheorySum RuleProduct RuleThe Rules of ProbabilitySum RuleProduct RuleBayes Theoremposterior µ likelihood ×priorProbability DensitiesTransformed DensitiesExpectationsConditional Expectation(discrete)A
6、pproximate Expectation(discrete and continuous)Variances and CovariancesThe Gaussian DistributionGaussian Mean and VarianceThe Multivariate GaussianGaussian Parameter EstimationLikelihood functionum (Log) LikelihoodProperties ofandCurve Fitting Re-visitedum LikelihoodDetermineby minimizing sum-of-sq
7、uares error,.Predictive DistributionMAP: A Step towards BayesDetermineby minimizing regularized sum-of-squares error,.Bayesian Curve FittingBayesian Predictive DistributionMSelectionCross-ValidationCurse of DimensionalityCurse of DimensionalityPolynomial curve fitting, M = 3Gaussian Densities inhigh
8、er dimensionsDecision TheoryInference stepDetermine eitheror.Decision stepFor given x, determine optimal t.Minimum Misclassification RateMinimum Expected LossExample: classify medical images as cancer or normalDecisionTruthMinimum Expected LossRegionsare chosen to minimizeReject OptionInference and
9、decisiongenerative msdiscriminative msdiscriminant functionWhy Separate Inference and Decision?Minimizing risk (loss matrix may change over time)Reject option Unbalanced class priorsCombining msDecision Theory for RegressionInference stepDetermine.Decision stepFor given x, make optimal prediction, y
10、(x), for t.Loss function:The Squared Loss FunctionGenerative vs DiscriminativeGenerative approach:MUse Bayes theoremDiscriminative approach:MdirectlyEntropyImportant quantity in coding theory statistical physics machine learningEntropyCoding theory: x discrete with 8 possible states; how manybits to transmit the state of x?All states equally likelyEntropyEntropyIn how many ways can N identical objects be allocated M bins?Entropyized whenEntropyConditional EntropyThe Kullback-Leibler DivergenceMutual InformationContents1 Introduction2 Probability Distributions3 Linear M4 Linear Ms for R
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年度绿化工程承包合同
- 大班种子课件教学课件
- 2024山西劳动合同范本
- 2024年度J企业卫星通信技术服务合同
- 2024年店面续租协议:市中心
- 2024互联网销售涂料产品独家代理合同
- 2024年工程进度与安全合同
- 2024年建筑修正协议
- 2024年家用电器维修服务合同
- 2024双方关于影视制作与发行委托合同
- 高考物理系统性复习 (能力提高练) 第五节 实验:探究小车速度随时间变化的规律(附解析)
- 眼科护理中的孕妇与产妇护理
- 业主业主委员会通用课件
- 了解金融市场和金融产品
- 南京理工大学2015年613物理化学(含答案)考研真题
- 初中数学应用题解题思路分享
- 安全生产科技创新与应用
- 人工智能在文化传承与遗产保护中的价值实现
- 2024年汽修厂开业计划书
- ISTA标准-2A、2B、2C系列解读(图文)
- 日间手术应急预案方案
评论
0/150
提交评论