理解偏差和方差平衡技术_第1页
理解偏差和方差平衡技术_第2页
理解偏差和方差平衡技术_第3页
理解偏差和方差平衡技术_第4页
理解偏差和方差平衡技术_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、理解偏差和方差平衡技术 2014-08-27 20:58 459人阅读 评论(0) 收藏 举报 目录(?)+1. Bias and Variance1. 1Conceptual Definition2. 2Graphical Definition1.Bias and VarianceUnderstanding how different sources of error lead to bias and variance helps us improve the data fitting process resulting in more accurate models. We define

2、bias and variance in three ways: conceptually, graphically and mathematically.1.偏差和方差理解不同错误导致的偏差和方差可以帮助我们提高数据对于模型的集合程度,从而提高模型的争取率。我们从三个方面来定义偏差和方差。这三个方面分别是概念定义,图形定义和数学定义。1.1Conceptual Definition Error due to Bias: The error due to bias is taken as the difference between the expected (or average) pred

3、iction of our model and the correct value which we are trying to predict. Of course you only have one model so talking about expected or average prediction values might seem a little strange. However, imagine you could repeat the whole model building process more than once: each time you gather new

4、data and run a new analysis creating a new model. Due to randomness in the underlying data sets, the resulting models will have a range of predictions. Bias measures how far off in general these models predictions are from the correct value. Error due to Variance: The error due to variance is taken

5、as the variability of a model prediction for a given data point. Again, imagine you can repeat the entire model building process multiple times. The variance is how much the predictions for a given point vary between different realizations of the model1.1概念定义由于偏差导致的错误:偏差错误被认为是我们模型预测结果的期望和真实值期望之间的差异。

6、当然你只有一个模型,所以谈论预测结果的期望有点奇怪。但是,想象一下,你不断使用新数据来构造模型,这样你就得到了多个模型,也就得到了多个预测结果。由于模型的数据是随机的,所以会产生一系列的预测。偏差就是衡量这些模型的预测与真实值的差别的。由于方差导致的错误:由于方差导致的错误被认为是一个模型对于一个数据点的预测的变化程度。想象一下,你可以构建你的模型多次。方差被认为是对于一个数据点来说预测的分散程度。1.2Graphical Definition We can create a graphical visualization of bias and variance using a bulls-

7、eye diagram. Imagine that the center of the target is a model that perfectly predicts the correct values. As we move away from the bulls-eye, our predictions get worse and worse. Imagine we can repeat our entire model building process to get a number of separate hits on the target. Each hit represen

8、ts an individual realization of our model, given the chance variability in the training data we gather. Sometimes we will get a good distribution of training data so we predict very well and we are close to the bulls-eye, while sometimes our training data might be full of outliers or non-standard va

9、lues resulting in poorer predictions. These different realizations result in a scatter of hits on the target.We can plot four different cases representing combinations of both high and low bias and variance.1.2图形定义 我们可以用一个打靶图来说明偏差和方差。想象靶心就是我们模型要预测的真实值。当我们离靶子越远时,我们的预测变得越来越糟糕。想象重复整个模型建立的过程来得到多个散点在靶子上。每一个点代表一次模型的实现。当我们接近靶心时,可以认为我们得到了好的训练数据,因此我们可以做出好的预测。但是有时我们的训练数据可能充满了异常值和不标准值,导致预测的结果不好。这些不同的实现可以看做是靶子上的散点。我们可以看四张图来代表偏差值和方差值的高低程度。1.3数学定义我们可以把要预测的变量定义为Y,协变量定义为X。我们可以推测Y和X之间有一个关系,例如Y=f(X)+e.其中e是服从正态分布的一个误差。我们可以用线性回归或者其他别的技术来做一个估计。在这种情况下,预测的错误的平方的期望就可以写作:Err(x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论