粒子物理与核物理实验中的数据分析课件_第1页
粒子物理与核物理实验中的数据分析课件_第2页
粒子物理与核物理实验中的数据分析课件_第3页
粒子物理与核物理实验中的数据分析课件_第4页
粒子物理与核物理实验中的数据分析课件_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

粒子物理与核物理实验中的数据分析杨振伟清华大学第九讲:最小二乘法上一章回顾四种方法给出最大似然估计的方差数值方法蒙特卡罗方法RCF边界方法图解法双参数的最大似然法(等高线)推广的最大似然法(样本总量为随机数)最大似然法处理分区数据(区间大小)用最大似然法合并多组测量结果12/6/2023212/6/20233本讲要点最小二乘法与最大似然法的关系线性情况下的最小二乘估计非线性情况下的最小二乘估计*约束情况下的最小二乘法*检验最小二乘法的拟合优度应用最小二乘法处理分区数据不等精度关联实验结果的并合问题12/6/20234最小二乘法与最大似然法设有高斯随机变量:yi,i=1,…,N,均值为对应的对数似然函数(去掉与

无关的项)为对于独立的高斯变量yi,联合概率密度函数为12/6/20235最小二乘估计量的定义如果

yi是多维高斯变量,协方差矩阵为V,满足那么其对数似然函数为也就是说,我们应求下式的最小值它的最小值定义了最小二乘法的估计量

,即使yi不是高斯变量,该定义依然适用。(实际上,yi

通常是高斯的,因为中心极限定理会导出测量误差近似高斯。)12/6/20236两种情况下的最小二乘参数估计尽管上式对任何含参数函数的具体形式均成立,但是,对参数的估计,可以根据理论预期值中所含参数的具体特征而采用不同的参数估计处理方法,简化问题。线性情况:非线性情况:12/6/20237线性最小二乘法估计这里aj(x)

是x

的任意线性独立函数。用矩阵来表示时,令Aij=aj(xi),有对

i

求偏微分,并令结果等于零,有解方程得到最小二乘法的估计量12/6/20238最小二乘估计量的方差等效地,可以利用下式来计算如果

yi是高斯变量时,其与RCF边界一致。12/6/20239最小二乘估计量的方差(续)12/6/202310多项式的最小二乘法拟合用一个多项式来拟合右图第0阶(一个参数)第1阶(两个参数)第4阶(五个参数)对于单参数拟合(例如上图的横线):例如:12/6/202311多项式的最小二乘法拟合(续)对于双参数拟合的情形(有非零斜率的直线)倾角给出相关系数。对于五个参量拟合的情形(有非零斜率的直线)

2min值的大小反映了数据与假设之间的符合程度。可以用来检验拟合优度。曲线通过所有点;

2min=0,参数的数目=数据点的数目。12/6/202312非线性最小二乘法估计*如果采用牛顿法求上式的最小值,第n+1次迭代公式可采用12/6/202313约束情况下的最小二乘法拟合*实际问题中会遇到测量量本身要受到某些物理定律的约束。求解可采用拉格朗日乘子法,对每一个约束引入因子

i,例如,能动量守恒,衰变顶点约束等等。对一个事例有m个观测量,无参数的最小二乘问题变为12/6/202314约束情况下的最小二乘法(续一)为了找到最小值,可以通过求微商方法而n+1

次迭代后设经过n

次迭代以后,找到一组解,得到函数的值。在上对

(n)

进行线性展开,并略去高阶项,得到12/6/202315约束情况下的最小二乘法(续二)两式联立消掉项,可以得到因此,可以得到第n+1

次迭代的l个拉格朗日乘子取值以及第n+1

次迭代的m

个测量量的预期值12/6/202316约束情况下的最小二乘法(续三)当经过n+1

次迭代以后,满足下式时即可终止实验中,为了提高测量精度而采用的四动量守恒约束拟合(4-Cfit),顶点或质量约束拟合(1-Cfit),大都采用该方式来进行。此时的

2值应满足自由度为(m-l)的

2分布。12/6/202317例:粒子动量分辨的改进例如,实验观测衰变通常情况下,探测器对光子探测的能量分辨率较差,从而影响到

0粒子动量重建的精度。已知:r12/6/202318例:粒子动量分辨的改进(续)因此,每一个衰变事例的观测量期待值为对应于每个观测量有误差估计,而且已知相互间不相关。则无参数的最小二乘问题可写为利用一个约束条件下,改进的光子动量观测值进行

重建研究,从

的不变质量谱可以看出光子的动量得到了明显的改进。12/6/202319检验最小二乘法的拟合优度那么

2min

服从N-m自由度的最小二乘概率密度函数分布。

据此来计算P-值例如在前面双参数拟合中

也就是说,重复实验多次,有26.3%的值将大于

2min。进行1000次蒙特卡罗实验而对于水平线拟合,有P-值太小!12/6/202320拟合优度与误差的最小值小的统计误差并不意味着是一个好的拟合(反之亦然)

2曲线在其最小值附近变化给出统计误差;

2min的曲率大小给出拟合的优度。在水平线拟合中,可以人为改变数据点纵向的位置,但保持误差不变,使得方差与改变前一样,但

2min变“好”了。

2(

0)曲线只是向下平移,表明与数据符合更好。但曲线形状并没有发生变化,即误差并没有改变。12/6/202321拟合优度与误差的最小值(续)估计量的方差告诉我们:P-值告诉我们:如果实验从复多次,估计量

分布有多宽。但是,它并不告诉我们假设是否正确。P-值太低,则假设可能有误,即存在系统误差。如果假设正确,并且实验重复了多次,实验与假设按照统计的

2min

完全符合或符合得更差的比率是多少。12/6/202322最小二乘法处理分区数据最小二乘法拟合使下式有最小值把yi

看做泊松分布的随机变量,方差为改进的最小二乘法虽方便了计算,但对于有些区间频数太少时

2min不再服从最小二乘的概率密度分布函数(或无定义)。12/6/202323最小二乘法的归一化问题例如n=400次,N=20个区间解决的方法是从数据中直接得到n,或者最好是用最大似然法定n。12/6/202324用最小二乘法并合各实验结果用最小二乘法得到

的N个测量的权重平均值在各测量量不相关的情况下,并合方法与最大似然法一样。12/6/202325两个相关实验的平均值假设有两相关测量量y1,y2,且因第二个测量导致方差倒数的增加为加权平均的结果将不在y1和y2之间。如果是由于使用相同数据的话,上述情况不可能发生,但有却可能来自共同的随机效应;此时的平均值很不可信,例如

,1,2不正确。第二个测量结果对平均值有帮助。12/6/202326例:用不同尺子测量长度实验上采用两把由不同材质做成的尺子测量一物体的长度。已知它们在不同温度下有不同的伸缩系数,即根据误差传递公式,可以计算长度估计量的误差为假设测量是无偏的,也就是方差矩阵为12/6/202327例:用不同尺子测量长度(续)相关系数为加权平均值为如果温度的误差很小可以忽略,则均值的估计值必在两测量值之间。而如果长度测量误差很小可以忽略,而且相关系数接近1时,则会出现方差为零的极端情况这种情况通常是温度测量极不可靠造成的。12/6/202328小结与最大似然法的联系线性的最小二乘法估计非线性的最小二乘法估计约束条件下的最小二乘法拟合用最小二乘法检验拟合优度用最小二乘法处理分区数据不等精度关联实验结果的并合问题对于高斯分布量yi,两者相同估计是通过求矩阵的逆来完成,估计量是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论