版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、粒子物理与核物理实验中的数据分析本讲要点矩的定义、矩的应用与参数估计矩方法与最大似然法和最小二乘法的比较统计误差中的标准误差问题经典置信区间问题利用似然函数或二乘函数确定置信区间贝叶斯上限2矩的一般表达式假设对随机变量 x 有n 次测量 x1,xn,服从概率密度函数分布 f (x; ) 。其中有 m 个未知参数 1,m。如果可以构造 m 个线性独立函数 ai(x), i=1,m,其均值可写为为了确定参数,上述独立函数必须进行适当选择使得含参数的函数 ei( ) 可以确定。此时,函数 ei( ) 可以通过计算无偏的样本平均值来估计因此,参数值可以通过求解 m 个 ei( ) 方程组来确定。矩的一
2、般表达式3线性独立函数的方差矩阵参数 1,m 估计值的协方差矩阵可以首先进行无偏估计它可以与样本平均值的协方差矩阵相联系, 即4线性独立函数均值的方差矩阵根据线性独立函数均值和其估计值的定义,可以有5参数估计值的方差矩阵由于待定参数 是 e 的函数,由误差传递(教材式1.54) 因此待定参数 的协方差矩阵估计值也可以确定。而根据线性独立函数的均值估计值表达式 可知参数值的估计值 可通过求解 m 个 方程组来确定。参数估计任务完成 6简单矩、代数矩和中心矩如果令 x0=0,则一阶矩就是随机变量 x 的期待值定义(也称作一阶代数矩)如果令 x0=Ex , 随机变量 x 围绕期待值的二阶矩就是随机变
3、量 x 的方差定义(也称作二阶中心矩)代数矩7代数矩与中心矩的关系代数矩中心矩低阶矩之间的关系一般情况下,它们的关系可以有如下表示高阶矩对研究概率密度函数在|x-|大值区间的行为很有帮助。对称分布的所有奇数中心矩为零。8角分布理论的简单验证在实验 中,理论预言角分布为将角分布化为 cos 的概率密度函数,则其二阶代数矩期待值 n=事例数为了验证理论,我们计算 cos 二阶代数样本矩平均值假设的统计检验可以通过简单比较二阶代数矩的期待值与样本矩平均值来完成。9简单验证中的误差估计在前面例子中对于不含参数的简单情形 cos 二阶代数矩平均值的误差估计可以按下列方法进行已知真值样本矩的方差为样本矩平
4、均值的方差可以证明为0.390.01 观测值在一个标准误差范围内与理论预期相符。10含参数情况举例在上例中,假设已知理论中包含一未知参数 ,例如和前例一样,计算出 cos 二阶代数矩的理论期待值 则参数 与二阶代数矩的关系为 只要函数是可积的,采用矩方法原则上就可以测定参数。11简单矩方法应用的其它问题非物理解问题:利用矩方法测定参数,可能会出现非物理结果。例如前例的二阶代数矩中,如果在矩方法中,我们无法加上限制条件使得参数的测定值保持在物理允许的范围内。假设检验问题:利用矩方法测定参数,由于只比较积分值并解方程得到参数估计值,信息含量不足,因此无法判断所得到的参数是否合理。实际应用中需要辅之
5、以其它方法来检验。适用范围问题:矩方法虽然简单,但在处理多参数问题中,由于涉及更高阶的积分,使研究变得复杂。在这种情况下,可以考虑采用所谓的“广义矩方法”。12最大似然法、最小二乘法和矩矩方法最大似然法最小二乘法数据输入单个事例单个事例直方图多维问题最容易归一化较复杂较难充分性会有信息丢失最具充分性有时与区间大小有关一致性收敛于真值收敛于真值收敛于真值有效性不是最有效通常最有效基本上与似然法一样无偏性渐进无偏渐进无偏渐进无偏拟合优度较难评估较难评估很容易充分性:估计量应包含观测值对于未知参数的全部信息;一致性:样本容量增大时,估计值收敛于真值;有效性:估计量的分布对其期望值具有最小方差;无偏性
6、:无论样本容量多大,估计值与真值无系统偏差。13再论统计分析的目标假设检验参数拟合检验数据是否与某一特定理论相符(注意,该理论可包含一些自由参数)。利用数据确定自由参数的大小。相符的程度由显著水平来表示。参数的准确程度由对应的误差大小来表示。如何定量计算显著水平与确定误差的大小。8/6/202214测量结果的表述与含义其真正的含义是什么呢?15参数估计值的分布可以用来作为误差传递的输入参量,以及用最小二乘法求平均值等等。中心置信区间应给出不对称的误差只有当要对不同实验求平均值时,它的形式就会发挥作用。给出了 68.3% 置信区间范围。16经典置信区间的定义17参数置信带的定义不等式 等价于 1
7、8参数的置信区间确定或者合并成 根据置信带的定义,有不等式19参数置信区间含义它的深刻含义是注意,该区间是随机的,真值 是一个未知常数。包含真实参数的概率为1- -而是意味着:重复同样样本大小的实验多次,每次按同样的描述构造置信区间,有1- - 部分的实验,置信区间将覆盖。20单边与中心置信区间通常,取 = = /2有时,单独指定 或 单边区间(极限,上限或下限)粒子与核物理的误差惯例是:68.3%的中心置信区间。覆盖概率为1- 中心置信区间21经典置信区间通常,我们并不构造置信带,而是解下列方程得到 a 与 b 的区间极限。22高斯分布估计量的置信区间如果存在为了找到 置信区间,解下列方程
8、得到 a 与 b 的解23高斯分布的累积函数与分位点是标准高斯的累积函数,可以证明24标准高斯的分位点为了找到服从高斯分布的参数估计量的置信区间,需要确定下列分位点通常对分位点取整 有时对概率覆盖率取整 10.682710.841320.954420.977230.997330.99870.901.6450.901.2820.951.9600.951.6450.992.5760.992.326中心 单边中心 单边25泊松分布均值的置信带确定对于固定的 ,由于 只能取分立值,置信带对任意的 并不一定存在。这种情况下,可考虑把方程变为 得出 a 与 b26泊松分布均值的置信区间确定利用27泊松分布
9、均值的置信水平上限值重要特例:对于置信水平 1-=95% 的上限,28例子: 无本底稀有衰变分支比已知实验对稀有衰变 的单个事例灵敏度为如果实验上没有观察到一个事例,要给出90%的置信水平,需计算如果实验上观察到一个事例,要给出68%的置信区间的分支比,需要给出重复实验在 (1-0.68)/2=0.16 范围内观察到至少一个事例的下限以及不多于一个事例的均值上限29从log L或 2 近似给出置信区间若 log L( ) 呈抛物线状,通过将log L( )展开, 则可得到即使 log L( )并不呈抛物线状,也可给出置信区间的近似值例如在指数函数例子中,只有 n=5个观测值时30多维置信区间研究中常遇到需要给出多参数拟合情况下的多维置信区间参数的联合概率密度函数为其中这里 V-1 为协方差矩阵。当联合概率密度函数值不变时,其等高线对应于常数的 Q。它们是在参数空间以真值为中央的椭圆(或对于两维以上的超椭圆)。31二维参数的置信区间例如在中微子振荡实验中的双参数拟合问题Phys.Rev.D74:072003,200632含本底泊松分布的经典置信区间在观察到 nobs 个事例条件下的置信区间的确定可能会出现的问题:如果本底研究给出的预言值 b与实验观测值 nobs可比较,那么可能会出现信号事例上限 只可能取零值的情况。
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论