粒子物理与核物理实验中的数据分析-第二讲_第1页
粒子物理与核物理实验中的数据分析-第二讲_第2页
粒子物理与核物理实验中的数据分析-第二讲_第3页
粒子物理与核物理实验中的数据分析-第二讲_第4页
粒子物理与核物理实验中的数据分析-第二讲_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、12/26/20211粒子物理与核物理实验中的粒子物理与核物理实验中的数据分析数据分析第二第二讲讲: :基本基本概念(续)概念(续)1艾滋病检验结果再认识艾滋病检验结果再认识12/26/20212()0.001 ()()0.032 ()P AIDSP AIDS 验前概率前概率验后概率后概率 对于个人对于个人而言而言,0.032 是主观概率。如果没有其是主观概率。如果没有其它额外的信息时它额外的信息时,应把应把 0.001 当作相对频率解释。但当作相对频率解释。但是往往在病毒检验前是往往在病毒检验前,该相对频率被当作一种信念来该相对频率被当作一种信念来处理个人是否患病。处理个人是否患病。 如果还

2、有其它额外的如果还有其它额外的信息信息,应该应该给出不同的先验给出不同的先验概率。这种贝叶斯统计的特点必定是主观的。例如概率。这种贝叶斯统计的特点必定是主观的。例如,受检者有过吸毒历史。一旦验前概率改变受检者有过吸毒历史。一旦验前概率改变,贝叶斯定贝叶斯定理就会告诉患病的可能性。对阳性结果的诠释就会理就会告诉患病的可能性。对阳性结果的诠释就会改变。改变。问题问题:能否能否构造含自变量的概率构造含自变量的概率?212/26/20213随机变量与概率密度函数随机变量与概率密度函数假设实验结果为假设实验结果为 x (记作样本空间中元素记作样本空间中元素)的概率为的概率为( , )( )Pxx xdx

3、f x dx观测到到在在范范围内内那么概率密度函数那么概率密度函数 p.d.f. 定义为定义为 f (x),它它对全部样本空间对全部样本空间S 满足满足( )1Sf x dx 定义累积分布函数为定义累积分布函数为( )()xF xf x dx 对于离散型随机变量对于离散型随机变量1(), 1, ( )()iniiiiixxfP xfF xP x)(xf)(xFxx3 分位数、中值与模分位数、中值与模12/26/20214分位分位点点 x 定义为随机变量定义为随机变量 x 的的值值,它它使得使得 ()F x 这里这里 0 1。因此可以容易求出分位点。因此可以容易求出分位点1( )xF 随机变量随

4、机变量 x 的的中值中值定义为定义为 11/2(1/ 2)xF 随机变量随机变量 x 被观测到大于或小于中值的概率是相等的。被观测到大于或小于中值的概率是相等的。 模模定义为使概率密度函数值达到极大的随机变量值。定义为使概率密度函数值达到极大的随机变量值。 412/26/20215直方图与概率密度函数直方图与概率密度函数概率密度函数概率密度函数 p.d.f. 就是拥有无穷大就是拥有无穷大样本样本,区间区间宽度为零宽度为零,而且归一化到单位面积的而且归一化到单位面积的直方图直方图。( )( )( )()N xf xn xN xnx 每每个个区区间的事的事例例数数 频数数填入填入直直方方图的的总事

5、事例例数数区区间的的宽度度)(xN)(xN)(xN)(xfxxxx直方图在统计分析中非常直方图在统计分析中非常重重要要,应应准确理解它的含义。准确理解它的含义。512/26/20216多变量情形多变量情形如果观测量大于一如果观测量大于一个个,例如例如 x 与与 y()( , )( , )p.d.f .( , )1P ABf x y dxdyf x yf x y dxdy 联合合的的612/26/20217边缘分布边缘分布将联合概率密度函数将联合概率密度函数 p.d.f. 分别投影到分别投影到 x 与与 y 轴轴y)(yfyx)(xfxyx( )( , )y( )( , )( ),( )p.d.

6、f .xyxyxfxf x y dyfyf x y dxfxfy 投投影到影到 轴: :投投影到影到边缘的的轴: :定定义: :7若若 x,y 相互独立相互独立,则可构造则可构造2-维维p.d.f12/26/20218条件概率密度函数条件概率密度函数利用条件概率的利用条件概率的定义定义,可可得到得到xP(AB)f(x, y)dxdyP(B| A)=P(A)f (x)dx 定义条件概率的密度函数定义条件概率的密度函数 p.d.f. 为为 xyf(x,y)f(x,y)h(y|x)=,g(x| y)=f (x)f (y)则贝叶斯定理可写为则贝叶斯定理可写为)()()|()|(yfxfxyhyxgyx

7、)()(),(yfxfyxfyx h(y|x)yyxdxdx812/26/20219名词总汇名词总汇随机事例随机事例概率概率条件概率条件概率相对频率与主观概率相对频率与主观概率贝叶斯定理贝叶斯定理随机变量随机变量概率密度函数概率密度函数条件密度函数条件密度函数直方图直方图912/26/202110问题问题()(|)( )P ABP A BP B条件概率条件概率如果如果 A 与与 B 相互相互独立独立,则则从文恩图上得到从文恩图上得到0AB因此因此 ()(|()0)( ) 0 ?( )P ABP A BPBPAAPB1012/26/202111解答解答:概率概率都是条件概率都是条件概率由柯尓莫哥

8、洛夫由柯尓莫哥洛夫公理公理,我们我们定义了概率定义了概率 P(A)。但在实际应用中,我们总是对但在实际应用中,我们总是对 A 相对于许多样本空间的概率相对于许多样本空间的概率感兴趣,而不仅仅只是一个空间。因此,通常以记号感兴趣,而不仅仅只是一个空间。因此,通常以记号(| )P A S来表示所进行的研究是在特定的样本空间来表示所进行的研究是在特定的样本空间 S 中,也就是中,也就是 A 相相对于对于 S 的条件概率。的条件概率。因此因此,所有所有概率在实际应用中都是概率在实际应用中都是条件概率条件概率。只有当只有当 S 的选择是明白无误时,才能简单记为的选择是明白无误时,才能简单记为(| )P

9、A S( )P A1112/26/202112解答解答:互斥互斥与相互独立与相互独立互斥互斥的定义为的定义为ABAB也就是两个事例的定义没有交集。所给出的推论为也就是两个事例的定义没有交集。所给出的推论为0()( )( )ABP ABP AP B相互独立相互独立的定义为的定义为 ()( ) ( ) P ABP A P BAB如果则与相互独立。因此因此,根据根据定义两个相互独立的事例不意味着是互斥的。前定义两个相互独立的事例不意味着是互斥的。前面的问题属于把两者定义混淆了。面的问题属于把两者定义混淆了。1212/26/202113证明证明举例举例:事例事例与逆事例与逆事例如果 A 是在 S 中的

10、任意一个事例,则( ) 1( )P AP A证明:由于 A 与 根据定义是互斥的,并且从文恩图得到AAAS因此可以写出( )( )()( )1P AP AP AAP S( ) 1( )P AP A1312/26/202114举例举例:检查检查给定概率的合理性给定概率的合理性如果一个实验有三种可能并且互斥的结果 A,B 和 C ,检查下列各种情况给出的概率值是否是合理的:1) ( )1/3, ( )1/3, ( )1/32) ( )0.64, ( )0.38, ( )0.023) ( )0.35, ( )0.52, ( )0.264) ( )0.57, ( )0.24, ( )0.19P AP

11、BP CP AP BP CP AP BP CP AP BP C 结论结论:只有只有1)与)与4)是合理的。)是合理的。评论评论:作为作为一个合格的实验研究一个合格的实验研究人员人员,一定一定要具备判断要具备判断 结果是否合理的能力结果是否合理的能力!1412/26/202115举例举例:检查检查经验概率密度函数经验概率密度函数221) ( ) 1,2,3,422) ( ) 0,1,2,3,425xf xxxh xx对于对于实验上经常经验性地从直方图中给出概率密度函数(例如通过拟合直方图分布等等),但是需要确定得到的函数是否满足概率密度函数的定义,例如试判断哪一个可以用作概率密度函数?答案:1)

12、有负概率值;2)累积函数值大于1。因此,两者在给定的随机变量范围内都不能用作概率密度函数。1512/26/202116数据分析中的问题数据分析中的问题粒子与核物理实验中对动量的测量通常是分别测量粒子与核物理实验中对动量的测量通常是分别测量xypzp在已知两分量测量值的概率密度函数情况在已知两分量测量值的概率密度函数情况下下,总总动量为动量为如何导出总动量的测量值的概率密度函数如何导出总动量的测量值的概率密度函数?22xyzppp(,)xyzf pp( )g p是研究随机变量函数的是研究随机变量函数的p.d.f问题。问题。1612/26/202117一维随机变量的函数一维随机变量的函数随机变量的

13、函数自身也是一个随机变量。随机变量的函数自身也是一个随机变量。假设假设 x 服从服从 p.d.f. f (x),对于对于函数函数 a(x),其其p.d.f. g(a)为何为何?()( )( )( )( )( ) ,( )()()( )( ( )dSx a dax adxx adadax ag a daf x dxdSaa adaxg a daf x dxf x dxdxg af x ada 在在内内的的 空空间间范范围围cos:与例如1712/26/202118函数的逆不唯一情况函数的逆不唯一情况假如假如 a(x) 的逆不的逆不唯一唯一,则则函数的函数的 p.d.f. 应将应将 dS 中对应于

14、中对应于 da 的所有的所有 dx 的区间包括进来的区间包括进来2:, , 2( )( ),22()()( )22dSdaaxxadxag a daf x dxdadadSaaaaaafafag aaa 例例如如1812/26/202119多维随机变量的函数多维随机变量的函数考虑随机矢量考虑随机矢量 与函数与函数 ,对应的,对应的 p.d.f.),.,(1nxxx )(xa如果两个独立变量如果两个独立变量 x 与与 y,分别分别按按 g(x) 与与 h(y)分布分布,那么函那么函数数 z = xy 应具有何种形式应具有何种形式?( , )( ) ( )f x yg x h y ()/| |/|

15、 |( )( , )( ) ( )( )( )dSdSz dzxz xf z dzf x y dxdyg x h y dxdyg x dxh y dy 19多维随机变量的函数多维随机变量的函数(续一续一)12/26/202120( )( ) ()() ( )|zdxzdyf zg x hgh yxxyyfgh记作记作 g 与与 h 的的Mellin卷积卷积如果函数为如果函数为 z = x+y ,则则应具有何种形式应具有何种形式?( )( ) ()() ( )f zg x h zx dxg zy h y dyfgh记作记作 g 与与 h 的傅立叶卷积的傅立叶卷积注意注意:通常通常将两者皆称为将两

16、者皆称为 g 与与 h 的的卷积卷积,已已相同记号表示。相同记号表示。20多维随机变量的函数多维随机变量的函数(续二续二)2112/26/202122期待值期待值考虑具有考虑具有 p.d.f. 的随机变量的随机变量 ,定义,定义期待期待(平均平均)值为值为 )(xfxdxxfxxE)(注意注意: 它不是它不是 的函数,而是的函数,而是 的一个参数。的一个参数。x)(xf通常记通常记为为:xE对对离散型离散型变量变量,有有niiixPxxE1)(对具有对具有 p.d.f. 的函数的函数 ,有,有)(xy)(ygdxxfxydyyygyE)()()(方差方差定义为定义为222)(xExExExV通

17、常记通常记为为:2xV标准偏差标准偏差:22212/26/202123协方差与相关系数协方差与相关系数定义定义协方差协方差 (也可用矩阵表示也可用矩阵表示 )为为 ,covyxxyVyxyxxyEyxEyx)(,cov相关系数相关系数定义为定义为 11 ,covxyyxxyyx如果如果 x,y 独立独立,即即 )()(),(yfxfyxfyx则则 0,covyx2312/26/202124举例举例:样本平均值样本平均值假设实验上研究一核素衰变寿命,在探测效率为100%的情况下,每次探测到的寿命为 ti,一共测量了 n 次,求平均寿命(也就是寿命的期待值)。根据离散型期待值的定义1 ( )nii

18、iE tt P t问题的关键是 ti 的概率密度函数是什么?根据概率的相对频率定义,在 n 次测量中出现 ti 频率为一次1( )iP tn因此,期待值(或平均寿命)为1111 nniiiiE tttnn思考:如果频率为 mi 次,结果会不同吗?2412/26/202125误差传递误差传递),.,(1nxxx 假设假设 服从某一联合服从某一联合 p.d.f. ,我们也许并不,我们也许并不全部知道该函数形式全部知道该函数形式 ,但假设我们有协方差,但假设我们有协方差)(xf,covjiijxxV 和平均值和平均值 xE现考虑一函数现考虑一函数 ,方差,方差 是什么?是什么? )(xy22)(yE

19、yEyV将将 在在 附近按附近按泰勒展开泰勒展开到第一级到第一级)(xy)()()(1iixniixxyyxy然后,计算然后,计算 与与 yE2yE2512/26/202126误差传递误差传递(续一续一)由于由于0iixE所以利用泰勒展开式可求所以利用泰勒展开式可求)()(yxyEijxnjijinjjjxjniiixiiixniiVxyxyyxxyxxyExExyyyxyE1,211122)()()()(2)()(2612/26/202127误差传递误差传递(续二续二)两项合起来给出两项合起来给出 的方差的方差)(xy2,1 nyiji jijxyyV yVxx如果如果 之间是无关之间是无关

20、的的,则则 ,那么上式变为那么上式变为ixijiijV22221 nyiiixyV yx类似类似地地,对于对于 组函数组函数m)(),.,()(1xyxyxym2712/26/202128误差传递误差传递(续三续三)ijxnjijliklkklVxyxyyyU1,cov或者记为矩阵形式或者记为矩阵形式xjiijTxyAAVAU ,)(xy注意注意:上上式只对式只对 为线性时是精确为线性时是精确的的,近似近似程度在函数非程度在函数非线性区变化比线性区变化比 要大时遭到很大的破坏。另外要大时遭到很大的破坏。另外,上式并不需上式并不需要知道要知道 的的 p.d.f. 具体形式具体形式,例如例如,它可

21、以不是高斯的。它可以不是高斯的。iix2812/26/202129误差传递的一些特殊情况误差传递的一些特殊情况,cov2212221221xxxxyy2121222221212221,cov2xxxxxxyxxyy注意在相关的情况注意在相关的情况下下,最终最终的误差会有很大的改变的误差会有很大的改变,例如当例如当1 ,10 ,212121xxy0 , 0211 , 0 :14 . 1 , 211 , 0 :022212221yyyVyEyVyE这种特征有时候是有益这种特征有时候是有益的的:将将公共的或难以估计的公共的或难以估计的误差误差,通通过过适当的数学处理将它们消掉适当的数学处理将它们消掉

22、,达到减小误差的目的。达到减小误差的目的。2912/26/202130坐标变换下的误差矩阵坐标变换下的误差矩阵实验上经常通过测量粒子在探测器中各点的击中坐标实验上经常通过测量粒子在探测器中各点的击中坐标(x, y)来拟合在极坐标下的径迹来拟合在极坐标下的径迹(r, )。通常情况。通常情况下下, (x, y)的的测量是不关联的。测量是不关联的。222tan/rxyy x ( , )( , )TU rAV x y A 由于由于因此因此,坐标变换坐标变换后的误差矩阵为后的误差矩阵为2222222222222222222222()0cov( , )101cov( , )()()xyyxxryyxxyx

23、yxyxyxyrrrrrryxyxrxyryxrrrrrr 3012/26/202131大亚湾反应堆中微子实验大亚湾反应堆中微子实验3112/26/2021321r2r1S2S反应堆中微子反应堆中微子反应堆能产生大量反电子型中微子3 GW 热功率反应堆206 10个反电子中微子/秒中微子几乎无损穿透物质假设产生的中微子以球面波传播,那么在任一地方任一给定面元的中微子流强为24rSIIrenpe 3212/26/202133大亚湾中微子振荡大亚湾中微子振荡中微子振荡中微子在运动过程中自己不断改变形态测量中微子形态随运动距离的改变1214rSIIr2224rSIIr中微子形态随运动距离的改变理论预

24、言2132()4(,sin)4reeSII PrSI fmr 截面效率3312/26/202134如何保证如何保证1%精度精度?测量中微子振荡的影响2112rIII方案 :方案 :那一种方案更易实现那一种方案更易实现1%精度的测量精度的测量?为什么为什么?132(,sin)4rSII fmr 截面效率3412/26/202135不同坐标系下相关性的变化不同坐标系下相关性的变化通过转动通过转动坐标坐标,随机变量随机变量的相关性会发生改变。的相关性会发生改变。xyx y 显然显然,通过通过将坐标系转动将坐标系转动 450,上面的相关性在新坐标系下消上面的相关性在新坐标系下消失。失。35随机变量作正

25、则变换去除相关性随机变量作正则变换去除相关性12/26/202136对应的协方差矩阵为对应的协方差矩阵为11,1,1cov,cov,cov,ijijnnikkjllkknikjlklk lnTikklljk lUyyA xA xA AxxA V A ,1cov,klklnkliji jijxUyyyyVxx 非线性情况非线性情况1niijjjyA x 假设有假设有 n 个随机变量个随机变量 x1,xn 以及协方差矩阵以及协方差矩阵Vij=covxi, xj,可以证明有可能通过可以证明有可能通过线性变换线性变换重新定义重新定义 n 个新的变量个新的变量 y1,yn 使得对应的协方差矩阵使得对应的协方差矩阵Uij=covyi, yj非对角元为零。令非对角元为零。令3612/26/202137变换后的变量协方差矩阵对角化变换后的变量协方差矩阵对角化为了使协方差矩阵为了使协方差矩阵 U 对角化对角化TUAVA 11 nniTjTikikijjijiijjkjjikjjArArA Ar rrr ,可先确定协

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论