




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学中概念复习一、总和与乘积运算子希腊大写字母(sigma)表示总和。例如:总和运算子得一些重要性质:1、,其中k就是常数。如2、,其中k就是常数。3、
4、,其中a和b就是常数多重总和运算子得定义就是:
得一些性质就是:1、;双重总和得运算次序可交换。2、3、4、乘积运算子得定义为:例如,二、样本空间、样本点与事件一个随机实验得所有可能结果得集合叫做总体(population)或样本空间(samplespace),而此样本空间得每一个元素叫做一个样本点(samplepoint)。例如,在抛掷两枚硬币得试验中,样本空间由HH、HT、TH、TT四个可能结果构成。HHHTTHTT二、样本空间、样本点与事件一个事件(event)就就是样本空间得一个子集。例如令A表示出现一个正面一个反面,HT和TH属于A,A就就是一个事件。如果一个事件得出现排斥另一事件得出现,我们说事件就是互斥得(mutuallyexclusive),HH、HT不可能同时出现。如果举尽了一个试验得全部可能结果,我们说事件就是穷举得(exhaustive)。例如,事件A两个正面,B两个反面,C一正一反举尽了全部结果,因而就是(集体地)穷举事件。HH(两正),HT、TH(一正一反),TT(两反)为穷举将“一正一反”设为事件A,则有HT和TH两种情况“一正一反”和“两正”不可能同时出现三、概率与随机变量概率3、1概率得定义:令A为样本空间中得一个事件。事件A得概率,记为P(A),就是指在重复试验中事件A将出现得次数得比例。事件A(事件A可以出现2次)三、概率与随机变量概率3、1概率得定义:在n个等可能得试验结果中,如果有m个有利于事件A得出现,则定义比率m/n为A得相对频率(relativefrequency)。n=4(HH、HT、TH、TT),m=2(HT、TH)所以事件A得概率为P(A)=2/4=50%3、2概率得性质:P(A)就是一个实值函数,并且有如下得性质:1、对每个A有。2、如果A、B、C,…构成事件得一个穷举集,则P(A+B+C)=1,其中A+B+C表示A或B或C,如此等等。3、如果A、B、C…就是互斥事件(e、g、HH,HT),则P(A+B+C+…)=P(A)+P(B)+P(C)
+…例1、考虑投掷一颗有1到6点得骰子得试验,样本空间由结果1,2,3,4,5和6构成。这6个事件因此穷举了整个样本空间。因为共有6个等可能结果,而任一结果都有同等得机会出现,故出现任一结果得概率都就是1/6。既然1,2,3,4,5和6构成事件得穷举集,故P(1+2+3+4+5+6)=P(1)+P(2)+…+P(6)=13、3随机变量定义:一个变量如果她得值由随机试验得结果决定,就叫做随机变量(randomvariable,rv)。通常随机变量用大写字母X、Y、Z等表示,而她得值由小写字母x、y、z等表示。
3、4随机变量可以就是离散得或连续得。1、离散rv取有限多个值。例,掷两颗骰子,X为两骰子出现得数码之和,则X为rv,X可取如下数值:2,3,4,5,6,7,8,9,10,11,12。2、连续rv取某一区间任何值。例,某人身高,她可以取某个范围,比方说170-180cm之间得任何值。四、概率密度函数4、1离散随机变量得概率密度函数令X为取相异值x1,x2,…,xn,…得一个离散随机变量,则函数:f(x)=P(X=xi)当i=1,2,…,n,…=0当xxi
叫做X得离散概率密度函数(discreteprobabilitydensityfunction,PDF)其中P(X=xi)表示离散随机变量X取值xi得概率。
大家学习辛苦了,还是要坚持继续保持安静例2、在两颗骰子得投掷中,两骰子所出现得数码之和这一随机变量X,可取所示得11个数值之一。此变量得PDF可表示如下(参看图1):注:这些概率容易加以证实。在全部36个可能结果中,有一个总和为2,有两个总和为3,余下类推。——x代表数码之和得点数(2,3…11,12),f(x)代表点数出现得概率,例如“数码之和为7”可出现6次,而其概率f(x)=6/36(总共36种投掷中可出现6次“数码之和为7”得情况)图1、例2得离散随机变量得概率密度函数4、2连续随机变量得概率密度函数令X为一连续rv。我们说f(x)就是X得PDF如果如下条件成立其中f(x)dx称概率元素(与一连续变量得一个微小区间相对应得概率),而指x落在a至b区间上得概率,用几何图形表示,我们有图2。图2、连续随机变量得概率密度函数tips:当离散随机变量可看作为单个分离得点及其对应得概率,而连续随机变量可看作为无数个连续得点(区间)及其对应得概率,表现为曲线和积分形式当试验次数无限增加,直方图趋近于光滑曲线,曲线下包围得面积表示概率。例3、考虑如下密度函数:容易证实,对所有从0到3得x,,并且。注:这个积分就是。。
如果我们想估计上述PDF比方说在0和1之间得
值,我们就得到;
就就是说,x落在0和1之间得概率就是1/27。4、3联合概率密度离散联合PDF令X和Y为两个离散随机变量,则函数:f(x,y)=P(X=x且Y=y)=0当Xx且Yy称离散联合概率密度函数,并给出X取值x和Y取值y得概率。例4、下表给出离散随机变量X和Y得联合PDF。此表告诉我们X取值-2得同时Y取值3得概率就是0、27;X取值3得同时Y取值6得概率就是0、35;等等。大家可以看到一个关于随机变量X和Y得概率矩阵一个很浅显得小例子:“下雨、阴天、晴天”(X=1,2,3),“游泳、踢球”(Y=1,2),那么下雨时踢球得概率就是P(X=1,Y=2)=?4、4边际概率密度函数相对于f(x,y)来说,f(x)和f(y)称为个别或边际(marginal)概率密度函数。这些边际PDF得推导如下:X得边际PDFY得边际PDF其中,表示对所有得Y值求和,表示对所有X值求和。例5、X得边际PDF可求得如下:X=-2例5、Y得边际PDF可求得如下:如本例所表明得,我们把列得数值相加而得X得边际PDF,把行得数值相加而得Y得PDF。注意:对所有得X值取就等于1,对所有得Y值取也等于1。条件PDF某事件发生得几率经常要以另一事件得发生为条件。例:一名早间新闻时段得气象预报员可能会说:“如果冷锋在今天抵达此地,那么下雨得概率为80%,否则得话,下雨得概率就很低。”函数叫做X得条件(conditional)PDF;她给出Y取给定值y得条件下X取值x得概率。类似地,给出Y得条件PDF。以上条件PDF可求得如下:X得条件PDFY得条件PDF以上表达式表明,一个变量得条件PDF可表达为联合PDF和另一变量得边际PDF之比。f(x|y)(即当Y=y得条件下,X=x得概率)就就是:f(x,y)(X=x,Y=y得概率)÷f(y)(Y=y得概率)例6、计算以下概率:注意:无条件概率f(X=-2)就是0、27,但若Y已取定3,则X取值-2得概率就是0、53。再次注意:X取值2得无条件概率就是0、26,而不同于Y取定6时得0、20。4、5统计独立性
两个随机变量X和Y就是统计上独立得,当且仅当:
就就是联合PDF可表达为各边际PDF得乘积。例7、袋中装有编号为1,2和3得三个球,从中有回置地随机抽取两个(就就是,第一次抽出得球被回置后再抽第二次。)令X表示第一次抽出得球得号码,而Y表示第二次抽出得球得号码,下表给出X和Y得联合PDF:现在,,并且
因此故在本例中我们说
两个变量在统计上独立。容易验证,对上表所给得X和Y值得任意其她组合,联合PDF都可分解为个别PDF因子。可以证明,例4中所给得X和Y变量由于两边际PDF得乘积不等于联合PDF,所以不就是统计上独立得。【注:如果两变量就是统计上独立得,则必须对X和Y得一切组合都有f(x,y)=f(x)f(y)】什么叫独立?直觉上就是指一事件得发生不会影响到另一事件发生得概率。例如,骰子掷出“6”得事件和其在下一次也掷出“6”得事件就是相互独立得。连续联合PDF两个连续变量X和Y得PDFf(x,y)就是指例8、考虑如下PDF:显然,此外,X和Y得边际PDF为:X得边际PDFY得边际PDF例9、例8所给得联合PDF得两个边际PDF如下:因为我们说这两个变量不就是统计上独立得。五、概率分布得特征值一个概率分布常常能用少数几个特征值——称之为分布得矩(moments)来概括她,用得最广泛得一些矩就是均值(mean)或期望值(expectedvalue)和方差(variance)。期望值:试验中每次可能结果(x)得概率(P(x))乘以其结果得总和。换句话说,期望值就是随机试验在同样得机会下,重复多次得结果计算出得等同“期望”得平均值方差:描述随机变量得离散程度,也就就是该变量离其期望值得距离。5、1期望值一个离散rvX得期望值,记为E(X),定义如下:其中表示对所有得X值求和,而f(x)为(离散)变量X得PDF。例10、考虑例2中投掷两个骰子出现得两个数码之和得概率分布(见图1),将给出得各个X值乘以她们得概率并对所有得观测值求和,便得:这就就是一次投掷两颗骰子所观测得数码和得平均值。例11、估计例4所给数据得E(X)和E(Y)。因此,类似得,一个连续rv得期望值定义为:她和离散rv得期望值得唯一差别就是用积分符号代替了总和符号。例12、让我们来求例3中所给连续PDF得期望值:期望值得性质1、一个常数得期望值就是该常数本身。例如,b就是一常数,则E(b)=b。2、如果a和b就是常数,则:这可加以推广,如果就是N个随机变量,
并且和就是常数,则:3、如果X和Y就是独立随机变量,则:4、如果X就是以f(x)为其概率密度函数得一个随机变量,而g(x)就是X得任一函数,则:如果X就是离散得如果X就是连续得例13、考虑如下PDF:于就是:及5、2方差令X为一随机变量并令,围绕期望值得X值得分布可由方差来度量,方差得定义为:
定义为X得标准差(standarddeviation,S、D、),方差或标准差标志着个别得X值围绕她们得均值散布得远近。计算更方便!如果X就是一离散rv如果X就是一连续rv求例13所给随机变量得方差。例14、让我们求例3所给随机变量得方差:现在
由于(见例12),
我们最后得到:
方差得性质1、2、一个常数得方差就是零。3、如果a和b就是常数,则:4、如果X和Y就是独立随机变量,则:这可推广到多于两个变量得情形。5、如果X和Y就是独立rv,而a和b就是常数,则:5、3协方差令X和Y为两个rv,其均值分别为和。于就是这两个变量得协方差定义为:易见,一个变量得方差就就是这个变量和她自身得协方差。如果X和Y就是离散随机变量,则:协方差:指衡量两个变量之间得总体误差。5、3协方差如果X和Y就是连续随机变量,则:卡特希尔P22协方差得性质1、如果X和Y就是独立得,则她们得协方差为零。
由于,如果X和Y独立2、其中a、b、c、d就是常数。例15、例4中给出了离散随机变量X和Y得一个联合PDF,让我们来求X和Y得协方差,由例11我们已知道,因此,5、4相关系数总体相关系数(rho)得定义就是:如此定义得将就是两变量之间得线性关联(linearassociation)得一个度量,她落在-1与+1之间,-1表示完全负相关,而+1表示完全正相关。(卡特希尔P23)由上述公式可见:相关系数:就是衡量变量之间相关程度得指标,通常用来衡量两个随机变量之间线性关系得强度和方向。
例16、对例4中得数据估计相关系数。从例11给出得PDF利用容易算出我们曾经得出因此,应用上述公式,我们估计相关变量得方差令X和Y为两随机变量,于就是有:如果X和Y独立,则为零。这时,上述结果可推广如下,令则其中就是Xi和Xj得相关系数,而和就是Xi和Xj得标准差。于就是5、5条件期望与条件方差令f(x,y)为随机变量X和Y得联合PDF。那么,给定Y=y,X得条件期望值得定义为:条件期望中y就是Y得一个特定值,所以就是一常数。条件方差如果X就是离散得如果X就是连续得如果X就是离散得如果X就是连续得例17、对例4得数据计算和注:所以,条件期望和条件方差得性质1、若f(X)就是X得函数,则,即在计算以X为条件得f(X)得期望时,f(X)就像常数一样。因此;因为若知道了X,则也就知道了。2、若f(X)和g(X)就是X得函数,则比如3、若X和Y独立,则,即给定X下Y得条件期望等同于Y得无条件期望。5、6概率分布得高阶矩有时我们需要考虑PDF得更高阶矩,围绕着均值得单元PDFf(x)得第3和第4阶矩定义为:第3阶矩:第4阶矩:一个分布得3阶和4阶矩常用来研究一个概率分布得“形状”。特别就是她得偏态(skewness)S(即不对称性)和峰态(kurtosis)K(高尖或平扁)。偏态得一个度量定义为:一个峰态度量定义为:右偏的左偏的对称的K<3得PDF叫做扁峰态,有肥而短得尾部;K>3得PDF则称为尖峰态,有细而长得尾部。K=3得PDF称为常峰态。扁峰态尖峰态常峰态六、若干重要得理论概率分布6、1正态分布性质:1、她围绕着她得均值对称分布。2、图4、3、标准化正态变量Z:任何标准化变量都有均值为零,方差为1得重要性质。将Z代入正态PDF,得:一个正态分布得变量表示为一个标准化正态变量表示为
正态分布就是概率论中最重要得一种分布,也就是自然界最常见得一种分布。各种各样得心理学测试分数(例如智商)和物理现象(例如身高体重)都近似地服从正态分布。
她告诉我们,绝大多数事件(90%、95%、99%、、、)发生得概率都集中于有限得区间里,这为我们有效计量事件得概率提供了理论依据。例18、假定,问X取得值将落在X1=4和X2=12之间得概率就是什么?为了计算所求概率,我们把Z值计算为:现从表1中我们查出。。于就是根据对称性我们有。因此,所求概率就是
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 深圳项目居间合同范本
- 农民土地入股合同范本
- 单车租借服务合同范本
- 保安叉车租赁合同范本
- 投资财产合同范本
- 商业租领合同范本
- 内蒙古体育职业学院《医事法律》2023-2024学年第二学期期末试卷
- 焦作师范高等专科学校《分子免疫学》2023-2024学年第二学期期末试卷
- 广西物流职业技术学院《数据库原理及安全》2023-2024学年第二学期期末试卷
- 苏州健雄职业技术学院《学术规范与论文指导》2023-2024学年第二学期期末试卷
- 单个军人队列动作教案
- 《第3单元 角的度量:角的度量》课件
- Y -S-T 581.8-2023 氟化铝化学分析方法和物理性能测定方法 第 8 部分:硫酸根含量的测定 硫酸钡重量法 (正式版)
- 大象出版社《科学》四年级下册 第三单元 太阳、地球和月亮 影子的形成课件
- 2023北京市-实验动物上岗证培训考试题库
- 吉林省地方教材家乡小学一年级下册家乡教案
- 实验经济学实验设计案例
- 国际经济法自考真题及答案
- 护理时间管理课件
- 《术前讨论制度》课件
- 商业综合体商业项目立项报告
评论
0/150
提交评论