




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
概率及统计知识回顾第1页,课件共56页,创作于2023年2月2事件概率的计算1.古典概率等可能性P(A)=m/n2.统计概率P(A)≈m/n3.主观概率第2页,课件共56页,创作于2023年2月3随机变量及分布离散型随机变量的概率分布(一)概率分布——分布列例:打靶规定打中域Ⅰ得3分,打中域Ⅱ得2分,打中域Ⅲ得1分,域外得0分。一射手每100次射击,平均有30次中域Ⅰ,55次中域Ⅱ,10次中域Ⅲ。该射手射击得分的概率分布为:0.5520.1010.0500.30P(X)3X第3页,课件共56页,创作于2023年2月4(二)离散型随机变量的数学期望值和方差1.期望值(Expectedvalue)
X
0123
P(X)
0.050.100.550.30该射手得分的数学期望值是:E(X)=0×0.05+1×0.10+2×0.55+3×0.30=2.10分2.方差第4页,课件共56页,创作于2023年2月5连续型随机变量的概率分布X、P(x)第5页,课件共56页,创作于2023年2月6连续型随机变量的特征值第6页,课件共56页,创作于2023年2月7数学期望值和方差的数学性质第7页,课件共56页,创作于2023年2月8某地电信局每月固定收取每部电话16元,市内电话每分钟收费0.1元。已知某集团用户电话每月使用时间的标准差为80分钟,试计算该集团用户每月话费的标准差。第8页,课件共56页,创作于2023年2月9正态分布
NormalDistribution1. 钟型,对称2. 随机变量值域无限。均值Meanxf(x)了解正态分布的特征掌握与正态分布有关的概率计算第9页,课件共56页,创作于2023年2月10正态分布概率密度函数f(x):随机变量x的概率密度函数x:随机变量的值(-<X<)=3.14159;e=2.71828:总体的均值σ:总体的标准差第10页,课件共56页,创作于2023年2月11参数变化(和)对分布图形的影响Xf(X)CAB第11页,课件共56页,创作于2023年2月12正态分布概率连续概率分布是对密度函数曲线以下面积的积分!cdXf(X)PcXdfXdxcd()()?第12页,课件共56页,创作于2023年2月13Z=0z=1Z正态分布的标准化正态分布标准正态分布X第13页,课件共56页,创作于2023年2月14计算(1)P(z<1.96)(2)P(z>1.5)(3)P(z<-2)(4)P(z>-1)(5)P(-2.33<z<2.33)第14页,课件共56页,创作于2023年2月15例题某地区家庭人均月收入是服从μ=1000元,σ=200的正态分布随机变量。求该地区人均月收入:(1)超过1200元的概率;(2)低于700元的概率;(3)在900—1100元之间的概率。第15页,课件共56页,创作于2023年2月16例:某年A省理科考生的高考成绩服从平均分=500分,标准差=100分的正态分布,求:
(1)考生的考分低于500分的概率;
(2)设考生的考分为X,问X为何值才能使75%的
考生的考分低于这一值?
(3)问X为何值才能使90%的考生的考分高于这
一值?第16页,课件共56页,创作于2023年2月17用标准差判断概率在均值±1个标准差(1x)之间取值的概率为68.27%在均值±2个标准差(2x)之间取值的概率为95.45%
在均值±3个标准差(3x)之间取值的概率为99.73%
第17页,课件共56页,创作于2023年2月18一、总体和样本总体(Population):所要研究对象的全体。样本(Sampling):为推断总体的某些特征,从总体中抽取的若干个体(Itemunit)。抽样估计的基本概念二、参数和统计量参数——总体统计量——样本第18页,课件共56页,创作于2023年2月19关键术语参数(Parameter)样本统计量(SamplingStatistic)抽样分布(Samplingdistribution)第19页,课件共56页,创作于2023年2月20抽样分布抽样分布——样本统计量的概率分布样本平均数的分布特征一、样本平均数的平均数等于总体平均数第20页,课件共56页,创作于2023年2月21二、样本平均数的方差等于总体方差的1/n。第21页,课件共56页,创作于2023年2月22样本平均数的标准差:反映的是样本平均数与其数学期望值(又即总体平均数)的平均误差程度,故可称为抽样平均误差、抽样标准误。影响抽样平均误差的因素?第22页,课件共56页,创作于2023年2月23抽样分布定理一、正态分布的再生定理当总体服从正态分布时(数学期望值与方差已知),样本平均数也服从正态分布。第23页,课件共56页,创作于2023年2月24第24页,课件共56页,创作于2023年2月25二、中心极限定理第25页,课件共56页,创作于2023年2月26中心极限定理
CentralLimitTheorem(CLT)如果样本容量足够大(n
30)...抽样分布近乎服从正态分布第26页,课件共56页,创作于2023年2月27点估计与区间估计点估计—根据样本资料得到参数的一个估计值。
抽样估计的基本方法第27页,课件共56页,创作于2023年2月281、无偏性:(Unbiasedness)优良估计量的标准第28页,课件共56页,创作于2023年2月29优良估计量的标准2、有效性:
(Efficiency)第29页,课件共56页,创作于2023年2月30优良估计量的标准3、一致性:
(Consistency)第30页,课件共56页,创作于2023年2月31置信标准(置信度):-zz第31页,课件共56页,创作于2023年2月32总体参数的区间估计
(Intervalestimate)正态总体,方差已知第32页,课件共56页,创作于2023年2月习题通常人类的智商呈正态分布,方差为225。现随机抽样64人调查,计算样本的平均智商为102。试以95.45%的概率,估计总体智商均值的置信区间。33第33页,课件共56页,创作于2023年2月34总体均值的置信区间为即为[102-3.75,102+3.75]=[98.25,105.75]因此,研究者有95.45%的把握,确认总体智商的均值在98.25~105.75之间。置信区间第34页,课件共56页,创作于2023年2月35总体参数的区间估计
(Intervalestimate)正态总体,方差已知正态总体,方差未知第35页,课件共56页,创作于2023年2月36均值的区间估计(X
未知)
应用t
分布
-tt0第36页,课件共56页,创作于2023年2月37结论:第37页,课件共56页,创作于2023年2月38Zt0t(df=5)标准正态分布
t(df=13)钟形对称尾部较大(1)t分布关于x=0对称。(2)当样本容量很大时,接近正态分布(3)E(X)=0,Var(X)=n/(n-2)第38页,课件共56页,创作于2023年2月39自由度(df)
DegreesofFreedom(df)1. 当样本统计量被计算出以后可以自由取值的观测值数目2. 例如3个数之和是6
X1=1(或其他数)
X2=2(或其他数)
X3=3(不能改变)
Sum=6自由度=n-1
=3-1
=2第39页,课件共56页,创作于2023年2月40例题某大学从该校学生中随机抽取25人,调查到他们平均每天参加体育锻炼的时间为26分钟,样本方差S2=36。试以95%的置信水平估计该大学的学生平均每天参加体育锻炼的时间(假定x~N(μ,σ2))。解:已知n=25,x~N(μ,σ2),σ2未知则样本统计量服从t分布第40页,课件共56页,创作于2023年2月41总体均值的置信区间为即为[26-2.48,26+2.48]=[23.52,28.48]故全校学生平均每天参加体育锻炼的时间在23.52~28.48分钟之间。第41页,课件共56页,创作于2023年2月42假设检验的一般问题一、假设检验的基本思想二、假设检验的步骤三、假设检验中的两类错误第42页,课件共56页,创作于2023年2月43如果总体均值
=4535样本均值不大可能为这个值因此拒绝原假设
=45样本平均年龄45抽样分布一、假设检验的基本思想40第43页,课件共56页,创作于2023年2月44
假设检验的基本思想基于小概率原理的反证法第44页,课件共56页,创作于2023年2月45二、假设检验的步骤1、提出假设,包括原假设和备择假设2、构造相应的检验统计量,确定其分布形式;根据样本数据计算统计量的值;3、确定显著性水平和临界值;4、作出结论。(根据所计算的统计量的值与临界值比较确定是否拒绝原假设)第45页,课件共56页,创作于2023年2月46原假设
TheNullHypothesis1.陈述需要检验的假设
例如:H0:=452.原假设用H0表示3.总是包含等号“=”(比如=,,)4.检验以“假定原假设为真”开始第46页,课件共56页,创作于2023年2月47平均每天看电视时间不是5小时。如何设定假设检验?H0:=5 H1:5第47页,课件共56页,创作于2023年2月48例题(双侧检验)据报导,美国全职教授年薪的数学期望值为68000美元,标准差为5000美元。一个由36名大学全职教授组成的样本表明,平均薪水为70000美元,检验报导的可信性。(显著性水平为0.02)第48页,课件共56页,创作于2023年2月49H0临界值临界值/2/2样本统计量拒绝域拒绝域非拒绝域接受域与拒绝域抽样分布1-置信度第49页,课件共56页,创作于2023年2月50(1)H0:μ=68000H1;μ≠68000(2)检验统计量服从Z分布检验统计量:(3)α=0.02,查正态分布表得:Z=2.33,
接受域为(-2.33,2.33)
结论:拒绝假定。第50页,课件共56页,创作于2023年2月51质检员认为在整个工作流程中平均装盒量符合标准:没有超过368克。随机抽取25盒为样本,均值X=372.5克,标准差s=15克。试在=0.05的条件下进行检验。给出你的结论。368克.例题(单侧检验)第51页,课件共56页,创作于2023年2月52t0拒绝H0t0拒绝H0接受域与拒绝域H0:0H1:<0H0:0H1:>0必须显著低于才会拒绝小的数值与H0不矛盾.,因此不会拒绝H0左侧检验右侧检验第52页,课件共56页,创作于2023年2月53(1)H0:μ≤368
H1;μ>368(2)检验统计量服从t分布检验统计量:(3)α=0.05,查t分布表得
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论