一元回归数学形式-99999统计基础_第1页
一元回归数学形式-99999统计基础_第2页
一元回归数学形式-99999统计基础_第3页
一元回归数学形式-99999统计基础_第4页
一元回归数学形式-99999统计基础_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1统计基础一、随机事件与概率(一)随机事件

有两种以上可能的结果,但在某一次观察中会出现哪一种结果具有不确定性的事件。事件:A、B、C(二)概率:度量随机事件发生的可能性。2事件概率的计算1.古典概率等可能性P(A)=m/n2.统计概率P(A)≈m/n3.主观概率3计数法则乘法原理:如果一个事件的完成要经过K个步骤,每一步骤分别有n1,n2,……,nk种方法则完成该事件共有n1n2…nk种方法。加法原理:如果一个事件的完成有K种方式,每种方式分别有n1,n2,……,nk种方法则完成该事件共有n1+n2+…+nk种方法。4习题计算抛3枚硬币时,如下结果发生的概率:(1)3枚中有1枚出现正面的概率;(2)3枚中至少有1枚出现正面的概率;(3)3枚中第一枚和第二枚都出现正面的概率;(4)3枚都出现反面的概率。5某游乐场设一摇奖装置,内装2个骰子,每个骰子均有6面,每面分别记上1,2,…,6分。(1)若中奖的规则是:摇出的2个骰子分数之和等于或超过10分,问中奖的机会是多大?(2)若中奖的规则改为:摇出的2个骰子的分数必须相等,问中奖的机会多大?6有三扇关着的门,其中一扇门后面放着一辆车。主持人知道车在哪里。假定主持人请你猜哪扇门后面有车。当你选定后,主持人打开另外两扇门当中的一扇空门。然后,问你是否愿意改变你的选择?7随机变量及分布离散型随机变量的概率分布(一)概率分布——分布列例:打靶规定打中域Ⅰ得3分,打中域Ⅱ得2分,打中域Ⅲ得1分,域外得0分。一射手每100次射击,平均有30次中域Ⅰ,55次中域Ⅱ,10次中域Ⅲ。该射手射击得分的概率分布为:0.5520.1010.0500.30P(X)3X8(二)离散型随机变量的数学期望值和方差1.期望值(Expectedvalue)X0123P(X)0.050.100.550.30该射手得分的数学期望值是:E(X)=0×0.05+1×0.10+2×0.55+3×0.30=2.10分2.方差9连续型随机变量的概率分布

X、P(x)10连续型随机变量的特征值11数学期望值和方差的数学性质12某地电信局每月固定收取每部电话16元,市内电话每分钟收费0.1元。已知某集团用户电话每月使用时间的标准差为80分钟,试计算该集团用户每月话费的标准差。13正态分布

NormalDistribution1. 钟型,对称2. 随机变量值域无限。均值Meanxf(x)了解正态分布的特征掌握与正态分布有关的概率计算14正态分布概率密度函数f(x):随机变量x的概率密度函数x:随机变量的值(-<X<)=3.14159;e=2.71828:总体的均值σ:总体的标准差15参数变化(

和)对分布图形的影响Xf(X)CAB16正态分布概率连续概率分布是对密度函数曲线以下面积的积分!cdXf(X)PcXdfXdxcd()()?17Z=0z=1Z正态分布的标准化正态分布标准正态分布X18

计算(1)P(z<1.96)(2)P(z>1.5)(3)P(z<-2)(4)P(z>-1)(5)P(-2.33<z<2.33)19例题某地区家庭人均月收入是服从μ=1000元,σ=200的正态分布随机变量。求该地区人均月收入:(1)超过1200元的概率;(2)低于700元的概率;(3)在900—1100元之间的概率。20例:某年A省理科考生的高考成绩服从平均分=500分,标准差=100分的正态分布,求:

(1)考生的考分低于500分的概率;

(2)设考生的考分为X,问X为何值才能使75%的

考生的考分低于这一值?

(3)问X为何值才能使90%的考生的考分高于这

一值?21用标准差判断概率在均值±1个标准差(1x)之间取值的概率为68.27%在均值±2个标准差(2x)之间取值的概率为95.45%

在均值±3个标准差(3x)之间取值的概率为99.73%

22一、总体和样本总体(Population):所要研究对象的全体。样本(Sampling):为推断总体的某些特征,从总体中抽取的若干个体(Itemunit)。

抽样估计的基本概念二、参数和统计量参数——总体统计量——样本23关键术语参数(Parameter)样本统计量(SamplingStatistic)抽样分布(Samplingdistribution)24抽样分布抽样分布——样本统计量的概率分布样本平均数的分布特征一、样本平均数的平均数等于总体平均数25二、样本平均数的方差等于总体方差的1/n。26样本平均数的标准差:反映的是样本平均数与其数学期望值(又即总体平均数)的平均误差程度,故可称为抽样平均误差、抽样标准误。影响抽样平均误差的因素?27抽样分布定理一、正态分布的再生定理当总体服从正态分布时(数学期望值与方差已知),样本平均数也服从正态分布。2829应用例:会计专业毕业生的年薪平均起点为25000元,假设其年薪服从正态分布,标准差为1000元。样本容量n=100,400时1.简述样本年薪平均起点的抽样分布。2.分别计算样本均值在总体均值左右100元以内的概率是多少在估计总体均值时,大样本的好处是什么?30二、中心极限定理31中心极限定理

CentralLimitTheorem(CLT)如果样本容量足够大(n

30)...抽样分布近乎服从正态分布32习题本期全体“托福”考生的平均成绩为580分,标准差为150分,现在随机抽取100名考生成绩。1.简述样本平均成绩的抽样分布。2.估计样本平均成绩在610分以上的概率是多少?33点估计与区间估计点估计—根据样本资料得到参数的一个估计值。

抽样估计的基本方法341、无偏性:

(Unbiasedness)优良估计量的标准35优良估计量的标准2、有效性:

(Efficiency)36优良估计量的标准3、一致性:

(Consistency)37置信标准(置信度):-zz38总体参数的区间估计

(Intervalestimate)正态总体,方差已知习题通常人类的智商呈正态分布,方差为225。现随机抽样64人调查,计算样本的平均智商为102。试以95.45%的概率,估计总体智商均值的置信区间。3940总体均值的置信区间为即为[102-3.75,102+3.75]=[98.25,105.75]因此,研究者有95.45%的把握,确认总体智商的均值在98.25~105.75之间。置信区间41总体参数的区间估计

(Intervalestimate)正态总体,方差已知正态总体,方差未知42均值的区间估计(X

未知)

应用t

分布

-tt043结论:44Zt0t(df=5)标准正态分布

t(df=13)钟形对称尾部较大(1)t分布关于x=0对称。(2)当样本容量很大时,接近正态分布(3)E(X)=0,Var(X)=n/(n-2)45自由度(df)

DegreesofFreedom(df)1. 当样本统计量被计算出以后可以自由取值的观测值数目2. 例如3个数之和是6

X1=1(或其他数)

X2=2(或其他数)

X3=3(不能改变)

Sum=6自由度=n-1

=3-1

=246例题某大学从该校学生中随机抽取25人,调查到他们平均每天参加体育锻炼的时间为26分钟,样本方差S2=36。试以95%的置信水平估计该大学的学生平均每天参加体育锻炼的时间(假定x~N(μ,σ2))。解:已知n=25,x~N(μ,σ2),σ2未知则样本统计量服从t分布47总体均值的置信区间为即为[26-2.48,26+2.48]=[23.52,28.48]故全校学生平均每天参加体育锻炼的时间在23.52~28.48分钟之间。48假设检验的一般问题一、假设检验的基本思想二、假设检验的步骤三、假设检验中的两类错误49如果总体均值

=4535样本均值不大可能为这个值因此拒绝原假设

=45样本平均年龄45抽样分布一、假设检验的基本思想4050

假设检验的基本思想基于小概率原理的反证法51二、假设检验的步骤1、提出假设,包括原假设和备择假设2、构造相应的检验统计量,确定其分布形式;根据样本数据计算统计量的值;3、确定显著性水平和临界值;4、作出结论。(根据所计算的统计量的值与临界值比较确定是否拒绝原假设)52原假设

TheNullHypothesis1.陈述需要检验的假设

例如:H0:=452.原假设用H0

表示3.总是包含等号“=”(比如=,,)4.检验以“假定原假设为真”开始53平均每天看电视时间不是5小时。如何设定假设检验?H0:=5 H1:554例题(双侧检验)据报导,美国全职教授年薪的数学期望值为68000美元,标准差为5000美元。一个由36名大学全职教授组成的样本表明,平均薪水为70000美元,检验报导的可信性。(显著性水平为0.02)55H0临界值临界值/2/2样本统计量拒绝域拒绝域非拒绝域接受域与拒绝域抽样分布1-置信度56(1)H0:μ=68000H1;μ≠68000(2)检验统计量服从Z分布检验统计量:(3)α=0.02,查正态分布表得:Z=2.33,

接受域为(-2.33,2.33)

结论:拒绝假定。57

质检员认为在整个工作流程中平均装盒量符合标准:没有超过368克。随机抽取25盒为样本,均值X=372.5克,标准差s=15

克。试在=0.05的条件下进行检验。给出你的结论。368克.例题(单侧检验)58t0拒绝H0t0拒绝H0接受域与拒绝域H0:0H1:<0H0:0H1:>0必须显著低于才会拒绝小的数值与H0不矛盾.,因此不会拒绝H0左侧检验右侧检验59(1)H0:μ≤368

H1;μ>368(2)检验统计量服从t分布检验统计量:(3)α=0.05,查t分布表得:t=1.711,

接受域为(-∞,1.711)

结论:接受原假定。60假设检验中的两类错误

检验决策错误第一类错误弃真错误,后果往往较为严重出现第一类错误的概率为

,等于显著性水平第二类错误

存伪错误,出现第二类错误的概率为61检验决策结果实际情况实际情况H0为真H0为假决策H0

为真H0为假

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论