版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、 统计学家视数据为资源,并且试图从数据中看出平常人所看不到的景致来。 .第一讲内容复习统计学的定义、分类;认识数据的第一步:他得到的是什么类型的数据?利用图表展现数据中的信息;运用目的描写数据的某些特征和程度;运用EXCEL来描画数据;.第一讲作业以及案例讨论 .第二讲抽样分布和估计2001年9月22日.统计推断的根本概念总体:有限总体、无限总体;样本;统计推断的义务:经过样本的统计量来了解总体的参数。为什么需求抽样: 1 总体无法得到; 2 时间本钱不允许; 3 实验具有破坏性。.统计推断的根本思想1选用一个概率模型来描写总体,运用样本对模型做出推断;2样本的获取的能够性依赖于他选用的模型;
2、根据这种能够性来分析我们由部分来认识总体所能够犯的错误风险。.统计推断的内容之一估计参数点估计和区间估计点估计的例子 居民家庭年收入 .统计推断内容之二 假设检验:能否可以选用这个模型?例子: 能否可以运用模型N(570,306)来描写一切居民的家庭年收入?思想: 假设该模型是好的,那么 和570相差很多的能够性不能太大。.简单随机抽样有限总体的简单随机抽样:等概率抽样; 有放回抽样:独立性 无放回抽样:非独立性抽样方法:利用随即数表 利用 Excel .随机数表的运用77191 25860 55204 73417 83920 6948676298 26678 89334 33938 9556
3、7 2938057099 10528 09925 89773 41335 9624415987 46962 67342 77592 57651 9550853122 16025 84299 53310 67380 8424937203 64516 51530 37069 40216 64. 无限总体的简单随机抽样:独立性;例子:掷硬币.样本和总体分布例子:薯片一个箱子中有10000包薯片,其中50%标价5元, 30%标价10元, 10%标价15元, 10%标价30元。.点估计的方法估计量统计量;估计值。基于一定的准那么求最好的估计量。 极大似然法那么; 矩估计; 最小二乘估计等.抽样分布样本不
4、同, 值也不同。那么 取不同值的能够性分别是什么? 的概率分布称作它的抽样分布。抽样分布在统计推断中的中心位置。抽样分布取决于总体的分布模型以及抽样的方式。 抽样方式 总体分布= 抽样分布. 样本均值的抽样分布无限总体假设总体服从 , 那么简单随机样本的均值服从正态分布假设样本容量n非常大,而且总体的期望是,方差是2+,那么简单随机样本的均值 近似服从正态分布 中心极限定理.样本比率的抽样分布 无限总体小样本情况 x服从二项式分布B(n,p).大样本情况,按照中心极限定理,近似地 .正态分布的图形.有限总体的修正系数设N是总体中个体的个数,n是样本容量,那么样本均值的方差是:样本比率的方差是:
5、注:假设N相比n大很多,比如n/N5%,可以视为无限总体。 .样本方差的抽样分布假设 是来自正态总体 的一个随机样本,定义样本方差为: .认识卡方分布.方差未知时样本均值的抽样分布正态总体,2未知,运用样本方差s2来替代2,那么样本均值满足:n30时,可以用规范正态分布近似。.正态分布和t 分布的比较.估计的误差不能以个别估计值作为评价准那么;估计的误差: .对估计量的评价无偏性:偏向是零;有效性:方差最小;一致性:样本容量添加会降低估计误差。样本均值比率是对总体均值比率的一个无偏的、有效的、一致的估计量。. 将概率模型引入统计推断中来描写总体,可以使得我们可以丈量和控制由部分样本来推断总体时
6、所犯的错误。 .Estimate PopulationParameter.with SampleStatisticMeanProportionpVariances2Population Parameters Estimated2Difference - 12 x - x 12_. 的抽样分布: 1正态总体 时,. 2非正态总体时,大样本情况n30). S2的抽样分布: 当总体是正态分布时,. 的抽样分布: . 有限总体时样本均值和样本比率的规范误差,有限总体修正系数。.结合食品公司的案例针对“结合食品公司的案例P.44 案例2-1,我们假设调查的100个客户组成一个简单随机样本。尝试回答下面的
7、问题:1一切客户一次购买金额的平均值是多少?2一切运用信誉卡的客户一次购买金额的平均值是多少?3运用信誉卡的客户占的比例是多少?. 1一切客户一次购买金额的平均值是多少?29.4449)2一切运用信誉卡的客户一次购买金额的平均值是多少?40.8768)3运用信誉卡的客户占的比例是多少?0.22).我们的估计值离真值有多远?我们希望经过样本的信息给出一个范围,使这个范围按足够大的概率包含我们所感兴趣的参数。如何寻觅K和L ,使得以95%的概率成立: . 抽样误差:无偏点估计值与总体参数之差的绝对值。.样本均值的抽样分布z-z1-.大样本且知的情况 .了解置信区间的含义 抽取100个样本,计算出1
8、00个平均值和100个区间,它们当中至少有1-*100个包含了未知的总体均值。 因此,可以以(1-)的程度确信落在每一个区间里面。 边沿误差: . Confidence Intervals Intervals Extend from(1 - ) % of Intervals Contain . % Do Not.1 -/2/2X_x_Intervals & Level of ConfidenceSampling Distribution of the Meanto.结合食品公司的例子假设知一切消费者一次购买金额的规范差是22,那么一次购买平均金额的一个95%的置信区间是: 29.44491.9
9、6*(22/10)或者25.1329, 33.7569),其中边沿误差=4.312.问题:对这个区间的含义他知道了什么? 怎样能够知道 规范差?.大样本且未知的情形.结合食品公司的例子一切顾客一次购买金额的平均值的95%的置信区间: 29.44491.96*(20.4162/10)或者 (25.44333, 33.44506)问题:对运用信誉卡的顾客一次购买金额的平均值能否类似进展区间估计?.小样本且未知的情形 .结合食品公司的例子一切持信誉卡的顾客一次购买金额的平均值的95%的置信区间是:问题:1他获得上述结论时对总体作了什么假定?能否合理? 2如何运用EXCEL处理该问题?.小样本且知的情
10、形 他本人可以处理这一问题吗?.大样本下总体比率p的区间估计 .结合食品公司的例子运用信誉卡支付的顾客的比率的95%的置信区间是多少?问题:能否符合大样本的条件?进一步的问题:假设嫌精度不够怎麽办?.Data Variation Sample Size nLevel of Confidence (1 - ) Intervals Extend ?1984-1994 T/Maker Co.影响区间长度的要素 .90% Samples95% Samplesx_Confidence Intervals99% SamplesX_.样本容量确实定1给定边沿误差E和置信系数1-,问题是:确定样本容量n使得总
11、体均值比率的1- 程度的置信区间长度不超越2E?该问题有什么实践意义? .样本容量确实定2怎样获得? 1用以前一样或类似的样本的样本规范差替代; 2用实验调查的方法选择初始样本,用该样本的样本规范差替代; 3对进展判别或者猜测:比如全距的1/4作为估计。为什么用正态分布的/2分位数而不用t分布?.样本容量确实定3对于总体比率来说:如何确定p? 1类似对确实定方法; 2运用p=0.5,此时p(1-p)最大,从而高估样本容量。 .结合食品公司的例子为使得一切顾客一次购买金额的平均值的95%的置信区间长度不超出6美圆,需至少采用多大的样本? E=? =? (全距=77.07) n=(1.96*77.
12、07/4)2/9=158.46159.结合食品公司的例子为了使得对持信誉卡购买的顾客比率p的95%的置信区间长度不超越0.2,样本至少多大?E=?P=? N=(1.96)2*0.5*0.5/0.12=96.0497.区间估计内容小结置信区间的含义;从抽样分布求置信区间;给定精度,确定样本大小。.Mean, , is unknownPopulationRandom SampleI am 95% confident that is between 40 & 60.Mean = 50Estimation ProcessSample.对总体模型的推断另一种方式:假设检验参数估计的思绪:选择一个适宜的模
13、型;假设检验的思绪:检验一个给定的模型。.PopulationAssume thepopulationmean age is 50.(Null Hypothesis)REJECTThe SampleMean Is 20SampleNull HypothesisHypothesis Testing ProcessNo, not likely!.从一个例子看假设检验的思绪摸球实验:有放回地在一个袋子中延续摸6次,都是红球,他能否接受“袋子中一半是红球一半是白球的说法?为什么?假设我接受他的说法假设,那么我看到的景象样本出现的能够性是多少?假设这种能够性太小,会是什么情况?.假设检验的根本概念H0:
14、 一半红球一半白球。 或者p=0.5);H1:红球白球不是各一半。或者p不是0.5。原假设;备择假设;选择的态度:回绝?接受? (To be or not to be,)更多的例子,简单假设和复合假设:.回绝域回绝域:哪些样本出现后,他会回绝原假设?他建立他的回绝域的根据是什么?抽样分布。所谓检验就是选择一个回绝域。为什么这是一个问题?.他会犯什么错误?.H0: InnocentJury TrialHypothesis TestActual SituationActual SituationVerdictInnocentGuiltyDecisionH0 TrueH0 FalseInnocent
15、CorrectErrorDo NotRejectH01 - aType IIError (b)GuiltyErrorCorrectRejectH0Type IError(a)Power(1 - b)Result Possibilities.abReduce probability of one error and the other one goes up.a & b Have an Inverse Relationship.Neymann-Pearson原那么找一个不犯错误的检验!?N-P原那么:控制犯第一类错误的概率。显著程度:犯第一类错误的最大约率。启示:回绝原假设、接受原假设?设置原假设和备择假设的学问:一种药品中含某元素超越0.01克为不合格。如何设置原假设? H0: 该药品合格; H0:该药品不合格。.一个例子一切结合食品公司的顾客一次购买金额的平均值是35美圆?H0: =35. H1: ?对容量为100的样本,给定显著程度=0.05, 选择回绝域为满足以下条件的样本组成: .一个例子续计算
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 云南蝴蝶泉导游词
- DB12T 481-2013 洗染业皮具护理服务规范
- 七夕节促销活动策划
- 高等数学教程 上册 第4版 测试题及答案 高数2-测试一 - 答案
- 影响货币供给量的因素有哪些
- 阳江职业技术学院附属实验学校八年级上学期语文第一次月考试卷
- 三年级数学(上)计算题专项练习附答案
- 胶管采购合同(2篇)
- 南京工业大学浦江学院《商务谈判》2023-2024学年第一学期期末试卷
- 江苏盱眙经济开发区圣山路及新海大道道路改造工程施工组织设计
- 亲子鉴定报告样本
- 心理健康的重要性课件
- 社区管理与服务创新课件
- 2024年度医院皮肤科中医带教计划课件
- 海鲜自助策划方案
- 你演我猜规则介绍+题目
- 社会主义新农村建设
- 消防专业职业生涯规划
- 执照-航空法规
- 急性化脓性胆囊炎查房课件
- 中国信通院-数字化供应链标杆案例汇编(2023)-2023.11
评论
0/150
提交评论