第1章 数据与统计学_第1页
第1章 数据与统计学_第2页
第1章 数据与统计学_第3页
第1章 数据与统计学_第4页
第1章 数据与统计学_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学赵雪艳手机箱:zxybanban@1《统计学习题与案例》

袁卫等编

高等教育出版社

23考试与成绩:考试;

平时成绩占30%:签到和习题册

期末考试成绩占70%

2000年中国GDP为89404亿元,比上年增长8%;2001年GDP为95933亿元,比上年增长7.3%;2004年GDP为136515亿元,比上年增长9.5%;2008年GDP为300670亿元,比上年增长9.0%;什么是统计?请先看看实际数据1953.7.1~587961964.7.1~704991982.7.1~1015411990.7.1~1132742000.11.1~1295332008年末~132802人口?(万人)中国进行了几次人口普查?人口平均预期寿命

中国:2000年71.4岁,其中男性69.63岁,女性为73.33岁

北京城区人口平均预期寿命79.6岁居全国之首(2006.5.7)

世界:2000年为66岁,发达国家和地区为76

岁,发展中国家和地区为64岁

其中:日本81岁瑞士79岁德国78岁澳大利亚79岁加拿大79岁美国78岁2009年2月10日,国家统计局发布的最新统计显示,今年1月份我国居民消费价格总水平(CPI)同比上涨1.0%,生产者物价指数(PPI)同比下降3.3%,创82个月以来月度新低。CPI告诉人们的是,对普通家庭的支出来说,购买具有代表性的一组商品,在今天要比过去某一时间多花费多少钱中国的CPI包括食品、衣着、医疗保健和个人用品、交通及通讯、娱乐教育文化用品及服务、居住、杂项商品与服务等八类。PPI调查的产品有4000多种,覆盖全部39个工业行业大类PPI是对企业来说,其产品的出厂价格在今天要比过去某一时间多多少钱CPI:通常作为观察通货膨胀水平的重要指标PPI:衡量各种商品在不同的生产阶段的价格变化情形,如果比预期数值高时,表明有通货膨胀的风险,如果比预期数值低,则表明有通货紧缩的风险。教学内容数据与统计学统计数据与描述概率、概率分析与抽样分布参数估计假设检验方差分析与试验设计相关与回归分析时间序列分析与预测统计指数国民经济统计基础知识17第1章数据与统计学181.1统计数据与统计学第一章数据与统计学1.2统计学的产生与发展1.4统计数据的来源1.5统计数据的质量1.6统计学的基本概念1.3统计学的分科191.1统计数据与统计学2021什么是统计学?收集、整理、显示和分析数据的科学,目的在于对统计数据的研究,探索数据内在的数量规律性

1.数据搜集:取得数据2.数据分析:分析数据3.数据表述:图表展示数据4.数据解释:结果的说明统计资料统计学统计活动

统计学的概念1.【统计的涵义】——三部分22统计资料(数据)经过观察、调查所取得具有信息价值的数字资料直接从各调查单位搜集的用来反映个体特征的数据资料由原始资料加工得到的在一定程度上能反映总体特征的数据资料原始资料次级资料

[统计的涵义之一]23政府统计:国家统计局、职能部门企事业单位统计:工厂统计机构等经营统计:调查咨询公司、统计事务所等其它:如研究性统计机构等[统计的涵义之二]统计活动即统计实践活动,包括统计调查、统计数据整理、统计分析和统计预测。人们对统计数据的要求客观性、准确性、及时性24统计学

1869年的第七次国际统计会议上,在讨论关于统计学的定义时,据说竟有180余种之多。“收集和分析数据的科学和艺术”。《不列颠百科全书》定义:统计学是一门关于数据资料的收集、整理、显示和分析的科学,目的是探索数据内在的数量规律性。

[统计的涵义之三]2526统计成果与过程的关系统计实践与理论的关系什么是数据内在的数量规律性(例子)正常条件下新生婴儿的男女性别比为105:100投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6农作物的产量与施肥量之间存在相关关系最佳广告投放策略丰田公司威驰汽车百公里耗油量案例抽样调查化妆品推断全市家庭购买意愿案例27统计学的故事

发生在英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期的对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。

为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是请来了统计学家,统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。思考:应该在什么位置增加护甲?

28统计学的故事

统计工作工作完成了,然后统计学家很牛的说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。

291.2统计学的产生和发展30(一)古典统计学时期(17C中—19C末)◆国势学派(也称记述学派):创始人和代表人物,德国康令(H.Coring,1606-1681)和阿亨瓦尔(G.Achenwall,1719-1772)。显著事项的记录1.命名“统计学”2.“统计数字资料”、“数字对比”等术语3.运用对比的方法来研究各国的实力的弱31◆政治算术学派:创始人和代表人物:英国威廉·配第(W.petty,1623-1670)《政治算术》政治经济学之父,某种意义上也是统计学的创始人!格朗特(J.Graunt,1620-1670)《关于死亡表的自然和政治观察》被认为是人口统计的创始人3233◆概率论学派:创始人和代表人物:法国帕斯卡和费马通过通信的方式,将赌博中出现的各种问题,归纳为一般的概率原理,为后来的概率论和统计学的发展奠定了重要基础。1.提出了大量观察法、典型调查、定期调查原则2.广泛运用分类、制表及各种指标来浓缩与显现数据资料的信息3.有意识地运用可度量的方法,力求依靠数字来解释和说明社会经济生活(二)近代统计学时期(18C末—19C末)◆社会统计学派:创始人和代表人物,德国克尼斯(K.G.A.Kinies,1821-1898)。德国统计学家恩格尔(C.L.E.Engel,1821-1896)提出的“恩格尔系数”,

◆数理统计学派:创始人和代表人物,比利时凯特莱(L.A.J.Quetelet,1796-1874)

统计学之父!34恩格尔定律和恩格尔系数

19世纪德国一个州的统计局长恩格尔(ErnstEngel,1821-1896)发现:收入不同的家庭,消费开支结构也不相同。收入越多的家庭,用于食物的开支在全部消费支出中所占的比重越小。随着收入增加,家庭花在食物上的开支也会增加,但在整个开支中所占的比重却会逐渐下降。35恩格尔还发现:收入增加会使高收入家庭用于衣着、住宅、照明和取暖的费用也会增加,但在整个开支中所占比重变化不大。用于文化、医疗、娱乐、交往方面的开支,不仅绝对数量,而且在比重上都不断增加大。

36

食物支出

恩格尔系数=──────×100

消费支出总额

恩格尔系数的大小已经广泛地被用来反映一个国家或家庭的生活水平。37联合国粮农组织提出了一个用恩格尔系数判定生活发展阶段的一般标准:59%以上为绝对贫困;50%~59%为温饱;40%~49%为小康;20~40%为富裕;20%以下为极度富裕。38(三)现代统计学时期(19C末—现在)小样本思想、t分布理论、卡方分布、方差分析、假设检验、估计理论、误差理论、决策理论、多元统计、时间序列、面板数据等方法的出现统计方法的不断创新医学统计学、天文统计学、传媒统计学、管理统计学、金融统计学、国民经济统计学、社会统计学、教育统计学、心理统计学、生物统计学等学科的出现统计应用面的的不断拓展40第一阶段是统计学的初创阶段第二阶段是统计推断方法体系基本确定的阶段第三阶段是统计方法与应用研究全面发展的阶段41戈塞特(WilliamSealeyGosset),英国统计学家。出生于英国肯特郡坎特伯雷市,求学于曼彻斯特学院和牛津大学,主要学习化学和数学。戈塞特是英国现代统计方法发展的先驱,由他导出的统计学T检验广泛运用于小样本平均数之间的差别测试。历史上著名的统计学家高斯(Carl

FriedrichGauss,1777—1855)1809年,发表了其数学和天体力学的名著《绕日天体运动的理论》。在此书末尾,他写了一节有关“数据结合”的问题,实际涉及的就是这个误差分布的确定问题。

贝叶斯ThomasBayes,英国数学家。1702年出生于伦敦,做过神甫。1742年成为英国皇家学会会员。1761年4月7日逝世。贝叶斯在数学方面主要研究概率论。他首先将归纳推理法用于概率论基础理论,并创立了贝叶斯统计理论,对于统计决策函数、统计推断、统计的估算等做出了贡献。弗朗西斯·高尔顿(Sir

Francis

Galton,1822-1911)于1822年2月16日出生于英格兰伯明翰一个显赫的银行家家庭,父亲特铁斯·高尔顿和祖父塞缪尔·约翰都是热爱自然的科学家。高尔顿无论是在进行人类学测量、实验心理学研究还是进行遗传优生的研究中,都充分依赖于数据分析,进行了大量的计算和统计工作。皮尔森(Karlpearson,1857-1936)是数理统计学派的代表人物之一。在凯特勒工作的基础上,后经皮尔森的发展,形成了现代数理统计的许多重要内容,并形成了统计学研究的数理统计学派。卡尔·皮尔森设计了统计指标——相关系数。1.3统计学的分科47统计方法48描述统计

(descriptivestatistics)用图形、表格和概括性的数字对数据进行描述的统计方法内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律例1.1一个随机样本包括200名顾客,他们同意对某一新产品提出意见。意见百分比(%)十分喜欢并购买该产品十分喜欢但可能不会购买该产品不喜欢该产品543214合计100200名顾客对新产品的意见51年龄(岁)样本年龄组中的人数十分喜欢并购买该产品的人数人数(人)比重(%)人数(人)占各年龄组人数的比重(%)15~19105110.020~292010420.030~3972363852.740~4976386281.650及以上2211313.6合计20010010854.0各年龄组中喜欢并购买该产品的人数分布推断统计

(inferentialstatistics)研究如何利用样本数据来推断总体特征内容参数估计假设检验目的对总体特征作出推断样本总体问题:如何知道该新灯丝的平均使用寿命?回答:需进行统计推断总体:所有用新灯丝生产的灯泡样本:200个随机抽检的灯泡数据收集:每个被检灯泡(样本)照明的小时数

例1.2高亮度灯泡平均使用寿命某灯泡厂使用一种新灯丝生产灯泡以延长灯泡使用寿命。55

如果该200个被检灯泡的平均照明时间为76小时,则可推断该新灯丝所生产灯泡的平均寿命为76小时,或者给出区间。统计推断程序:描述统计与推断统计的关系反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据57描述统计学与推论统计学的异点第一、产生年代不同第二、研究特点不同第三、研究样本不同第四、应用统计的性质不完全相同58理论统计与应用统计理论统计研究统计学的一般理论研究统计方法的数学原理应用统计研究统计学在各领域的具体应用

例如:医学统计、管理学统计、心理学学统、生物统计等591.4

统计数据的来源60一、直接获取数据(没有现成数据)1.普查:为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。2.抽样调查:抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。二、间接数据的获取(有现成数据)统计年鉴统计局网站61例:为了全面掌握我国第二产业、第三产业的发展规模、结构和效益等情况,建立健全基本单位名录库及其数据库系统,为研究制定国民经济和社会发展规划,提高决策和管理水平奠定基础,我国于2004年进行了第一次全国经济普查。这次普查的标准时点为2004年12月31日,时期资料为2004年度。普查对象是在我国境内从事第二产业、第三产业的全部法人单位、产业活动单位和个体经营户。普查主要内容包括单位基本属性、就业人员、财务状况、生产经营情况、生产能力、原材料和能源消耗、科技活动情况等。2004年末,全国共有从事第二、三产业的法人单位516.9万个。其中,企业法人单位325.0万个,机关、事业法人单位90.0万个,社会团体法人单位10.5万个,其他法人单位91.4万个。产业活动单位682.4万个,其中,第二产业167.5万个,第三产业514.9万个。个体经营户3921.6万户,其中,第二产业588.7万户,第三产业3332.9万户

普查结果621.5统计数据的质量63抽样误差和非抽样误差抽样误差(不可避免)利用样本推断总体时产生的误差由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的非抽样误差(可以避免)由于调查过程中各有关环节工作失误造成的包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中不回答产生的误差等64例题:10个男生

,身高有3个为170,4个为175,3个为180,平均身高为175,对这10个男生进行抽样调查,抽了5个人,分别是170,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论