《应用统计学》(01)第1章-统计能为你做些什么_第1页
《应用统计学》(01)第1章-统计能为你做些什么_第2页
《应用统计学》(01)第1章-统计能为你做些什么_第3页
《应用统计学》(01)第1章-统计能为你做些什么_第4页
《应用统计学》(01)第1章-统计能为你做些什么_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

yyyy-M-应用统计应

AppliedStatisticsyyyy-M-统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。

H.G.Wells统计名言yyyy-M-你相信下面的统计结果吗?吸烟对健康是有害的不结婚的男性会早逝10年身材高的父亲,其子女的身高也较高第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类推两天服一片阿司匹林会减少心脏病第二次发作的机会身体超重30%会使寿命减少1300天每天摄取500毫升维生素C,生命可延长6年怕老婆的丈夫得心脏病的机会较大学生们在听了莫扎特钢琴曲10分钟后的推理测试会比他们听10分钟娱乐磁带或其他曲目做得更好上课坐在前面的学生平均考试分数比坐在后面的学生高第1章统计能为你做些什么?1.1

统计无处不在1.2统计研究什么?1.3统计能做什么和不能做什么?1.4怎样获得数据?Statistics1.1统计无处不在第1章统计能为你做些什么?yyyy-M-不同原因引起的寿命损失原因天数原因天数未结婚(男性)3500饮酒130惯用左手3285枪炮事故11未结婚(女性)1600自然放射线830%超重1300医疗X-射线620%超重900咖啡6吸香烟(男性)2250口服避孕药5吸香烟(女性)800减肥饮料2抽雪茄300家里有烟雾报警-10用烟斗抽烟丝220带有气囊的轿车-50危险工作,事故300移动冠状动脉监护器-125一般工作,事故74注:负数表示寿命增加yyyy-M-理解统计对大众的必要性在外出旅游时,需要关心一段时间内的详细天气预报在投资股票时,需要了解股票市场价格的信息,了解某只特定股票的有关财务信息如果你关心足球世界杯,在有关媒体上,你可以看到详细的报道如果你关心宏观经济形式,在有关媒体上你可以得到有关报道yyyy-M-理解统计对管理者更重要一个统计办公室的主管也是一个行政事务官,一次与一些统计学者开会,统计学者抱怨从其他部门收到的一些估计值没有给出标准误差(估计时的误差大小,表示估计的精度),这个主管马上问道:“对误差也有标准吗?”一个统计顾问提交给茶叶委员会的报告中,含有标题为“饮茶人数的估计值(含标准误差)”的附表。不久,一封信被送到这个统计学者手中,问道什么是人们喝红茶时的“标准误差”yyyy-M-理解统计对管理者更重要皇家委员会审查一份统计报告,报告中提到中产阶级家庭平均有2.2个子女,委员会评述说:“每一个成人女性有2.2个子女的数字是荒谬的。这是为要求对中产阶级提供财政援助以便通过四舍五入把平均值提高到一个更合适的整数健康大臣对一个统计学者的报告中提到的去年由于某种疾病,平均1000中死亡人数为3.2这个数字发生了兴趣。他问他的私人秘书,3.2个人是如何死法?他的秘书说:“先生,当一个统计学家说死了3.2个人时,意味着3个人已经死了,两个人正要死”yyyy-M-假定你是市场部的新任经理,一次广告活动的统计结果摆到了你面前,声称某个结果是“统计显著”的。你如何解释这份报告而又是暴露你对该术语的无知?

赶快学点统计,这对你和你的事业都非常有用。

GudmundR.Iversen避免尴尬yyyy-M-让你说出哪些领域不使用统计,这很困难,因为几乎找不到一个不用统计的领域;让你说出哪些领域应用统计,同样也很困难,因为几乎所有的领域都应用统计出一个统计没有用途的领域名称比举出一个统计作为其组成部分的领域名称要困难得多(RobertJohnson)几乎所有的领域都要用统计yyyy-M-统计应用

用统计识别作者用统计识别作者:1787—1788年,三位作者AlexanderHamilton,JohnJay和JamesMadison为了说服纽约人认可宪法,匿名发表了著名的85篇论文。这些论文中的大多数作者已经得到了识别,但是,其中的12篇论文的作者身份引起了争议通过对不同单词的频数进行统计分析,得出的结论是,JamesMadison最有可能是这12篇论文的作者。现在,对于这些存在争议的论文,认为JamesMadison是原创作者的说法占主导地位,而且几乎可以肯定这种说法是正确yyyy-M-统计应用

质量管理中的6

统计在许多领域都有应用:在统计中,

表示一个总体的标准差,它说的是数据之间的差异程度。比如,在企业生产的产品中,同一种产品也没有两个是完全一样的,因为在生产过程中,由于各种因素的影响而使产品质量产生波动。在服务领域就更是如此。产品或服务的这种差异称为质量的波动性,也正是由于波动性的存在才需要进行质量管理6

是质量管理中使用的一个术语,它的含义是指偏离正态分布的中心6个标准差。就产品生产或服务而言,它表示在生产或服务过程中缺陷率不超过百万分之3.4,通俗地说,如果生产100万个产品或进行100万次服务,产品的不合格率或服务达不到要求的比率平均来说不超过3.4个或3.4次。这样的不合格率非常低以致于可以忽略不计yyyy-M-统计应用

质量管理中的6

6

质量管理已成为最新的质量管理理念,近年来,它已成为一些著名国际大企业的质量管理方法,并在这样的管理理念下使企业受益匪浅。例如,实行了6

质量标准,使摩托罗拉公司在3年中节省的资金超过9.4亿美元。实行6

管理的大公司还有美国通用电器公司(简称GE)、宝利来(Polaroid)h和德州仪器(TexasInstruments)等GE的前CEO杰克.韦尔奇1999年4月曾说过这样一段话:“6

培训计划是GE下一个世纪领导层得以产生繁衍的园地,6

是我们曾经尝试过的最重要的管理培训方法,它胜过到哈佛工商学院就读,也胜过到克顿维尔(注:克顿维尔是GE公司内部的质量培训部)进修,它教会你一种完全与众不同的思维方式。”在推广6

质量管理策略不到10年的时间内,通用电器公司总市值从世界排名第十位跃升到第二位yyyy-M-统计应用

用简单的描述量得到一个重要发现费舍(R.A.Fisher)在1952的一篇文章中举了一个例子,说明如何由基本的描述统计量的知识引出一个重要的发现20世纪早期,哥本哈根卡尔堡实验室的施密特(J.Schmidt)发现不同地区所捕获的同种鱼类的脊椎骨和鳃线的数量有很大不同;甚至在同一海湾内不同地点所捕获的同种鱼类,也发现这样的倾向。然而,鳗鱼的脊椎骨的数量变化不大。施密特从欧洲各地、冰岛、亚速尔群岛以及尼罗河等几乎分离的海域里所捕获的鳗鱼的样本中,计算发现了几乎一样的均值和标准偏差值施密特推由此断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的。后来名为“戴纳(Dana)”的科学考察船在一次远征中发现了这个场所yyyy-M-统计的应用领域actuarialwork

(精算)

agriculture

(农业)animalscience

(动物学)

anthropology

(人类学)archaeology(考古学)

auditing(审计学)crystallography(晶体学)

demography(人口统计学)dentistry(牙医学)

ecology

(生态学)econometrics(经济计量学)

education(教育学)

electionforecastingandprojection

(选举预测和策划)engineering(工程)

epidemiology(流行病学)finance(金融)fisheriesresearch

(水产渔业研究)gambling(赌博)

genetics(遗传学)geography(地理学)

geology(地质学)historicalresearch

(历史研究)

humangenetics

(人类遗传学)yyyy-M-统计的应用领域hydrology(水文学)

industry

(工业)linguistics

(语言学)

literature(文学)manpowerplanning

(劳动力计划)managementscience

(管理科学)marketing(市场营销学)

medicaldiagnosis

(医学诊断)meteorology(气象学)

militaryscience

(军事科学)nuclearmaterialsafeguards

(核材料安全管理)ophthalmology(眼科学)

pharmaceutics(制药学)physics

(物理学)

politicalscience

(政治学)psychology(心理学)

psychophysics(心理物理学)qualitycontrol

(质量控制)

religiousstudies

(宗教研究)sociology

(社会学)

surveysampling

(调查抽样)taxonomy(分类学)

weathermodification

(气象改善)1.2统计研究什么?第1章统计能为你做些什么?yyyy-M-统计学是一门独立的科学吗?物理学研究的是像热、光、电等这类自然现象的运动规律化学家测定物质的组成及化学元素之间的交互作用生物学家研究植物和动物的生活数学家则在给出的假定之下推演各种命题这些学科中的每一门都有它自己的问题,而且有解决这些问题的各自的方法,各学科因此而成为一门单独的学科yyyy-M-统计学有自己的研究对象吗?统计学(statistics)没有任何固定的对象,是一门独特的学问统计学研究的是来自各领域的数据,由解决其他领域内的问题而存在并兴旺发达。按萨维奇(L.J.Savage)的说法:统计学基本上是寄生的。靠研究其他领域内的工作而生存。这不是对统计学的轻视,这是因为对很多寄主来说,如果没有寄生虫就会死。对有的动物来说,如果没有寄生虫就不能消化它们的食物。因此,人类奋斗的很多领域,如果没有统计学,虽然不会死亡,但一定会变得很弱yyyy-M-什么是统计学?

(statistics)

统计学研究的是数据,提供的是一套通用于所有学科领域的获取数据、分析数据并从数据中得出结论的原则和方法Statisticsyyyy-M-统计学是什么?统计学是一门科学它提供一套方法和技术,使用者在给定的情况下必须根据所掌握的专门知识选择使用的方法,如果需要还要进行必要的修正统计方法是通用的数据分析方法。这些方法不是为某个特定的问题领域而构造的统计学是一种技术如同工业生产过程中的质量控制程序一样,统计方法是为保证产品达到所希望的质量和保持其稳定性的的管理系统中建立起来的统计方法也能用于控制、减少和考察不确定性统计学是一门艺术提供一种归纳推理的方法,推理就是一种艺术。既然是归纳推理,就不能保证结论百分之百正确,就不能没有争议怎样让别人看懂并理解统计结论,要看统计表达这些结论的技巧和艺术yyyy-M-统计方法统计方法描述统计推断统计参数估计假设检验yyyy-M-02550Q1Q2Q3Q4¥x=30s2=105描述统计

(descriptivestatistics)研究数据收集、整理和描述的统计学分支内容搜集数据整理数据展示数据描述性分析目的描述数据特征找出数据的基本规律yyyy-M-推断统计

(inferentialstatistics)研究如何利用样本数据来推断总体特征的统计学分支内容参数估计假设检验目的对总体特征作出推断样本总体1.3统计能做什么和不能做什么?第1章统计能为你做些什么?yyyy-M-统计帮助你分析数据大量数据如果不去分析它,那也仅仅是一堆数据而已,没有什么用处。因为有用的信息恰恰藏在数据的里面统计可以在多个方面帮助你分析数据利用统计简化繁杂的数据用图表重新展示数据,进行比较分析建立数据模型进行预测yyyy-M-统计不能解决你的所有问题统计仅仅是一种数据分析的方法,与数学一样统计是一种工具,是数据分析的工具统计结论需要你的专业知识去解释统计在自然科学和管理科学中的作用不同,管理人员所需要的,统计未必能提供Toolsyyyy-M-统计的误用与滥用大约在一个世纪以前,政治家BenjaminDisraeli曾有一个著名的论断:“有三类谎言:谎言、糟透的谎言和统计”。他还说:“图并没有说谎,是说谎者在画图”历史学家AndrewLang说,一些人使用统计“就像喝醉酒的人使用街灯柱—支撑的功能多于照明”统计滥用不好的样本过小的样本误导性图表局部描述故意曲解Falseyyyy-M-统计应用的两个极端不懂或不太懂统计的人认为统计没什么用,他们因为不懂统计而瞧不起统计,他们不用或几乎不用统计方法分析数据,即使做些统计分析,也往往是表面上的把简单问题复杂化,特别是在管理领域把本来可以用简单方法解决的问题故意复杂化为证明管理的科学性,建立一个别人看不懂的模型,编一大堆程序,输出了一大堆数字和符号得出用统计语言陈述的结论,提出一些似是而非的建议……1.4怎样获得统计数据?第1章统计能为你做些什么?yyyy-M-变量与数据

(variable&data)

从一次观察到下一次观察会出现不同结果“企业销售额”、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”观察变量得到的结果即数据变量可以分为数值变量(metricvariable)

:可以用阿拉伯数据来记录其观察结果分类变量(categoricalvariable)

:观察结果表现为不同的类别顺序变量(rankvariable):有序类别yyyy-M-你不必吃完整头牛,才知道它的肉是咬不动的。(Youdon’thavetoeatthewholeoxtoknowthatitistough.)

SamelJohnsonyyyy-M-怎样获得一个样本?

(概率抽样方法)

简单随机抽样(simplerandomsampling)从含有个元素的总体中,抽取个元素组成样本,使得总体中的每一个元素都有相同的机会(概率)被抽中如果抽取一个个体记录下数据后,再把这个个体放回到原来的总体中参加下一次抽选,叫做重复抽样(samplingwithreplacement如果抽中的个体不再放回,再从所剩下的个体中抽取第二个元素,直到抽取个个体为止,这样的抽样方法叫做不重复抽样(samplingwithoutreplacement)简单随机抽样得到的样本称为简单随机样本(simplerandomsample)yyyy-M-怎样获得一个样本?

(概率抽样方法)

分层抽样(stratifiedsampling)在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本系统抽样(systematicsampling)先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取个元素组成一个样本整群抽样(clustersampling)先将总体划分成若干群,然后在以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察yyyy-M-简单随机抽样

(用Excel对分类数据随机抽样)【例】某班级共有30名学生,他们的名单如右表。用Excel抽出一个由5个学生构成的随机样本yyyy-M-简单随机抽样

(用Excel产生一个简单随机样本)第1步:将30个学生的名单录入到Excel工作表中的一列第2步:给每个学生一个数字代码,分别为1,2…,30

,并按顺序排列,将代码录入到Excel工作表中的一列,与学生名单相对应(数值型数据直接抽取)第3步:选择【工具】下拉菜单,并选择【数据分析】选项,然后在【数据分析】选项中选择【抽样】第4步:在【抽样】对话框中的【输入区域】中输入学生代码区域,在【抽样方法】中单击【随机】

。在【样本数】中输入需要抽样的学生个数。在【输出区域】中选择抽样结果放置的区域。【确定】后即得到要抽取的样本

用Excel对分类数据抽样yyyy-M-简单随机抽样

(用Excel生成随机数)生成位于两个指定数之间的一个随机数(RANDBETWEEN函数)第1步:在Excel表格界面中,直接点击【f(x)】命令第2步:在复选框“函数分类”中点击【全部】选项,并在“函数名”中点击【RANDBETWEEN】选项,然后【确定】第3步:在【Bottom】输入要返回的最小整数(本例为100)

在【Top】输入要返回的最大整数(本例为1)

单击【确定】即可得到一个随机数(要得到多个随机数向下复制即可)

用Excel生成1~100之间的20个随机数yyyy-M-简单随机抽样

(用Excel生成随机数)生成位于0~1之间的均匀分布随机数

(RAND函数)第1步:在Excel表格界面中,直接点击【f(x)】命令第2步:在“函数分类”中点击【

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论