第一章 统计学2_第1页
第一章 统计学2_第2页
第一章 统计学2_第3页
第一章 统计学2_第4页
第一章 统计学2_第5页
已阅读5页,还剩78页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学导论主讲:卢二坡E-mail:Luerpo@163.com蒙代尔当今世界上最伟大的统计学家之一C.R.劳拉先生在他的统计论著《统计与真理——怎样运用偶然性》中指出:在终极分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。我国著名的经济学家马寅初:学者不能离开统计而研究;政治家不能离开统计而施政;实业家不能离开统计而执业。美国SCIENCFY有一篇文章列出近百年来最有用的科学,统计高居前十名。香港城市大学管理科学系介绍统计专业时用了四句话:各大机构和国际企业均设立完善的信息系统;统计是信息系统不可缺少的一项功能;所有具有规模的企业均视数据库为“金矿”;统计学便是开采这个金矿的最有效工具。“Whenyouanalyzeanytopic,youareinvolvedinstatistics”。统计学是一个高效公民的必备知识。

课程的主要内容绪论统计数据的收集、整理与显示总量指标和相对指标统计数据分布特征的描述时间序列分析统计指数抽样分布与参数估计相关与回归分析课时安排和考核方式总课时:54学时,3课时/周考核:期末:统一的上机考试:80%,自动生成成绩课程作业:20%学习统计学的一些建议不要缺课。由于课程内容是前后呼应的,缺课非常不利于后续内容的学习。多做练习。通过练习加深对统计方法的理解。树立正确的观念。统计学不神秘,不可怕,不难学好,统计学既很有用,也很有趣。贾俊平.《统计学(第五版)》,中国人民大学出版社,2012.袁卫等主编,《统计学》,高等教育出版社,2009年7月第3版。参考书目:信息时代,自我学习《统计学》精品课程网站:网易公开课:MOOC:果壳网第一章绪论第一节什么是统计学?第二节统计学的种类及性质第三节统计学的基本概念一、无处不在的“统计”2014年8月31日,分别利用“百度”和“谷歌”搜索关键词“统计”第一节什么是统计?找到相关结果约100,000,000个二、什么是统计:统计的含义日常生活中,“统计”的3种含义统计统计工作统计资料统计学统计工作(又称统计实践)是搜集、整理、分析和提供关于社会经济现象的数字资料工作的总称。英文中的统计statistics与“国家”同一词根,可以说,自从有了国家,就有统计实践活动。谁在做:政府、企业、科研机构、个人统计资料即统计数据,是统计实践活动过程所获得的各种数字资料及其他资料的总称,是统计实践活动的的成果。一般反映在统计表、统计图、统计手册、统计年鉴、统计资料汇编和统计分析报告中。对统计数据的基本要求:客观性、准确性、及时性。统计是以数据为食物的动物

统计的本业是消化数据,并产生有营养的结果。它的本质,和母牛相差不多。

Grass——Cow——MilkData——Statistics——Information

统计学是研究如何收集、整理、分析反映客观现象总体数量的数据,以便给出正确认识的方法论科学。《不列颠百科全书》对统计学的定义为:“统计学是关于收集和分析数据的科学和艺术”。Whenmanypeopleheartheword“statistics,”theythinkofeithersports-relatednumbersorthecollegeclasstheytookandbarelypassed.Whilestatisticscanbethoughtaboutintheseterms,thereismoretotherelationshipbetweenyouandstatisticsthanyouprobablyimagine.So,whatisstatistics?SeveralinformaldefinitionsareofferedinthebookACareerinStatistics:BeyondtheNumbersbyGeraldHahnandNecipDoganaksoy:Thescienceoflearningfrom(ormakingsenseoutof)dataThetheoryandmethodsofextractinginformationfromobservationaldataforsolvingreal-worldproblemsThescienceofuncertaintyThequintessentialinterdisciplinaryscienceTheartoftellingastorywith[numerical]data三者关系统计工作统计资料统计学工作与工作成果关系实践与理论关系“统计学”浸透到当今信息社会的方方面面,“一个学科如果连定量都做不到一定是不成熟的。生物、医学、经济、金融、国防等社会生活的各个方面都需要数学来量化,任何一个体系运行的好坏都要通过数据来检验,现代科技的发展更是把改进技术指标的关键变成了统计问题”。(范剑青)三、统计的应用领域应用案例:制定宏观经济政策政府制定各项经济政策对需要大量的统计支持(数据收集、趋势预测、政策效果的评价等等)。未来的就业形势?经济增长前景?物价形势?国际收支状况?应用案例:产品质量管理质量是企业的生命,是企业持续发展的基础。质量管理中离不开统计的应用。在一些知名的跨国公司,“六西格玛”准则已成为重要的管理理念,其核心是利用统计方法不断改进产品的质量。Welch1995年底在通用电气开始发起“六西格玛”项目,这些项目的实施取得了令人诧异的成功:1997年带来的效益是3.2亿美元。市场研究:企业要在市场竞争中取得优势,首先必须了解市场,而要了解市场、则需要作广泛的市场调查,取得所需的信息,并对这些信息进行科学的分析,这些都需要统计的支持。经济预测:企业要对未来的市场状况进行预测,在进行预测时要使用各种统计信息和统计方法。人力资源管理:利用统计方法对企业员工的年龄、性别、受教育程度、工资等进行分析,并作为企业制定工资计划、奖惩制度的依据。应用案例:企业的生产、经营管理应用案例:政治领域、总统选举美国大选2008年11月02日民意调查机构调查结果(选民票得票率)

马里斯特:奥巴马50,麦凯恩43.

拉斯马森:奥巴马51,

麦凯恩47.

盖洛普:奥巴马52,麦凯恩43.

佐格比:奥巴马50,麦凯恩43.

迪亚乔:奥巴马48,麦凯恩41.

战场:

奥巴马49,

麦凯恩45.

IBD:

奥巴马48,

麦凯恩44.实际结果:奥巴马和麦凯恩的选民票得票率分别为52%和46%。

MedicalResearchisBetterBecauseofStatistics医学研究统计学的主要应用领域:统计学非常有用!!四、统计学的研究对象及特点统计学的研究对象:客观事物的数量方面,包括数量特征和数量关系等等。统计学的研究对象的特点:1.数量性统计研究的对象是客观现象总体的数量方面。“数字是统计的语言”,“数据是统计的原料”2.总体性统计的数量研究是对现象总体中各单位普遍存在的事实进行大量观察和综合分析。3.变异性总体各单位的特征表现存在差异,并且这种差异不是事先可知的,没有变异,就没有统计存在的必要。变异是统计研究的前提!数据内在的数量规律性(一些例子)正常条件下新生婴儿的性别比为105:100投掷一枚均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6农作物的产量与施肥量之间存在相关关系五、统计研究的基本环节统计设计收集数据整理与分析资料积累开发应用统计学理论与相关实质性学科理论描述统计推断统计统计调查、实验统计设计:对整个统计工作的全盘安排,需要用到统计学和相关实质性学科知识。统计数据收集:数据的两个主要来源是科学实验和统计调查统计整理和分析:对搜集到的统计数据进行加工、分类、整理、分析。统计方法包括描述统计和推断统计。统计资料的积累、开发和应用:第二节统计学的性质和特点***一、统计学的产生和发展统计学的萌芽期(17世纪中-18世纪中)政治算术学派国势学派统计学的近代期(18世纪末-19世纪末)社会统计学派数理统计学派政治算术学派人物:最早的统计学源于17世纪英国。其代表人物是威廉.配第。贡献:主张用大量观察和数量分析等方法对社会经济现象进行研究的主张,为统计学的发展开辟了广阔的前景。评价:“有统计之实,无统计之名”的学派威廉·配第(WillianPetty,1623--1687),马克思评价他是“政治经济学之父,在某种程度上也可以说是统计学的创始人”。他也是英国皇家学会的创始人之一国势学派代表人物:18世纪德国的康令和阿亨瓦尔,认为统计是记述国家显著事项之学。贡献:提出世界公认的名词-统计学(Statistics)评价:“有统计之名,无统计之实”的学派特弗里德·阿亨瓦尔(1719—1772)。阿亨瓦尔把记述和比较国情的国家学定名为“统计学”,第一个使用了“统计学”这个名称社会统计学派人物:19世纪德国的克尼斯、恩格尔和梅尔主要观点:提出统计学是一门独立的社会科学,是一门对社会经济现象进行数量对比分析的科学主要贡献:各国学者在社会经济统计指标的设定与计算、指数的编制、资料的收集与整理、统计调查的组织和实施、经济社会的数量分析和预测等方面做出的贡献已成为现代统计学的重要组成部分。例如,“恩格尔系数”,至今仍为人们广泛使用。国民收入和国内生产总值的核算方法被称为“20世纪最伟大的发明之一。”数理统计学派人物:19世纪中叶至20世纪中叶,凯特勒、戈赛特、费希尔、内曼、卡尔皮尔逊等等贡献:完成统计学和概率论结合认为统计学是一门通用的方法论科学建立了丰富的数理统计理论英国生物学家高尔顿提出并阐述了“相关”的概念;皮尔逊提出了计算复相关和偏相关的方法。戈塞特建立了“小样本理论”,即所谓的“t分布”;费歇尔在样本相关系数的分布、方差分析、实验设计等方面的研究中做出了重要贡献。到20世纪中期,数理统计学的基本框架已经形成。数理统计学派成为英美等国统计学界的主流。二、现代统计学:理论统计和应用统计统计学的现代期(20世纪初至今)统计学的主流从描述统计学转向推断统计学20世纪30年代R·费希尔的推断统计理论标志着现代数理统计学的确立现代统计学可以分为两大类:理论统计学:即统计学的数学原理,以抽象的数量为研究对象,研究一般的收集数据、整理数据和分析数据方法。如概率论与数理统计、时间序列分析、非参数统计等等应用统计学:以各个不同领域的具体数量为研究对象的。如经济统计、社会统计、教育统计、医学统计、生物统计等等统计学旺盛的生命力来源于它和实际应用的紧密结合。范剑青说:“就像文学家只要贴近生活就不会觉得没有题材可写,统计最好的题材就是从实际问题中抽象出理论和方法。只要人类不断发展,统计学家的新问题就会源源不断。”理论统计学和应用统计学是相互促进、共同提高的。统计学注定是一门交叉学科。范剑青在普林斯顿大学的5个部门任职:运筹学与金融工程系、经济系、金融中心、应用数学以及生物工程。他常讲:“统计学家是讲多种语言的。要和物理、化学、工程、环境保护、金融、生物等领域打交道,这个范围要多广有多广。我自己将主要精力放在四个方向:金融学、生物信息、机器学习和生物统计,这四个方向已经够广了。”参见2012年国家社科基金第四批重大项目选题指南。统计学在原先的学科专业目录中是属于“经济学”学科门类“应用经济学”一级学科下的二级学科。在国务院学位委员会和教育部于2011年3月颁布的新的“学位授予和人才培养学科目录(2011年)”中,统计学成为“理学”门类下的一级学科。参见袁卫.《机遇与挑战——写在统计学成为一级学科之际》,《统计研究》2011年第11期。三、统计方法:描述统计和推断统计统计方法包括两个组成部分:描述统计和推断统计描述统计(DescriptiveStatistics):研究的是如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工、处理和显示。内容包括统计数据的收集方法、数据的加工处理方法、数据的显示方法、数据分布特征的概括与分析方法等。推断统计(InferentialStatistics):研究如何利用样本数据来推总体数量特征的统计方法。它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。

。反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)描述统计(统计数据的搜集、整理、显示和分析等)总体数据样本数据描述统计与推断统计的关系四、统计学和其他学科统计学和数学:数学是统计学发展的重要理论基础,但统计学不是数学数学研究的是抽象的数量关系,统计学研究具体、实际的数量关系;数学研究的是没有量纲或者单位的抽象数,统计学研究具体事物或者有单位的数据;数学使用的是演绎方法,统计学使用的是演绎与归纳相结合的方法,但以归纳方法为主。统计与数学一样,是一种工具,一种数据分析的工具,它帮助我们理解周围的世界,但统计并不等同于数学。数学家的幽默

统计学家调侃数学家:你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若喜欢一个女孩,那么这个女孩喜欢的男生你也喜欢吧?

数学家反问道:你们不是喜欢谈平均吗,那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均不过是五十度而已!”统计学和其他实质性学科统计学的发展应用离不开经济学、社会学、生物学、医学等实质性学科的发展统计学为探索其他学科数量规律性提供工具其他实质性学科数量规律性的解释只能由实质性学科完成统计学的应用强调定性分析与定量分析相结合。统计学和计算机科学计算机科学是统计学应用的重要工具统计学的发展离不开计算机科学统计软件:Excel、SPSS、SAS、Stata、Eviews、Matlab、R。。。。。。。第三节统计学的基本概念一、总体和总体单位二、样本三、标志四、统计指标和指标体系五、统计数据一、总体和总体单位(一)概念1.总体:是根据统计研究目的确定的、由具有某种共同性质的许多个体组成的整体。2.总体单位:构成总体的每个具体单位(每一)根据研究目的的不同,总体单位可以是人、物、机构等实物单位,也可以是一种现象或活动等非实物单位。研究某个班学生的学习情况总体:全班所有的学生总体单位:每一个学生研究某市的工业生产情况总体:所有的工业企业总体单位:每一个工业企业某市的工业生产设备情况总体:所有的工业生产设备总体单位:每一台工业生产设备研究某地区交通事故发生的原因:总体:该地区所有的交通事故总体单位:该地区每一起交通事故研究全国大型连锁超市的销售变化情况总体:全国所有的大型超市总体单位:每一家大型连锁超市研究某一家大型连锁超的销售变化情况总体:该家大型连锁超市总体单位:各连锁店(或各种商品)总体和总体单位的关系:(1)总体单位是构成总体的基础。(2)研究目的一旦确定,总体和总体单位便也相应确定。(3)总体与总体单位的概念是相对的,随着研究目的变化,二者的位置也会发生相应转换。很重要哦!1.总体有三大特点:同质性:总体各单位具有某种共同的性质。它是确定总体基本标准,是由统计研究的目的而定的。大量性:总体应该由足够数量的同质性单位构成差异性:各个个体具有某一共同性质,但其他的性质、特征是不同的。差异性是统计研究的前提。(二)统计总体的特点和分类2.统计总体的分类(1)按总体所包含的总体单位数多少分有限总体:总体单位数是有限的无限总体:总体单位数是无限的(2)按总体单位的性质分实物总体:总体单位为实物单位行为总体:总体单位为行为单位(3)按总体的范围分全及总体:又称总体,所要研究对象的全体抽样总体:又称样本,指从全及总体中抽取出来的、用以代表全及总体的部分个体组成的集合体。样本也是由一定数量的总体单位构成的,样本所包含的总体单位数为样本容量。总体、样本和总体单位二、统计标志和统计指标(一)统计标志的概念和分类统计标志说明总体单位的属性和特征的名称。例如:每一个学生作为总体单位,具有性别、年龄、籍贯、成绩等属性。每一个企业作为总体单位,具有经济类型、行业、产值、利润等属性。标志表现标志名称之后所表明的具体属性和数值。汉1980年140公斤中国国籍:民族:出生年份:体重:标志标志表现226厘米身高:姚明姓名:标志的分类:(1)根据标志表现的具体形式:品质标志:表示事物质(属性)的特征,其具体表现用文字表示。如:性别、专业、民族等。数量标志:表示事物量(单位数量)的特征,其具体表现用数字表示。如:年龄、产值、身高、体重等。品质标志品质标志数量标志数量标志国籍:民族:出生年份:体重:标志数量标志身高:品质标志姓名:对于中国公民总体(2)根据总体各单位某标志的具体表现是否相同:不变标志:总体各单位有关标志的表现都相同。可变标志:总体各单位的标志表现各不相同,又称变异。可变的数量标志—数量变异可变的品质标志—属性变异例如:在教师总体中,职业是不变标志,年龄是可变标志。在年龄30岁的职工总体中,年龄都为30岁,故年龄为不变标志,是常量;而工资可能不同,故工资为可变标志,是变量。在统计总体中,不变标志和变异标志各自发挥着重要作用。一个总体至少要有一个不变标志,才能使各单位结合成一个总体。作为总体,同时必须存在变异标志,这是进行统计研究的前提。(二)统计指标概念:它是反映统计总体数量特征的概念和具体数值。构成主要有两部分:

指标名称:对所研究现象本质的抽象概括,也是对总体数量特征的质的规定性。

指标数值:反映所研究现象在具体时间、地点、条件下的规模和水平。在观察指标数值时,必须了解其具体的时间状态、空间范围、计量单位、计量方法等限定,同时注意由于上述条件的变化而引起数值的可比性问题。如:2010年

我国

国内生产总值(GDP)为397983亿元时间限制空间限制指标名称计算方法指标数值计量单位统计指标和标志的联系和区别:区别:1.说明对象不同:指标是说明总体特征的,标志是说明总体单位特征的。2.表现形式不同:统计指标都是用数值表示,标志有的用文字表示,有的用数字表示。联系:1.个别和整体的关系:指标是通过标志的具体表现综合得到的。2.转换关系:随着研究目的不同,指标和标志的概念可以相互转化。很重要哦!举例:以我国大型连锁超市的销售变化情况为例

统计某一总体单位的在某一时期的销售品种、销售数量、销售额登记如下标志:商品品名、规格、货号、单位、数量、单价、金额统计如下指标:各个品种和全部商品的销售数量、金额、及数量、金额和价格总的变化和结构变化情况等统计指标的分类(1)根据统计指标的性质分:数量指标:反映现象总规模、总水平的统计指标。又称总量指标,用绝对数表示。如人口总数、企业总数、工资总额、国内生产总值等。质量指标:反映现象相对水平和工作质量的统计指标。质量指标是总量指标的派生指标,用相对数或平均数来表示。例如职工平均工资、人口密度、工人出勤率等等。(2)按统计指标的表现形式分总量指标相对指标平均指标(三)统计指标体系

是由一系列相互联系的统计指标所组成的有机整体。用以反映所研究现象各方面相互依存相互制约的关系。如:和谐社会统计指标体系,全面小康社会指标体系。五、统计数据(一)变量和变量值变量:说明现象的某一数量特征的概念变量值:变量的具体取值是变量值。(1)按变量值是否连续:连续型变量和离散型变量连续型变量:指其数值连续不断,在相邻的两值之间可无穷分割,必须用测量或计量的方法取得。例如,人的身高、体重;企业的产值、利润率等等。离散型变量:变量值只能取整数,可用计数方法取得。

例如,企业数,职工人数、机器台数等?年龄是连续变量还是离散变量?变量的分类:(2)按变量值的取值确定与否:确定性变量和随机变量确定性变量:受确定性因素影响的变量。例如:企业的工资总额不外乎受职工人数和平均工资两个因素的影响,这两个因素是可以人为控制的,对总资总额影响的方向和大小是确定的。随机变量:指受随机性因素影响的变量例如:农作物产量的高低受土壤、水份、光照、气温、施肥、管理等多方面因素的影响,而水份、光照、气温等因素是非确定的或非人所能控制的,因此,农作物产量是随机性变量。随机变量也蕴藏着规律性,通过大量观察可以揭示这种规律性。(二)统计数据的种类统计数据是总体单位标志或总体统计指标的具体数量表现。“数据!数据!数据!”他不耐烦地喊道,“我不能做无米之炊!”—Sherlock·福尔摩斯1.按照数据的计量尺度,可将数据分为四个层次:定类尺度定序尺度定距尺度定比尺度数据的计量有四种尺度定类尺度

nominalscale定序尺度

ordinalscale定距尺度

intervalscale定比尺度

ratioscale按照某属性对事物进行平行的分类。(=、≠)对事物类别间等级或顺序差别的测度。(<、>)对事物类别或次序之间差距的测度。

(+、-)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论