第1章 数据与统计学-统计学_第1页
第1章 数据与统计学-统计学_第2页
第1章 数据与统计学-统计学_第3页
第1章 数据与统计学-统计学_第4页
第1章 数据与统计学-统计学_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计学主讲教师:李康荣leekr76@163.com第1章绪论1.1

统计数据与统计学1.2统计学的产生和发展1.3统计学的分科1.4统计数据的来源1.5统计数据的质量1.6统计学的基本概念

本章小结3“统计”的三种含义1.统计工作收集数据的活动2.统计数据对现象计量的结果3.统计学分析数据的方法与技术统计工作统计学统计数据三者关系图1.1统计数据与统计学统计三要素关系统计工作是基础,统计资料和统计学都是在统计实践基础上产生和发展的统计资料来源于统计工作,没有统计实践就没有统计资料,同时统计资料又服务于统计实践统计学是对统计工作(实践)的理论抽象和总结,但又反过来指导统计实践活动45一、什么是统计学?1.数据搜集:例如,调查与试验2.数据整理:例如,分组3.数据展示:例如,图和表4.数据分析:例如,回归分析统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识重点6统计研究的过程收集数据(取得数据)整理数据(处理数据)解释数据(结果说明)分析数据(研究数据)实际问题7统计规律

(一些例子)正常条件下新生婴儿的男女性别比为107:100投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6农作物的产量与施肥量之间存在相关关系8二、统计学与其他学科的关系1、统计学与数学的关系联系:数学为统计理论和统计方法的发展提供基础不能将统计学等同于数学区别:数学统计学研究内容:抽象的数量规律

具体的、实际现象数量规律逻辑方法:演绎

演绎与归纳相结合,但主要是归纳9

统计学的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)2、统计学与其它学科的关系10统计学应用的领域(续)hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)统计学是一门应用极为广泛的学科,其应用领域涉及到了社会、经济、管理、医学等方方面面!!!11

一般认为,统计学产生于17世纪中叶,是从几个不同领域开始的:第一个源头——威廉·配第(WilliamPatty)《政治算术》(1676年)。在书中用大量的数据对英、法、荷三国的经济实力进行比较,使用定量的分析方法。(配第)是政治经济学之父,在某种程度上也可以说是统计学的创造人马克思1.2

统计学的产生和发展12另一个创始人——英国的约翰·格朗特(JohnGraunt)发表于1662年的《关于死亡表的自然观察与政治观察》一文中,通过大量观察的方法,研究并发现了人口与社会现象中重要的数量规律性。被称为“人口统计创始人”。第三个源头——古典概率论引入统计学,开辟了统计学的新领域,形成了数理统计学。19世纪末建成了古典统计学(主要是描述统计学)的基本框架。20世纪,统计学在理论、方法和应用领域有了较大发展,50年代以来,扩展成为各学科的基础工具。13历史上著名的统计学家JacobBernoulli(伯努利)(1654—1705)EdmondHalley(哈雷)(1656—1742)DeMoivre(棣莫弗)(1667—1754)ThomasBayes(贝叶斯)(1702—1761)LeonhardEuler(欧拉)(1707—1783)PierreSimonLaplace(拉普拉斯)(1749—1827)AdrienMarieLegendre(勒让德)(1752—1833)ThomasRobertMalthus(马尔萨斯)(1766—1834)ThomasRobertMalthus(马尔萨斯)PierreSimonLaplace(拉普拉斯)LeonhardEuler(欧拉)资料14历史上著名的统计学家FriedrichGauss(高斯)(1777—1855)JohannGregorMendel(孟德尔)(1822—1884)KarlPearson(皮尔逊)(1857—1936)RonaldAylmerFisher(费希尔)(1890—1962)Jerzy

Neyman(奈曼)(1894—1981)EgonSharpePearson(皮尔逊)(1895—1980)WilliamFeller(费勒)(1906—1970).FriedrichGauss(高斯)JohannGregorMendel(孟德尔)15一、按照应用方法的不同分为

描述统计学推断统计学描述统计是整个统计学的基础.推断统计则是现代统计学的主要内容.1.3统计学的分科16描述统计推断统计描述统计和推断统计指对采集的数据进行登记、审核、整理、归类.在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。17描述统计

(DescriptiveStatistics)研究数据收集、整理和描述的统计学方法内容搜集数据整理数据显示数据

目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105重点18推断统计

(InferentialStatistics)研究如何利用样本数据来推断总体特征的统计学方法内容参数估计假设检验目的对总体特征作出推断样本总体重点19描述统计与推断统计的关系重点反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)样本数据总体数据描述统计(统计数据的搜集、整理、显示和分析等)区别:

(1)产生年代不同:描述统计产生于二十世纪二十年代之前,以K.毕尔生为代表;推断统计产生于二十世纪二十年代以后,以费雪为代表。

(2)研究特点不同:描述统计研究如何简缩数据并描述这些数据的方法,包括统计分析方法、分类原理、汇总、统计图表、频数分布、时间序列、指数、估计、相关分析等;推断统计研究如何在随机抽样基础上推论总体特征,包括统计推断原理、实验设计、估计理论、抽样调查、序列分析等。思考题:举例分析:描述统计与推断统计的区别与联系?(3)研究样本不同:描述统计研究大样本理论;推断统计研究小样本理论。(4)应用统计的性质不同:描述统计多用于是指科学的影响;推断统计用于通用的方法论科学。联系:描述统计是基础,推断统计是描述统计的升华和进一步发展。22统计方法统计方法描述统计推断统计参数估计假设检验23理论统计(TheoreticalStatistics)研究统计学的一般理论研究统计方法的数学原理应用统计(AppliedStatistics)研究统计学在各领域的具体应用二、按照研究内容的不同分为

理论统计学

应用统计学24统计学的两大类

理论统计学

(数理统计学)应用统计学它的定义是把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证,其中心内容是以归纳方法研究随机变经的一般规律。社会经济统计学。这是一门以社会经济现象的数量方面为特定研究对象的应用统计学。理论统计学和应用统计学251.4统计数据的来源直接获取的数据统计数据来源于直接的调查、观察和科学实验又称为第一手数据间接获取的数据从报纸、图书、杂志、统计年鉴、网络等渠道获得又称为第二手数据26直接数据对于社会经济管理和决策而言,主要通过统计调查的方式获取数据统计调查方法普查为特定目的,一次性全面调查优点:资料全面、准确性高;缺点:费用比较高,应用范围比较狭窄。一般适用于为社会提供基础全面的资料抽样调查随机样本推断总体规律性具有经济性、时效性强、适应面广、准确性高等特点应用最广泛、最重要27统计调查组织方式重点调查抽样调查普查典型调查统计报表统计调查组织方式我国现行统计调查体系,是以普查、统计报表为基础,以抽样调查为主要方式、辅之以重点调查典型调查的一种调查体系。本小节补充内容28普查

(census)

1.为特定目的专门组织的非经常性全面调查2.通常是一次性或周期性的3.一般需要规定统一的标准调查时间4.数据的规范化程度较高5.应用范围比较狭窄总体29抽样调查

(samplingsurvey)

1. 从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法总体随机样本2.具有经济性、时效性强、适应面广、准确性高等特点30重点调查

重点调查是从调查对象的全部单位中选择少数重点单位进行非全面调查重点单位是指在所要调查的数量特征上占有较大比重的单位。如若要调查某市人民币储蓄状况,则大型储蓄所则成为重点单位注:重点调查的调查结果不能用于推断总体优点:调查单位少,省时省力,能及时取得较详细的资料;缺点:调查的前提是重点单位要存在31典型调查

典型调查是从调查对象的全部单位中选择少数典型单位进行非全面调查调查目的是描述和揭示事物的本质特征和规律,其调查结果也不能用于推断总体。优点:代表性好、省时省力、资料详细;缺点:典型单位选择的好与坏直接关系到统计结果32统计报表

统计报表是按照国家或上级部门有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式统计报表的资料来源是基层单位的原始记录优点:准确性高、完整性好、便于资料积累;缺点:缺乏灵活性,时效性差33间接数据利用各种现成的数据报纸、图书、杂志、统计年鉴从专业数据公司购买互联网34间接取得的数据Internethttp//WWW.中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料35提供统计数据的部分政府网站中国政府及相关机构

网址数据内容国家统计局http://统计年鉴、统计月报等国务院发展研究中心信息网http://宏观经济、财经、货币金融等中国经济信息网http://经济信息及各类网站华通数据中心http://国家统计局授权的数据中心中国决策信息网http://决策知识及案例三农数据网http://三农信息、论坛及相关网站36提供统计数据的部分政府网站美国政府机构

网址数据内容人口普查局http://人口和家庭等联邦储备局http://www.bog.frb.fed.us货币供应、信誉、汇率等预算编制办公室http:///omb财政收入、支出、债券等商务部http://商业、工业等37数据的搜集方法访问调查问卷调查文案调查观察调查实验调查数据的搜集方法利用现有的各种文献资料进行调查的方法。是一切调查方法的起点是以问卷的形式由被调查者填答进行调查的方法。通过调查者与被调查者之间的访谈获取资料的方法报刊问卷邮寄问卷留置问卷直接访问间接访问(电话调查)调查者利用自身感觉器官或观察工具搜集资料的方法通过实验方式确定因果联系的方法381.5统计数据的质量统计数据的质量控制问题是贯穿于统计研究全过程的重要问题不同的统计工作阶段,统计数据误差的原因不同,严重程度也不同。39统计调查阶段的误差40抽样误差

(samplingerror)由于抽样的随机性所带来的误差所有样本可能的结果与总体真值之间的平均性差异影响抽样误差大小的因素样本量的大小总体的变异性41非抽样误差

(non-samplingerror)相对于抽样误差而言除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异存在于所有的调查之中概率抽样,非概率抽样,全面性调查有抽样框误差、回答误差、无回答误差、调查员误差、测量误差42误差的控制抽样误差可计算和控制非抽样误差的控制调查员的挑选调查员的培训督导员的调查专业水平调查过程控制调查结果进行检验、评估现场调查人员进行奖惩的制度431.6

统计学的基本概念一、统计总体、总体单位和样本1.统计总体(population)是客观存在的、在某一性质基础上结合起来的许多个别事物的整体。总体分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的总体的三个特征:(1)大量性(2)同质性(3)差异性重点442.总体单位构成总体的这些个别事物总体所研究的全部个体(数据)的集合,其中的每一个元素称为个体3.样本(sample)从总体中抽取的部分总体单位构成的整体构成样本的元素的数目称为样本容量45统计总体、总体单位和样本三者关系总体单位总体样本注意:三者依据研究对象的不同,具有相对性46思考题:

为了解经管学院09级3班的学习情况,校学习部特对该班进行了一次调查,问:此次调查中总体是什么?总体单位是什么?如果校学习部想了解经管学院所有班级的学习状况,这时总体是什么?总体单位呢?若学习部在抽样调查中,选中了3班、5班,问3班和5班组成的整体,我们称为什么?47二、参数和统计量1.参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示

补充内容482.统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母表示

49参数和统计量平均数标准差比例参数统计量xsp总体样本50三、标志和标志表现1.什么是标志?总体各单位普遍具有的属性或特征,是各单位属性特征和数量特征的名称。统计研究是从登记标志开始,并通过对标志的综合来反映总体的数量特征,因此标志是统计研究的起点。2.什么是标志表现?即标志特征在各单位的具体表现如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现补充内容51标志的分类数量标志品质标志表明总体单位属性方面的特征,只能用文字、语言来描述,如年龄、性别表明总体单位数量方面的特征,可以用数值来表现,如工资、身高不变标志变异标志一个总体中各单位有关标志的具体表现都相同一个标志在总体各单位的具体表现不同52

标志表现有品质标志表现和数量标志表现之分

品质标志表现只能用文字表述,因此往往不能转化为统计指标,但对其对应的单位进行总计时就形成统计指标。

数量标志表现是一具体数值,也称标志值。

可变的数量标志称为变量。

在统计研究中,品质标志主要作为统计分组的依据,以便计算出不同组别的总体单位数。数量标志除作为分组依据计算单位数外,还可以直接进行许多其它计算,如计算平均年龄、平均工资等。53标志标志表现品质标志数量标志性别民族宗教信仰家庭住址年龄身高体重文字表述数据表述(标志值)男汉族佛教43岁182cm75公斤北京路6号54

四、统计指标与指标体系

统计指标是反映统计总体数量特征的概念和数值基本要素指标的取值:反映所研究现象的规模和水平指标的概念(名称):是对所研究现象本质的抽象概括

如2000年我国国内生产总值89403.5亿元国内生产总值89403.5亿元补充内容55完

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论