数据与统计学_第1页
数据与统计学_第2页
数据与统计学_第3页
数据与统计学_第4页
数据与统计学_第5页
已阅读5页,还剩57页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据与统计学第1页,共62页,2023年,2月20日,星期五2统计学描述统计推断统计目的基础参数估计参数估计参数估计假设检验参数估计方差分析参数估计相关与回归分析参数估计时间序列分析参数估计统计指数概率、概率分布和抽样分布第2页,共62页,2023年,2月20日,星期五第1章绪论1.1

统计数据与统计学1.2统计学的产生和发展1.3统计学的分科1.4统计数据的来源1.5统计数据的质量1.6统计学的基本概念本章小结第3页,共62页,2023年,2月20日,星期五4本章学习教学大纲要求1.理解统计学的基本涵义2.理解统计数据与统计学的关系3.区分描述统计与推断统计4.了解统计误差的基本概念和分类5.了解统计学与其他学科的关系6.了解统计学的产生与发展过程7.掌握并理解总体与总体单位、样本、指标与标志的基本概念第4页,共62页,2023年,2月20日,星期五5“统计”的三种含义1.统计工作收集数据的活动2.统计数据对现象计量的结果3.统计学分析数据的方法与技术统计工作统计学统计数据三者关系图1.1统计数据与统计学第5页,共62页,2023年,2月20日,星期五6一、什么是统计学?1.数据搜集:例如,调查与试验2.数据整理:例如,分组3.数据展示:例如,图和表4.数据分析:例如,回归分析统计学是一门收集、整理和分析数据的方法科学,其目的是探索数据的内在数量规律性,以达到对客观事物的科学认识重点第6页,共62页,2023年,2月20日,星期五7统计研究的过程收集数据(取得数据)整理数据(处理数据)解释数据(结果说明)分析数据(研究数据)实际问题第7页,共62页,2023年,2月20日,星期五8统计规律

(一些例子)正常条件下新生婴儿的男女性别比为107:100投掷一枚质地均匀的硬币,出现正面和反面的频率各为1/2;投掷一枚骰子出现1~6点的频率各为1/6农作物的产量与施肥量之间存在相关关系第8页,共62页,2023年,2月20日,星期五9二、统计学与其他学科的关系1、统计学与数学的关系联系:数学为统计理论和统计方法的发展提供基础不能将统计学等同于数学区别:数学统计学研究内容:抽象的数量规律

具体的、实际现象数量规律逻辑方法:演绎

演绎与归纳相结合,但主要是归纳第9页,共62页,2023年,2月20日,星期五10

统计学的应用领域actuarialwork(精算)agriculture(农业)animalscience(动物学)anthropology(人类学)archaeology(考古学)auditing(审计学)crystallography(晶体学)demography(人口统计学)dentistry(牙医学)ecology(生态学)econometrics(经济计量学)education(教育学)electionforecastingandprojection(选举预测和策划)engineering(工程)epidemiology(流行病学)finance(金融)fisheriesresearch(水产渔业研究)gambling(赌博)genetics(遗传学)geography(地理学)geology(地质学)historicalresearch(历史研究)humangenetics(人类遗传学)2、统计学与其它学科的关系第10页,共62页,2023年,2月20日,星期五11统计学应用的领域(续)hydrology(水文学)Industry(工业)linguistics(语言学)literature(文学)manpowerplanning(劳动力计划)managementscience(管理科学)marketing(市场营销学)medicaldiagnosis(医学诊断)meteorology(气象学)militaryscience(军事科学)nuclearmaterialsafeguards(核材料安全管理)ophthalmology(眼科学)pharmaceutics(制药学)physics(物理学)politicalscience(政治学)psychology(心理学)psychophysics(心理物理学)qualitycontrol(质量控制)religiousstudies(宗教研究)sociology(社会学)surveysampling(调查抽样)taxonomy(分类学)weathermodification(气象改善)统计学是一门应用极为广泛的学科,其应用领域涉及到了社会、经济、管理、医学等方方面面!!!第11页,共62页,2023年,2月20日,星期五12

一般认为,统计学产生于17世纪中叶,是从几个不同领域开始的:第一个源头——威廉·配第(WilliamPatty)《政治算术》(1676年)。在书中用大量的数据对英、法、荷三国的经济实力进行比较,使用定量的分析方法。(配第)是政治经济学之父,在某种程度上也可以说是统计学的创造人马克思1.2

统计学的产生和发展第12页,共62页,2023年,2月20日,星期五13另一个创始人——英国的约翰·格朗特(JohnGraunt)发表于1662年的《关于死亡表的自然观察与政治观察》一文中,通过大量观察的方法,研究并发现了人口与社会现象中重要的数量规律性。被称为“人口统计创始人”。第三个源头——古典概率论引入统计学,开辟了统计学的新领域,形成了数理统计学。19世纪末建成了古典统计学(主要是描述统计学)的基本框架。20世纪,统计学在理论、方法和应用领域有了较大发展,50年代以来,扩展成为各学科的基础工具。第13页,共62页,2023年,2月20日,星期五14历史上著名的统计学家JacobBernoulli(伯努利)(1654—1705)EdmondHalley(哈雷)(1656—1742)DeMoivre(棣莫弗)(1667—1754)ThomasBayes(贝叶斯)(1702—1761)LeonhardEuler(欧拉)(1707—1783)PierreSimonLaplace(拉普拉斯)(1749—1827)AdrienMarieLegendre(勒让德)(1752—1833)ThomasRobertMalthus(马尔萨斯)(1766—1834)ThomasRobertMalthus(马尔萨斯)PierreSimonLaplace(拉普拉斯)LeonhardEuler(欧拉)资料第14页,共62页,2023年,2月20日,星期五15历史上著名的统计学家FriedrichGauss(高斯)(1777—1855)JohannGregorMendel(孟德尔)(1822—1884)KarlPearson(皮尔逊)(1857—1936)RonaldAylmerFisher(费希尔)(1890—1962)JerzyNeyman(奈曼)(1894—1981)EgonSharpePearson(皮尔逊)(1895—1980)WilliamFeller(费勒)(1906—1970).FriedrichGauss(高斯)JohannGregorMendel(孟德尔)第15页,共62页,2023年,2月20日,星期五16一、按照应用方法的不同分为

描述统计学推断统计学描述统计是整个统计学的基础,推断统计则是现代统计学的主要内容思考题:举例分析:描述统计与推断统计的区别与联系?1.3统计学的分科第16页,共62页,2023年,2月20日,星期五17描述统计推断统计描述统计和推断统计指对采集的数据进行登记、审核、整理、归类.在此基础上进一步计算出各种能反映总体数量特征的综合指标,并用图表的形式表示经过归纳分析而得到的各种有用的统计信息。是在对样本数据进行描述的基础上,利用一定的方法根据样本数据去估计或检验总体的数量特征。第17页,共62页,2023年,2月20日,星期五18描述统计

(DescriptiveStatistics)研究数据收集、整理和描述的统计学方法内容搜集数据整理数据显示数据

目的描述数据特征找出数据的基本规律02550Q1Q2Q3Q4¥x=30s2=105重点第18页,共62页,2023年,2月20日,星期五19推断统计

(InferentialStatistics)研究如何利用样本数据来推断总体特征的统计学方法内容参数估计假设检验目的对总体特征作出推断样本总体重点第19页,共62页,2023年,2月20日,星期五20描述统计与推断统计的关系重点反映客观现象的数据总体内在的数量规律性推断统计(利用样本信息和概率论对总体的数量特征进行估计和检验等)概率论(包括分布理论、大数定律和中心极限定理等)样本数据总体数据描述统计(统计数据的搜集、整理、显示和分析等)第20页,共62页,2023年,2月20日,星期五21统计方法统计方法描述统计推断统计参数估计假设检验第21页,共62页,2023年,2月20日,星期五22理论统计(TheoreticalStatistics)研究统计学的一般理论研究统计方法的数学原理应用统计(AppliedStatistics)研究统计学在各领域的具体应用二、按照研究内容的不同分为

理论统计学

应用统计学第22页,共62页,2023年,2月20日,星期五23统计学的两大类

理论统计学

(数理统计学)应用统计学它的定义是把研究对象一般化、抽象化,以数学中的概率论为基础,从纯理论的角度,对统计方法加以推导论证,其中心内容是以归纳方法研究随机变经的一般规律。社会经济统计学。这是一门以社会经济现象的数量方面为特定研究对象的应用统计学。理论统计学和应用统计学第23页,共62页,2023年,2月20日,星期五241.4统计数据的来源直接获取的数据统计数据来源于直接的调查、观察和科学实验又称为第一手数据间接获取的数据从报纸、图书、杂志、统计年鉴、网络等渠道获得又称为第二手数据第24页,共62页,2023年,2月20日,星期五25直接数据对于社会经济管理和决策而言,主要通过统计调查的方式获取数据统计调查方法普查为特定目的,一次性全面调查优点:资料全面、准确性高;缺点:费用比较高,应用范围比较狭窄。一般适用于为社会提供基础全面的资料抽样调查随机样本推断总体规律性具有经济性、时效性强、适应面广、准确性高等特点应用最广泛、最重要第25页,共62页,2023年,2月20日,星期五26统计调查组织方式重点调查抽样调查普查典型调查统计报表统计调查组织方式我国现行统计调查体系,是以普查、统计报表为基础,以抽样调查为主要方式、辅之以重点调查典型调查的一种调查体系。本小节补充内容第26页,共62页,2023年,2月20日,星期五27普查

(census)

1.为特定目的专门组织的非经常性全面调查2.通常是一次性或周期性的3.一般需要规定统一的标准调查时间4.数据的规范化程度较高5.应用范围比较狭窄总体第27页,共62页,2023年,2月20日,星期五28抽样调查

(samplingsurvey)

1. 从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法总体随机样本2.具有经济性、时效性强、适应面广、准确性高等特点第28页,共62页,2023年,2月20日,星期五29重点调查

重点调查是从调查对象的全部单位中选择少数重点单位进行非全面调查重点单位是指在所要调查的数量特征上占有较大比重的单位。如若要调查某市人民币储蓄状况,则大型储蓄所则成为重点单位注:重点调查的调查结果不能用于推断总体优点:调查单位少,省时省力,能及时取得较详细的资料;缺点:调查的前提是重点单位要存在第29页,共62页,2023年,2月20日,星期五30典型调查

典型调查是从调查对象的全部单位中选择少数典型单位进行非全面调查调查目的是描述和揭示事物的本质特征和规律,其调查结果也不能用于推断总体。优点:代表性好、省时省力、资料详细;缺点:典型单位选择的好与坏直接关系到统计结果第30页,共62页,2023年,2月20日,星期五31统计报表

统计报表是按照国家或上级部门有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式统计报表的资料来源是基层单位的原始记录优点:准确性高、完整性好、便于资料积累;缺点:缺乏灵活性,时效性差第31页,共62页,2023年,2月20日,星期五32间接数据利用各种现成的数据报纸、图书、杂志、统计年鉴从专业数据公司购买互联网第32页,共62页,2023年,2月20日,星期五33间接取得的数据Internethttp//WWW.中国统计年鉴2001中国人口统计年鉴中国市场统计年鉴世界发展报告世界经济年检工业普查数据中国统计出版社统计部门和政府部门公布的有关资料,如各类统计年鉴各类经济信息中心、信息咨询机构、专业调查机构等提供的数据各类专业期刊、报纸、书籍所提供的资料各种会议,如博览会、展销会、交易会及专业性、学术性研讨会上交流的有关资料从互联网或图书馆查阅到的相关资料第33页,共62页,2023年,2月20日,星期五34提供统计数据的部分政府网站中国政府及相关机构

网址数据内容国家统计局统计年鉴、统计月报等国务院发展研究中心信息网宏观经济、财经、货币金融等中国经济信息网经济信息及各类网站华通数据中心国家统计局授权的数据中心中国决策信息网决策知识及案例三农数据网三农信息、论坛及相关网站第34页,共62页,2023年,2月20日,星期五35提供统计数据的部分政府网站美国政府机构

网址数据内容人口普查局人口和家庭等联邦储备局http://www.bog.frb.fed.us货币供应、信誉、汇率等预算编制办公室/omb财政收入、支出、债券等商务部商业、工业等第35页,共62页,2023年,2月20日,星期五36数据的搜集方法访问调查问卷调查文案调查观察调查实验调查数据的搜集方法利用现有的各种文献资料进行调查的方法。是一切调查方法的起点是以问卷的形式由被调查者填答进行调查的方法。通过调查者与被调查者之间的访谈获取资料的方法报刊问卷邮寄问卷留置问卷直接访问间接访问(电话调查)调查者利用自身感觉器官或观察工具搜集资料的方法通过实验方式确定因果联系的方法第36页,共62页,2023年,2月20日,星期五371.5统计数据的质量统计数据的质量控制问题是贯穿于统计研究全过程的重要问题不同的统计工作阶段,统计数据误差的原因不同,严重程度也不同。第37页,共62页,2023年,2月20日,星期五38统计调查阶段的误差统计调查阶段(直接收集数据)非抽样误差填报、抄录、不完整抽样等错误被调查者不合作人为干扰(虚报、瞒报)抽样误差利用样本推断总体时产生这类误差可以避免加强统计人员责任心、科学抽样等这类误差无法避免但可以计量、控制,如加大样本量第38页,共62页,2023年,2月20日,星期五39抽样误差

(samplingerror)由于抽样的随机性所带来的误差所有样本可能的结果与总体真值之间的平均性差异影响抽样误差大小的因素样本量的大小总体的变异性第39页,共62页,2023年,2月20日,星期五40非抽样误差

(non-samplingerror)相对于抽样误差而言除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异存在于所有的调查之中概率抽样,非概率抽样,全面性调查有抽样框误差、回答误差、无回答误差、调查员误差、测量误差第40页,共62页,2023年,2月20日,星期五41误差的控制抽样误差可计算和控制非抽样误差的控制调查员的挑选调查员的培训督导员的调查专业水平调查过程控制调查结果进行检验、评估现场调查人员进行奖惩的制度第41页,共62页,2023年,2月20日,星期五421.6

统计学的基本概念一、统计总体、总体单位和样本1.统计总体(population)是客观存在的、在某一性质基础上结合起来的许多个别事物的整体。总体分为有限总体和无限总体有限总体的范围能够明确确定,且元素的数目是有限的无限总体所包括的元素是无限的,不可数的总体的三个特征:(1)大量性(2)同质性(3)差异性第42页,共62页,2023年,2月20日,星期五432.总体单位构成总体的这些个别事物总体所研究的全部个体(数据)的集合,其中的每一个元素称为个体3.样本(sample)从总体中抽取的部分总体单位构成的整体构成样本的元素的数目称为样本容量第43页,共62页,2023年,2月20日,星期五44统计总体、总体单位和样本三者关系总体单位总体样本注意:三者依据研究对象的不同,具有相对性第44页,共62页,2023年,2月20日,星期五45思考题:

为了解经管学院09级3班的学习情况,校学习部特对该班进行了一次调查,问:此次调查中总体是什么?总体单位是什么?如果校学习部想了解经管学院所有班级的学习状况,这时总体是什么?总体单位呢?若学习部在抽样调查中,选中了3班、5班,问3班和5班组成的整体,我们称为什么?第45页,共62页,2023年,2月20日,星期五46二、参数和统计量1.参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值()、标准差()、总体比例()等总体参数通常用希腊字母表示

补充内容第46页,共62页,2023年,2月20日,星期五472.统计量(statistic)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母表示

第47页,共62页,2023年,2月20日,星期五48参数和统计量平均数标准差比例参数统计量xsp总体样本第48页,共62页,2023年,2月20日,星期五49三、标志和标志表现1.什么是标志?总体各单位普遍具有的属性或特征统计研究是从登记标志开始,并通过对标志的综合来反映总体的数量特征,因此标志是统计研究的起点。2.什么是标志表现?即标志特征在各单位的具体表现如果说标志是统计所要调查的项目,那么标志表现是调查所得结果,标志的实际体现补充内容第49页,共62页,2023年,2月20日,星期五50标志的分类数量标志品质标志表明总体单位属性方面的特征,只能用文字、语言来描述,如年龄、性别表明总体单位数量方面的特征,可以用数值来表现,如工资、身高不变标志变异标志一个总体中各单位有关标志的具体表现都相同一个标志在总体各单位的具体表现不同第50页,共62页,2023年,2月20日,星期五51

标志表现有品质标志表现和数量标志表现之分

品质标志表现只能用文字表述,因此往往不能转化为统计指标,但对其对应的单位进行总计时就形成统计指标。

数量标志表现是一具体数值,也称标志值。

在统计研究中,品质标志主要作为统计分组的依据,以便计算出不同组别的总体单位数。数量标志除作为分组依据计算单位数外,还可以直接进行许多其它计算,如计算平均年龄、平均工资等。第51页,共62页,2023年,2月20日,星期五52标志标志表现品质标志数量标志性别民族宗教信仰家庭住址年龄身高体重文字表述数据表述(标志值)男汉族佛教43岁182cm75公斤北京路6号第52页,共62页,2023年,2月20日,星期五53

四、统计指标与指标体系

统计指标是反映统计总体数量特征的概念和数值基本要素指标的取值:反映所研究现象的规模和水平指标的概念(名称):是对所研究现象本质的抽象概括

如2000年我国国内生产总值89403.5亿元国内生产总值89403.5亿元第53页,共62页,2023年,2月20日,星期五54完整的统计指标包括四项内容:

1、指标名称,说明所反映现象数量特征的性质和内容。

2、统计的时间界限和空间范围。

3、计量单位。

4、指标的数值。例如,中国1983年全国钢产量4002万吨,就是一个完整的统计指标。统计学中的统计指标,一般是泛指社会经济现象某种数量特征,即没有具体规定其时、空界限和没有数值的统计指标名称(如“钢产量”)。第54页,共62页,2023年,2月20日,星期五55质量指标例如,人口的年龄构成、农业—一轻工业——重工业比例、平均单产、平均工资等等。数量指标例如,人口数、企业数、工资总额、商品销售额等等统计指标的分类也称为总量指标,用绝对数来表示。反映现象或过程的总规模和水平是总量指标的派生指标,用相对数或平均数来表示,以反映现象之间的内在联系相对比关系如人口总数、企业总数、职工总数、工资总额如职工平均工资、人口密度、工人出勤率统计指标的分类第55页,共62页,2023年,2月20日,星期五56指标和标志既有明显的区别,又有密切的联系,二者的主要区别是:(1)指标是说明总体特征的,而标志是说明总体单位特征的;(2)标志有不能用数值表示的品质标志和能用数值表示的数量标志两种,而指标都必须是能用数值表示的。指标和标志的联系主要表现在:(1)有许多统计指标的数值是直接从总体单位的数量标志值汇总而来的;(2)指标与数量标志之间存在着转化的关系。由于总体和单位的概念会随着研究目的不同而变化研究全国工业企业的情况,则各企业的职工人数是总体单位的标志,而如果研究目的变成某一企业的职工状况,则该企业变成一个总体,企业的职工人数变成了统计指标第56页,共62页,2023年,2月20日,星期五57统计指标体系意义概念一个统计指标只反映总体的某一个数量特征,说明现象某一侧面的情况。客观现象是复杂的,要反映其全貌、描述现象发展的全过程,只靠单个统计指标是不够的,需要设立统计指标体系。

统计指标体系是由一系列相互联系的统计指标所组成的有机整体用以反映所研究现象各方面相互依存、相互制约的关系。统计指标体系第57页,共62页,2023年,2月20日,星期五58思考题:1、下列标志中,属于数量标志的有哪些?品质标志有哪些?A工资B年龄C性别D民族E体重2、某班为调查总体,则每一名学生的统计学成绩是标志还是指标?全班平均统计学成绩呢?3、下列指标中属于数量指标的有哪些?A人口密度B国土面积C人口总额D平均GDP增长率E平均人口密度第58页,共62页,2023年,2月20日,星期五59本章小结统计数据与统计学统计学的产生和发展统计学的分科统计学与其他学科的关系统计数据的来源统计数据的质量控制统计学的基本概念第59页,共62页,2023年,2月20日,星期五60控制图controlchart

根据假设检验的原理构造一种图,用于监测生产过程是否处于控制状态。它是统计质量管理的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论