统计学发展概况_第1页
统计学发展概况_第2页
统计学发展概况_第3页
统计学发展概况_第4页
统计学发展概况_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计发展概览由于人类的统计实践是通过计算活动实现的,统计发展史可以追溯到古代的原始社会,即从现在开始足有5000多年的漫长岁月。但是可以将人类的统计实践提高到理论上可以概括的水平。也就是说,开始成为系统的学问统计是近代的事情,离现在只有300多年前的短暂历史了。统计发展的概述可以分为经典记录统计、现代技术统计、现代推理统计三种形式。一、经典记录统计古典记录统计形成时间大约从17世纪中叶到19世纪中叶。统计在这个崛起阶段仍然是意义和范围不太明确的学科,在用文字或数字真实地记录和分析国家社会经济状况的过程中,初步建立了统计研究的方法和规则。概率理论引进后,才成为越来越成熟的方法。第一次有效地将古典概率论引入统计学的是法国天文学家、数学家和统计学家拉普拉斯(P.S. Laplace,1749-1827)。因此,比利时统计学家凯特勒指出,统计应该从拉普拉斯开始。(a)拉普拉斯的主要贡献1,开发概率论的研究拉氏概率论的最初表达发表于1774年。这是他的代表作,从1812年开始发行4版概率分析理论。在本书中,拉氏首次将数学分析方法系统地应用于概率论研究,建立了严密的概率数学理论。这本书不仅总结了自己过去的研究,还总结了老一辈学者研究概率论的成果,成为古典概率论的集大成者。2、推进概率论在统计中的应用,由于拉普拉斯将天文学和物理学的研究结合起来从事概率研究,他可以指出,概率理论可以相当自觉、相当明确地应用,并能解决一系列实际问题。他在实际振兴中的成绩多方面,主要表现在人口统计、观测误差理论及概率论在天文问题上的应用。结合概率分布模型和中心极限思想,研究了最小二乘法的1809年至1812年,首次为统计中此后最广泛使用的手段提供了理论依据。3,统计学的大量法则拉普拉斯认为。“作为现象的原因,我们知道或知道的也是原因复杂,无法计算;发生原因被偶然因素或没有一定规律的因素扰乱,直到事物发展的变化,要长期广泛观察,才能求得发展的真法。概率理论可以研究造成这种发展变化的成分,并指明其成分的数量。”这是他通过天文学上的研究获得的经验。他发现,如果有足够的时间观察天体的运动,就会出现使物体特征消失的倾向等现象。他指出,这不是偶然,而是其中一定有什么原因。4、在统计发展史上,试图推断大样本,人口计算问题,可以成为统计学家多年的问题。拉普拉斯直到19世纪初才利用概率论的原理迈出了重要的一步。理论上,1781年拉普拉斯在“理论上概率论”一文中建立了概率积分,提供了计算区间误差的强有力的手段。从1781年到1786年,提出了“拉普拉斯定理”(中心极限定理的一部分),初步确立了大样本推理的理论基础。实际上,拉普拉斯在1786年写了一篇关于巴黎人口出生、结婚和死亡的文章,文章提出了根据法国特定地区的出生率估计全国人口的问题。他抽调了30个市县,进行了深入调查,估算了全国总人口数。其方法和结果仍然相当粗糙,但在统计发展史上,他利用样本推断出整体的思想方式,为后人开辟了抽样调查的新途径。对概率论与统计的结合研究做出贡献的另一个人是德国伟大的数学家高斯(c.f .高斯,1777-1855)。(b)高斯的主要贡献1、成立最小平方的学生时代,课程开始了最小平方研究。1794年,他读了数学家兰伯特(j . h . Lambert,1728 1777)的作品,讨论了如何使用平均法确定观察值(yi,Xi)中线性关系y= x的两个系数。1795年,以残差平方和西格玛(I-a-bxi)2为最小值得到的a和b估计了和。1798年完成最小二乘法的整体思维结构于1809年正式发表。2、发现高斯分布调查、观察或测量的误差是不可避免的,而且一般无法掌握。科斯通过他丰富的天文观测和从1821年到1825年测量土地的经验,发现了观察值x和实际值的误差变异,极大地服从了现代人最熟悉的正规分布。他利用最大似然法和其他数学知识推导了测量误差的概率分布公式。“误差分布曲线”一词是科斯莫斯提出的,后代为了纪念他,将此分布曲线称为高斯分布曲线,即今天的正态分布曲线。高斯发现的一般误差概率分布曲线及其所产生的天文观测误差的测量方法在理论上和应用上都具有十分重要的意义。二、现代技术统计近代技术统计形成时期大约是19世纪中叶到20世纪上半叶。这种“描述”的特征最初是由研究生物进化的学者组成的群体确定的,因此历史上称他们为生物统计学。生物统计学派的创始人是英国的戈登(F. Galton,1822-1911),队长是戈登的学生比尔森(K.Pearson,1857-1936)。(a)戈登的主要贡献1、为了研究早期生物统计学人类智能的遗传问题,高利登仔细阅读了300多人的传记,初步确定了其中有多少人的亲属关系及关系大致紧密。然后在知名人士组个别调查,从整体上查明了智力遗传学的规律性。为了获得更多有关人的特性和能力的统计资料,高尔顿从1882年开始成立了“人体测量实验室”。连续6年测量了9337名“身高、体重、宽度、呼吸力、牵引力和压力、掌掴速度、听觉、视力、色觉和其他个人信息”,深入研究了这些数据中隐藏的内在关系,得出了“祖先遗传规律”。他努力探索描述和比较大量数据的方法和方法,引入了重要的统计概念和方法,如中数、百分位数、四分位数、四分位数、分布、相关性、回归等。1901年,戈登和他的学生比尔森为生物计量学 (Biometrika)杂志撰写的创刊中,首次为他们使用的统计方法提出了“生物统计”(biology)一词。戈登解释说:“所谓的生物统计学是适用于生物界的现代统计方法。”看戈登和随后的研究室,他们把生物统计看作应用统计。其研究范围是对生物科学的问题进行统计研究,更重要的是开发生物科学应用中的统计方法本身。2、对统计的贡献(1)戈登首次统计接近变异是进化论中的重要概念,并领导了英国生物统计学派的创立。1889年,戈登将整体定量测定法引入遗传研究。戈登发现,通过整体测量,可以确定对象或植物的每种类型的平均类型。在一个恒星中,所有的物体围绕这个平均类型,以它为轴,向多方面变异。这就是他在遗传的天赋这本书里提出的平均偏差法则。(2)“相关”统计相关法律是戈登制定的。首先,他测量了甜豌豆的大小,发现后代有遗传后“回双亲”的现象。1877年收集了很多身体长度的数据,计算了高个子和矮个子,高个子的父母的后代各有多少个高个子和矮个子的孩子,在一定程度上知道父母高个子,父母矮个子的后代矮个子的事实,在父母和子女之间的长度上将其具体化为数量关系。1888年,戈登在相关与人体主要测量一文中充分论述了“相关”的统计重要性,并提出了戈尔登相关函数(即目前常用的相关系数)的计算公式。戈尔登在1870年研究人类身体长度的遗传时发现,高个子父母的子女倾向于低于父母的身体长度。相反,短父母的子女们的身体长度倾向于高于父母的长度。从整体来看,高个子的人“回归”了一般身高的期待,矮个子的人则相反的“回归”。这是统计上“回归”的初始含义。1886年,戈登在论文中正式提出了“从遗传的身体长度到中间身体长度的回归”的概念。(b)比尔森的主要贡献比尔森在生物统计学上倾注了心血,上升到了通用方法学的高度。比尔森的生活是统计学的一生,他对统计做出了巨大贡献:1、从可变数据处理生物统计中获取的数据往往是无序的,很难知道原因。为此,比尔森首次探索了处理数据的方法,他开创的频率分布图和频率分布图现在成为统计方法最基本的手段之一。据悉,分布曲线的匹配在19世纪以前用频率分布解释了变异值,最终以正态分布曲线出现。但是比尔森注意到在生物统计学的经验分布中,对很多生物的测量不是正态分布,而是经常以偏法分布,甚至是坡度很多。都不是单峰,也不是单峰。说明“现状”信念不可靠。1894年,他在一篇名为“不对称频率曲线的分解”的文章中,首先将不对称观测曲线分解成几条规则曲线。他利用称为“相对梯度”的方法获得了12种分布函数类型:正态分布、矩形分布、j型分布、u型分布或贝尔分布。经过r . fisher的进一步研究,biersheng分布曲线、型出现在小样本理论中。推导比尔森曲线系统的方法缺乏理论基础,但给了很多启示。3.卡方检察官于1900年独立重新发现了比尔森的分布,并提出了著名的卡方检验法(Test of)。比尔森得到了统计:=(实际次数-理论数)2/证明了当理论数和观测值足够多时总是近似服从自由度为(k-1)的分布。其中k表示要拆分的组数。在自然现象的范围内,检验法被广泛使用。由r .费雪补充,小样本成为推断统计的早期方法之一。4、回归及相关开发回归及相关,经过birson的进一步开发,在这两个概念生物统计学领域,它被推进为一般统计方法的重要概念。1896年,他在进化论的数学研究:回归、遗传、随机配对一文中写道,仍然广泛使用的线性相关计算公式:比尔幸存的回归计算公式:=a bx(其中a和b根据最小二乘法计算得出),回归系数的计算公式:y随着x的变化而变化,(如果x与y一起变更,则输入(x-)/-(y-)2。比尔的生存从1897年到1905年,不仅发展了阿尔高登的理论,还在数学上发展了相关的相关、总相关、相关比例等概念。三、现代推理统计现代推断统计形成时间大约是20世纪初叶到20世纪中叶。人类历史进入20世纪后,社会领域和自然领域对统计的要求都更大。各种事物和现象之间复杂的数量关系和一系列未知的数量变化仅仅靠记录或技术很难看到效果。因此,把握事物的整体真实关系,预测未来发展的“推论”方法层出不穷。从技术统计中学习推理是统计发展过程中的一大飞跃。统计发展的这一重大变化是在农业现场试验领域进行的。因此,历史上被称为农业试验学。对确立现代推理统计的最大贡献是英国统计学家戈塞特(W.S. Gosset,1876-1937年)和费舍尔(r . a . fisher,1890-1962年)。(a)戈塞特的t检验和小样本思想1908年,戈塞特首次以学生的笔名在生物计量学杂志上发表了平均概率误差。这篇文章提供了学生t检验的依据,因此很多统计学家认为1908年是统计推理理论发展史上的里程碑。之后,高尔塞连续发表了相关系数的概率误差(1909)、随机样本平均分布(1909)、来自无限总体随机样本平均的概率估计表(1917)等。他比较了这些论文中的第一、平均误差和标准误差两种计算方法;其次,研究了泊松分布的样本误差问题。第三,建立了相关系数的抽样分布。第四,带来了“学生”分布,即t分布。这些论文的完成为“小样本理论”奠定了基础。之后为样品数据的统计分析和解释开辟了新的道路。由于戈塞特的理论,统计学开始从大标本发展到小标本,从描写发展到推理,有些人把戈塞特誉为推理的先驱。(b) R .费舍统计理论和方法费雪一生写了329篇论文。世界各国最普及的统计著作有:1925年出版的供研究人员用的统计方法,1930年出版的自然选择的遗传原理,1935年出版的试验设计,1938年和耶特联合出版的供生物学、农学与医学研究用的统计表,1938年出版的统计估计理论,1950年出版的对数理统计的贡献当时他在统计学上处于世界领先地位,他的贡献是多方面的。1、通用方法r .费雪强调,统计学是对所有自然现象或社会生活现象的研究、统计方法及其计算方法“和其他数学科目一样,对所有问题的研究应用相同的公式”的一般方法。他指出:“统计学是应用数学最重要的部分,可以看作是加工观察到的材料的数学。”2、“无限假设”r .费雪认为,研究包括社会经济现象在内的各种事物的现象时,必须抛弃有关具体物质内容的信息,让统计只涉及“统计总纲”。例如,“如果已经有1万名新兵的信息,统计调查的对象不是全体新兵,而是各种身体长度大小的总和。”.显然,r .费雪只对构成整个统计元素的特定符号感兴趣,而对每个元素本身没有兴趣。其目的是简化问题,使其易于统计处理。他在1922年写的理论统计学的数学基础一书中提出了“无限总体假设”的重要概念。“假设的无限总体,即现有数据就是那个随机样本。”.3,采样分布r . fisher(r)从研究概率分布开始。1915年,他在统计方法和科学推断杂志上发表了无限总体样本相关系数值的频率分布。这篇论文对相关系数的一般公式进行了论证,对以后整体推理统计的发展将有所贡献。这篇论文被称为现代抽象统计的第一篇论文。1922年,r .皮雪导出了相关系数r的z分布,随后还准备了生物计量学。1924年,r .皮雪综合研究了t .分布、分布、z .分布,使皮氏生的检查也适用于小样本。1938

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论