正态分布对概率统计起源与发展的影响_第1页
正态分布对概率统计起源与发展的影响_第2页
正态分布对概率统计起源与发展的影响_第3页
正态分布对概率统计起源与发展的影响_第4页
正态分布对概率统计起源与发展的影响_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、正态分布对概率统计起源与发展的影响 学号:哈尔滨师范大学学士学位论文题 目正态分布对概率统计起源与发展的影响 学 生 指导教师 讲师年 级2008级 专 业数学与应用数学 系 别数学系 学 院数学科学学院 哈 尔 滨 师 范 大 学学士学位论文开题报告 论文题目正态分布对概率统计起源 与发展的影响 学生姓名 指导教师 讲师 年 级2008级 专 业数学与应用数学2011年 11 月说 明 本表需在指导教师和有关领导审查批准的情况下,要求学生认真填写。 说明课题的来源(自拟题目或指导教师承担的科研任务)、课题研究的目的和意义、课题在国内外研究现状和发展趋势。若课题因故变动时,应向指导教师提出申请

2、,提交题目变动论证报告。 课题来源: 由指导教师提供。课题研究的目的和意义: 正态分布属于概率论的范围,同时也是统计学的基石,它的提出和应用具有其独特的双重理论背景和重要价值。正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,大样本这些统计推断方法也是以正态分布为理论基础的。 结合不同阶段的发展背景,对该理论的思想演化过程及其代表人物的重要工作做分析与总结,阐明了正态分布在发展的不同阶段同相关理论的相互影响,强调该理论从产生到成熟发展的曲折性,诠释概率统计

3、理论由观念转变和技术创新来推动发展的微妙性及二者互为渗透、交融的发展规律,可以为现代数学史研究和数学教育提供借鉴意义。国内外同类课题研究现状及发展趋势: 正态分布概念是由德国的数学家和天文学家moivre于1733年受次提出的,但由于德国数学家gauss率先将其应用于天文学家研究,故正态分布又叫高斯分布。对于正态分布的发展过程,现有文献大多是谈论某一个人物或某一阶段对正态分布理论的工作,并且以详实地记录其理论上的推导和证明为主,对于正态分布从开始不受重视到之后大行其道的发展背景和历史根源并没有进行详尽地挖掘和明确地表述,而后者对于数学研究则更具有理论价值和指导意义。以正态分布的历史发展为题材,

4、对其不同阶段的发展背景做系统的分析与总结,并以此为线索来考证概率统计理论由互相孤立到彼此渗透,再到相互交融的发展特点等问题将是该题目研究的方向。 课题研究的主要内容和方法,研究过程中的主要问题和解决办法:研究内容:1.正态曲线在概率论中的提出; 2.正态分布从误差论中的重生; 正态分布向近代统计学的引入; 正态分布对现代统计学的影响;主要问题: 1.正态分布进入概率统计的历史演化; 2.正态分布对概率统计的影响;解决办法 1.查阅相关文献,从正态分布的发展来明确主要路线; 2.参考中外学者对正态分布的总结分析,来了解正态分布对概率统计的重要意义。课题研究起止时间和进度安排: 1指导教师给学生下

5、达任务2011.09.01?2011.10.02; 2完成开题报告,交给指导教师审阅 2011.10.02?2011.11.25; 3完成毕业论文,交给指导教师审阅 2012.03.15?2012.04.15; 4毕业论文答辩 2012.04.16?2012.04.26.课题研究所需主要设备、仪器及药品:外出调研主要单位,访问学者姓名:指导教师审查意见: 指导教师 (签字) 年月 教研室(研究室)评审意见: _教研室(研究室)主任(签字) 年月院(系)审查意见: _院(系)主任 (签字) 年月学 士 学 位 论 文题 目正态分布对概率统计起源 与发展的影响 学 生 指导教师讲师 年 级2008

6、级 专 业数学与应用数学 系 别数学系 学 院数学科学学院 哈尔滨师范大学2012年4月目 录摘要.1关键词.1引言.1正态曲线在概率论中的提出.1正态分布从误差论中的重生.2正态分布向近代统计学的引入.3正态分布对现代统计学的影响.4结束语.7参考文献8英文摘要9 正态分布对概率统计起源与发展的影响 摘要:正态分布在概率统计中占有特别重要的地位,是许多统计方法的理论基础。本文通过梳理正态分布的发现和改进的历史过程,阐述其对概率统计起源于发展的影响,为现代数学史研究和数学教育提供借鉴意义。 关键词:概率统计;正态分布;发展历史;数学教育 引言 概率论是一门研究随机现象规律性的数学分支,数理统计

7、研究怎样有效地收集、整理和分析随机性数据,并对所考察的问题进行推断或预测,直至为采取一定的决策和行动提供依据和建议,可以说,统计比概率具有更广泛的应用性。 概率论与统计学分别经历了不同阶段的发展,呈现出理论上由青涩到成熟、方法上由粗略到严密、应用上由单一到多向的发展规律。从历史上看,概率论和统计学是一对姊妹学科:在时间上,二者的发展具有并行性和交织性;在理论上,二者互为渗透、影响并逐渐走向交融。概率论直接来源于赌博,其理论的深化推动了统计学的发展;而统计事业的萌芽又为概率论提供了新的现实模型,拓展了其研究和应用的范围。 正态分布由于其强大的普适性,是概率论中最重要的一种连续型分布。例如,在生产

8、条件不变的情况下产品的强力、抚压、强度、口径长度等指标;一种生物体的身长、体重等;同一种种子的重量;弹着点沿某一方向的偏差等都可以认为是服从正态分布。研究表明,一个变量如果受到大量微小的、独立的随机因素的影响,那么这个变量一般是一个正态变量。正态分布是实践中应用最为广泛,在理论上研究最多的分布之一,它在概率统计中占有特别重要的地位。从形式上看,正态分布属于概率论的范围,但同时又是统计学的基石,因此它的提出和应用具有其独特的双重理论背景和重要价值。 正态分布从提出时的不受重视到之后在统计学中大行其道的历史过程,完美地展示了概率论与统计学在发展的不同阶段相关理论间的相互影响,成为相关研究的一个理论

9、典范。 一、正态曲线在概率论中的提出 1713年,伯努利遗著猜度术出版,其中提出了研究大量重复的随机现象中出现的必然规律? 伯努利定理,这是概率论中的经典定理之一。经过反复试验,他证明了在一定范围内存在稳定的概率,但并没有揭示这种偶然现象的背后的实质内容和规律。而后,狄莫弗在研究伯努利提出的问题时得出了二项分布,正是在寻求二项分布的渐进公式时,发现了正态分布的密度函数。这是对正态分布最早的发现。在1733年11月12日,他第一次以文字的形式把这个公式写在论文中,后来又发表在机会的学说的第二版和第三版以及分析杂论的某些版本中。 但是狄莫弗关于二项分布近似服从正态分布这一发现并没有引起人们的注意,

10、卡尔-皮尔逊在编写正态曲线史时重新提到狄莫弗的工作,人们这才认识到狄莫弗的贡献。狄莫弗的这项工作具有重要意义,正如他所指出的,尽管机会具有不规则性,由于机会无限多,随着时间的推移,不规则性与秩序相比将显得微不足道。刚开始,正态分布的密度函数并没有纳入到概率分布的行列。一直到18世纪末,正态分布仍未取得它后来的重要地位,而只是作为二项分布的近似表示,所涉及的统计数据分析问题也主要与二项分布模型有关。 就正态分布的提出过程而言,它主要受到了来自概率论的影响,首先,狄莫弗的工作是解决某类赌博问题的直接结果,这与概率论的产生和发展是一脉相承的;其次,狄莫弗在做此工作之前只详细阅读过惠更斯的著作,这对他

11、之后概率论方面的成就奠定了坚实的基础;最后,虽然狄莫弗做出了与雅各布?伯努利遥相辉映,并成奇葩的工作。 正态分布理论的完善与中心极限定理、最小二乘法等理论的工作相辅相成,互为促进,激发了众多学者的兴奋点,他们纷纷把目光聚集过来,审视并完善这一理论,基本误差假设就是一个昭然若揭的范例!然而,在相当长的时期内,误差论和统计学被看成是两个不相干的领域,其研究对象和研究方法具有本质的区别,这样正态分布就陆续进入了发展的双轨道。 二、正态分布从误差论中的重生 虽则狄莫弗早在1730?1733年间已从二项分布逼近的途径得到了正态密度函数的形式,但当时其身份还只是一个数学表达式而非概率分布。甚至到1780年

12、拉普拉斯得到的一般中心极限定理的形式时,也还是这个情况。惟有高斯在1809年提出“正态误差”的理论后,它才取得“概率分布”的身份并因此而引起人们的重视,并随着魁特奈特?高尔顿等人在社会?经济和遗传学等领域的工作,将其应用由测量误差拓展到广大的领域。所以,溯本寻源,正态分布这条大河的“正源”,还要算是测量误差理论。 误差论的基本问题是:随机测量误差应服从怎样的概率规律,即有怎样的概率分布。这个问题的提出和讨论,是天文学者的功劳,正态分布的重新提出始终是围绕误差论基本问题的解决来做出重大突破的。天文学自古代至18世纪是应用数学中最发达的领域,观测和数学天文学,给出了建模及数据拟合的最初例子。正态分

13、布的重生过程为此评论提供了一个典型的例子。天文学的问题使得人们最早关心使用算术平均的合理性问题,并从误差分布论的角度来进行考察。 1809年,德国大数学家高斯,在研究测量误差的概率分布时,提出正态误差理论,使狄莫弗在约70年前引进的那个函数首次取得了“概率分布”的身份,为赢得人们的重视和普遍应用提供了可能。与此同时,与正态分布相关的一系列概率理论的完善,正态分布从天文学向社会学、生物学领域渗透的理论基础,概率论与统计学的交融发展尤其令人欣喜的是,高斯连同拉普拉斯、勒让德等人关于中心极限定理、最小二乘法等理论的工作与正态分布理论的完善相辅相成,互为促进,激发了测地学家、天文学家、物理学家等众多学

14、者的兴奋点,他们纷纷把目光聚集过来,审视并完善这一理论,对正态分布的广泛应用奠定了良好的理论基础。 此外,高斯对最小二乘法的误差分析,最初也源自拉普拉斯的考虑。1811年,拉普拉斯考虑了可测量值为一维时参数的无偏估计,证明了当误差为正态时,利用方差尽量小原则和施瓦茨不等式,可知或然误差最小的估计是最小二乘估计,以及若误差不服从正态分布但n很大时,可利用中心极限定理近似地得出相同结论。由此拉普拉斯表明当样本规模很大时,线性回归系数的一类线性无偏估计值是渐近正态分布的。 总之,高斯对误差正态分布的提出,以及与之相伴的最小二乘法和中心极限定理一般形式的诞生,对后世的影响极大,这也使正态分布同时有了“

15、高斯分布”名称。 三、正态分布向近代统计学的引入 18世纪所涉及的统计数据分析问题,主要与二项分布有关,狄莫弗引入的正态分布被人们生生地抛在脑后;到了19世纪初,拉普拉斯中心极限定理与高斯正态误差理论的问世,使这种情况逐渐出现转机,正态分布开始崭露头角,发挥其作为统计模型的优势,只是由于观测数据与统计数据不相容性的认识,使得它的影响仍受限于其发源地;而真正把正态分布的舞台拓展出去的当属凯特莱,他首次强调了正态分布的用途,并将以它为基础的统计方法应用到天文学、数学、物理学、生物学、社会统计学及气象学等研究范围,在他的影响下,正态分布获得了普遍认可和广泛应用,以至有些学者认为19世纪是正态分布在统

16、计学中占统治地位的时代。 凯特莱与正态曲线有关的工作分为两个方面:一是把误差理论应用到新的领域,二是“平均人”的概念。前者的灵感来源于人口普查,后者则是使统计方法获得广泛应用的理论基础。二者相辅相成,共同构成了凯特莱思想的根基。 同时高尔顿是英国利用欧洲大陆更早著作的第一人,受凯特莱的启发,他对正态分布怀有浓厚的兴趣。他与凯特莱一样相信正态曲线是“适用于无数情况”的一般法则。他最早把统计方法应用于生物学,并作了两点突破:第一,他指出,若干个同质数据的混合体,可借助正态分布分离开,他极其广泛地搜集资料,目的就在于探索把大量已知数目归纳为能够用于描述和比较的几个简单公式的途径和方法;第二,引进了“

17、统计尺度”的概念,把非数量性指标(如智力)数量化,从而能够进行计算和比较,并指出:同一物种若其某数量性指标(如身高)可用正态曲线拟合,则其他指标也可用正态分布拟合,这种思想在心理学和教育学中出现了很多追随者。 由于凯特莱和高尔顿的创新思想与实干精神的结合,正态分布逐步完成了从丑小鸭向白天鹅的蜕变,它亭亭玉立于世人的面前,是如此地谦恭,如此地多能,等待着来自各个理论研究的人们的召唤。如果说,充斥着偶然性的世界是一个纷乱的世界,那么,正态分布为这个纷乱的世界建立了一定的秩序,它如同一位少女在嘈杂的人群中翩翩起舞,直达理论的核心地位,使得偶然性现象在数量上被计算和预测成为可能。 还有一位杰出的人物魁

18、特奈特,他是19世纪最具影响的统计学家之一,他的主要贡献,是提倡并身体力行将正态分布用于连续性数据的分析。他的这一努力是正态分布在19世纪统计应用中大为流行,有的学者说正态分布统治了19世纪的统计学,并造出了“魁特奈特主义”这个名词。 四、正态分布对现代统计学的影响 现代统计主要起源于研究总体、变差和简化数据。对死亡表的自然观察和政治观察一书是“真正统计学的肇端”。英国政治算术学派代表约翰?格朗特在书中通过大量观察的方法,研究并发现了一系列人口统计规律。格朗特注意到了随机的起伏,但他仅以机械的术语加以描述,将其与钟表运动的忽动忽停相联系。威廉?配第是格朗特同时代的经济学家,他认为需要建立中央统

19、计部及相应部门为统计人口的有关状况来收集一些数据,其中应包括出生、死亡、婚姻、收入、教育和商业等方面的统计数据。其代表作为1676年出版的政治算术.书中利用大量的数字资料对英国、法国、荷兰三国的经济实力进行比较.他运用了数字、重量、尺度等进行数量对比分析的方法,奠定了经济统计学基础。哈雷利用breslau记有死亡之年龄的数据,改进了格朗特的生命表并定义了死亡率这个概念。伯努利以弱大数定律支持了对大样本均值的使用。辛普森计算了同分布随机变量之和的精确分布。瑞士数学家欧拉提出了平稳生命表的概念。马尔萨斯开始用数学方法来研究生命表的理论。拉普拉斯导出了对男子出生比例的类似的渐近公式,并首先把数学分析

20、系统地运用于概率论,由此导致了建立在概率论基础上的统计学发生了质的飞跃。 直到1830年,几乎所有的经验分布都是关于一维误差或一个非数值变量。在1830年之后,凯特勒使得诸如身高体重之类的度量值的变量的经验分布通俗化,他在生物统计研究中大量利用了理论二项分布和正态分布。“相关”和“回归”,是高尔顿在1886年研究了两代豌豆重量之间的相关性时使用的,时他发现了y关于一正态随机变量x的线性回归及类似于椭圆的等概率线。从此,多元正态分布就经常出现在文献之中。皮尔森在高尔顿的指点下,讨论生物进化、返祖、遗传、自然选择、随机交配等问题,用回归和相关工具,系统地将生物进化数量化,并先后提出和发展了标准差、

21、正态概率曲线、平均变差、均方根误差等一系列数理统计学名词和概念。1901年,皮尔森创办生物计量学杂志,数理统计学才有了自己的阵地。1908年,戈塞特以“student”为笔名,在生物计量学上发表了论文平均数的规律误差。这篇文章提供了t检验的基础,被统计学家看作统计推断发展史上的里程碑。一般认为,戈塞特的研究工作的意义不仅在于获得小样本理论,更重要的是其研究方法和思路,即不仅依靠大量观测进行描述,而且通过实验思考得出推断。 在20世纪30年代费舍曾对独立同分布概率变量的最大值极值统计量的渐近分布进行过理论研究,发现了在极值分布中有逆威布尔分布康拜尔分布遵从于同一分布的n个独立连续概率变量中最大值

22、x的极限分布即弗莱舍分布,以及观察到了属于正态分布的极值统计量向极值分布的收敛相当缓慢。费舍以其四篇论文开创了统计学的新纪元。它们给出了相关系数估计的精确分布,协调一致了mendelian和生物统计对遗传学的不同方法,正确解释了列联表及估计和推断的一般定理。在1920年之后,费舍发展了有广泛应用价值的方差分析和试验与分析的理论。 1940年以后,数理统计的学派开始多元化,50年代极值理论的研究有了很大的进展,通常是选取一年中某时期或某领域的最大值进行研究,将取得的极值数据按照三种极值分布模式拟合,推测其参数。但极值数据适合于何种形式的极值分布事先很难确定,因此,在1950年以英国的统计学者为主

23、展开了以一种形式表现三种类型极值分布的一般极值分布的数据解析研究.60年代开始了2变量的极值分布研究以及对具有从属性概率过程的极值统计量的渐进分布研究。60年代是分布偏差有效推定理论盛行的时代.即采用古典的方法论成功地解决了概率分布的假定与实际数据分布偏离的问题。但是,其研究所假定的概率模型侧重于数学形式的完整可能,而对数据所遵从的概率分布的拟合准确性的考虑尚有欠缺。在以后的系统控制之中,分布偏差有效理论起到了很大的作用。70年代可以认为是规范化模型的时代.从正态分布的假定,发展到将共变量的条件分布线性模型化,其核心是剔除正态性的假定,实现了包括从二项分布到咖码分布的规范线性化。80年代的前期

24、侧重于渐进理论的研究,高次渐进性理论运用高等数学公式推导出了复杂的展开式,对高次渐进的有效性与充分性进了探讨,以往很多都是固定模型的次元,在样本容量极限的条件下研究其确定的变动,结果失去了许多有用的信息.之后作为改进,在决定理论的结构中用有限的样本进行更为严密的考察。出现了即使模型与实际的拟合受到影响也要一味追求模型近似的精确度等问题,使所进行的严密计算并没有多大的实际意义。80年代后期计算机带来了统计学巨大的变化。数据模拟,回归变量的推定等非参数估计的方法应运而生。它使得比较复杂的数据变得简便了。计算机节省了大量人力,特别是在同样输出的重复计算上,例如在计算多元分析的相关系数和其它检验统计量

25、时。由于计算软件包可用于所有通常的检验,特别是关于方差分析,则节省更多,高速计算使得有可能运用匹配和排列检验,当分布不能写一个封闭的分析公式时,显著性水平也能计算。另外,计算机能用蒙特卡洛方法计算每一个事件的概率或近似显著性水平。90年代对“复杂性”研究较为瞩目.特别是对马尔可夫链蒙卡尔理论的研究建立了可实际应用的统计模型开辟了广阔的前景。90年代以来,很多应用问题都存在着分析对象比较复杂与正确识别模型结构的困难。通过使用专用统计软件进行mcmc模拟,可解决许多复杂性问题,此外,得益于mcmc理论的运用,使得古老的贝叶斯统计得到了再度复兴,以往被认为不可能实施计算的统计方法变得轻而易举了。 目

26、前,随着统计方法在各个领域的应用,统计学已发展成为具有多个分支的大家族。随着社会经济的多元化、金融交易的多样化、国际市场间资本移动的迅猛增长、以及电子商务的出现,统计学及其应用将会继续发展和扩大。 正态分布从产生到作为分析统计数据的概率模型大致经历了三个阶段:18世纪30年代,狄莫弗在研究一个概率近似计算的问题时发现了正态曲线,但并没有想到它可作为刻画随机现象的概率分布提出;1809年,高斯在研究测量误差时,第一次以概率分布的形式重新提出此分布,此时引起了人们的普遍关注和研究。然而人们对统计数据与观测数据不相容性的认识,使得它的应用范围却仅限于天文学、测地学等误差论领域;19世纪中叶至末期,凯

27、特莱在社会领域、高尔顿等人在生物学领域的工作使正态分布迅速扩大到许多自然和社会科学领域,并最终进入统计学,成为一系列核心理论的基础和导火索。 可以认为19世纪的统计学时代是由正态分布所主导的,数理统计学史上的很多重大事件,莫不与这个分布发展程度有着或多或少的关联。 结束语 应该说正态分布的早期历史,主要是数理统计学开始作为一门科学的历史。从最初数学表达式的提出,到之后成为一种连续型概率分布的应用,再到构成各种统计方法的理论基础,每一次蜕变都蕴含着该阶段最著名数学家的心血和努力,体现了观念转变和技术创新的决定性影响,印证了人们对该理论由无知到有知,由有知到多知,再由多知到熟知的认识规律,同时展示

28、了正态分布同概率论的起源、误差论的发展、近代统计学的形成以及现代统计学的飞跃等理论背景相互促进、相互制约的辩证关系。 概率论和统计学是一对姊妹学科,是集天文学家、数学家、物理学家、生物学家、心理学家、人类学家、经济学家、政治学家、审计学家和职业赌博家的劳动成果为一体的学科。二者彼此交织,互相渗透,并行发展。正态分布进入统计学的历史过程可认为是精辟诠释这种关系的一个典范!几百年来,统计学中没有哪一个理论,象正态分布那样被广泛地发展。人们总是设法利用改进了的新观念和新方法,去研究该理论的应用基础及其数学性质,它的产生和发展,它的新理论和新应用,它的传递性和同内外理论的相互作用,推动了整个统计学的发

29、展,在共同的研究中,将不断引起新的突破。 在联系自然、社会和思维的实践背景下,我们以正态分布的本质为基础,以正态分布曲线及面积分布图为表征,进行抽象与提升,抓住其中的主要哲学内涵,正态分布论是科学的世界观,也是科学的方法论,是我们认识和改造世界的最重要和最根本的工具之一,对我们的理论和实践有重要的指导意义。以正态哲学认识世界,能更好的认识和把握世界的本质和规律,以正态哲学来改造世界,能更好的在尊重和利用客观规律,更有效的改造世界。 结合不同发展阶段的背景,对该理论的思想演化过程及其代表人物的重要工作做分析总结,阐明正态分布在发展的不同阶段同相关理论的相互影响,强调该理论从产生到成熟的发展的曲折

30、性,诠释概率统计理论由观念转变和技术创新的发展规律,为现代历史研究和教育提供借鉴意义。 参考文献: 1高庆丰:欧美统计学史,中国统计出版社,1987年版。 2郭贵春,宋尚玮:对概率论起源的思考,科学技术与辩证法,2006年版。 3徐传胜,曲安京:惠更斯与概率论的奠基,自然辩证法通讯,2006(6)。 4陈希孺:数理统计学简史,湖南教育出版社,2002年版。 5李文林:数学史概论,高等教育出版社,2002年版。 6胡作玄:20世纪的数学,20世纪科学技术简史,科学出版社,1999年版。 7胡作玄,邓明立:20世纪数学思想,山东教育出版社,2001年版。 8陈善林,张浙:统计发展史,立信会计图书用品社,1987年版。英文摘要normal distribution to the influenceon origin and development of probability and statistics yu qi abstract:normal distrib

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论