数理统计课件:数理统计介绍_第1页
数理统计课件:数理统计介绍_第2页
数理统计课件:数理统计介绍_第3页
数理统计课件:数理统计介绍_第4页
数理统计课件:数理统计介绍_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数理统计绪论

数理统计介绍1.1.1数理统计学的任务自然界现象分为两大类确定性现象随机现象用随机变量(向量)描述但是,在许多实际问题中,描述随机现象的随机变量的概率分布完全未知或不完全知道.此时,如何研究随机现象中的有关问题呢?随机变量的概率分布不确定,

是数理统计研究的第一前提!统计学的任务是研究如何有效地收集、整理和分析带有随机性影响的数据,从而对所考虑的问题作出一定结论的方法和理论.研究统计学方法中理论基础问题那部分构成数理统计的内容.统计学是数据科学,用数据(事实)说话:有理有据说理.解决实际问题的过程对随机现象进行试验或观测,以有效的方式收集、整理和分析带有随机性影响的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.数据带有随机性是数理统计研究的第二前提!收集数据的方法全面调查抽样调查安排试验有效的收集数据1下面通过例子详细说明例1.1.1人口普查和抽样调查普查又称全面调查,因普查费用高、时间长,不常使用,破坏性检查(如灯泡寿命试验)更不会使用.只有在少数重要场合才会使用普查.如我国规定每十年进行一次人口普查,期间九年中每年进行一次人口抽样调查.抽样调查在全面调查不可靠时的一种补充方法.如何安排抽样调查,是有效收集数据的一个重要问题.——抽样调查方法例1.1.2考察某地区10000户农户的经济状况若该地区分为平原和山区两部分,平原较富,占该地区农户的70%,而占30%的山区农户较穷.抽样方案规定在抽取的100户中,从平原地区抽70户,山区抽30户,之后在各自范围内用随机化方法抽取.从中挑选100户做抽样调查.收集数据中,数据必须带有随机性例1.1.2中,随机性:抽样的100户农户是从10000户农户中按照一定的方式“随机抽取”的;代表性:平原和山区按照比例抽取.假如只在该地区富裕的那部分农户中挑选,得到的数据就不具有代表性,更谈不上有效.例1.1.2中,有效收集数据是通过合理的设计抽样方案实现.例1.1.3.(提高某化工产品转化率的试验)某种化工产品的转化率可能与反应温度A、反应时间B、某两种原料配比C、真空度D有关.为寻找最优的生产条件,以提高该化工产品的转化率,因此考虑对A、B、C、D这四个因素进行试验,根据以往经验,确定每个因素只需考虑三个水平,数据如下表所示.

水平因素123反应温度A607080反应时间B2.53.03.5原料配比C

1.1:11.15:11.2:1真空度D500550600理想的做法:各种因素所有水平搭配下都做试验,4个因素,每个因素3个水平,共需要做34=81次试验.提出要求:如何通过尽可能少的试验获得尽可能多的信息.设计试验:选81种搭配的一部分,每个因素的每个水平都出现,且能反映出交互作用,以获得最佳或较好的试验条件.不现实:耗时、耗力、耗经费数理统计的另一个分支——试验设计它主要利用现成的规范化的表——正交表来科学的安排试验方案和分析试验结果.优点在很多试验方案(试验条件)中挑选出代表性很强的少数试验方案,并通过对少数试验方案试验结果的分析,推断出最优方案.例1.1.3中,有效收集数据是通过科学安排试验的方法实现.例1.1.3中,数据的随机性是由试验误差体现.化工产品的转化率除了受温度、时间和原料配比影响外还受一些无法控制,甚至仍未被人们认识的因素影响.如:每次试验中受试验材料产地的影响、所使用仪器设备精度的影响和操作者水平的影响等.这些因素无法或者不便加以完全控制,从而对试验结果产生随机性的影响,因此带来不确定性.有效的使用数据2获取数据后,需要利用有效的方法去集中和提取数据中的有关信息,对所研究的问题作出一定的结论,统计上称之为推断.——统计推断1用算术平均值计算该村农户年均收入如下例1.1.4某农村有100户农户,要调查此村农户是否脱贫.脱贫的标准是每户年均收入超过1万元.经调查此村90户农民年收入5000元,10户农民年收入10万元,问此村农户是否脱贫?结论:该村农民脱贫.但是90%的农户年均收入只有5000元,事实未脱贫.2用样本中位数计算该村农户年收入将100户农户的年收入记为x1,x2,…,x100,将其按照大小排列为样本中位数定义为排在最中间两户的平均值结论:该村农民未脱贫,与实际情况相符.例1.1.4说明为有效地使用数据进行推断,就要涉及统计中的一些准则,以评价推断的优良性,因此采用合适的统计方法是有效使用数据的一个重要方面.随机现象的统计规律性随机变量及其概率分布全面描述分布函数F(x)密度函数f(x)分布律pi概率论:已知随机变量的分布,可求得:

某个随机事件发生的概率,随机变量落在某个区间的

概率,随机变量的数字特征如均值,方差,协方差,

相关系数等.推理的方向:知道原因,推出结果.概率论1.1.2数理统计与概率论的关系在许多实际问题中,描述随机现象的随机变量的概率分布可能完全不知道或者是不完全知道.我们通过对所研究的随机变量进行重复独立的观察得到许多观察值,对这些数据进行统计分析,从而对所研究的随机变量的分布作出推断.数理统计:已知随机变量的取值(数据),去求随机变量的分布,或一些数字特征如均值,方差,协方差,相关系数等.推理的方向:知道结果,推断原因.数理统计

概率论是数理统计的基础,而数理统计是概率论的重要应用.

但它们是两个并列的数学分支学科,并无从属关系.统计的结果不是必然的,会带有误差或犯错误.所以,统计推断要尽可能地减少误差,尽可能地减少犯错误的概率.统计思想,统计方法,统计理论.怎么办?统计推断属于归纳推理方法.数理统计学的研究内容非常丰富,且形成了多个分支,如回归分析、抽样调查、试验设计、可靠性统计、多元统计分析、非参数统计和贝叶斯(Bayes)统计等.由于随机现象无处不在,因此其应用越来越广泛深入,在国民经济和科学技术中的地位越来越重要.目前,数理统计学已经涉及到金融、经济、生物、工程技术、医学、工农业生产、地质、质量控制、航天航空等诸多领域.无论是自然科学还是社会科学都离不开统计.1.1.3数理统计的应用领域只要一个实际问题有数据,我们就可以用数理统计的方法去分析并解决该实际问题.数理统计方法所处理的只是在各种专门学科中带普遍性(共性)且受随机性影响的数据收集、整理和推断问题,而不涉及各种专门学科中的具体问题.这种带共性的问题既然是从专门领域中提炼出来,就可以用数学的方法去研究,这就是数理统计的研究任务.数理统计方法有很广泛的实用性,与很多专门学科有关.统计方法只是从事物外在数量上的表现去推断事物可能的规律性.统计方法本身不能说明何以会有这个规律性.例如:用统计方法分析得到吸烟与某些呼吸系统的疾病有关.这纯粹是从吸烟者和不吸烟者的发病率的对比分析得到结论.它不能解释吸烟何以会增加患这类疾病的危险性,这是医学这个专门学科的任务.2015年,首次提出“国家大数据战略”,旨在全面推进我国大数据发展和应用,加快建设数据强国,推动数据资源开放共享,大数据战略上升为国家战略。2017年,国务院印刷《新一代人工智能

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论