Excel中地描述统计分析报告工具_第1页
Excel中地描述统计分析报告工具_第2页
Excel中地描述统计分析报告工具_第3页
Excel中地描述统计分析报告工具_第4页
免费预览已结束,剩余14页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用文档Excel 中的描述统计分析工具Excel 描述统计工具计算与数据的集中趋势、离中趋势、偏度、峰度等有关的描述性统计指标。使用:工具 - 数据分析 - 描述统计汇总统计输出结果解释:平均平均数或均值, X标准误差S / n ,求总体均值的置信区间中值中位数, Md模式众数, Mo标准偏差标准差, S样本方差S2峰值峰度, K偏斜度SK区域最小值最大值求和计数总体单位数,或样本容量, n示例: 10年校园调查汇总数据第一次随堂作业的有关事宜通知文案大全实用文档1 、作业完成地点:北京大学校内2 、随堂作业时间:本周五下午2 :30-4 : 303 、作业内容:对10 年校园调查的汇总数据

2、进行描述统计分析,完成对一个指定主题的深入分析。4 、作业的具体内容:届时参见网络平台的“作业”版块。5 、其他要求:独立完成,不得与别人讨论交流。第三部分推断统计第四章概率论与数理统计基础1 了解和认识随机事件与概率北京市天气预报:明天白天降水概率40% ,它的含义是:A 明天白天北京地区有40% 的地区有降雨;B 明天白天北京地区有40% 的时间要下雨;C 明天白天北京地区下雨的强度有40% ;D 明天白天北京地区下雨的可能性有40% ;E 北京气象局有40% 的工程师认为明天会下雨。一、 必然现象与随机现象1 、必然现象:可事前预言,即在准确地重复某些条件下,它的结果总是可以肯定的。例:

3、太阳每天从东方升起在标准大气压下,水加热到100 摄氏度,就必然会沸腾文案大全实用文档在欧式几何中,三角形的内角和总是180 在北京大学,不及格科目达到1/3 ,一定拿不到毕业证事物间的这种联系是属于必然性的。通常的自然科学各学科就是专门研究和认识这种必然性的,寻求这类必然现象的因果关系,把握它们之间的数量规律。2 、随机现象:一种可能发生,也可能不发生;可能这样发生,也可能那样发生的不确定现象。在随机现象中,可能结果不止一个,且事前无法预知确切的结果。也称偶然现象。在自然界,在生产、生活中,随机现象十分普遍,也就是说随机现象是大量存在的。例:高考的结果掷骰子的结果学生对手机品牌的选择随机抽取

4、的交作业名单今天来上统计学课的学生人数这类现象是即使在一定的相同条件下,它的结果也是不确定的。举例来说,同一个工人在同一台机床上加工同一种零件若干个, 它们的尺寸总会有一点差异。在同样条件下, 进行小麦品种的人工催芽试验, 各颗种子的发芽情况也不尽相同, 有强弱和早晚的分别等等。3 、为什么会有随机现象在这里,我们说的“相同条件”是指一些主要条件来说的,除了这些主要条件外,还会有许多次要条件和偶然因素又是人们无法事先一一能够掌握的。正因为这样, 我们在这一类现象文案大全实用文档中,就无法用必然性的因果关系,对个别现象的结果事先做出确定的答案。事物间的这种关系是属于偶然性的,随机性的。在同样条件

5、下,多次进行同一试验或调查同一现象,所的结果不完全一样,而且无法准确地预测下一次所得结果,随机现象这种结果的不确定性,是由于一些次要的、偶然的因素影响所造成的。4 、随机现象的规律性随机现象从表面上看,似乎是杂乱无章的、没有什么规律的现象。但实践证明,如果同类的随机现象大量重复出现, 它的总体就呈现出一定的规律性。 大量同类随机现象所呈现的这种规律性, 随着我们观察的次数的增多而愈加明显。比如掷硬币, 每一次投掷很难判断是那一面朝上,但是如果多次重复的掷这枚硬币,就会越来越清楚的发现它们朝上的次数大体相同。我们把这种由大量同类随机现象所呈现出来的集体规律性,叫做统计规律性。 概率论和数理统计就

6、是研究大量同类随机现象的统计规律性的数学学科。例:生日的巧合根据数学中的“抽屉定理”,我们可以预言,在366 个人当中,一定有两个人的生日相同。但是,根据概率论的计算,在k 个人群中,至少有2 个人生日一样的概率为:文案大全实用文档kpkp50.027250.569100.117300.706150.253400.891200.411500.970220.476600.994230.507计算思路:首先计算 k 个人群的生日搭配一共有365k 种可能的情况;然后计算 k 个人群中,没有任何2 个人生日一样的可能情况有365 364(365k1)365! /(365k )! 种接下来计算k 个人

7、群中,没有任何2 个人生日一样的概率为:365! /( 365k)!k然后计算在k 个人群中,至少有2 个人生日一样的概率为:365! /(365k)!1365k“你信仰掷骰子的上帝,我却信仰完备的定律和秩序。”爱因斯坦致玻尔的信“我无论如何深信上帝不是在掷骰子。”爱因斯坦爱因斯坦始终不放弃科学的自然因果律和确定性原则,这是他与玻尔得分歧所在二、随机事件文案大全实用文档1 、随机试验( 1 )试验可以在相同条件下重复进行;( 2 )试验的结果不止一个,但所有可能结果都是明确可知的;( 3 )每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定究竟是出现哪一个结果。例:抛硬币让一位顾

8、客从两种商品中选出他 / 她更喜欢的一种股票市场价格指数每天的变化2 、基本事件:一次随机试验的可能结果例:抛硬币只可能出现两种结果:正面或反面掷骰子可能出现 1、 2、 3、 4、 5、6 六种结果股票市场价格指数可能取值在(0,+ )3 、随机事件:随机试验的结果,一个随机事件可以包含多个基本事件例:掷骰子, “出现奇数”和“出现不小于4 的数”就是两个事件三、随机事件的概率1 、事件 A 的概率是描述事件A 在实验中出现的可能性大小的一种度量。2 、对概率定义的解释( 1 )概率的统计定义:频率解释文案大全实用文档频率的稳定性是通过大量的试验所得到的随机事件的规律性,这种规律性因此称为统

9、计规律性。概率的统计定义:在不变的一组条件S 下,重复作 n 次试验, m 是 n 次试验中事件 A 发生的次数,当试验次数 n 很大时,如果频率m/n稳定地在某一数值 p 的附近摆动,且随着试验次数的增多,摆动的幅度越来越小,则称p 为事件 A 在条件组 S 下发生的概率,记作:P( A)mpn例:以下是北大经济学院00 级成人教育学生,通过调查访问所收集的北京市场上消费者购买冰箱的情况。他们一共访问了457 个对象。次数与频率分布表随机变量的概率分布表冰箱品牌购买人数比重 %冰箱品牌 X概率 pi %海尔13128.67128.67伊莱克斯5812.69212.69西门子418.9738.

10、97新飞347.4447.44LG306.5656.56容声306.5666.56容事达10.22200.22总计457100-100例:文案大全实用文档A 1986 article inNewsweekby the mathematician John Paulos makes the point thatmost people have no grasp of the probabilities of events that may affect them andtend to have great fear of publicized events with small probabil

11、ity, while notworrying at all about events with much higher probability. As an example, Paulosgives the following data: In 1985, 28 million Americans traveled abroad, and 39 ofthem were killed by terrorists. But in the same year, 1 in 5300 Americans was killedin an automobile accident.Probability of

12、 being killed by terrorists = 39/28,000,000 = 1.393*10-6Probability of being killed in an automobile accident = 1/5300 = 1.887*10-4( 2 ) 概率的古典定义,起源与赌博,如掷硬币、掷骰子核心思想:等可能的结果,概率总和为1 。古典概率模型特点:试验的结果有限、各个结果出现的可能性相等P( A)m :事件 A 所包含的基本事件的个数;n :随机实验所包含的全部基本事件的个数( 3 )概率的几何定义mn集合概率若随机试验中的基本事件有无穷多个,且每个基本事件发生是等可

13、能的,这时就不能使用古典概率,于是产生了几何概率。几何概率的基本思想是把事件与几何区域对应,利用几何区域的度量来计算事件发生的概率,文案大全实用文档定义:设区域G 的长度(或面积、体积)为D,质点可以等可能地落在区域G 中的任何一点,设事件A = “质点落在G 内一个长度(面积、体积)为d 的区域 g 内”,定义 A 的概率为: P(A) =d / D 为几何概率。例:一个质点在数轴上0, 5 区间上作随机运动,五分钟后停止,求下述事件的概率:()“该点落在1 , 2上的概率” ;P( A )( 2-1 )( 5-0 ) 0.2( 2 ) B “该点落在 (1 , 2) 上的概率”;P( B)

14、( 2-1 ) / ( 5-0 ) 0.2( 3 ) C “该点落在 (0 ,5) 上的概率”;P( C) 5/5 1( 4 ) D “该点落在3 上的概率”P()( 4 )主观概率面对不确定性,由个人判断某事件发生的可能性大小。基于个人的经验、观点或对特定情况分析而作出的对某一事件发生可能性的推测。例:新产品市场成功的概率经济增长波动的概率四、 概率性质文案大全实用文档对于概率的 3 个定义,概率具有下述性质:性质 1对于任一随机事件A ,有:0P( A)1性质 2设事件 A1 , A2, An 互不相容,即它们当中只能有一个最终发生,则nnP(Ai )P( Ai )ii事件的和表示或者A1

15、 ,或者 A2 , ,或者 An 发生。性质 3如果一个样本空间(一次随机试验所有可能结果的集合)所包括的所有事件为A1 , A2 , An ,则nP(Ai )1in事件Ai 称为必然事件。i补充说明:必然事件发生的概率为1,不可能事件发生的概率为零,即P(S)1, P()0但要注意:概率为1 的事件并不必然发生,而概率为零的事件也绝不是不可能发生。例如:一个均匀的质点在区间 a, b 上作随机运动,它落在 a, b 区间内某一个具体的点,例如点 c 的可能性为零,但这绝不是不会发生的;落在开区间( a, b )内的可能性为1,但它还是有可能落在a 或 b 这两个端点上,不在( a, b)内。

16、亚里斯多德说过:“不可能事件(在这里,指的是概率为零的事件)将会发生,这正是概率的特性。”2随机变量与概率分布文案大全实用文档一、随机变量随机变量: 用数值描述事件的结果。某个随机事件在试验中可能取得的不同数值。由机会确定的具有不同取值的变量。例:用 Z 表示所调查对象的性别Z = 0,如果调查对象为女性;Z = 1,如果调查对象为男性。用 X 表示消费者所购买的冰箱品牌X = 1 ,如果消费者购买的是海尔冰箱;X = 2 ,如果消费者购买的是新飞冰箱;X = 3 ,如果消费者购买的是西门子冰箱;X = 4 ,如果消费者购买的是伊莱克斯冰箱;用 Y 表示消费者的家庭月收入Y = 1000 ,

17、2000 , , 12000 , 特点:( 1 )变量的取值是随机的(变量出现什么值是随机的);( 2 )变量出现某个数值的概率是确定的。文案大全实用文档很多随机现象的试验结果都是可以用数值表示的,因此用随机变量来表示事件是没有问题的。二、离散型随机变量与概率分布1 、离散型随机变量:如果随机变量X 只能取到有限个或可数个数值,则称X 是离散型随机变量。2 、离散型随机变量的概率分布用一系列等式或表格来表示每个随机变量X 取值的概率,即为离散型随机变量X 的概率分布。X 例如: 10 件同样的产品中有2 件次品,从中任取2 件,取出的两件产品中次品的个数X 为随机变量,它的概率分布可以表示如下

18、:p0p( X0)= 28/45;=16/45pP(X 2) C2/ C 21/ 452210由概率的性质可知,随机变量X 的概率分布应满足以下条件:( 1 ) 0P(Xi)1文案大全实用文档( 2 )P(Xi) = 13 、离散型随机变量的累积概率分布iiF( Xxi )P( Xxi )piP( Xxi )i1i1三、几种重要的离散型随机变量及其概率分布1 、贝努里分布James Bernoulli(1)定义在许多试验中,对每次试验而言,试验结果只有两种可能:yesorno;successorfailure 。如抛掷硬币、产品检验、新生儿性别等试验。这种一次试验只有两种结果的试验称为贝努里试

19、验。 若把贝努里试验中某事件出现的结果记为事件A,则另一种结果就是事件A的对立事件A ,记事件 A 出现的概率为P( A)p ,事件出现的概率为P( A)1p ,令试验结果为随机变量X 并对其赋值为X = 1 (当事件 A 出现)或 X = 0 (当事件 A 不出现),则 X 的概率分布为:f ( X x; p) p x (1 p)1 xx 0,1 (0 p 1)即P( X1)pP( X0)1 p则称 X 服从参数为p 的贝努里分布。( 2 )对贝努里分布的实验观察文案大全实用文档运用 Excel 中的随机数发生器工具2 、二项分布故事: 一个由多国遗传学家组成的研究小组的研究显示,中亚有逾

20、1600 万男子拥有与历史上的蒙古领袖成吉思汗相同的男性Y 染色体,这意味着,全球每200 名在世的男性中,便有一人是成吉思汗的后人。我们考虑这样一个问题。现随机地从全世界选取50 名男性,恰好有一人是成吉思汗后人的概率是多少?两人、十人的概率又为多少?对于随机试验中的每个男性, 他是成吉思汗后人的的概率都是1/200 ,显然这个试验符合贝努里试验的条件,每次选取都相当于进行了1 次贝努里试验,50 人次的随机选区就相当于进行了 50 次独立的贝努里试验,n 次随机选择相当于进行n 次独立的贝努里试验,称为n重贝努里试验。 n 重贝努里试验即意味着在相同的条件下独立地进行多次同样的试验,对于每

21、次试验而言,试验的结果只有两个:成功或失败,成功的概率为p(在这个例子中即为是成吉思汗后人的概率 1/200 ),失败的概率为1- p ,且每次试验结果是互不影响的。类似的例子还有:一批五件产品中合格品的个数在 33 个考试题中回答正确的题数100 位进入店内的顾客中买东西的顾客人数文案大全实用文档这样,在 n 重贝努里试验中,事件A 发生的概率为p ,则 A 在 n 次试验中发生x 次的概率为:P( X x) C nx p x (1 p) n xx 0,1,2, n 0 p 1( 1 )定义:如果随机变量X 的分布如下:f(;,p)(X x)Cxpx(1)n xx0,1,2,n0p1nX x

22、nPp则称 X 服从参数为( n, p)的二项分布,用记号X B( n ,p )表示, n , p 分别为二项分布的两个参数。它的累积分布函数为xF( X x; n, p) P( X x)C nx p x (1 p) n x 。x 0例:掷一枚质地均匀的硬币,重复地掷 5 次,记正面向上的次数为随机变量X,(1)求 X=2的概率;(2 )若分币质地不均匀,出现正面的概率为2/3 ,求重复掷 5 次时 X=2的概率。解: (1 ) P( X 2) C52(1 / 2)2 (1 / 2)3= 5/16 = 0.3125(2) P(X 2) C52(2 / 3)2(1/ 3)3= 40/243 = 0.165当 n=1 时,随机变量X 服从贝努里分布。可见,参数为p 的贝努里分布是二项分布的一个特例。( 2 )二项分布图

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论