教学课件·商务统计学(第5版)1_第1页
教学课件·商务统计学(第5版)1_第2页
教学课件·商务统计学(第5版)1_第3页
教学课件·商务统计学(第5版)1_第4页
教学课件·商务统计学(第5版)1_第5页
已阅读5页,还剩494页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Chap 1-1第1章概述与数据收集商务统计学(第5版)Chap 1-2学习目标在本章中你将学到:商业中是如何使用统计学的讨论数据的来源讨论数据的类型Microsoft Excel的基本使用Minitab的基本使用Chap 1-3为什么学习统计学?你能更好地理解普遍使用的数字:商业备忘录商业研究技术报告技术期刊报刊文章杂志文章Chap 1-4什么是统计学?将数字转化为对决策者有用信息的数学的分支。处理和分析数字的方法帮助减少决策时固有的不确定性的方法Chap 1-5为什么学习统计学?在商业世界中,统计学有4种重要的应用。总结商业数据根据数据得出结论作出商业行动的可靠预测改进运营过程Chap 1

2、-6统计学的类型统计学将数字转化为对决策者有用信息的数学的分支。统计描述注重数据的收集、总结、演示和分析统计推断利用从一个小组收集的数据而得出有关更大组的结论Chap 1-7统计描述数据的收集例如, 调查数据的演示例如, 表格和图形数据的分析例如, 样本均值 = Chap 1-8统计推断估计例如, 使用样本的平均体重估计总体的平均体重假设检验例如,检验总体的平均体重是120磅的说法利用从一个小组收集的数据而得出有关更大组的结论Chap 1-9统计学的基本术语变量变量(variable)是项目或者个人的一个特征。数据数据(data)就是与变量相联不同的值.通用的定义数据的值是无意义的,除非他们的

3、变量有通用的定义(operational definitions)。这些定义对所有与该分析相关的人而言是普遍被接受的含义。Chap 1-10统计学的基本术语总体总体(population)就是所考虑的全部元素。样本样本(sample)就是从总体中挑选出来用于分析的一部分。参数参数(parameter)就是描述总体特征的概括性度量。统计量统计量(statistic)就是根据样本数据计算出来用于描述或估计总体特征的概括性度量。Chap 1-11总体与样本总体样本参数是描述总体特征的概括性度量。统计量是根据样本数据计算出来用于描述总体特征概括性度量。Chap 1-12为什么收集数据?市场调研者需要了

4、解一个新电视广告的效果。某个研制药物的人员想要知道某种新药是否比当前正在使用的药物更加有效。某公司的运营经理要改进一个生产或服务过程。某个审计人员要了解公司的财务活动,确认这些活动是否符合大家普遍接受的会计准则。Chap 1-13数据的来源原始来源:数据收集者就是使用数据分析的人政治调查的数据实验收集的数据观察的数据二手来源:进行统计分析的人不是数据收集者分析人口普查数据。从期刊或在互联网上获得数据。.Chap 1-14四个主要的数据来源组织或者个人已经发布的数据。可以设计一个实验来获得必要的数据。可以进行调查。可以通过观察研究的方式。Chap 1-15数据的类型属性变量(categorica

5、l variables)(也称为定性变量(qualitative variables)给出定性的回答,比如是或者不是。数值变量(numberical variables)(也称为定量变量(quantitative variables)给出定量的回答。Chap 1-16数据的类型数据属性数据数值数据离散的连续的例子:婚姻状况政治党派眼睛的颜色 (定义的类别)例子:孩子数每小时缺陷数 (计数项目)例子:重量电压 (衡量特征)Chap 1-17统计学使用的电脑程序Minitab进行统计分析的统计包用来进行尽可能精确的统计分析Microsoft Excel多种功能的数据分析工具有多种功能,但是每一种都

6、没有其他程序那样专注Minitab和Excel都用工作表来存储收集来分析的数据Chap 1-18Minitab和Microsoft Excel事项当使用Minitab或Microsoft Excel时,用工作表(worksheets)来存储收集来分析的数据。工作表是列表排列的数据,行和列的相交形成单元(cells)。当想要引用一组形成连续的矩形区域的数据是,可以使用单元范围(cell range)。Excel中工作表存在于工作簿(workbooks)中,Minitab中则在工程(projects)中。工作簿(workbooks)和工程(projects)都可以容纳数据、总结,和图表。Chap

7、1-19当正确使用程序时,你应能够:理解潜在的统计概念理解如何组织和表示信息理解如何操作你程序的用户界面知道如何评论结果中的错误定和保护清晰命名的工作备份Chap 1-20小结回顾了为啥经理人需要学习统计学介绍了核心概念:总体与样本原始与二手数据类型属性与数值数据统计描述与统计推断回顾了数据类型讨论了Minitab和Microsoft Excel事项我们在本章中:Chap 3-21第3章数值描述度量商务统计学(第5版)Chap 3-22在本章中你将学到:描述数值型数据的集中趋势、变异程度和分布形状的特性计算总体的描述性总结度量构建和解释盒须图描述协方差和相关系数学习目标Chap 3-23定义集

8、中趋势(central tendency)是一个所有的数据观测值组在一个典型或中心值周围的范围。变异程度(variation)是观测值与一个中心值散布或分散的量。分布形状(shape)是观测值从最低值到最高值分布的模式。Chap 3-24集中趋势的度量:算术平均数算术平均数(算术平均数又称为平均数,平均数)是最常见的集中趋势的度量。对于包含n个观测值的样本样本数观测值第i个值读作x拔Chap 3-25集中趋势的度量:算术平均数最常见的集中趋势的度量平均数 = 观测值的和除以观察值的个数受极端值的影响 (异常值)(续)0 1 2 3 4 5 6 7 8 9 10平均数 = 3 0 1 2 3 4

9、 5 6 7 8 9 10平均数 = 4Chap 3-26集中趋势的度量:中位数中位数(中位数)是从最小到最大按顺序排列的数据正中间的数据值。(一半的观测值小于或等于中位数而一半的观测值大于或等于中位数。) 中位数不受数据集中极端值的影响。0 1 2 3 4 5 6 7 8 9 10中位数 = 3 0 1 2 3 4 5 6 7 8 9 10中位数 = 3Chap 3-27集中趋势的度量:中位数的位置从最小到最大按顺序排列观测值,中位数的位置:如果数据集的观测值项数为奇数,中位数是排列在中间位置上的观测值。如果数据集的观测值项数为偶数,中位数介于数据集正中位置上两个观测值之间。中位数是两个中间

10、观测值的算术平均数。 需注意 不是中位数的值,只是中位数在排序数据中的位置。Chap 3-28集中趋势的度量:众数众数(mode)是在数据中发生频数最高的数据值。众数不受极端值的影响。可用于数值和属性数据。众数可能不存在。众数可能有多个。0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 众数 = 90 1 2 3 4 5 6没有众数Chap 3-29集中趋势的度量:复习例子住房价格: $2,000,000 $500,000 $300,000 $100,000 $100,000总和 $3,000,000平均数: ($3,000,000/5) = $600,000中位数: 排序

11、数据的中间值 = $300,000众数: 出现最多的值 = $100,000Chap 3-30集中趋势的度量: 选择哪种度量?平均数最常使用,除非存在极端值 (异常值) 。因为中位数对极端值不敏感,中位数也经常使用。例如,可能公布一个地区住房价格中位数,其对异常值比较不敏感。在某些情况下,同时公布平均数和中位数是有意义的。.Chap 3-31集中趋势的度量:总结集中趋势算数平均数中位数众数有序数组的中间值最经常出现的观察值Chap 3-32同样的中心, 不同的变异程度变异程度的度量变异程度度量数据集中的观测值的离散程度(中位数),或散布程度(dispersion)。 变异程度标准差变异系数全距

12、方差Chap 3-33变异程度的度量:全距变异程度最简单的度量。最大值和最小值之间的差异:全距 = X最大 X最小0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 全距 = 13 - 1 = 12例子:Chap 3-34变异程度的度量:为什么全距可能会误导忽略数据分布的方式对异常值敏感7 8 9 10 11 12全距 = 12 - 7 = 57 8 9 10 11 12全距 = 12 - 7 = 51,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,51,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,

13、3,3,3,4,120全距 = 5 - 1 = 4全距 = 120 - 1 = 119Chap 3-35观察值相对其算术平均数的离差平方和样本方差:变异程度的度量:方差其中 = 算术平均数n = 样本容量Xi = 变量X 的第i个观测值Chap 3-36变异程度的度量:标准差变异程度最常用的度量显示与平均数的变异程度方差的平方根与原始数据有相同的单位样本标准差:Chap 3-37变异程度的度量:标准差计算标准差的步骤:1.计算每一个观测值与平均数的差。2.计算差的平方。3.加总差的平方。4.将加总的和除以n-1得到样本方差。5.取样本方差的平方根得到样本标准差。Chap 3-38变异程度的度量

14、:样本标准差:计算例子样本数据 (Xi) : 10 12 14 15 17 18 18 24 n = 8 平均数 = X = 16度量在平均数附近的“平均”散布Chap 3-39变异程度的度量:比较标准差s平均数 = 15.5 S = 3.338 11 12 13 14 15 16 17 18 19 20 2111 12 13 14 15 16 17 18 19 20 21数据 B数据 A平均数 = 15.5 S = 0.92611 12 13 14 15 16 17 18 19 20 21平均数 = 15.5 S = 4.570数据 CChap 3-40变异程度的度量:比较标准差s较小的 标

15、准差较大的 标准差Chap 3-41变异程度的度量:特征汇总数据分布的越广,全距, 方差和标准差就越大。数据分布的越集中,全距, 方差和标准差就越小。如果所有的观测值都一样(没有变异程度),这些度量均为0。这些度量均不为负。Chap 3-42变异程度的度量:变异系数对变异程度的相对度量。总是表现为百分数 (%)。度量的是数据相对于平均数的离散程度。变异系数可以用来比较两组或更多组用不同单位度量的数据。Chap 3-43变异程度的度量:比较变异系数股票A:去年平均价格 = $50标准差 = $5股票B:去年平均价格 = $100标准差 = $5两只股票有相同的样本标准差, 但是股票B 相对其价格

16、变化更小。Chap 3-44识别极端异常值:Z值计算数据观测值的Z值, 减去平均数后除以标准差。Z值是一个数据观测值距离平均数的标准差数。一个Z值如果小于-3.0或大于3.0被认为是异常值。Z值的绝对值越大,距离平均数越远。Chap 3-45识别极端异常值:Z值其中 X表示数据观测值 X 为样本平均数 S 为样本标准差Chap 3-46识别极端异常值:Z值假如数学成绩平均数是490, 标准差是100。计算数学成绩620的 Z值。数学成绩620 在平均数之上1.3 标准差,不认为是异常值。Chap 3-47分布形状描述数据是如何分布的。分布形状的度量对称或有偏的。平均数 = 中位数 平均数 中位

17、数 中位数 1) 例子:(1 - 1/22) x 100% = 75% . k=2 ( 2)(1 - 1/32) x 100% = 89% . k=3 ( 3)切比雪夫法则在之内至少Chap 3-61四分位数度量四分位数将排序后的数据分成4个部分,每部分的观测值数相同。25%第一四分位数, Q1,将25.0%的观测值从更大的其他75.0%中分离出来。Q2 与中位数相同 (50.0%的观测值小于中位数且50.0%大于)。只有25.0%的观测值大于第三四分位数。Q1Q2Q325%25%25%Chap 3-62四分位数 度量:寻找四分位数通过排序数据中观测值的位置寻找四分位数, 其中 第一四分位数位

18、置: Q1 = (n+1)/4从小到大顺序排列的观测值 第二四分位数位置: Q2 = (n+1)/2从小到大顺序排列的观测值 第三四分位数位置: Q3 = 3(n+1)/4从小到大顺序排列的观测值 其中 n 为观测值的个数Chap 3-63四分位数 度量:计算规则使用下列的法则来从一组顺序排列的观测值计算四分位数: 如果求得的位置是整数,该位置上的这个数量观测值就是四分位数。如果求得的位置处于两个整数的中间(例如 2.5, 7.5, 8.5, 等等.) ,则它们相应的观测值的平均数就是四分位数。如果求得的位置既不是整数也不是两个整数的中间,一个简单的规则是就近取整,并找出相应该整数位置的观测值

19、。Chap 3-64 (n = 9) Q1 在排序数据的(9+1)/4 = 2.5 位置 ,所以取第二和第三的平均值因此 Q1 = 12.5四分位数 度量:寻找四分位数例子样本数据 有序数组: 11 12 13 16 16 17 18 21 22 Q1 和Q3 度量非集中趋势。 Q2 = 中位数, 是集中趋势的度量。Chap 3-65 (n = 9)Q1在排序数据的(9+1)/4 = 2.5,所以 Q1 = (12+13)/2 = 12.5Q2在排序数据的(9+1)/2 = 5th 位置,所以 Q2 = 中位数 = 16Q3在排序数据的3(9+1)/4 = 7.5 位置,所以 Q3 = (18

20、+21)/2 = 19.5四分位数 度量:寻找四分位数例子样本数据 有序数组: 11 12 13 16 16 17 18 21 22 Q1 和Q3 度量非集中趋势。 Q2 = 中位数, 是集中趋势的度量。Chap 3-66四分位数 度量:四分位间距(IQR)四分位间距为 Q3 Q1 ,度量中间50%的数据的散布。四分位间距也称为中间散布(midspread),因为其覆盖了中间50%的数据。四分位间距是变异程度的度量,不受异常值的影响。概括性度量诸如中位数,Q,Q和四分位间距,不受极端值的影响,被称为有抵抗力的度量(resistant measures)。Chap 3-67计算四分位间距中位数(

21、Q2)X最大X最小Q1Q3例子:25% 25% 25% 25%12 30 45 57 70四分位间距= 57 30 = 27Chap 3-68五值概括法帮助描述中心、散布和图形形状的五值概括法(five-number summary)中的统计值为:X最小第一四分位数 (Q1)中位数 (Q2)第三 四分位数 (Q3)X最大Chap 3-69五值概括法与分布形状之间的关系左偏对称右偏中位数 X最小X最大 中位数中位数 X最小X最大 中位数中位数 X最小X最大 Q3Q1 X最小X最大 Q3Q1 X最小Q3 中位数中位数 Q1Q3 中位数中位数 Q1 0 X和Y倾向于相同方向变化cov(X,Y) 0

22、X和Y倾向于相反方向变化cov(X,Y) = 0 X和Y是独立的协方差有一个主要缺陷 :不能够从协方差的值来判定关系的相对强度。解释协方差Chap 3-77相关系数衡量两个数值型变量之间线性关系的相对强度。样本相关系数: 其中Chap 3-78相关系数的特征总体相关系数表示为.The 样本相关系数表示为r. 或r都有下列特征:与单位无光在1到1之间越接近1, 负相关关系越强。越接近1,正相关关系越强。越接近0,相关关系越弱。Chap 3-79各种相关系数样本数据的散点图YXYXYXYXr = -1r = -.6r = +.3r = +1YXr = 0Chap 3-80用Microsoft Ex

23、cel计算相关系数选择Tools/Data Analysis从选择菜单选择 Correlation点击OK . . .Chap 3-81用Microsoft Excel计算相关系数输入数据全距并选择合适选项点击OK 得到输出Chap 3-82用Microsoft Excel解释相关系数r = .733test score #1 和 test score #2之间有着很强的正线性相关关系。第一次测验取得高分的学生倾向于第二次测验也得分较高。Chap 3-83数值描述度量的缺陷数据分析是客观的应该公布最能描述和传递数据重要方面的度量数据解释是主观的应公平、公正和清晰Chap 3-84道德考量数值描

24、述度量:好和不好的结果都应该记载。应该以公平、客观和中性的方式呈现。不应该使用不合适的度量以扭曲事实。Chap 3-85小结集中趋势的描述度量平均数, 中位数, 众数变异程度的描述度量全距, 四分间距 全距, 方差 和标准差, 变异系数, Z值阐述分布的形状对称, 有偏的使用五值概括法描述数据盒须图Chap 3-86小结讨论了协方差 和相关系数阐述了数值描述度量的缺陷和道德考量(续)Chap 4-87第4章概率论基础商务统计学(第5版)Chap 4-88学习目标在本章中你将学到:概率论基础概念条件概率使用贝叶斯定理修正概率Chap 4-89概率论基础概念概率 不确定性事件发生的可能性 (始终在

25、0和1之间)不可能事件 不可能发生的事件(概率= 0)确定性事件 肯定发生的事件 (概率= 1)Chap 4-90判定概率有三种方式判定不确定性事件概率:1. a 先验概率 -基于预先掌握的知识对事件发生的概率做出推测。2. 经验概率3. 主观概率基于个人过去的经验、个人观点和对特定情况分析的结合。假设各种结果出现的可能性都是一样的 事件发生的概率=X/Y其中X表示使某事件发生的结果数量,Y表示所有可能出现的结果总数。 事件发生的概率=使其发生的事件数量/基本事件总数。Chap 4-91先验概率例子找出从一副标准的52张扑克牌中选出脸牌(J、Q和K)的概率。脸牌的概率=X/T=脸牌总数/总牌数

26、 =12张脸牌/52张牌数 =3/13Chap 4-92经验概率例子学习统计学不学统计学总计男性 84145229女性 76134210总计160279439从下面表格找出一个学习统计学的男性的概率:学习统计学男性的概率=学习统计学男性总数/总人数 =84/439 =0.191Chap 4-93事件某一变量的每种可能的结果都可以被看作是一个事件(event)。简单事件只具有一个特征的事件。例如, 从一副牌中抽出一张红色的牌。联合事件具有两个或两个以上特征的事件。例如,从一副牌中抽出一张红色的1。事件 A的补事件 (用 A表示)所有不属于事件A的事件。例如,所有不是方块的牌。Chap 4-94样

27、本空间样本空间为所有可能事件的集合例如骰子的6面:例如扑克的52张牌:Chap 4-95显示事件列联表决策树 红牌 2 24 26 黑牌 2 24 26总计 4 48 52 1点 非1点 总计Full Deck of 52 Cards红牌黑牌非1点1点1点非1点样本空间样本空间224224Chap 4-96显示事件事件韦恩图令 A = 1点令 B = 红牌ABA B = 1点且 红牌A U B = 1点或红牌Chap 4-97定义简单 与 联合概率简单概率为简单事件的概率。例如P(K)例如P(黑桃)联合概率为两个或更多事件发生的概率(联合事件).例如P(K且黑桃)Chap 4-98互斥事件互斥

28、事件不能同时发生的事件例子: 从一副牌中抽出一张牌 A = 方块q; B = 梅花q事件 A 和 B 为互斥事件Chap 4-99完备事件完备事件必有某一个事件发生。事件集包括整个样本空间。例子: A = 1点; B = 黑牌; C = 方块; D = 红心事件 A, B, C和D是完备事件 (但不是互斥事件 1点可能也是红心)。事件B, C和D是完备事件并且也是互斥事件。Chap 4-100计算联合和边缘概率联合事件A和 B的概率:计算边缘 (或简单)概率:其中 B1, B2, , Bk 是 k 互斥事件 且 完备事件Chap 4-101联合概率例子P(红牌 且 一点)黑牌颜色类型红牌总计一

29、点224非一点242448总计262652Chap 4-102边缘概率例子P(一点)黑牌颜色类型红牌总计一点224非一点242448总计262652Chap 4-103 P(A1 且 B2)P(A1)总计事件列联表中边缘和联合概率P(A2 且 B1)P(A1 且 B1)事件总计1联合概率边缘 (简单)概率 A1 A2B1B2 P(B1) P(B2)P(A2 且 B2)P(A2)Chap 4-104前述概率小结概率是事件发生可能的数值度量 。任何事件的概率必然介于 0 和1之间。所有互斥事件 且完备事件概率的和为1。确定不可能0.5100 P(A) 1 对于任何 事件 A如果A, B和C为互斥事

30、件且完备事件Chap 4-105一般加法法则P(A 或 B) = P(A) + P(B) - P(A且B)一般加法法则:如果A和B是互斥事件, 那么P(A且B) = 0, 则该法则可以简化为:P(A或B) = P(A) + P(B) 对于互斥事件A 和BChap 4-106一般加法法则例子P(红牌或一点) = P(红牌) +P(一点) - P(红牌 且 梅花) = 26/52 + 4/52 - 2/52 = 28/52不能计算红牌一点两次!黑牌颜色类型红牌总计一点224非一点242448总计262652Chap 4-107计算条件概率条件概率为给定另一个事件B发生的信息,再发生事件A的概率:其

31、中 P(A且B) =A和B的 联合概率 P(A) = A的边缘或简单概率P(B) = B的边缘或简单概率给定B已经发生发生,A的条件概率给定A已经发生发生,B的条件概率Chap 4-108给定有空调(AC) ,一辆汽车有CD播放器的概率是多少?也就是, 我们要找出P(CD | AC)条件概率例子使用的汽车中, 70%有空调(AC) 且40% 有CD播放器 (CD)。 20%的汽车两者都有。Chap 4-109条件概率例子无CDCD总计AC0.20.50.7无AC0.20.10.3总计0.40.6 1.0使用的汽车中, 70%有空调(AC) 且40% 有CD播放器 (CD)。 20%的汽车两者都

32、有。(续)Chap 4-110条件概率例子无 CDCD总计AC0.20.50.7无 AC0.20.10.3总计0.40.6 1.0给定AC,我们仅考虑第一行 (70%的汽车)。其中, 20% 有CD播放器 。 70%中的20% 大约为28.57%。(续)Chap 4-111使用决策树有 AC没有 AC有 CD没有 CD有 CD没有 CDP(AC)= 0.7P(AC)= 0.3P(AC 且CD) = 0.2P(AC 且CD) = 0.5P(AC 且CD) = 0.1P(AC 且CD) = 0.2所有汽车给定 AC 或没有AC:条件概率Chap 4-112使用决策树有 CD没有 CD有 AC没有

33、AC有 AC没有 ACP(CD)= 0.4P(CD)= 0.6P(CD 且AC) = 0.2P(CD 且AC) = 0.2P(CD 且AC) = 0.1P(CD 且AC) = 0.5AllCars给定CD 或没有CD:(续)条件概率Chap 4-113独立性两个事件是独立的当且仅当:事件A和B 是独立的, 当一个事件的概率不受另外一个事件已经发生情况的影响。Chap 4-114乘法法则事件A和B的乘法法则:注意: If A和B are 独立的, 则乘法法则简化为Chap 4-115边缘概率事件 A的边缘概率:其中 B1, B2, , Bk 是 k 互斥事件 和完备事件Chap 4-116贝叶斯

34、定理贝叶斯定理(Bayes Theorem)是用来基于新的信息修正原先已经计算的概率的定理。由Thomas Bayes 在18世纪发展出来。它是条件概率的扩展。Chap 4-117贝叶斯定理其中:Bi = k 互斥事件 且完备事件中第i个事件A = 可能影响P(Bi)的新事件Chap 4-118贝叶斯定理例子钻探公司已经估计他们的新油井有40%的可能出油。计划一个细节测试来得到更多的信息。历史上看,60%成功的油井进行过细节测试,20%不成功的油井进行过细节测试。给定这油井已经计划进行细节测试,这个油井成功的概率是多少?Chap 4-119令 S = 成功的油井 U = 不成功的wellP(S

35、) = 0.4 , P(U) = 0.6 (先验概率)定义细节测试事件为D条件概率:P(D|S) = 0.6 P(D|U) = 0.2目标是找出P(S|D)贝叶斯定理例子(续)Chap 4-120贝叶斯定理例子(续)应用贝叶斯定理:所以给定油井已经计划细节测试,修正的成功概率是0.667。Chap 4-121给定油井已经计划细节测试,修正的成功概率从最初估计0.4上升到0.667贝叶斯定理例子事件先验概率条件概率联合概率修正概率S (成功的)0.40.6(0.4)(0.6) = 0.240.24/0.36 = 0.667U (不成功的)0.60.2(0.6)(0.2) = 0.120.12/0

36、.36 = 0.333和 = 0.36(续)Chap 4-122小结讨论了概率论基础 概念样本空间和事件, 列联表, 韦恩图, 简单概率和联合概率检验了概率论基础法则一般加法法则, 互斥事件的加法法则, 完备事件的法则定义了条件概率统计量独立性, 边缘概率, 决策树和乘法法则讨论了贝叶斯定理Chap 5-123第5章离散概率分布商务统计学(第5版)Chap 5-124学习目标在本章中你将学到:概率分布的性质计算概率分布的期望值和方差 计算二项分布和泊松分布的概率如何使用二项分布和泊松分布来解决商业问题Chap 5-125定义 随机变量随机变量表示一个不确定事件的可能值。离散随机变量的结果来自一

37、个计数过程(例如 你本学期所选的课程数).连续随机变量的结果来自一个计量(例如 你的年薪,或你的体重). Chap 5-126定义 随机变量随机变量离散 随机变量连续随机变量第5章第6章离散 随机变量连续随机变量第5章第6章离散 随机变量连续随机变量第5章第6章随机变量Chap 5-127离散 随机变量只能假设一些可数数量的观察值例子: 抛骰子两次 twice令X为4发生的次数(则 X可能为 0, 1或2次)抛硬币5次 令X为头朝上的次数 (则X = 0, 1, 2, 3, 4或5)Chap 5-128离散随机变量的概率分布离散随机变量的概率分布是随机变量所有可能出现的互斥结果的取值以及对应的

38、概率的列表选课数概率20.230.440.2450.16Chap 5-129实验: 抛两枚硬币 ,令X = 正面朝上的枚数TT离散随机变量概率分布例子4个可能的结果TTHHHH概率分布 0 1 2 X X值 概率 0 1/4 = 0.25 1 2/4 = 0.50 2 1/4 = 0.250.500.25 概率 Chap 5-130离散随机变量期望值 (度量集中趋势)离散随机变量期望值 (或平均数) (加权平均数)例子:抛两枚硬币, X = 正面朝上的枚数, 计算X的期望值: E(X) = (0)(0.25) + (1)(0.50) + (2)(0.25) = 1.0 X P(X) 0 0.2

39、5 1 0.50 2 0.25Chap 5-131离散随机变量的方差离散随机变量的标准差其中:E(X) = 离散随机变量X的期望值 Xi = X的第i个结果P(Xi) = X的第i个结果发生的概率离散随机变量度量变异程度Chap 5-132例子: 抛两枚硬币, X =正面朝上的枚数, 计算标准差(回忆E(X) = 1)离散随机变量度量变异程度(续)可能的正面朝上的枚数= 0, 1, or 2Chap 5-133概率分布连续概率分布二项分布泊松分布概率分布离散 概率分布正态分布第5章第6章Chap 5-134二项分布的概率分布固定的观察值个数, n例如, 一枚硬币抛15次;仓库中拿出来的10个电

40、灯泡所有观察值归为两类,这两类具有互斥性和完备性。例如, 每次抛硬币的正面或反面;有缺陷的或没有缺陷的电灯泡因为两类具有互斥性和完备性某个观察值被归为我们感兴趣的事件概率为,则我们感兴趣的事件不发生的概率1 - 某个观察值被归为我们感兴趣的事件概率为,且这个概率不随观察值的改变而改变。当我们抛硬币的时候反面朝上的概率保持不变Chap 5-135二项分布的概率分布(续)观察值是独立的一个观察值的结果不受其他的影响两种取样方式导致独立性不重复的无限总体重复的有限总体Chap 5-136二项分布的可能应用生产工厂将项目标记为有缺陷的或可接受的以公司合同投标或者中标合同或者不中标市场研究公司收到“是的

41、,我将购买”或“不,我不会买”的调查回应新工作的申请者要么接受工作机会要么拒绝Chap 5-137二项分布的计算技巧假设感兴趣的事件是抛硬币正面朝上。抛硬币三次,有几种方式可以得到两次正面朝上?可能的方式: 正正反,正反正,反正正,所以有3种方式可以得到两次正面朝上。这种情况是相当简单的。我们需要能够计算更复杂情况的方式数。Chap 5-138计算技巧 组合定律从n个目标中选出目标的组合 数为 其中:n! =(n)(n - 1)(n - 2) . . . (2)(1)X! = (X)(X - 1)(X - 2) . . . (2)(1) 0! = 1 (根据定义)Chap 5-139计算技巧

42、组合定律如果你有31家喜欢的冰激凌店,选出3家的组合有多少种可能?所有的选择数n = 31,我们选择其中X = 3.Chap 5-140P(X) = n 次实验中X次感兴趣事件发生的概率, 每次实验感兴趣事件发生的概率是 X = 样本中感兴趣事件数量, (X = 0, 1, 2, ., n) n = 样本容量(实验或观察值数量) = 感兴趣事件的概率 of “event of interest” P(X)nX !nX(1-)XnX!()!=-例子: 抛一枚硬币4次, 令x = 正面朝上的次数:n = 4 = 0.51 - = (1 - 0.5) = 0.5X = 0, 1, 2, 3, 4二项

43、分布公式Chap 5-141例子: 计算二项分布概率如果感兴趣事件的概率为0.1,五次观察中一次成功的概率是多少? X = 1, n = 5和 = 0.1Chap 5-142二项分布例子假设购买有缺陷的计算器的概率是0.02。在一组10台中买到两台有缺陷计算器的概率是多少? X = 2, n = 10和 = 0.02Chap 5-143二项分布形状n = 5 = 0.1 0.2.4.6012345XP(X)n = 5 = 0.5.2.4.6012345XP(X)0二项分布的形状取决于 和n的值这里, n = 5和 = .1这里, n = 5和 = .5Chap 5-144二项分布 使用二项分布

44、表n = 10 x=.20=.25=.30=.35=.40=.45=.500123456789100.10740.26840.30200.20130.08810.02640.00550.00080.00010.00000.00000.05630.18770.28160.25030.14600.05840.01620.00310.00040.00000.00000.02820.12110.23350.26680.20010.10290.03680.00900.00140.00010.00000.01350.07250.17570.25220.23770.15360.06890.02120.004

45、30.00050.00000.00600.04030.12090.21500.25080.20070.11150.04250.01060.00160.00010.00250.02070.07630.16650.23840.23400.15960.07460.02290.00420.00030.00100.00980.04390.11720.20510.24610.20510.11720.04390.00980.0010109876543210=.80=.75=.70=.65=.60=.55=.50 x例子: n = 10, = .35, x = 3: P(x = 3|n =10, = .35)

46、 = .2522n = 10, = .75, x = 2: P(x = 2|n =10, = .75) = .0004Chap 5-145二项分布特征平均数方差和标准差其中n = 样本容量 = 任何实验感兴趣事件的概率(1 ) =任何实验无感兴趣事件的概率Chap 5-146二项分布特征n = 5 = 0.1 0.2.4.6012345XP(X)n = 5 = 0.5.2.4.6012345XP(X)0例子Chap 5-147二项分布 使用ExcelChap 5-148泊松分布定义当对给定机会域中某事件发生的次数感兴趣时使用泊松分布 。机会域(area of opportunity)是一个连续

47、的单位,或者时间间隔,容量,或者任何一个事件会发生超过一次的物理区域。汽车油漆上擦痕的数量咬某人的蚊子数一天中计算器出错的次数Chap 5-149泊松分布应用泊松分布 :在给定的机会域中,你想数出某一事件发生的次数。给定机会域中一个事件发生的概率对于所有机会域来说都是一样的。在某一个机会域中发生的事件数量和任何其他机会域中的事件发生的数量是独立的。 随着机会域变小,在某个机会域中两件或两件以上的事件发生的概率趋近于0.每单位期望的事件数是 (读作lambda)Chap 5-150泊松分布公式其中:X = 机会域事件数 =每单位期望的事件数e = 自然对数(2.71828.)Chap 5-151

48、泊松分布特征平均数方差和标准差其中 =每单位期望的事件数Chap 5-152使用泊松分布表X0.100.200.300.400.500.600.700.800.90012345670.90480.09050.00450.00020.00000.00000.00000.00000.81870.16370.01640.00110.00010.00000.00000.00000.74080.22220.03330.00330.00030.00000.00000.00000.67030.26810.05360.00720.00070.00010.00000.00000.60650.30330.0758

49、0.01260.00160.00020.00000.00000.54880.32930.09880.01980.00300.00040.00000.00000.49660.34760.12170.02840.00500.00070.00010.00000.44930.35950.14380.03830.00770.00120.00020.00000.40660.36590.16470.04940.01110.00200.00030.0000例子: 找出P(X = 2) , 如果 = 0.50Chap 5-153泊松分布使用ExcelChap 5-154泊松分布概率图示X =0.50012345

50、670.60650.30330.07580.01260.00160.00020.00000.0000P(X = 2) = 0.0758 图示: = 0.50 Chap 5-155泊松分布形状泊松分布的形状取决于参数 : = 0.50 = 3.00Chap 5-156小结说明了离散随机变量的概率分布讨论了二项分布讨论了泊松分布 Chap 6-157第6章正态分布商务统计学(第5版).Chap 6-158学习目标在本章中你将学到:计算正态分布的概率使用正态分布图判定一组数据是否近似正态分布.Chap 6-159连续概率分布连续随机变量是可以取连续的任意值的变量 (可以假设有不可数的观察值数)某物的

51、厚度完成任务所需要的时间溶液的温度以英寸计的高度其潜在的值仅取决于度量工具的精确跟准确度.Chap 6-160正态分布 钟形 对称 平均数, 中位数 和众数相等位置由均数, 决定散布由标准差, 决定随机变量理论上有无限的全距 : + 到 平均数 = 中位数 = 众数Xf(X).Chap 6-161正态分布的分布函数正态分布的分布函数公式为Wheree = 数学常数,大约为2.71828 = 数学常数,大约为3.14159 = 总体平均数 = 总体标准差X = 连续变量的任何观测值.Chap 6-162通过变动参数 和, 我们得到不同的正态分布各种正态分布.Chap 6-163正态分布形态Xf(

52、X)改变 左或右移分布.改变 增加或减少散布.Chap 6-164标准正态分布任何正态分布(任何平均数和标准差的组合)都能够转换为标准正态分布(Z)需要将X转换为Z标准正态分布(Z)的平均数为0且标准差为1.Chap 6-165转换成标准正态分布通过将X减去平均数之后处于其标准差转换成标准正态分布 (“Z” 分布) :Z 分布的平均数 = 0 且标准差 = 1.Chap 6-166标准正态分布分布函数标准正态分布分布函数公式为Wheree = 数学常数,大约为2.71828 = 数学常数,大约为3.14159Z = 标准正态分布的任何观测值.Chap 6-167标准 正态分布也称为“Z” 分布

53、平均数 is 0标准差 is 1Zf(Z)01平均数之上的观测值有正的Z-值,平均数之下的观测值有负的Z-值.Chap 6-168例子如果X服从正态分布,平均数为100且标准差为50, 对于 X = 200 的Z值为这说明X = 200在平均数100之上两个标准差 (2个50).Chap 6-169比较X和Z单位Z1002.00200X注意分布形态是一样的,仅是坐标改变。我们可以将问题用原始单位(X)或标准单位(Z)表示。( = 100, = 50)( = 0, = 1).Chap 6-170计算正态分布概率abXf(X)PaXb()概率用曲线下面积来度量PaXb()=(注意任何单个观测值的概

54、率为0).Chap 6-171f(X)X概率为曲线下面积0.50.5曲线下总面积为 1.0, 且曲线是对称的, 因此一般大于平均数, 一半小于.Chap 6-172标准正态分布表 教科书 (附录表 E.2)上累计标准正态分布表给出了低于一个需要的Z值概率 (也就是,从负无穷到Z)Z02.000.9772例子: P(Z 2.00) = 0.9772.Chap 6-173标准正态分布表 表中的值给出从Z = 直到所需要的Z值的概率.97722.0P(Z 2.00) = 0.9772 行显示到第一位小数的Z值 列给出到第二位小数的Z值2.0.(续) Z 0.00 0.01 0.02 0.00.1.C

55、hap 6-174计算正态分布概率的一般步骤 画出问题所对应于X的正态分布曲线 将X值转换成Z值 使用标准正态分布表计算P(a X b) ,当X服从正态分布:.Chap 6-175计算正态分布概率令X表示从互联网上下载一张图片所需要的时间假设X服从正态分布,平均数 8.0 且标准差 5.0。 计算P(X 8.6)X8.68.0.Chap 6-176令X表示从互联网上下载一张图片所需要的时间假设X服从正态分布,平均数 8.0 且标准差 5.0。 计算P(X 8.6)Z0.12 0X8.6 8 = 8 = 10 = 0 = 1(续)计算正态分布概率P(X 8.6)P(Z 0.12).Chap 6-

56、177Z0.12Z.00.010.0.5000.5040.5080.5398.54380.2.5793.5832.58710.3.6179.6217.6255结论: 计算 P(Z 0.12).5478.020.1.5478标准正态分布表 (部分)0.00= P(Z 0.12)P(X 8.6)X8.68.0.Chap 6-179现在计算 P(X 8.6)(续)Z0.12 0Z0.120.5478 01.0001.0 - 0.5478 = 0.4522 P(X 8.6) = P(Z 0.12) = 1.0 - P(Z 0.12) = 1.0 - 0.5478 = 0.4522计算正态分布右侧概率.

57、Chap 6-180计算两个值之间的正态分布概率假设X服从正态分布,平均数 8.0 且标准差 5.0。 计算 P(8 X 8.6) P(8 X 8.6)= P(0 Z 0.12)Z0.12 0X8.6 8计算Z值:.Chap 6-181Z0.12结论: 计算 P(0 Z 0.12)0.04780.00= P(0 Z 0.12)P(8 X 8.6)= P(Z 0.12) P(Z 0)= 0.5478 - .5000 = 0.04780.5000Z.00.010.0.5000.5040.5080.5398.54380.2.5793.5832.58710.3.6179.6217.6255.020.1

58、.5478标准正态分布表 (部分).Chap 6-182假设X服从正态分布,平均数 8.0 且标准差 5.0。 现在计算 P(7.4 X 8)X7.48.0左半部分概率.Chap 6-183左半部分概率 现在计算 P(7.4 X 8)X7.48.0 P(7.4 X 8) = P(-0.12 Z 0)= P(Z 0) P(Z -0.12)= 0.5000 - 0.4522 = 0.0478(续)0.04780.4522Z-0.12 0正态分布是对称的, 所有此概率 与P(0 Z 30 将导致抽样分布近乎正态分布对于完全对称分布, n 15 一般足够导致抽样分布近乎正态分布对正态分布的总体,平均数

59、的抽样分布总是服从正态分布Basic Business Statistics, 11e 2009 Prentice-Hall, Inc.Chap 7-236例子假设总体的平均数 = 8 且标准差 = 3. 假设选中容量n = 36随机样本。样本平均数介于7.8和8.2之间的概率是多少?Basic Business Statistics, 11e 2009 Prentice-Hall, Inc.Chap 7-237例子结论:即使总体非正态分布, 中心极限定理可以应用 (n 30) 因此抽样分布近乎正态分布 且平均数 = 8 且标准差(续)Basic Business Statistics, 11

60、e 2009 Prentice-Hall, Inc.Chap 7-238例子 结论(续):(续)Z7.8 8.2-0.4 0.4抽样分布标准正态分布分布.1554 +.1554总体 分布?样本标准化XBasic Business Statistics, 11e 2009 Prentice-Hall, Inc.Chap 7-239总体比例 = 有着某种特性的总体的比例 样本比例 ( p ) 提供的估计:0 p 1当n比较大时,p 近乎正态分布(假设是有放回的抽样或者无限总体无放回的抽样)Basic Business Statistics, 11e 2009 Prentice-Hall, Inc.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论