概率、信息描述与抽样推断小结._第1页
概率、信息描述与抽样推断小结._第2页
概率、信息描述与抽样推断小结._第3页
概率、信息描述与抽样推断小结._第4页
概率、信息描述与抽样推断小结._第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、概率与正态曲线概率与正态曲线 1.1.研究随机性和规律性的两个例子研究随机性和规律性的两个例子 1 1)2020世纪世纪5050年代,小儿麻痹症育苗的研究。年代,小儿麻痹症育苗的研究。实验组(疫苗)实验组(疫苗)20万5656对照组(安慰对照组(安慰剂)剂)20万138138问题是:问题是:5656和和138138之间的差别是否超过了之间的差别是否超过了随机性所能解释的范围。随机性所能解释的范围。 2)1970,美国越战的征兵1183366305931/71/114/98/631/1210011073问题是:73和和110之间的差别是否超过了随机性之间的差别是否超过了随机性所能解释的范围。所能

2、解释的范围。 思考题思考题 拧松水龙头,让其刚好到只有水滴下来,计算拧松水龙头,让其刚好到只有水滴下来,计算并记录并记录1515分钟内每个分钟内每个2020秒里的水滴数。利用你秒里的水滴数。利用你的数据,请说出该水滴在什么方面是随机的?的数据,请说出该水滴在什么方面是随机的?什么方面又是有规律的?什么方面又是有规律的? 1 1)随机性随机性和和规律性规律性是统计学的两个重要概念。是统计学的两个重要概念。规律规律性本身包含着随机性性本身包含着随机性。统计可以定义为在随机性中寻。统计可以定义为在随机性中寻找规律性,当两种规律之间的差异超出了随机性本身找规律性,当两种规律之间的差异超出了随机性本身的

3、影响(或者解释范围),变化趋势就发生了。的影响(或者解释范围),变化趋势就发生了。 2 2)概率为我们从数据中得出结论提供了基础,)概率为我们从数据中得出结论提供了基础,统计统计学家利用概率判断数据间的差异是否超出了随机性本学家利用概率判断数据间的差异是否超出了随机性本身的影响身的影响。 3 3)统计很少对总体进行直接的研究,都是通过对具)统计很少对总体进行直接的研究,都是通过对具有代表性的样本的研究,来对总体的信息进行推断。有代表性的样本的研究,来对总体的信息进行推断。一、概率论发展简史一、概率论发展简史1. 1. 概率论的起源概率论的起源Pascal(16231662) Fermat, (

4、16011665) 16541654年,赌年,赌金分配问题金分配问题 赌金分配问题赌金分配问题 梅雷说:有一次他与某赌友梅雷说:有一次他与某赌友( (代称为代称为A A先生先生) )掷骰掷骰子时,各押子时,各押3232个金币为赌注,双方约定如果谁先个金币为赌注,双方约定如果谁先赢得赢得3 3局,就可以把赌金全部拿走,但因为梅雷局,就可以把赌金全部拿走,但因为梅雷临时有事,所以赌局不得不中途中断。此时梅雷临时有事,所以赌局不得不中途中断。此时梅雷已经赢得已经赢得2 2局,而局,而A A先生只赢先生只赢1 1局,局,如何公平分配如何公平分配赌金?赌金? 起点起点费马费马:情况情况1 12 23 3

5、4 4胜者胜者梅雷、梅雷梅雷、梅雷 梅雷、梅雷、A AA A、梅雷、梅雷A A、A A帕斯卡尔:帕斯卡尔: 16551655年,荷兰数学家惠更斯年,荷兰数学家惠更斯 (Christopher (Christopher Huygens) Huygens) 访问巴黎时,了解到帕斯卡尔与费马访问巴黎时,了解到帕斯卡尔与费马的通信研究,对这类问题产生兴趣,后来,他撰的通信研究,对这类问题产生兴趣,后来,他撰写写骰子游戏骰子游戏(Dice Game, 1657) (Dice Game, 1657) 来探讨机率来探讨机率问题的原理,其中包含许多习题,被许多人认为问题的原理,其中包含许多习题,被许多人认为是

6、机率史上第一本教科书。是机率史上第一本教科书。提出了期望的概念提出了期望的概念。 17131713年,瑞士数学家伯努利(年,瑞士数学家伯努利(Jacob BernoulliJacob Bernoulli,1654 17051654 1705)出版了)出版了猜度术猜度术一书,一书,提出了提出了大数定理大数定理 。 17651765年,法国数学家棣莫弗年,法国数学家棣莫弗(A.DeMoivre,16671754A.DeMoivre,16671754)的)的机会的学说机会的学说一书出版,一书出版,17331733年就发现了正态曲线年就发现了正态曲线,以及论述,以及论述了不存在运气。了不存在运气。 1

7、9331933年,俄罗斯数学家科尔莫戈罗夫年,俄罗斯数学家科尔莫戈罗夫(1903(190319871987)以德文出版的经典性著作)以德文出版的经典性著作概率论基础概率论基础,标志着概率论的公理化完成,这就是我们现在看标志着概率论的公理化完成,这就是我们现在看到的概率论的情形。到的概率论的情形。2. 2. 概率论专有名词概率论专有名词随机实验随机实验(Random trial)(Random trial):满足如下三个条件就可以称:满足如下三个条件就可以称之为随机实验:(之为随机实验:(1 1)在同一条件下可无限次重复;()在同一条件下可无限次重复;(2 2)实验结果有多个,且不确定;(实验结

8、果有多个,且不确定;(3 3)事前不知实验结果)事前不知实验结果(outcomeoutcome)。抛硬币)。抛硬币 基本事件基本事件(Elementary event)(Elementary event):一次随机实验的可能结:一次随机实验的可能结果,称为基本事件或者基本随机事件。果,称为基本事件或者基本随机事件。若随机实验若随机实验E E是是“抛两次硬币抛两次硬币”,其基本事件就是,其基本事件就是“+ +、”,“+ +、+”+”,“,”,“,+”+”。样本空间样本空间(Sample space)(Sample space):所有基本事件所组成的集合,:所有基本事件所组成的集合,称为样本空间或

9、基本空间。称为样本空间或基本空间。接上例,其样本空间就是集合接上例,其样本空间就是集合“+“+、”,“+ +、+”+”,“,”,“,+”+”。 随机事件随机事件(Random event)(Random event):简称事件,指一些由基本事件所组成的集合。简称事件,指一些由基本事件所组成的集合。 例如,接上例,事件例如,接上例,事件“两次出现相同面两次出现相同面”,就有两个,就有两个基本事件组成:基本事件组成:+ +、+”+”,“,”。 不相容事件不相容事件(Mutually exclusive events)(Mutually exclusive events):在随机试验中,不能同时发生

10、或其交集为空集的几在随机试验中,不能同时发生或其交集为空集的几个事件,称为不相容事件。反之为相容事件个事件,称为不相容事件。反之为相容事件 接上例,事件接上例,事件“两次同时出现正面两次同时出现正面”和和“两次同时出两次同时出现反面现反面” ” 就是不相容事件。就是不相容事件。“至少出现一次正面至少出现一次正面”和和“至少出现反面至少出现反面”就是两个相容事件就是两个相容事件3. 3. 概率的含义概率的含义 概率概率(Probability)是一个是一个0 0到到1 1之间的数,描述了一个事件发之间的数,描述了一个事件发生的经常程度生的经常程度。小概率(接近。小概率(接近于于0)的事件很少发生

11、,而大)的事件很少发生,而大概率(接近于概率(接近于1)的事件则经)的事件则经常发生。常发生。 概率对统计的意义:对于统计,概率对统计的意义:对于统计,概率告诉我们,概率告诉我们,在样本数据的在样本数据的基础上,如果试验重复多次,基础上,如果试验重复多次,各种结果发生的经常程度是多各种结果发生的经常程度是多大大。.5 01不可能不可能必然必然4.4.获得概率的基本方法获得概率的基本方法 利用机会均等法则利用机会均等法则(Equality likely (Equality likely approach)approach) 使用相对频次使用相对频次(Relative frequency)(Rel

12、ative frequency)的方的方法法利用主观概率利用主观概率(Subjective approach)(Subjective approach) 4.1 4.1 利用机会均等法则利用机会均等法则如果试验有如果试验有n n种可能的结果,使某特定事件出种可能的结果,使某特定事件出现的结果数量为现的结果数量为k k,那么(,那么(k/nk/n)就是出现该事)就是出现该事件的概率。件的概率。思考题:一副扑克思考题:一副扑克5252张(大、小王去掉),洗均匀,张(大、小王去掉),洗均匀,随机取一张牌,那么该张牌是梅花的概率是多少?随机取一张牌,那么该张牌是梅花的概率是多少?kn要注意两点要注意两

13、点: (1)分清楚你求解问题中什么是你的n,什么是你的k。 (2) 其实我们在这样做的时候,就已经接受了两个前提假设两个前提假设:a)实验的可能结果是已知的;b)由于对称性,每一个结果的可能性都是相同的。往往这两个前提假设不一定满足.思考题思考题再求以下问题的概率中,以上的哪个前提假设再求以下问题的概率中,以上的哪个前提假设不满足:不满足: 1 1)一场赛马比赛,有)一场赛马比赛,有6 6匹马,求某一匹马胜匹马,求某一匹马胜出的概率。出的概率。 2 2)求解生男孩和女孩的概率)求解生男孩和女孩的概率14讲小结讲小结一、一、霍桑实验霍桑实验中的群体实验中的群体实验 这个实验的目的就是要看看,当每

14、个工人的工这个实验的目的就是要看看,当每个工人的工作情况不但与自己的报酬、而且与同伴的报酬作情况不但与自己的报酬、而且与同伴的报酬紧密关联时,工人会如何办?怎样协作?紧密关联时,工人会如何办?怎样协作?实验条件:(1)人员:14名男职工,其中9名绕线工,3名是焊接工,2名检验工;(2)计件工作制度,但却不是按个人的产量计酬,而是按集体的总产量计酬;报酬由厂方直接支付给个人,而不是交由小组自行分配。这样,工人完成的工作数额,不但决定着自己的工资,而且直接影响着一起干活的同事们的收入。实验结果:工人每天只完成了60006600个焊接点(标准每个工人应该完成7312个焊接点),且天天如此。为什么?为

15、什么? 解释解释1 1:可能是这些工人的智力或者动作协调:可能是这些工人的智力或者动作协调性有问题。性有问题。 再做研究,研究测试结果否定了这一解释。再做研究,研究测试结果否定了这一解释。合理的解释:工人们自动限制产量的理由是,如果他们过分努力地工作,就可能造成群体内同伴的失业,或者公司会制定出更高的生产定额来。所以群体会迫使其中的个体进行一致限产。也就是工人会受到也就是工人会受到非正式组织的影响。非正式组织的影响。 证实在工人当中存在着一种非正式的组织在工人当中存在着一种非正式的组织,而且这种非正式的组织对工人的生产率有着极其重要非正式的组织对工人的生产率有着极其重要的影响的影响 总结一下该

16、研究的研究过程不支持支持提出假设数 据 分数 据 分析析假设成为一种假说,进而为理论数据支持假设么?理论研究(产生方式)理论研究(产生方式)2通过实验或其他方式收集数据二、变量(二、变量(variablevariable) 变量简单的说就是事物的特征或者属性。变量简单的说就是事物的特征或者属性。 研究者在研究项目开始的时候,就要确定他们所要研究的变量是什么。 变量的值(变量的值(value)通常是对某一个特定单位的度量,这种单位常常被视为一个个体一个个体(element)。什么是个体取决于你的研究问题。 2 21 1 变量的测量层次变量的测量层次 1 1)思考题:)思考题:请回答以下收集到的数

17、据,可以进行请回答以下收集到的数据,可以进行“ ”,“”,“、” ” ,“,”中的哪些运算?中的哪些运算? (1 1)五个人的性别:)五个人的性别:1 1,0 0,0 0,1 1,1 1(1 1:男性;:男性;0 0:女:女性)性) (2 2)五个人的身高:)五个人的身高:170170,173173,165165,180180,161161(单位:(单位:厘米)厘米) (3 3)七天的气温(摄氏温度)七天的气温(摄氏温度):):1515,2424,2727,1818,3434,3030,1919。 (4 4)五个人对一项政策满意程度的评分:)五个人对一项政策满意程度的评分: 5 5,3 3,3

18、 3,4 4,2 2(1 1:十分不满意;:十分不满意;2 2:不满意;:不满意;3 3:一般或中立;:一般或中立;4 4:满意;:满意;5 5:十分满意):十分满意) 2 2)思考题:)思考题: (1 1)我们用一个量表测量人们对一项法律的态度,)我们用一个量表测量人们对一项法律的态度,如果如果1 1表示不赞成,表示不赞成,2 2表示无所谓,表示无所谓,3 3表示赞成,对表示赞成,对于于3 3个人我们测得的值分别为:个人我们测得的值分别为:3 3、1 1、2 2,这些数据,这些数据为为_数据。数据。 (2 2)测量)测量1010个大学生所在的年级,如果用个大学生所在的年级,如果用1 1表示大

19、表示大一、一、2 2表示大二、表示大二、3 3表示大三、表示大三、4 4表示大四、表示大四、5 5表示其表示其他。测量的值为:他。测量的值为:1 1、3 3、4 4、1 1、2 2、3 3、2 2、1 1、1 1、4 4,这些数据为这些数据为_数据。数据。 (3 3)测得)测得5 5个人的第一次结婚年龄(单位:周岁)个人的第一次结婚年龄(单位:周岁)为:为:2020、2222、2424、3030和和2626,这些数据为,这些数据为_数据。数据。 三、频数分布数列三、频数分布数列 1.统计分组后,每个组分配的总体单位数称为频数或次数(f)。 频数/总体单位总数=频率。 2.意义 整理了杂乱无章的

20、数据,同时显示出一批数的分布情况,是数理统计学中随机变量及其概论分布概念在实际中的应用。例1 家庭所拥有的电视机数对于广告行业来说是一个重要的信息,下面的数据是随机抽取的50户家庭中每个家庭所拥有的电视机数。 1 1 1 2 6 3 3 4 2 4 3 2 1 5 2 1 3 6 2 2 3 1 1 4 3 2 2 2 2 3 0 3 1 2 1 2 3 1 1 3 3 2 1 1 3 1 5 1 你能从中发现什么?电视机数电视机数频次频次频率频率0 01 10.020.021 116160.320.322 214140.280.283 312120.240.244 43 30.060.065

21、 52 20.040.046 62 20.040.04 思考题: (1)如果要让你去获取你所在楼层的家庭拥有的电视机数量的分布,你怎么去获取? (2)如果要让你去获取广州市家庭拥有的电视机数量的分布,你怎么去获取?四、集中趋势分析四、集中趋势分析 集中趋势是数据分布的中心,描述集中趋势的指标有算集中趋势是数据分布的中心,描述集中趋势的指标有算术平均数术平均数( )( )、几何平均数(、几何平均数( )、中位)、中位数(数( )、众数)、众数( )( )等。等。MeoMxG众数众数中位数中位数 1.平均数的分类平均数的分类2.算术平均数的计算公式 算术平均数 1.1.简单算术平均数简单算术平均数

22、: : 2.加权算术平均数加权算术平均数:12nXXXXXnnffXffffffkkk212211XXXX 例1:应用条件:资料未分组,各组出现的次数都是应用条件:资料未分组,各组出现的次数都是1 1。5 5名学生的学习成绩分别为:名学生的学习成绩分别为:7575、9191、6464、5353、8282。则平均成绩为:。则平均成绩为: =73(分) 分分平平均均成成绩绩73536558253649075 x例2:某车间某车间2020名工人加工某种零件资料:名工人加工某种零件资料:按日产量分组(件)按日产量分组(件)x x工人数(人)工人数(人)f f 日产总量日产总量 xfxf 14 14 2

23、 2 28 28 15 15 4 4 60 60 16 16 8 8 128 128 17 17 5 5 85 85 18 18 1 1 18 18 合计合计 20 20 319 319 件件平均日产量平均日产量1620319 x= 16(件)件)123111111nniinnHXXXXX甲甲乙乙丙丙1.200.500.801800012500 64001500025000 8000合计合计3690048000 12312311231nnniininiimmmmmHmmmmmXXXXX%44. 94500425%7105%10200%121201052001201mxmH调和平均数调和平均数

24、(例题分析例题分析)(1)(2))/(38. 11667. 23215 . 11113n1nH元公斤6.5 6.5 6.519.51.38(/ )111114.08336.56.56.511.52mHmx 公 斤元 (3)(4)3 2 161.24(/)11114.8332111.52mHmx 公斤元元)(公斤/5 . 1325 . 11nxx200 200 20060025.2(/)111123.81200200200302820mHmx公 里小)/(266156222220228230fxfx小时公里4. 几何平均数的计算公式 几何平均数 1.简单几何平均数: : 2.加权几何平均数: n

25、nxxx 21GG ffnffnxxx 2121例:1.某产品经过三个流水连续作业的车间加工生产而成,本月第一车间的产品合格率为90%,第二车间的产品合格率为80%,第三车间的产品合格率为70%。则全厂的总合格率为:%4.50%70%80%90总合格率这样平均合格率为321%70%80%90nnxxxG平均合格率%58.79%4.503 例2:设某笔为期20年的投资按复利计算收益,前10年的年利率为10%,中间5年的利率为8%,最后5年的年利率为6%。求平均年利率。 解答:假设初始投资额为a,则20年后的本利和为A。则 Aa(1+10%)10(1+8%)5(1+6%)5 所谓的平均年利率,设为

26、r,就是要使得a(1+r)20=A, 即a(1+r)20= a(1+10%)10(1+8%)5(1+6%)5 %49.10820506. 1508. 1101 . 1)1 (r年平均本利率%49.81%49.108r年平均利率5.众数众数 1.众数的含义:众数的含义:总体中出现次数最多、频率最高的标志值。总体中出现次数最多、频率最高的标志值。 2.确定众数的方法。确定众数的方法。 (1)单项数列确定众数单项数列确定众数 21(件)(件)按日产量分组(件)按日产量分组(件)工人数(人)工人数(人)20201515212130302222202023231010oM众数的缺点只考虑出現次数最多的资

27、料,忽略了其他数值大小,故较不具敏感性除非知道全部的資料,否則我们无法由两组已知众数,求出合并后的众数,故不适合代数运算。众数不具存在唯一性,可能只有一个、可能不只一个、也可能不存在 (2)由组距数列确定众数由组距数列确定众数dLdffffffLM211)10)10)100( dUdffffffUM212)10)10)100(n例例1:9个家庭的人均月收入数据个家庭的人均月收入数据21neXMn例例2:10个家庭的人均月收入数据个家庭的人均月收入数据 2122nneXXM3)由组距分组数列确定中位数 (1)确定“中位数组”。 向上累计次数等于 (2)假定中位数组内分布是均匀的,计算出中位数来。

28、2feeeemmmemdfSfLM12eeeeemmmmdffSUM2向上累计时向上累计时向下累计时向下累计时eeeeemmmdfmSfUM12中位数计算公式比较众数、中位数和算术平均数的相对比较众数、中位数和算术平均数的相对位置位置 MeMo MeMo MeMo Me0时, 分布是右偏(正偏)的;当SK0,故也称正偏态;当分布为左偏态时,SK0,故也称负偏态。但除非是分组频数分布数据,否则SK公式中的众数M0有很大的随易性。例例1 1:两种投资组合:甲、乙,表中是:两种投资组合:甲、乙,表中是9 9笔过去半笔过去半年期投资报酬率,请问哪种投资组合的风险大?年期投资报酬率,请问哪种投资组合的风

29、险大?甲()甲() 9 917172 26 6191910104 413138 8乙()乙() 6 615153 31 116163 32 28 82 2 注意,两者的标准差相同:注意,两者的标准差相同:0.056960.05696,但是,但是 CVCV甲甲58.25%58.25% CVCV乙乙91.45%91.45% 所以乙的风险较大。所以乙的风险较大。例例2 2:某地:某地7 7岁男孩身高的均数为岁男孩身高的均数为123.10cm123.10cm,标准,标准差为差为4.714.71;体重均数为;体重均数为22.59kg22.59kg,标准差为,标准差为2.26kg,2.26kg,比较其变异

30、度?比较其变异度? 体重 2.26100%10.14%22.29CV 身高 4.71100% 3.83%123.10CV 七、抽样七、抽样统 计 量 参 数样本容量:n 总体容量:N样本平均数: 总体平均数:样本比例: p 总体比例:P样本标准差:s 总体标准差:样本方差: S2 总体方差:2x总体与样本总体与样本参数参数: :统计量统计量1.1.抽样基本概念抽样基本概念 全及总体和样本总体全及总体和样本总体1.抽样基本概念 根据全及总体计算的反映总体数量特征的指标称为全及指标,又叫参数。常用的总体参数有总体平均数和总体标准差(或总体方差)。 总体平均数: = 总体方差(或总体标准差): =2

31、Nx2)(Nx)(2FXFNX1.抽样基本概念 样本指标是指根据样本总体计算的指标,又叫统计量。 样本平均数:样本平均数: 样本方差或样本标准差样本方差或样本标准差 S2 = n-1为样本变量自由度为样本变量自由度1)(2nxx1)(2nsxxfxfnxx抽样平均数的平均误差例题:某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下:月平均工资(元)524534 540 550 560580600660工人数(个)469108643计算样本平均数和抽样平均误差计算样本平均数和抽样平均误差解:列表计算 xfxf5244209612965184534632

32、0467640565409486040036005501055001001000560844800058063480400240060042400160064006603198010000300005028000526402)(xxfxx2)( 计算平均数即平均工资:元)(5605028000fxfx元)(样本方差(45.325052640)2ffxx元)抽样平均误差(59. 45045.32nx抽样调查的优点抽样调查的优点: (1 1)经济性。)经济性。 (2 2)时效性强。抽样调查可以迅速、及时地获)时效性强。抽样调查可以迅速、及时地获取到所需要的信息。取到所需要的信息。 (3 3)准确性

33、高。)准确性高。抽样调查的一个原则:抽样调查的一个原则: “确信锅里的汤被确信锅里的汤被搅拌均匀搅拌均匀”。2.2.抽样调查的方法抽样调查的方法概率抽样概率抽样(Probability sampling)(Probability sampling)非概率抽样非概率抽样(Nonprobability(Nonprobability sampling) sampling)2.12.1概率抽样概率抽样(Probability sampling)(Probability sampling) 1 1)简单随机抽样)简单随机抽样(simple random sampling)(simple random s

34、ampling)就是等概率抽样,每个个体以相同的概率被抽中。就是等概率抽样,每个个体以相同的概率被抽中。这也可以分为重复抽样和不重复抽样两种形式。这也可以分为重复抽样和不重复抽样两种形式。 2 2)分层抽样)分层抽样(Stratified sampling)(Stratified sampling)在抽样之前将总体划分为不同的层(群),然后在在抽样之前将总体划分为不同的层(群),然后在各个层中抽取一定数量的元素组成样本。各个层中抽取一定数量的元素组成样本。分层抽样的时候应该是各个层内之间的元素的差异分层抽样的时候应该是各个层内之间的元素的差异比较小,而使层之间的元素比较大。各个层的划分比较小,

35、而使层之间的元素比较大。各个层的划分要根据研究者的判断和研究目的。要根据研究者的判断和研究目的。概率抽样概率抽样(Probability sampling)(Probability sampling) 3 3)等距离抽样)等距离抽样(systematic sampling,(systematic sampling,系统抽样)系统抽样)首先将总体中的个体按照某种顺序排列起来,然后首先将总体中的个体按照某种顺序排列起来,然后按照某种规则确定一个随机起点,然后,每隔一定按照某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直到抽满的间隔抽取一个元素,直到抽满n n个元素形成一个样个元素形成

36、一个样本为止。本为止。 4 4)整群抽样)整群抽样(Cluster sampling)(Cluster sampling)就是首先将总体划分为若干个群,然后以这些群为就是首先将总体划分为若干个群,然后以这些群为抽样单位从中抽出部分群,在对抽选出的群中的所抽样单位从中抽出部分群,在对抽选出的群中的所有元素进行观察。有元素进行观察。 思考题:假如你要调查广州市市区内的居民月收入,假思考题:假如你要调查广州市市区内的居民月收入,假设抽样容量为设抽样容量为10001000。你如何展开抽样?。你如何展开抽样? 1)1)便利抽样便利抽样(Convenience sampling(Convenience s

37、ampling)研究者出于收集数据的便利,而不考虑抽样的概率,研究者出于收集数据的便利,而不考虑抽样的概率,所进行的抽样。例如:街头访谈、电话访谈、向自所进行的抽样。例如:街头访谈、电话访谈、向自己的亲朋好友收集数据。己的亲朋好友收集数据。这种样本数据收集过程都加入了某中人为的干扰和这种样本数据收集过程都加入了某中人为的干扰和选择,选择,所以从方便样本中得出的结果对于总体信息所以从方便样本中得出的结果对于总体信息的推论程度是有限的的推论程度是有限的。 思考题:思考题: 有时候杂志要求读者回答某些问题并寄回答案,从而构有时候杂志要求读者回答某些问题并寄回答案,从而构成一个样本。成一个样本。 请问

38、这个样本能不能代表读者群总体?请问这个样本能不能代表读者群总体?为什么?为什么?2.22.2非概率抽样非概率抽样(Nonprobability(Nonprobability sampling)sampling) 2)2)判断抽样判断抽样(Judgment sampling)(Judgment sampling)是指经过专家考虑后,以适当的方式进是指经过专家考虑后,以适当的方式进行抽样。行抽样。例如:研究青少年吸毒问题。例如:研究青少年吸毒问题。3.3.抽样误差抽样误差 一般而言,样本统计量的分布就叫作一般而言,样本统计量的分布就叫作抽样分布抽样分布 抽样平均误差就是抽样平均数(或抽样成数)的抽

39、样平均误差就是抽样平均数(或抽样成数)的标准差。反映抽样平均数(或抽样成数)与总体标准差。反映抽样平均数(或抽样成数)与总体平均数(或总体成数)的平均误差程度。平均数(或总体成数)的平均误差程度。 抽样误差抽样误差= = 数据收集、整理、记录和制表过程中产生的数据收集、整理、记录和制表过程中产生的误差是非抽样误差。误差是非抽样误差。x影响抽样误差大小因素影响抽样误差大小因素 总体方差或总体标准差的大小(正比例)总体方差或总体标准差的大小(正比例) 样本容量的大小(反比例)样本容量的大小(反比例) 抽样组织方式和抽样方法抽样组织方式和抽样方法 抽样平均误差是反映抽样误差一般水平的指标。抽样平均误

40、差是反映抽样误差一般水平的指标。常用抽样平均的标准差或抽样成数的标准差作常用抽样平均的标准差或抽样成数的标准差作为衡量误差一般水平的尺度。为衡量误差一般水平的尺度。计算公式:计算公式:成成 数数平均数平均数不重复抽不重复抽样样成成 数数平均数平均数重复抽样重复抽样xnx2nx= = =np2nPP)1( p= = =x)1 (2Nnnx= =p)1 ()1 (NnnPp= = 例例1 1:从某厂生产的10000只日光灯管中随机抽取100只进行检查,假如该厂日光灯管平均使用寿命的标准差为100小时,试计算该厂日光灯管平均使用寿命的抽样平均误差。 在重复抽样条件下: 在不重复抽样条件下: (小时)101001

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论