《应用统计学》研究生配套教学课件_第1页
《应用统计学》研究生配套教学课件_第2页
《应用统计学》研究生配套教学课件_第3页
《应用统计学》研究生配套教学课件_第4页
《应用统计学》研究生配套教学课件_第5页
已阅读5页,还剩299页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

应用统计学经济、管理类基础课程统计的应用马寅初:1.学者离不开统计而研究2.政治家离不开统计而施政3.企业家离不开统计而执业威尔斯:——英国统计思维,就像读和写的能力一样,是现代社会公民必须具备的能力了解数字美国约翰.霍普金斯大学开始接收女生时,一个不赞成异性同校的记者做了一个惊人的报道:约翰.霍普金斯大学1/3的女生嫁给了该校教师。一时舆论哗然真相是:该校总共有3名女生,其中1人嫁给了老师了解数字在美国与西班牙交战期间,美国海军的死亡率是9‰,而同时期纽约市居民的死亡率是16‰海军征兵人员就用这些数据证明:参军更安全数据是真的,问题在于:这两组对象是不可比的海军主要有体格健壮的年轻人组成,而城市居民包括了婴儿、老人、病人,他们无论在哪儿死亡率都比较高。这些数据根本不能证明:符合参军标准的人在海军比在其他地方有更高的存活率第1章

绪论1.1统计的产生和发展1.2统计学的分类1.3统计学的性质和特点1.4统计学在管理中的作用1.5统计中的几个基本概念1.1统计的产生和发展统计的产生统计的发展统计学的分科1.1.1统计的产生1)产生于原始社会末期原始社会末期,统计萌芽于生产活动中的计量和计数活动《周易正义》:“事大,大结其绳;事小,小结其绳;结之多少,随物众寡”奴隶社会时期,统计已日益重要封建社会时期,统计已初具规模资本主社会的兴起,使统计扩展到社会经济的各个方面

2)统计是作为认识工具和管理工具而产生的

3)统计是认识社会的有力工具统计学作为一门系统的科学,距今已有300多年的历史统计是探索奥秘的技术统计使人聪明对统计学的一知半解常常造成不必要的上当受骗对统计学的一概排斥往往造成不必要的愚昧无知统计作为认识工具和管理工具2010年上海世博会1.2010年4月30日晚8:10分开幕2.园区面积5.28平方公里3.5.1—10.31日,历时184天4.平均每天参观人数40万,总数7000万人次5.平均每天演出100场6.主题馆有世界最大单体太阳能屋面,每年可减少二氧化碳排放量约2800吨统计作为认识工具和管理工具2006年以来的民工荒深层次原因:计划生育导致出生人口数迅速减少1.北京、上海等大城市高考录取人数超过报名人数2.1979年,中国0-14岁的少儿人口占总人口的1/3,2009年,比例不足1/5,下降速度惊人3.1993年以来,小学生人数逐年减少,从当初的13195.15万人,减少到2010年的不足10000万人,而小学学校,则从近70万所,锐减到30万所建议:1.适当放开计划生育政策2.征收美女税。干预青年女子嫁给外国人(白俄罗斯)3.征收无子女税(俄罗斯)。月工资的6%为税款1.1.2统计的发展迅速发展于资本主义社会三个统计学派:1)政治算术学派:社会经济统计学2)国势学派:自然技术统计学3)数理统计学派:数理统计学统计学的分科描述统计学和推断统计学理论统计学和应用统计学描述统计学和推断统计学描述统计学:研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征大样本推断统计学:研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断小样本1.2统计学的性质和特点1.2.1统计的涵义1.2.2统计学的性质1.2.3统计学的特点1.2.1“统计”的涵义1)统计工作:

数据的收集、整理、分析等的具体工作。证券行业分析师,质量检验员,化验员等2)统计资料:统计工作的成果。数据、图表、分析报告等3)统计学:统计的理论和方法,指导统计工作三种涵义中“统计工作”是基础1.2.2统计学的研究对象统计学研究社会经济现象总体的数量方面研究的是反映总体特征的数据提供一套用于所有科学领域的获取数据、分析数据并从数据中得出结论的原则和方法统计更重要的功能是分析数据

统计学是关于数据的科学1.2.3统计学研究对象的特点数量性:研究社会现象的数量方面具体性:社会现象的数量方面是客观存在的广泛性:任何领域都用到总体性:数量方面是说明整体特征的1.3统计学的作用1.3.1作用:1)在管理工作中的作用2)在国家宏观调控中的作用3)在科学研究中的作用4)在国际交流中的作用5)所有现实生活领域1.3.2职能:对国民经济和社会发展情况进行统计调查、统计分析、提供统计资料和统计咨询意见、实行统计监督。1.4几个基本概念总体和总体单位标志和变量统计指标指标体系存量流量1.4.1统计总体与总体单位统计总体:统计总体是统计研究的对象,是由客观存在的许多性质相同的基本单位组成的整体。如某班级的全体学生、某企业生产的全部产品总体单位:组成总体的基本单位称为总体单位,是统计资料的承担者。如每一位同学、每一件产品总体单位是数据资料的承担者是组成总体的基本元素相对于总体而言,不可细分性质:具有变异性或差异性标志与变量标志:总体单位所具有的属性和特征的名称,标志有数量标志和品质标志之分变量:可变的标志标志数量标志:可以量化的属性,如人的年龄、工资等品质标志:不能量化的属性,如人的姓名、籍贯等不变标志:所有总体单位都相同的标志,如学籍、国籍、学位等可变标志:所有总体单位不尽相同,如产品编号、型号、规格、人的年龄、职称等性质:1)说明单位特征的

2)是资料收集的对象

3)是计算指标的基础变量变量:

可变的标志。变量有变量名和变量值。如年龄、企业产值、工资收入等1)变量按取值的不同分为离散变量和连续变量2)变量按性质的不同分为确定性变量和随机性变量3)变量按形式分为定量变量和定性变量离散变量和连续变量离散变量:只取整数值,如产品数、出生人口数、企业数等,取值是分散的连续变量:可取任意值,如面积、容积、成本、产值等,取值是连续的确定性变量和随机变量确定性变量:一定条件下,变量值唯一确定水在一个大气压下,沸点是100度随机性变量:一定条件下,变量值有偶然性如某地区出生的婴儿数,某种产品的销售量随机性变量决定于不确定性或变数或偶然性定量变量和定性变量定量变量:观察结果直接表现为一定的数字

如:年龄,工资,价格,产量定性变量:观察结果表现为一定的类别或有顺序的类别分类变量和顺序变量如:专业,工种,产品型号,民族职称等级,奖学金等级变量是用来表示个体(总体单位)特征的指标指标:说明总体综合特征的数据资料指标有指标名称、指标值、计量单位、时间特征、空间范围等五个构成要素指标的种类1.指标按计量单位的不同分为实物指标和价值指标

电视机的产量和电视机的产值2.指标按说明的内容的不同分为数量指标和质量指标企业的利润总量和人均利润3.指标按时间特性分为时期指标和时点指标

某银行的个人储蓄存款余额和发放的贷款额指标体系1)若干个有联系的统计指标组成的整体称为统计指标体系。统计指标体系对统计总体的描述和刻画更加全面和深刻

2)指标体系中的指标一定是有联系的。其中的指标可以用另一些指标表示出来,以发挥指标体系的整体性功能存量和流量存量:是指事物在一定时点(刻)上累计或结存的总量,是按一定时点计算出来的。如储蓄存款余额,年初人口数,流动资金余额,商品库存额、库存量等流量:是指事物在一定时期内发展变化的总量,是按一定时期计算出来的数量。如国内生产总值,物流量,人流量,客流量。

流量亦称为增量中国的政府统计集中型的统计管理体制1.CPI统计改革2.住房价格统计改革中国的统计公报制度专业统计:金融统计、交通运输统计、医疗卫生统计、海关统计等等本章小结统计的重要性统计学的研究对象统计中的基本概念第2章数据收集学习目标统计数据收集的意义统计数据的计量与类型统计数据的来源2思考在你企业生产的产品中,需要了解客户对产品的评价,请思考:用什么办法可以知道客户对该产品的评价?有几家供货商都可以提供你企业所需的生产原料。你怎样选择原料供货商?应聘企业管理宏观调控个人入学、就业、就医、理财和投资需要大量的数据信息作决策2.1数据收集的意义PM2.5实时监控:骆家辉的贡献余额宝:开户数、资金规模、年化收益率淘宝数据(大數据)1.淘宝+天猫每天发出1200万单;每分钟成交8300多笔订单2.最“数码控”:每个月更换一部手机;拥有两台以上平板电脑3.最该“剁手”:人均年购物额达16万元,每两天就要买3次东西2.2统计数据的类型统计数据是对客观现象进行计量的结果数据的计量尺度:即计量标准或测度标准定类尺度1)是最粗略、计量层次最低的计量尺度2)只能按照事物的某种属性对其进行平行的分类或分组3)只能区分事物的类别4)如果用数字表示某一类别,它具有=或≠的数学特性5)各类别之间是平等的,无优劣、大小之分,但各类别之间的顺序可以改变6)通过计算出每一类别中各元素或个体出现的频数或频率来进行分析定类尺度产品类别商品类别学生按专业分类企业按经济类型分类人口数按年龄分类、性别分类、户籍分类人口按职业分类

分类有何益处?定序尺度1)称为顺序尺度2)对事物之间的等级差或顺序差别的测度3)计量结果表现为不同的类别,但可以比较优劣和顺序4)比定类尺度精确,测度出了类别之间的顺序,未测量出类别之间的准确差值5)该尺度具有﹥和﹤的数学特性6)计量结果不仅能对事物分门别类,还可以比较大小,但不能进行数学运算定序尺度受教育程度:文盲、小学、中学、大学、大学以上国家:发达国家、发展中国家医院:三级甲、三级乙、三级丙台风预警颜色:黄色、橙色、红色、黑色军衔等级

中国人民解放军军官衔分为3等10级,即将官3级(上将、中将、少将)、校官4级(大校、上校、中校、少校)、尉官3级(上尉、中尉、少尉)。志愿兵役制士兵按军衔等级分为:高级士官(六级土官、五级士官);中级士官(四级士官、三级士官);初级士官(二级士官、一级士官)。职称:初级、中级、高级定距尺度1)称为间隔尺度2)既能将事物区分为不同类型并进行排序,又可以准确指出类别之间的差距3)是对事物类别或次序之间间距的测度4)通常使用自然或度量衡单位作为计量尺度5)计量结果表现为数值,不仅具有定类尺度和定序尺度的特性,其结果还可以进行加、减运算

温度、湿度、风力、考试分数定比尺度1)称为比率尺度2)与定距尺度属于同一层次,计量结果表现为数值3)可以计算两个测度值之间的比值4)有一个绝对的零点,在定比尺度中,“0”表示“没有”或“不存在”0度、湿度为0、考试成绩是0分;0“有”产量是0,工资收入是0;0“没有”数据类型2.3数据的来源直接来源:问卷、实验或观察

原始数据;初级资料;第一手资料

直接测量或观察所得到间接来源:出版物、网络(数据库)

二手数据;二手资料;次级资料

已经公开发布的数据统计调查(市场调查、企业调查)1.统计报表制度:是收集统计资料的一种重要方法,是按照国家有关法规的规定,自下而上的逐级提供基本统计资料的一种调查方式。如统计公报2.专(项)门调查:为了研究某种专(项)门问题而组织的调查方式,有普查、重点调查、典型调查、抽样调查如:房产税对房价的影响;

电商对传统商业的影响;

农村土地流转对农民的影响;

互联网金融对传统金融的影响统计调查(市场调查、企业调查)1)全面调查:(普查)调查了全部应调查的个体,又称普查。如人口普查;经济普查;农业生产情况普查等2)非全面调查:只调查了一部分个体,根据一部分个体(样本)的特征推断总体的情况。如抽样调查、重点调查和典型调查。如:食品质量调查;电视节目收视率调查;

产品质量检测等普查1)是专门组织的一次性的全面调查。如:2000年的全国第五次人口普查

2004年的全国第一次经济普查

2006年的全国第二次农业普查2013年全国经济普查2)组织方式利用基层单位的报表成立专门的普查机构经济普查领导小组办公室3)普查必须设立统一的标准时点和普查项目第五次人口普查的标准时点是2000年11月1日零点第二次经济普查的标准时点是2008年12月31日重点调查1)是专门组织的非全面调查先选取重点单位对重点单位进行全面调查2)重点单位

单位个数比较少数量标志值的总和在全部单位中所占的比重较大3)重点单位的选取不具有客观性,我们不能用重点调查的结果来推断总体典型调查1)是专门组织的非全面调查先选取典型单位对典型单位进行全面调查2)典型单位最具有代表性的单位最能反映总体本质特征的单位3)研究事物的本质特征、发展趋势或规律4)典型单位的选取不具有客观性,我们不能用典型调查的结果来推断总体抽样调查1)是专门组织的非全面调查2)按随机性原则从总体中抽取样本单位3)根据样本的信息推断总体4)样本单位具有很好的代表性5)是最重要的统计调查方式,应用最广

关于失地农民生活和就业状况的抽样调查为什么消费者喜欢网络购物的抽样调查

绝大多数社会调查都是抽样调查谚语:你不必吃完整头牛,才知道牛肉是老的。抽样调查概率抽样:保证样本具有代表性1.简单随机抽样2.分层抽样3.系统抽样4.整群抽样数据来源—间接来源国家统计机构咨询公司、行业分析公司权威报刊杂志广播电视传媒英特网數据库间接数据作为比较分析的基础本章小结统计数据的类型数据收集方法全面调查、非全面调查抽样调查重点调查典型调查普查第2章用图表和统计量看数据学习目标用图形和表格描述数据的特征用统计量描述数据的特征描述统计学的基本内容和方法22.1用图表描述数据特征数据整理用图形和表格展示数据的基本特征2.1.1统计数据整理统计整理:是统计研究工作的重要阶段,是对收集来的资料用科学的方法进行加工处理,使资料系统化、条理化、档案化,为统计分析服务统计整理的基本任务是:提炼出大量的、复杂的、零散的数据中隐含的信息,并展示数据的规律和特性,为统计分析服务统计分组根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组。例:收集到某班所有同学的统计学考试成绩,为了研究需要划分高、中、低三个成绩段,每个成绩段的范围分别是85-100,70-85,0-70,将每个成绩归入到相应的组中

2.1.1统计数据整理考试成绩等级人数(人)0~70低1270~85中3585~100高18合计652.1.2数据整理—统计分组1)统计分组是一种定性分类2)分组的结果要做到:组内同质性,组间差异性;不重复,不遗漏3)是对复杂总体进行认识的第一步统计分组可以:1)划分现象的类型2)说明现象的内部结构3)分析现象之间的依存关系2.1.2统计分组例.按百分制记分,某班级40位学生统计学考试成绩分别如下:

89887699746082608986939994827779977895928784796598675972848556817773656683637970

将上述资料编制成频数分布表,如下表所示:2.1.2统计分组考分人数(人)比重(%)50—6025.060—70717.570—801127.580—901230.090—100820.0合计40100表

某班级学生统计学考试成绩表2.1.3数据整理—频数分布表频数分布表

对数据进行分组时,需要建立频数分布表,以便更有效地显示数据的特征和分布。构成:频数:各组的单位数(数据个数)频率:各组频数与总数之比频数分布:由分组标志序列和各组相对应的分布次数这两个要素构成频率分布:由分组标志序列和各组相应的频率构成频率分布2.1.3定性数据的频数分布表2014年商学院各专业的招生人数专业人数(人)比重(%)金融学9039.13财务管理5624.35会计学2310.00国际贸易3013.04工商管理3113.48合计230100.002.1.4定量数据的频数分布表选择组数计算各组的宽度(组距)宽度=(最大值-最小值)/组数确定组界:最大值、最小值;称为上限、下限计算组中值=(上限+下限)/2某组的组中值作为一组的代表值根据分组整理成频数分布表计算每个组的频数、相对频数(频率)

2.1.4定量数据的频数分布表组距数列表某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)105~110110~115115~120120~125125~130130~135135~140358141064610162820128合计501002.1.5累计频数分布表为了统计分析的需要,有时要观察某一数值以上或某一数值以下频数或频率之和,这就需要在频数分布表基本分组的基础上计算累计频数或累计频率。1.向上累计由变量值小的向变量值大的方向的频数或频率相加2.向下累计由变量值大的向变量值小的方向的频数或频率相加2.1.5累计频数分布表考分人数(人)向上累计向下累计50—60224060—70793870—8011203180—9012322090—1008408合计402.2数据图形描述(分组后数据)用图形展示定性数据1)条形图或柱形图:适合于展示分类型数据

条形图是用宽度相同的条形的长短来表示数据的变动2)饼图或环形图:适合于展示结构型数据用圆形及圆内扇形的面积来表示数值大小的图形3)帕累托图:适合于展示分类型数据2.2.1条形图例.某班级有60名同学,根据他们的爱好分为5组。如下表。现将这组数据资料用条形图和圆形图展示出来。爱好分组人数(人)绘画20舞蹈7音乐10文学8体育152.2.2饼图2.2.3环形图2)环形图:环形图与圆形图类似,所不同的是,环形图中间有一个“空洞”,总体中的每一部分数据用环中的一段弧长表示2.2.3环形图例.在一项研究小区物业管理服务水平的社会调查中,研究人员在甲、乙两个小区各抽查320户家庭,其中的一个问题是:“您对您小区的物业服务水平是否满意?”有5个备选答案:(1)非常不满意;(2)不满意;(3)一般;(4)满意;(5)非常满意。调查结果整理如下:2.2.3环形图甲小区回答类别户数百分比向上累计(户)(%)户数(户)百分比(%)非常不满意288.8288.8不满意11235.014043.8一般9730.323774.1满意4915.328689.4非常满意3410.3320100.0合计320100——甲小区:2.2.3环形图乙小区回答类别户数百分比向下累计(户)(%)户数(户)百分比(%)非常不满意257.8320100.0不满意10332.229592.2一般8225.619260.0满意6821.211034.4非常满意4213.24213.2合计320100.0——乙小区:2.2.3环形图2.2.4定距数据和定比数据的展示1)分组数据用直方图和折线图2)未分组数据用茎叶图2.2.5分组数据用直方图展示1)在平面直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图2)用矩形的宽度和高度来表示频数分布的图形。实际上是用矩形的面积来表示各组的频数分布3)直方图下的总面积等于1某车间50名工人日加工零件数分组表表

某车间50名工人日加工零件数分组表按零件数分组频数(人)频率(%)110~115115~120120~125125~130130~135135~140140~145359121074610182420148合计50100

2.2.5分组数据—直方图31151201251301351401456912

频数(人)50名工人日产零件分组31106912

频数(人)2.2.5直方图与条形图的区别1)条形图是用条形的长度表示各类别频数的多少,其宽度则是固定的、无意义的2)直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,其高度与宽度均有意义3)直方图的各矩形通常是连续排列,而条形图是分开排列的2.2.6分组数据—折线图1)折线图也称频数多边形图(Frequencypolygon)2)是在直方图的基础上,把各直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图擦去3)折线图的两个终点要与横轴相交,具体的做法是:第一个矩形的顶部中点通过左边的竖边中点连接到横轴,最后一个矩形顶部中点与其右边的竖边中点连接到横轴

折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的2.2.6分组数据—折线图12963110115120125130135140145日加工零件数(个)频数(人)

某车间工人日加工零件数的折线图12963110115120125130135140145日加工零件数(个)频数(人)

某车间工人日加工零件数的折线图2.2.7未分组数据—茎叶图1)用于显示未分组的原始数据的分布2)由“茎”和“叶”两部分构成,其图形是由数字组成3)以该组数据的高位数值作树茎,低位数字作树叶4)茎叶图类似于横置的直方图,但又有区别

通过直方图可大体上看出一组数据的分布状况,但

看不出原始数据

茎叶图既能给出数据的分布状况,又能保留原始的数据信息2.2.7未分组数据—茎叶图例题:某行业管理局所属的40个企业2012年的产品销售收入如下(单位:万元),试编制茎叶图。15212412911610010392951271041051191141151031181421351251171081051071371201361171089788123115119138112146113126871102.2.7未分组数据—茎叶图树茎树叶数据个数(个)8782925731003345578891102345567789912120345679713567841426215212.2.8箱线图奇异值最大值最小值中位数大于1.5倍四分位数间距四分位数间距范围2.2.8箱线图中间的黑粗线为中位数方框为四分位间距的范围离方框上/下界的距离超过四分位数间距1.5倍的为离群值,以“O”表示;超过3倍的则为极值,用“*”表示2.2.9多变量定量数据的图表描述

散点图同时研究两个数字变量的取值在图上标出所有数对(Xi,Yi)时间序列图表示一列定量数据如何随时间变化组箱线图比较多个总体的分布特征雷达图用于要同时分析的变量个数较多的情况

标出所有数对(Xi,Yi)02040600204060XY散点图年份销售02468200420052006200720082009时间序列折线图组箱线图2.2用统计量描述数据2.2.1用一个值概括一组数据2.2.2找出数据彼此之间的差距2.2.3数据分布的形状2.2.1用一个值概括一组数据平均值中位数众数平均值

平均指标:表明同质总体内某一数量标志值在一定条件下的一般水平的综合指标。如平均工资、平均成绩、平均利润等特点:

1)将总体单位数量上的差异抽象化

2)只能在同质总体内进行计算

3)能反映总体变量值的集中趋势

4)平均指标在科学研究、国际比较和经济管理中有重要作用平均值统计学家与数学家的对话一名统计学家遇到一位数学家,统计学家调侃数学家,说道:“你们不是说若x=y且y=z,则x=z吗,那么想必你若喜欢一个女孩,那个女孩喜欢的男生,你也会喜欢了?”

数学家想了一下,反问道:“如果你把左手放到一锅100度的开水中,右手放到一锅0度的冰水里,想必你也没事吧!因为它们平均不过是50度而已。算术平均数设x1

、x2、x3

……xn为n个变量值,为n个变量的算术平均数,则可用下式计算:加权算术平均数

加权算术平均数适合于:

1)数据个数较多

2)数据已分组设x1、x2

、x3、……、xn分别是n组变量的标志值,f1

、f2

、f3

、……、fn,是各组的频数(次数),则

1)n个变量连乘积的n次方根称为n个变量的几何平均数,用2)设x1

、x2

、x3

、……、xn是n个变量,是几何平均数,则几何平均数

1)X≥02)几何平均数适合于计算平均比率或平均速度3)几何平均数也有简单几何平均数和加权几何平均数之分几何平均数的特点例1.某水泥生产企业2013年的产量为100万吨,2014与2013年相比增长率为9%,2015年与2014相比增长率为16%,2016年与2015年相比增长率为20%。求各年的年平均增长率。年平均增长率为114.91%-100%=14.91%例题例题例2.某位投资者持有一种股票,2013年、2014年、2015年、2016年的收益率分别为4.5%、2.0%、3.5%、5.4%。计算投资者在这四年内的平均收益率。该投资者的年平均收益率为:

103.84%-100%=3.84%众数(M0)1)一组数据中出现次数最多的变量值,用M0表示2)众数主要用于测定数据的集中趋势。3)不同种类的数据计算众数的方法有所不同众数(M0)例:下列是某班级20名同学的身高(单位:米);1.56,1.63,1.75,1.82,1.71,1.70,1.75,1.68,1.65,1.75,1.72,1.80,1.75,1.75,1.58,1.75,1.67,1.70,1.75,1.60,身高的众数是:M0=1.75m众数的特点1)测度数据的集中趋势2)只有当数据的个数较多,且有明显的集中趋势时,计算的众数才有意义。3)有些数据可能有双众数,有些数据可能没有众数。4)不受数据中极端大值或极端小值的影响,比前面的平均指标更有代表性。5)众数的计算没有用到全部的标志值,也把它称为位置平均数。中位数1)

将一组数据按大小顺序排列,处于中点位置上的变量值,叫做中位数,用Me表示2)中位数是一种位置平均数3)掌握的资料不同,计算中位数的方法也不同计算步骤:1)对数据资料排序,设x1

、x2

、x3

、……xn为n个数据,按大小顺序排列为x(1)、x(2)、x(3)、……、x(n)2)根据公式(n为数据的个数)确定中点的位置,3)计算中位数。若n为奇数,则中位数为若n为偶数,则中位数为未分组数据计算中位数中位数的特点1)

是一种位置平均数2)不受极端值和开口组的影响3)对某些不具有数学特点或不能用数值测定的现象,可用中位数求其一般水平分位数1.百分位数(1)百分位数(Percentile)是用99个点将排列好的数据100等分后,分别给出从最小值到最大值区间内数据的信息分位点上的值。其中每个部分包含了1%的数据(2)百分位数的计算方法与中位数的类似分位数(1)升序或降序)进行排列。(2)确定所求百分位数的位置。假设求第p百分位数,则该第p百分位数位置为:i=pn/100(3)确定百分位数。如果计算的i为整数,则直接在排列的数据列中找到第个i个值即为所求

若i不为整数,则取位于两侧的变量的平均数作为所要求的百分位数分位数2.四分位数一组数据排序后处于25%和75%位置上的值,称为四分位数(quartile),也称四分位点。四分位数是通过三个点,即将全部数据等分为四部分,其中每部分包含25%的数据中间的四分位数就是中位数因此通常所说的四分位数是指处在25%位置上的数值(下四分位数)和处在75%位置上的数值(上四分位数)平均指标的代表性5859606162

4050607080两组数据的平均数都是60,哪一组平均数的代表性好?2.2.2找出数据之间的差距极差样本方差;标准差标准分数离散系数极差1)R=变量的最大值-变量的最小值

=最高组的上限-最小组的下限2)

度量了变量值的变动范围3)计算简单4)忽略了中间值的影响5)又称为全距极差例1.某车间两个生产小组的7名工人,各组各人日产量如下(件):甲组:20,40,60,70,80,100,120

乙组:67,68,69,70,71,72,73

各组的平均每人日产量都是70件。而各组的全距分别是:

R甲=120-20=100(件)

R乙=73-67=6(件)方差和标准差1)方差*是各变量与其算术平均数之差的平方的算术平均数*是测度数据离散程度的最主要方法*在实际中有非常重要的应用116方差和标准差2)标准差:是方差的平方根*反映了每个数据与其算术平均数相比平均相差的数值*根据全部数据计算出来的*能较准确的反映出数据的离散程度*是实际应用中最广泛的测度离散程度的指标标准分数某个数据与平均数相比相差多少个标准差用Z表示:Z的平均数为0,标准差为1标准分数可以将数据标准化,并消除量纲的影响。Z没有计量单位比较几组数据的离散程度例:某企业集团,一分公司职工的平均产值是3万元,标准差1500元;二分公司职工的平均产值是3.85万元,标准差是1800元。问哪个公司的职工产值水平比较稳定?

怎样解决这个问题?比较几组数据的离散程度离散系数1)反映或说明一组数据的离散程度或差异程度或波动程度2)消除计量单位的影响3)反映现象发展的稳定性和均衡性比较几组数据的离散程度一分公司产值的离散程度:二分公司产值的离散程度:二分公司职工的产值比一分公司稳定2.2.3数据分布的形态正态分布:钟型分布U型分布J型分布正态分布U型分布正J型分布反J型分布2.2.3数据分布的形态偏态系数:峰态系数:2.2.3数据分布的形态偏态系数:

说明数据的分布形状。数据是否对称平均的分布在平均数两边?如果数据对称平均的分布在其平均数两边,数据分布是对称的。否则,就是有偏的。偏态系数就是衡量数据分布是否对称的统计量1)偏态系数为0,数据分布对称2)偏态系数大于0,右偏;小于0,左偏3)偏态系数绝对值越大,偏斜程度越大数据分布的形态对称分布:平均值=众数=中位数右偏分布:平均值>中位数>众数左偏分布:平均值<中位数<众数2.2.3数据分布的形态峰态系数:1.说明数据分布的集中程度或陡峭程度2.与标准正态分布相比较。标准正态分布的峰态系数为03.峰态系数大于0,为尖峰分布4.峰态系数小于0,为平峰分布EXCEL的图表功能EXCEL的图表向导功能:制作各种统计图形。100多种图型EXCEL制作频数分布表EXCEL制作直方图EXCEL制作数据透视表和透视图EXCEL计算描述统计指标EXCEL的统计函数本章小结用图和表描述数据的特征学习EXCEL的统计功能第3章用概率分布描述随机变量主要内容3.1度量事件发生的可能性3.2随机变量的概率分布3.3几个重要的小样本分布3.4样本统计量的抽样分布23.1度量事件发生的可能性确定性现象:自然界和社会生活中,在一定的条件下,某种现象的结果是唯一的,并且事先可知。

如:水在一个大气压下100度时必然沸腾;地铁票价;铁块不能漂浮在水面上;棉花不会沉入水里。随机现象:自然界和社会生活中,在一定的条件下,其结果不唯一;并且事先不知道哪种结果会出现。如:天气温度;投掷硬币观察向上的那一面事件:随机现象的每一种可能的结果。记为ω;ω1,

ω2,

ω3,…ωn也称为样本点或基本事件。随机事件:在一次观察中可能发生或不发生的事件。用A,B,C,D表示。分别是样本点的集合。投掷一枚标有1、2、3、4、5、6数字的立方体两次,向上面上的数字之和为8。A={(26),(62),(35),(53),(44)}3.1度量事件发生的可能性频率:做N次试验,事件A发生了n次,事件A的频率F(A)=n/N事件的概率P(A):表示做一次试验,A发生的可能性大小,0≤P(A)≤1。当试验次数无限大时,F(A)趋近于一个常数,即P(A)。P(A)=F(A)“频率代替概率原则”事件的概率必须满足两个条件:必然事件的概率为1;不可能事件的概率为03.2随机变量的概率分布随机变量:用数值来描述特定试验一切可能出现的结果,它的取值事先不能确定,具有随机性。用英文字母X、Y、Z等表示如:一年内,某地区出生的婴儿人数X

某种产品的销售量Y

某地区的温度Z

投篮50次,投中的次数Z1小时内120、110、119、121的电话呼叫次数X3.2随机变量的概率分布随机变量(一维随机变量):1.离散型;只取整数值2.连续型;能取任意值随机变量的密度函数:描述随机变量的特征,表明随机变量的取值及其取相应值的概率对离散型随机变量而言,概率密度函数可表示为;XX1X2……XnPP1P2……Pn3.2离散型随机变量的特征值1.随机变量的特征值:表明随机变量取值的基本情况;如平均值,方差,标准差等2.离散型随机变量的平均值:称为数学期望E(X);中心值3.离散型随机变量的方差:Var(X)=D(x)3.2.2离散型随机变量的概率分布伯努利(Bernoulli)分布:两点分布;只取两个值二项分布:把伯努利分布独立的做n次3.2.2离散型随机变量的概率分布泊松分布(Poisson):一段时间内,电台的呼叫次数3.2.3连续型随机变量的概率分布连续性随机变量:可以取任意值,取值在某个区间内分布函数密度函数密度函数的性质3.2.3连续型随机变量的概率分布正态分布:钟型分布,两头小、中间大。正态分布密度曲线3.2.3连续型随机变量的概率分布关于X=u对称,均值决定了它的位置,方差决定了图形的陡峭或平坦标准正态分布:均值u=0,方差=1。用Z表示密度函数:ф(x),分布函数u3.2.3连续型随机变量的概率分布ECXEL中的正态分布函数1.NORMDIST;计算给定均值、方差的正态分布的概率2.NORMSDIST;计算标准正态分布的概率3.NORMSINV;计算已知概率时,标准正态分布的反函数3.3小样本分布分布:。n个独立的标准正态分布的平方和分布的密度曲线3.3小样本分布ECXEL中的卡方分布函数1.CHIDIST;计算给定自由度的卡方分布的概率2.CHIINV;计算给定自由度卡方分布右尾概率的反函数3.3小样本分布(T分布)

分布:。标准正态分布除以卡方分布的平方根0分布密度曲线3.3小样本分布(T分布)EXCEL中的T分布函数1.TDIST;计算给定自由度T分布的右侧概率值2.TINV;计算给定自由度和概率值的反函数3.3小样本分布(F分布)分布分布的密度曲线3.3小样本分布(F分布)EXCEL中的F分布函数1.FDIST;计算给定自由度时F分布的概率值2.FINV;计算给定自由度和概率值的右尾反函数值3.4样本统计量的抽样分布1)样本统计量:是指不包含任何未知参数的样本的函数2)样本统计量是随机变量3)抽样分布:是指样本统计量的随机分布。如:样本均值的分布,样本比例的分布,样本标准差的分布等3.4样本统计量的抽样分布1)样本均值的抽样分布当样本量(n>30)足够大时,样本均值的抽样分布服从正态分布2)样本比例的抽样分布3)样本方差的抽样分布3.4样本统计量的抽样分布统计量的标准误差1)样本均值的标准误差:2)样本比例的标准误差:本章小结概率的含义随机变量随机变量的概率分布常见的概率分布第4章假设检验主要内容假设检验的原理总体均值的假设检验总体比例的假设检验总体方差的假设检验两总体均值差的假设检验引例某健身俱乐部欲根据往年的会员情况,制定2016年的会员发展营销策略。主管经理估计俱乐部会员的平均年龄是35岁,其中25~35岁的会员占总人数的70%。研究人员从2015年入会的新会员中随机抽取40人,调查得知他们的平均年龄是32岁,其中25~35岁的会员占74%。根据这份调查结果,问主管经理对会员年龄的估计是否准确?(总体均值和总体比例)假定总体分布中的参数是未知的,但事先对参数的取值作出假定;如:均值(平均年龄)=35,25—35岁占比(P)=70%思考:1.本假定是否正确?需要检验。

2.如何检验?需要抽样。利用样本的信息来验证(检验)原假定是否正确?

统计学是通过假设检验的方法来解决上述问题的。假设检验(Hypothesistesting)和参数估计(Parameterestimation)是统计推断的两个组成部分,它们都是利用样本对总体进行某种推断参数估计是用样本统计量估计总体参数的方法,总体参数在估计之前是未知的假设检验则是先对总体参数的取值提出一个假设,然后利用样本信息去检验这个假设是否成立统计方法统计方法统计描述统计推断参数估计假设检验假设检验的基本原理假设检验(HypothesisTesting)也称为显著性检验,是事先作出一个关于总体参数取值的假设,然后利用样本信息来判断该假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设的统计推断方法假设检验的理论依据是概率论中的“小概率事件在一次试验中不可能发生”原理大数定律:当试验次数足够大时,小概率事件必然发生“日久见人心”、“路遥知马力”、“保险”

假设检验的过程和思路

——概率意义下的反证法

总体假设总体的平均年龄是35岁判断样本均值是32岁样本假设检验的步骤第一步:根据问题要求提出原假设(Nullhypothesis,H0)和备选假设(Alternativehypothesis,H1);原假设H0:关于总体参数的取值情况的假定备选假设H1:与原假设H0相互对立,需要支持或证实的第二步:确定适当的检验统计量及相应的抽样分布;第三步:选取显著性水平α,确定原假设的接受域和拒绝域;第四步:计算检验统计量的值;第五步:作出统计决策下面结合例题1对每一个步骤的内容进行分析和说明举例1某健身俱乐部主管经理估计会员的平均年龄是35岁,研究人员从2012年入会的新会员中随机抽取40人,调查得到他们的年龄数据如下。33283226373527293330352939342737343631292926192136384239363827222934362039372239试根据调查结果判断主管经理的估计是否准确?1.提出原假设和备选假设原假设(Nullhypothesis)又称零假设,是需要通过样本推断其正确与否的命题,用H0表示本例中可以提出:H0:

m=35;这里m表示总体会员的平均年龄,意味着总体会员的平均年龄与主管经理估计的35岁没有差异与原假设对立的假设是备选假设,用H1表示在本例中,备选假设意味着“总体会员的平均年龄与主管经理估计的会员平均年龄35岁有显著差异”,可以表示为H1:

m≠35原假设与备选假设互斥,检验结果二者必取其一原假设陈述需要检验的假设,用H0

表示例如:H0:=35

代表“正常”的情形总是包含等号“=”。H0:p=70%检验以“假定原假设为真”开始反证法备择假设为原假设的对立情况,用H1表示

例如:H1:≠35;:H1:p≠70%不包含等号;≠,>,<需要支持和证实的2.确定适当的检验统计量假设检验需要借助样本统计量进行统计推断,称为检验统计量。不同的假设检验问题需要选择不同的检验统计量检验统计量:利用样本的信息构造的函数在具体问题中,选择什么统计量,需要考虑的因素有:总体方差已知还是未知,用于进行检验的样本是大样本还是小样本,等等在本例中,由于n=40>30是大样本,所以近似服从正态分布,以样本标准差代替总体标准差,所用的统计量是:3.选取显著性水平,确定接受域和拒绝域显著性水平(SignificantLevel):事先给定的形成拒绝域的小概率,用a表示通常取a=0.01,a=0.05或a=0.10;表明,当作出接受原假设的决定时,其正确的概率为99%,95%或90%拒绝域:原假设H0

成立条件下,统计量落入的小概率区域接受域:统计量能够取值的非拒绝域本例为双侧检验,有接受域:-1.96≤z≤1.96拒绝域:z<-1.96或z>1.96

a/2-1.961.961-aa/2在实际应用中,一般是先给定了显著性水平,这样就可以由有关的概率分布表查到临界值(criticalvalue),从而确定H0的接受域和拒绝域。对于不同形式的假设,H0的接受域和拒绝域也有所不同。0拒绝域拒绝域接受域(1)双侧检验0拒绝域接受域(2)左单侧检验0拒绝域接受域(3)右单侧检验

如图所示,双侧检验的拒绝域位于统计量分布曲线的两侧,左单侧检验的拒绝域位于统计量分布曲线的左侧,右单侧检验的拒绝域位于统计量分布曲线的右侧。4.计算检验统计量的值在提出原假设H0和备选假设H1,确定了检验统计量,给定了显著性水平a以后,接下来就要根据样本数据计算检验统计量的值。其计算的基本公式为:上式不是计算检验统计量的唯一公式在本例中,5.作出统计决策根据样本信息计算出统计量z的具体值,将它与临界值相比较,就可以作出接受原假设或拒绝原假设的统计决策在本例中,由于z=3.184>1.96,落在拒绝域内,所以拒绝原假设H0。可以得出结论:在a=0.05的显著性水平下,抽样结果的平均年龄显著低于主管经理的估计值,有理由认为经理的估计不准确假设检验中的两类错误第一类错误弃真错误。原假设正确,因为抽样等原因,反而拒绝了原假设后果往往很严重犯第一类错误的概率为第二类错误取伪错误。原假设错误,因为抽样等原因,反而接受了原假设犯第二类错误的概率为假设检验中四种可能结果的概率不能拒绝H0(接受)拒绝H0H0为真1-a(正确判断)a〈弃真错误〉H0为伪b〈取伪错误〉1-b

(正确判断)对于一定的样本量n,不能同时做到减小犯这两种错误的概率。如果减小a错误,就会增大b错误的机会;如果减小b错误,则会增大a错误的概率。因此,在假设检验中,需要对这两类错误进行控制

与的逆向关系不能同时降低两类错误!假设检验中的P值P值(P-value)是指在原假设为真时,所得到的样本观察结果或更极端结果的概率根据“小概率原理”,如果P值非常小,就有理由拒绝原假设,且P值越小,拒绝的理由就越充分实际应用中,多数统计软件直接给出P值,其检验判断规则如下(双侧检验):若P值<a/2,则拒绝原假设;若P值≥

a/2

,则不能拒绝原假设假设检验的内容假设检验总体均值的假设检验总体比例的假设检验总体方差的假设检验s未知s已知大样本小样本两个总体均值差的假设检验已知标准差,总体均值的Z检验1. 将样本统计量(如)转换为标准正态分布Z变量。

2.给定显著性水平,可得,Z的临界值。与Z值比较如Z检验统计量的值落在临界域内则接受H0否则,不能接受H0已知,均值的双侧Z检验假设总体服从正态分布;当(n

30)时,不服从正态分布的总体可以用正态分布来近似原假设只有“=”号;H0=u0。H1≠u0使用Z检验统计量H0临界值临界值(1/2)

(1/2)样本统计量拒绝域拒绝域非拒绝域拒绝域抽样分布1

-置信度举例22011年某地区职工平均工资为32808元,标准差为3820元。现在随机抽取200人进行调查,测定2012年样本平均工资为34400元。按照5%的显著性水平判断该市2012年的职工平均工资与2011有无显著差异?解答本例中,我们关心的是前后两年职工的平均工资有没有显著的差异,因此,属于双侧检验。检验过程如下:

(1)提出假设:H0:m=32808;H1:m≠32808;(2)总体标准差s已知,大样本抽样,故选用Z统计量;(3)显著性水平a=0.05,由双侧检验,临界值:。判断规则为:若z>1.96或z<-1.96,则拒绝H0;若-1.96≤z≤1.96,则不能拒绝H0。(4)计算统计量Z的值(5)检验判断:由于,落在拒绝域,故拒绝原假设H0。结论:以5%的显著性水平可以认为该市2012年的职工平均工资比2011年有明显的差异。已知,均值的单侧Z检验1. 假设总体服从正态分布;当(n

30)时,不服从正态分布的总体可以用正态分布来逼近2. 原假设有

或者号:H0:u≤u0,H0:u≥u03. 使用Z检验统计量Zxxnxx/Z0Z0拒绝域拒绝域H0:0H1:<0H0:0H1:>0较小的m值与H0不矛盾.拒绝域1-1-举例3已知某电子产品的使用寿命服从正态分布,根据历史数据,其平均使用寿命为8000小时,标准差为370小时。现采用新的机器设备进行生产,随机抽取了100个产品进行检测,得到样本均值为7910小时。试问在5%的显著性水平下,新的机器是否合格?解答这是一个左单侧检验问题。抽样的目的是为了检测新机器生产的产品使用寿命是否达到标准,我们比较关心的是使用寿命的下限,如果新产品的使用寿命与过去相比没有明显降低,则说明所使用的新机器合格;反之,则说明新机器不合格。检验过程如下:(1)提出假设:H0:m≥8000;H1:m<8000;(2)总体标准差s已知,大样本抽样,故选用Z统计量;(3)显著性水平a=0.05,由单侧检验,临界值(4)计算统计量Z的值:(5)检验判断:由于,落在拒绝域;故拒绝原假设H0。即认为产品的使用寿命有明显降低,新机器不合格。未知的大样本检验1.假设总体服从正态分布;当(n

30)时,不服从正态分布的总体可以用正态分布来近似2.使用Z检验统计量,用样本方差代替总体方差3.将样本统计量转换为标准正态分布Z变量4.与Z的临界值比较如Z检验统计量的值落在临界域内则接受H0否则,拒绝H0举例4某乳制品厂生产的一种盒装鲜奶的标准重量是495克。为了检测产品合格率,随机抽取100盒鲜奶,测得产品的平均重量为494克,标准差为6克,试以5%的显著性水平判断这批产品的质量是否合格?解答产品的标准重量是495克,过轻或者过重都不符合产品质量标准。检验过程如下:(1)提出假设:H0:m=495;H1:m≠495;(2)总体标准差s未知,但是由于大样本抽样,故仍选用Z统计量(3)显著性水平a=0.05,由双侧检验,临界值(4)计算统计量Z的值,式中用s代替s:(5)检验判断:由于,落在接受域;故不能拒绝原假设H0,即不能说明这批产品不符合质量标准。未知的小样本检验1.假设:总体服从正态分布;2.使用t检验统计量4.t检验的决策规则:若采用双侧检验,临界值为-ta/2和ta/2

。当-ta/2≤t≤ta/2时,落入接受域,不能拒绝原假设;反之,则拒绝原假设若采用左单侧检验,临界值为-ta。当t<-ta时,落入拒绝域,拒绝原假设;反之,则不能拒绝原假设若采用右单侧检验,临界值为ta。当t>ta时,落入拒绝域,拒绝原假设;反之,则不能拒绝原假设举例5沿用例4,对鲜奶产品进行抽样检查,随机抽取10盒产品,测得每盒重量数据如下(单位:克):496、499、481、499、489、492、491、495、494、502。试以5%的显著性水平判断这批产品的质量是否合格?解答根据前面的分析,本例题为双侧检验问题。检验过程如下:(1)提出假设:H0:m=495;H1:m≠495;(2)总体标准差s未知,小样本抽样,故仍选用t统计量;(3)当a=0.05,自由度n-1=9时,由双侧检验,查表可以得出临界值:(4)计算统计量t的值:(5)检验判断:由于,落在接受域;故不能拒绝原假设H0,即不能说明这批产品不符合质量标准。假设检验的内容假设检验总体均值的假设检验总体比例的假设检验总体方差的假设检验两个总体比例之差单一总体两个总体均值差的假设检验单一总体比例的假设检验通常是在大样本条件下进行的,根据正态分布来近似临界值,其检验方法和步骤与均值检验时相同。待检验的假设为:双侧检验:左侧检验:右侧检验:检验统计量为:举例6(双侧)沿用引例。主管经理估计25-35岁的会员占总人数的70%,随机抽取40人,调查得知其中25-35岁的会员占74%。试以5%的显著性水平判断主管经理的估计是否准确?解答根据题意,建立如下假设:样本比例p=0.74;显著性水平

a=0.05,由双侧检验,临界值:Za/2=1.96;由于是大样本抽样,样本统计量Z值为:由于,即Z的值落入接受域,故不能拒绝原假设;即不能认为主管经理的估计错误。两个总体比例之差的假设检验假设两个总体服从二项分布。两个总体中具有某种特征单位数的比例分别为p1和p2,但p1和p2未知,可用样本比例p1和p2代替。待检验的假设为:双侧检验:左侧检验:右侧检验:检验统计量为:举例7(单侧)某电子产品厂商对两条流水线上生产的同种产品进行质量检测,检测结果如下:A流水线:抽样检测产品100个,合格92个;B流水线:抽样检测产品80个,合格76个;能否根据上述检测结果,以5%的显著性水平判断流水线B的合格率比流水线A的合格率高?解答根据题意,这是一个左单侧检验问题,建立如下假设:样本比例p1=0.92,p2=0.95;显著性水平a=0.05,由左单侧检验,

临界值:Za=-1.645;统计量Z值为:由于,落入接受域,故不能拒绝原假设;即不能认为流水线B的产品合格率高于流水线A的假设检验的内容假设检验总体均值的假设检验总体比例的假设检验总体方差的假设检验两个总体方差比单一总体两个总体均值差的假设检验单一总体方差的假设检验对方差进行检验的程序,与均值检验、比例检验是类似的,它们的主要区别在于使用不同的检验统计量方差检验使用c2统计量:H0临界值临界值1/21/2样本统计量拒绝域拒绝域非拒绝域拒绝域(双侧)抽样分布1-置信度举例8沿用例4,某乳制品厂的一种盒装鲜奶产品的标准重量是495克,现改进生产工艺,要求每盒的误差上下不超过3克。从新生产出的产品中随机抽取15盒进行检查,测得产品的重量误差如下(克)试以5%的显著性水平判断这批产品的质量是否合格2.5-3.3-3.12.83.6-4.12.23.1-3.02.92.92.83.33.53.1解答本例为双侧检验,拒绝域为:或建立如下假设:计算得:s2=8.617显著性水平a=0.05,查c2分布表,两个临界点分别为:统计量结论:由于落在接受域,故不能拒绝原假设;即认为这批产品的重量达到标准。两个总体方差比的假设检验假定两个总体都服从正态分布。用两个样本方差的比来进行判断:如果接近于1,说明两个未知的总体方差很接近;如果比值结果远离1,说明s12和s22之间有较大差异。建立假设(双侧):或或两个方差之比服从F分布,使用F统计量:在原假设下,检验统计量:,此时F统计量的两个自由度分别为:分子自由度n1-1,分母自由度n2-1。在双侧检验中,拒绝域在F分布的两侧,两个临界点的位置分别为:在单侧检验中,拒绝域在F分布的右侧,建立如下假设:

临界点为其中F1-a/21/21/2拒绝域拒绝域非拒绝域拒绝域(双侧)抽样分布1-Fa/2F举例9某校抽查了20名学生的《应用统计学》考试成绩,其中,男生12人,女生8人,他们的分数见下表。根据这组数据,以5%的置信水平检验两个总体(男、女生的平均成绩)的方差是否相等。成绩(单位:分)男688084608179765570758892女8078857985929468解答本题采用双侧检验,建立如下假设:计算得:统计量由a=0.05,查表得:有:结论:由于故不能拒绝;即可以认为这两个总体的方差没有显著差异。

假设检验的内容假设检验总体均值的假设检验总体比例的假设检验总体方差的假设检验配对样本独立样本两个总体均值差的假设检验已知s未知s独立样本1.已知Z统计量2.未知,大样本Z统计量3.未知,小样本假设总体服从正态分布;t统计量。均值之差的Z检验样本统计量:1.已知2.未知,大样本举例10瑜伽和舍宾是近年来流行的休闲健身方式,某健身俱乐部对这两种方式的减肥瘦身效果进行了数据统计,结果显示:在参加为期一个月的健身班后,瑜伽班成员的减重量标准差为0.75千克;舍宾班的减重量标准差为0.95千克。现从两个健身班中各抽取一个随机样本,样本量分别为n1=40,n2=35,瑜伽班的平均减重量为=2.35千克,舍宾班的平均减重量为千克。试以5%的显著性水平判断两种健身方式在减肥瘦身效果上是否有显著差别?解答由于检验两种健身方式在减肥效果上是否有显著差别,没有涉及方向,故本例是双侧检验。检验过程如下:(1)提出假设:(2)两个总体标准差s均已知,大样本抽样,选用Z统计量;(3)显著性水平a=0.05,由双侧检验,查表可以得出临界值:(4)计算统计量:(5)检验判断:由于,落在接受域,故不能拒绝原假设;即不能认为两种健身方式在减肥效果上有显著差别。均值之差的t检验()1.小样本条件下,检验两个具有相同方差的独立总体的均值2.假设两个总体都是正态分布;如果不是正态分布,可以用正态分布近似(n1

30&

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论