




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、各位;范围已经缩小,红色标示的内容是本书的重点,请注意红色标示的各类简答、计算、判断改错。第一章1.1什么是统计学?是收集、处理、分析、解释数据并从数据中得出结论的科学。1.2解释描述统计和推断统计。描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的统计方法。如人口特征统计就是推断统计。1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?P71.4解释分类数据、顺序数据和数值型数据的含义。统计数据分为分类数据、顺序数据和数值型数据。分类数据是只能归于某一类别的非数字型数据,是对事物进行分类的结果,数据表现来类别,是用文字
2、来表述的。顺序数据是只能归于某一有序类别的非数字型数据。有类别并是有序的。数值型数据是按数字尺度测量的观察值,其结果表现为具体的数值。分类数据和顺序数据说明的是事物的品质特征,通常用文字来表述,结果表现为类别,也可统称为定性数据或品质数据;数值型数据说明的现象的数量特征,通常用数值来表现,也可称为定量数据或数量数据。1. 5举例说明总体、样本、参数、统计量、P9变量这几个概念。(区别、联系)总体是包含所研究的全部个体(数据)的集合,由所研究的一些个体组成,如由多个人构成的集合,每一个人就是一个个体,多个企业构成的集合,每一个企业就是一个个体;如检验一批灯泡的寿命,这批灯泡构成的集合就是总体。也
3、可把这批灯泡的寿命集合作为总体。样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。抽样的目的是根据样本提供的信息推断总体的特征。如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本,然后根据这100个灯泡的平均使用寿命去推断这批灯泡的平均使用寿命。参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。如总体平均数、总体标准差、总体比例等统计量是用来描述样本特征的概括性数字度量。是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。如样本平均数、样本标准差。抽样的目的就是要根据样本统计量去估计总体参数。如:用样本平均数去估计
4、总体平均数,用样本标准参去估计总体标准差,用样本比例去估计总体比例。变量是说明现象某种特征的概念,其特点是从一次观察到下一次观察结果会呈现出差别或变化。变量的具体取值称为变量值。如商品销售额是变量,20万元就是变量值。变量可以分为分类变量、顺序变量、数值型变量(离散型变量可一一列举有限个数如企业数、产品数量和连续型变量不能一一列举取值连续不断如年龄、温度)。第二章2. 1什么是二手资料?使用二手资料需要注意什么?如果与研究内容有关的原信息已经存在,只是对这些原信息重新加工、整理,使之成为我们进行的统计分析可以使用的数据,间接来源的数据称为二手资料。使用二手资料要注意数据的定义、含义、计算口径和
5、计算方法,避免错用、误用、滥用。以引用二手数据时,应注明数据的来源,以尊重他人的劳动成果。2.概率抽样和非概率抽样的区别与联系,P23+P34举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。概率抽样也称随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定机会被选入样本,样本是采用概率抽样方式得到的,为统计估计结果的评估提供了有力的依据;非概率抽样相对于概率抽样而言,不依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查;样本统计量的分布不是确切的,取决于多种因素,因而无法使用样本的结果对总体相应的参数进行推断。概率抽样在于掌握研究对象总
6、体的数量特征,得到总体参数的置信区间,技术含量较高。如航天器中精密仪器主轴加工精度的要求;非概率抽样中如报刊上的调查问卷;3. P86最上面一段需要简答:4 P15最下面一行,从普查数据到重要内容一判断改错题。答案:有误差5 。P28实验数据:名词解释+实验是检验变量间因果关系的一种方法。6误差的控制:抽样误差可以采用相应的措施进行控制。P397计算题:重点是平均值和方差。参考:1.P93例4.7。例4.118.P212参数估计和假设检验的区别与联系。2.3调查中搜集数据的方法主要有自填式、面访式、电话式。除此之外,还有哪些搜集数据的方法?除自填式、面访式、电话式外,还有观察式。2.6你认为应
7、当如何控制调查中的回答误差?导致回答误差的原因主要有理解误差、记忆误差和有意识误差。为防止每个人都按自己的理解回答,在心理学知识帮助下,了解被调查者的心理活动,控制好理解误差在回答的误差,措辞很重要,将频率改为数量级,进行相应的排序;由于调查的问题是关于一段时期内的现象或事实,需要被调查者回忆,需要回忆的时间间隔越久,回忆的数据可能越不准确,所以缩短调查所涉及的时间范围,以周期发生事件采取周期调查期,可以减少记忆误差。有意识误差需要多方面的努力,调查人员要做好被调查者的思想工作,让他们打消顾虑,调查人员要遵守职业道德,为被调查者保密,调查中尽量避免敏感性问题。对于政府统计中的调查,要加强法制化
8、管理。第三章-数据的图表展示P783.2分类数据和顺序数据的整理和图示方法各有哪些?答:1)分类数据:是对事物进行分类的结果。因本身就是对事物的一种分类,所以在整理时首先列出所分的类别,然后计算出每一类别的频数、频率或比例等,即可形成一张频数分布表,最后根据需要选择适当的图形进行展示,以便对数据及其特征有一个初步的了解。分类数据的图示方法有:条形图:用宽度相同的条形盒高度或长短来表示数据多少的图行。柱形图:条形图纵置时成为柱形图。帕累托图:按各类别数据出现的频数多少排序后绘制的条形图。饼图:是用圆形及圆内扇形的角度来表示数据大小的图形。只能显示一个样本各部分所占的比例。环形图:与饼图类似,但中
9、间有一个“空洞”。可显示多个样本各部分所占的相应比例。2)顺序数据:分类数据的频数分布表和图示方法,如频数、比例、百分比、比率、条形图和饼图等,也都适用于对顺序数据的整理与显示。但一些适用于顺序数据的整理和显示方法,并不适用于分类数据。对于顺序数据,除了可使用上面的整理和显示技术,还可以计算累积频数和累积频率(百分比)。顺序数据的图示:根据累积频数或累积频率,可以绘制累积频数分布或频率图。3.4直方图与条形图有何区别?答:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的。2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组
10、的组距,其高度与宽度均有意义。3 .直方图的各矩形通常是连续排列,条形图则是分开排列。4 .条形图主要用于展示分类数据,直方图则主要用于展示数值型数据。3.6饼图和环形图有什么不同?答:1.饼图也称圆形图,是用圆形及园内扇形的面积来表示数值大小的图形.它主要用于表示总体或样本中各组成部分所占的比例,对于研究结构性问题十分有用。2 .环形图中间有一个空洞”,总体中的每一部分数据用环中的一段表示。环形图与圆形图类似,但又有区别圆形图只能显示一个总体各部分所占的比例环形图则可以同时绘制多个总体的数据系列,每一个总体的数据系列为一个环3 .环形图可用于结构比较研究,主要用于展示分类和顺序数据。3.7茎
11、叶图与直方图相比有什么优点?它们的应用场合是什么?答:茎叶图与直方图相比,茎叶图既能给出数据的分布状况,又能给出每一个原始数值,即保留了原始数据的信息。而直方图虽然能很好地显示数据的分布,但不能保留原始的数值。在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。第四章一一数据的概括性度量P1094.1一组数据的分布特征可以从哪几个方面进行测量?答:数据分布的特征可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏态和峰态。这三个方面分别反映了数据分布特征的不同侧
12、面。4.5简述众数、中位数和平均数的特点和应用场合。简答题答:众数是一组数据中出现次数最多的变量值,用Mo表示。它不受极端值影响,具有不唯一性。众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。数据分布偏斜程度较大时应用。中位数是一组数据排序后处于中间位置上的变量值,用Me表示,也不受极端值影响。它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。数据分布偏斜程度较大时应用。平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。它易受极端值影响,数学性质优良。主要适用于数
13、值型数据,而不适用于分类数据和顺序数据。数据对称分布或接近对称分布时应用。4.8 为什么要计算离散系数?与方差的区别答:离散系数是一组数据的标准差与其相应的平均数之比。是对数据相对离散程度的测度,消除了数据水平高低和计量单位的影响,主要用于对不同组别数据离散程度的比较。离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。4.9 测度数据分布形状的统计量有哪些?答:偏态和峰态是对数据分布形状的测度。偏态是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。峰态是对数据分布平峰或尖峰程度的测度。测度峰态的统计量则是峰态系数,记作Ko练习题4.6在某地区抽取120家企业
14、,按利润额进行分组,结果如下:按利润额分组(万元)企业数(个)200-30019300-40030400-50042500-60018600以上11合计120要求:1、计算120家企业利润额的平均数和标准差。答:平土匀数=(250*19+350*30+450*42+550*18+650*11)/120=426.67标准差=(250-426.67)2*19(350-426.67)2*30-(450-426.67)2*42(550-426.67)2*18(650-426.67)2*11120-1=116.482、计算分布的偏态系数和峰态系数答:偏态系数=(250-426.67)3*19(350-4
15、26.67)3*30(450-426.67)3*42(550-426.67)3*18(650-426.67)3*11120*S5323823.23-120*116.483=0.203峰态系数=(250-426.67)4*19+(350-426.67)4*30+(450-426.67)4*42+(550-426.67)4*18+(650-426.67)4*11-3120*S4_51087441648=4120*116.484=-0.687第四章重要公式如下:k十,花一M1fl+M2f2+.+Mkfk二Mifi平均数x=22kk=3f1f2fknI2kn_x(xi-x)2未分组数据方差s2=mn7
16、k_%(Mi-x)2fi1分组数据方差s2=n一1'、(Xi-x)2未分组数据平均差s=:Fn-1k分组数据平均差s=(Mi-X)2fii1n-1第五章一一概率与概率分布P1425.4.2正态分布1.正态分布121(X-)2如果随机变量X的概率密度为:f(x)=e七,-8<X<+9二、2二则称X服从正态分布,记作XN(仃2),其中-g<N<+g,仃>0,N为随机变量X的均值,。为随机变量X的标准差,它们是正态分布的两个参数。XN(R,仃2)通常称随机变量X服从均值为N,方差为仃2的正态分布。标准正态分布I.1;当N=0,仃=1时,有f(x)=e2,-
17、76;°<X<+00,相应的正态分布N(0,1)称为标准2二正态分布,通常用邛(x)表示概率密度函数,用(x)表示分布函数,即X:'(X)=_(t)dt=.t2-2dt,2X-1设X-N(N,。),则Z=N(0,1)o中(-x)=1-中(x)一般设XN(0,1),则有P(aMXMb)=Q,(b)-:D(a)P(|X|Ma)=2:D(a)-1一般设XN(匕仃2),则有b-。/a-2P(a<X<b)=b一-6一I<aJ<aJ例5.21设X-N(0,1),求以下概率:重点记住:=1,=2,=3时的值是多少?P(X<1.5)。(2)P(X&g
18、t;2)。(3)P(-1<X<3)o(4)P(IXI<2)o:,(1)=0.8413>(1.5)=0.9332中(2)=0.97731(3)=0.9987解:(1)P(X<1.5)=(1.5)=0.9332P(X>2)=1-P(X三2)=1-:,(2)=1-0.9773=0.0227P(-1<X<3)=P(X£3)-P(XE-1)=中(3)-力(-1)=:(3)-1-:,(1)=0.9987-1+0.8413=0.84P(IXI£2)=2中(2)-1=2*0.9773-1=1.9546-1=0.9546P148例5.23某种零
19、件的长度服从正态分布,平均长度为10MM,标准差为0.2mm。试问:从该批零件中随机抽取一件,其长度不到9.4mm的概率。为了保证产品质量,要求以95%的概率保证该零件的长度在9.5mm-10.5mm之间,这一要求能否实现?解:已知XN(10,0.22),则94-10'''P(X<9.4)=9101=6(3)=16(3)=10.9987=0.0013<0.2)P(9.5<x<10.5)=_f10.5-10、_/9.5_10_6=92.562.52.51=2*0.99381=0.9876<0.2)00.2)即可以用98.76%的概率保证该批零
20、件的长度在9.5mm10.5mm之间,也就是说,该批零件的质量要求可以实现。做练习题:P1545.16设XN(3,4),试求:P|X|>2PX>3解:已知XN(3,22),则,、一_.J/23)工,z-2-3P|X|>2=1-P(|X|<2)=1-P(-2<X<2)=1.I6if112/<2)=1-4-0.5-2.5=1-1+:'(0.5)+1-:'(2.5)=0.6915+1-0.9938=0.6977PX>3=1-P(X<3)=1->(3)=1-0.9987=0.00135.17一工厂生产的电子管寿命X(以小时计算
21、)服从期望值k=160的正态分布,若要求P120<X<200之0.08,允许标准差最大为多少?解:由P120<X<200之0.08得PX<200-PX<12020.08得(200)-6(120)圭0.08/日-200-160,/120-160、得,()-”)-0.08C7/日c,,40、得2:,(),1.08CT/日,40、得/(),0.54CT得40_0,1CT得C-_4005.18一本书排版后一校时出现错误处数X服从正态分布N(200,400),求:1、出现错误处数不超过230的概率。2、出现错误处数在190-210之间的概率。解:已知XN(200,20
22、2),则品230200)*30、1.P(X<230)=1=6一1=中(1.5)=0.9332120J<20J2.P(190<X<210)=210-200x20"190-20020=中0.5-1*10.5=2*0.6915-1=0.3830注意:P166.X的抽样分布P178中间的图形一95%的值=1.96,90%的值=1.645第七章参数估计正态总体、方差仃2已知,或非正态总体、大样本:样本均值X的抽样分布均为正态分布,其数学期望为总体均值N,方差为仃2/n。而样本均值x-经过标准化以后的随机变量则服从标准正态分布,即z=N(0,1)从而得出总体均值其中x-Z
23、)/2X工Z"2一n在1-a置信水平下的置信区间为:二/.n称为置信下限,nx+z“21称为置信上限,«是事先确定的一个概率值,是总体均值不包括在置信区间的概n率。如果总体服从正态分布但仃2未知,或总体并不服从正态分布,只要是在大样本条件下,总体方差仃2就可以用样本方差s2代替,这时总体均值H在1-s置信水平下的置信区间可写为:一,sx-Z:/2.n例7.2一家保险公司收集到由36位投保人组成的随机样本,得到每位投保人的年龄数据如表示。表7-37-3所23353927364436424643313342534554472434283936444039493834485034
24、3945484532试建立投保人年龄90%的置信区间。解:已知n=36,1-a=90%,Z/2=1.645,由于总体方差未知,但为大样本,可用样本方差代替总体方差。x=39.5,s='xi-xi4=7.77n-1s7.77x±Z2-F=39.5±1.645*-=39.5±2.13=(37.4,41.6),投保人平均年龄90%的置信区间为,n,3637.4岁41.6岁。例7.3已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16个,测得其使用寿命(单位h)如下:1510145014801460152014801490146014801510153014
25、701500152015101470试建立该批灯泡平均使用寿命95%的置信区间。解:已知n=16,1-ct=95%,x=23840/16=1490Z(xi-xf0i9200S=24.77n-1.16-1根据口=0.05查t分布表得to/2(n1)=t0.025(15)=2.131,平均使用寿命的置信区间为:一s24.77x-t-./2=1490-2.131*:1490-13.2=.n:16(1476.8,1503.2),该灯泡平均使用寿命95%的置信区间为1476.8h-1503.2ho例7.4某城市想要估计下岗职工中女性所占比例,随机抽取了100位下岗职工,其中65人为女性职工。试以95%的
26、置信水平估计该城市下岗职工中女性比例的置信区间。p=65/100=65%p士z“2p(1;p)=65%±1.96.解:已知n=100,1-口=95%。根据抽样结果计算的样本比例为:65%(1-65%)=65%_9.35%=(55.65%,74.35%)100该城市的置彳t区间为55.65%74.35%。思考题7.2简述评价估计量好坏的标准。答:评价估计量的标准主要有:(1)无偏性:是指估计量抽样分布的数学期望等于被估计的总体参数。设总体参数为日,所选择的估计量为e,如果e七l=e,则称日为8的无偏估计量。(2)有效性:是指对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。(
27、3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。7.5z值2的含义是什么?.n答:指的是估计总体均值时的估计误差。7.8简述样本量与置信水平、总体方差、估计误差的关系。样本量n=Z:./22E2二2,从公式中可以看出,样本量与置信水平称正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;样本量与总体方差成正比,总体的差异越大,所要求的样本量就越大;样本量与估计误差成反比,即可以接受的估计误差越大,所需要的样本量就越小。练习题P2017.1从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为25。(1)样本均值的抽样标准误差等于多少?(2)在95%的置信水
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 营业执照申请书
- 跳高运动会的广播稿
- 小学一年级数学两位数加减一位数同步练习试题带答案
- 贫困捐款倡议书
- 金风年终总结
- 质量管理员面试自我介绍
- 针刺伤预防与处理措施
- 中国政治思想史知到课后答案智慧树章节测试答案2025年春南昌大学
- 轮椅转运流程指引
- 人教宁夏 九年级 下册 语文 第四单元《 短文两篇》习题课 课件
- 《铁路轨道维护》课件-起道作业
- GB/T 22500-2024动植物油脂紫外吸光度的测定
- 肺结核宣传课件下载
- (高鸿业)微观经济学习题解析+微观经济学题库解析
- 躲在蚊子后面的大象读书
- 6S管理控制程序文件
- 华为认证HCIA-5G(H35-660)考试题附答案
- 消防管道及设备安装技术交底
- 精装修项目主要分项工程施工技术方案
- 四川省成都市航天中学2025届高三二诊模拟考试物理试卷含解析
- 巧绘节气图(教学设计)-2024-2025学年二年级上册综合实践活动蒙沪版
评论
0/150
提交评论