版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、请举出统计应用的几个例子1、用统计识别作者:对于存在争议的论文,通过统计量推出作者2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3、挑战者航天飞机失事预测请举出应用统计的几个领域:1、在企业发展战略中的应用2、在产品质量管理中的应用3、在市场研究中的应用在财务分析中的应用在经济预测中的应用你怎么理解统计的研究内容:1、统计学研究的基本内容包括统计对象、统计方法和统计规律。2、统计对象就是统计研究的课题,称谓统计总体。3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。统计规律就是通过大量观察和综合分析所揭示
2、的用数量指标反映的客观现象的本质特征和发展规律。举例说明分类变量、顺序变量和数值变量:分类变量:表现为不同类别的变量称为分类变量,如性别”表现为男”或女”,企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。这里的“考试成绩等级”、“态度”等就是顺序变量。数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。定性数据和定量数据的图
3、示方法各有哪些:1、定性数据的图示:条形图、帕累托图、饼图、环形图2、定量数据的图示:a、分组数据看分布:直方图b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图c、两个变量间的关系:散点图d、比较多个样本的相似性:雷达图和轮廓图直方图与条形图有何区别:1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。3、条形图主要用于展示定性数据,而直方图则主要用于展示定量数据。一组数据的分布特征可以从哪几个方面进行描述:1、数据的水平,反映数据的集中程度2、数据的差异,反映各数据的离散程度
4、3、分布的形状,反映数据分布的偏态和峰态说明平均数、中位数和众数的特点及应用场合:平均数也称为均值,它是一组数据相加后除以数据的个数而得到的结果。平均数是度量数据水平的常用统计量,在参数估计以及假设检验中经常用到。中位数是一组在数据排序后处于中间位置上的数值,用Me表示。中位数是用中间位置上的值代表数据水平,其特点是不受极端值影响,在研究收入分配中很有用。众数与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,其特点是不受极端值的影响,具有不惟一性,一组数据中可能会有一个人众数,也可能会有多个或没有。为什么要计算离散系数:极差、平均差、方差和标准差等都是反
5、映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和数量单位不同对离散程度的测度值的影响,需要计算离散系数。举例说明离散型随机变量和连续性随机变量:离散型随机变量:设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散型随机变量。包括二项分布、泊松分布、超几何分布,如一定时间内某航空公司接到的订票电话数连续型概率分布:包括正态分布、均匀分布和指数分布。叙述正态分布曲线的特点:正态曲线的图形是关于x=u对称的钟形曲线,且峰值在x=u处。正
6、态分布的两个参数u和b旦确定,正态分布的具体形式也惟一确定,不同参数取值的正态分布构成一个完整的“正态分布族”。当X的取值向横轴左右两个方向无限延伸时,正态曲线的左右两个尾端也无限渐近横轴,但理论上永远不会与之相交。正态随机变量在特定区间上取值的概率由正态曲线下的面积给出,而且其曲线下的总面积等于1解释中心极限定理的含义:随着样本量n的增大(通常要求n=30),不论原来的总体是否服从正态分布,样本均值的概率分布都将趋于正态分布,其分布的期望值为总体均值u,方差为总体方差的1/n。这一定理可表述为:从均值为u、方差为bA2的总体中,抽取样本量为n的随机样本,当n充分大时(通常要求n=30),样本
7、均值的分布近似服从均值为u,方差为bA2/n的正态分布。说明区间估计的基本原理:区间估计,是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出的一个概率度量。简述评价估计量的标准:无偏性:它是指估计量抽样分布的期望值等于被估计的总体参数;有效性:它是指估计量的方差尽可能小;一致性:它是指随着样本量的增大,点估计量的值越来越接近被估计总体的参数解释置信水平的含义:置信水平,是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体
8、参数值间误差范围。置信区间越大,置信水平越高。简述样本量与置信水平、总体方差、估计误差的关系样本量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本量也就越大;样本量与总体方差成正比,总体的差异越大,所要求的样本量也越大;样本量与估计误差的平方成正比,即允许的估计误差的平方越大,所要求的样本量就越大。解释原假设和备择假设:原假设:它通常是研究者想收集证据予以推翻的假设,用H0表示,原假设所表达的含义总是指参数没有变化或变量之间没有关系,等号“=”总放在原假设上。备择假设:通常指研究者想收集证据予以支持的假设,用H1或Ha表示。备择假设所表达的H1:u工含义是总体参数发生了变化或
9、变量之间有某种关系。备择假设的形式总是为uO,H1:uuO第一类错误和第二类错误分别是指什么它们发生的概率大小之间存在怎样的关系:第I类错误(弃真错误):原假设为真时拒绝原假设时所犯的错误第n类错误(取伪错误):原假设为假时未拒绝原假设当样本容量n确定后,当a变小时,则检验的拒绝域变小,相应的接受域会变大,因此B值也就随之变大;相反,若B变小,则a又会变大.样本量的大小与显著性有怎样的关系:显著性水平与样本的大小密切相关,相关量越大,检验统计量的值也就越大,显著性水平越小,就越有可能拒绝原假设。相关分析主要解决哪些问题:变量之间是否存在关系如果存在关系,它们之间是什么样的关系变量之间的关系强度
10、如何样本所反映的变量之间的关系能否代表总体变量之间的关系解释回归模型和估计的回归方程的含义:回归模型是描述因变量y如何依赖于自变量x和误差项的方程。回归方程是描述因变量y的期望值如何依赖于自变量x的方程。估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。简述参数最小二乘估计的基本原理:这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小。根据这一思想确定直线中未知常数和的方法称为最小二乘法什么是P值利用P值进行检验和利用统计量进行检验有什么不同如果能把犯第I类错误的真实概率算出来,就可
11、以直接用这个概率做出决策。而不需要管什么事先给定的显著性水平a,这个犯第I类错误的真实概率就是P值。不同:统计量检验是根据事先确定的显著性水平a围成的拒绝域作出决策,不论检验统计量的值是大是小,只要把它落入拒绝域就拒绝原假设Ho否则就不拒绝Ho这样,无论统计量落在拒绝域的什么位置,你也只能说犯第一错误的概率为a,而用P值检验则能把犯第I类错误的真实概率算出来。获得数据的概率抽样方法有哪些(1) 简单随机抽样简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。它最直观地体现了抽样的基本原理,是最基本的概率抽样。(2) 系统抽样系统抽样也称等距抽样或机械抽样,是按一定的间隔
12、距离抽取样本的方法。(3) 分层抽样分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。(4) 整群抽样整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。(5) 多阶段抽样多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。样本量的大小与显著性有怎样的关系通常在做某种统计推断
13、时,显著性水平要求越高,要达到该显著性水平的样本量越大。样本量越大,检验统计量的值夜就越大,P值就越小,就越有可能拒绝原假设。反之则相反第1章统计和统计数据指出下面的变量类型。(1)年龄。(2)性别。(3)汽车产量。(4)员工对企业某项改革措施的态度(赞成、中立、反对)。(5)购买商品时的支付方式(现金、信用卡、支票)。详细答案:(1)数值变量。(2)分类变量。(3)数值变量。(4)顺序变量。(5)分类变量。一家研究机构从IT从业者中随机抽取1000人作为样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。(1)这一研究的总体是什么样本是什么样
14、本量是多少(2)“月收入”是分类变量、顺序变量还是数值变量(3)“消费支付方式”是分类变量、顺序变量还是数值变量详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。(2)数值变量。(3)分类变量。一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。(1)这一研究的总体是什么(2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量详细答案:(1)总体是“所有的网上购物者”。(2)分类变量。某大学的商学院为了解毕业生的就业倾向,分别在会计专业抽取50人、市场营销专业抽取30、企业管理20人进行调
15、查。(1)这种抽样方式是分层抽样、系统抽样还是整群抽样(2)样本量是多少详细答案:(1)分层抽样。(2)100。第3章用统计量描述数据教材习题答案随机抽取25个网络用户,得到他们的年19152925242321382218302019191623272234244120311723龄数据如下(单位:周岁):计算网民年龄的描述统计量,并对网民年龄的分布特征进行综合分析详细答案:网民年龄的描述统计量如下:平均24中位数2325%四分位数1975%四分位数众数19标准差方差峰度偏度极差26最小值15最大值41从集中度来看,网民平均年龄为24岁,中位数为23岁。从离散度来看,标准差在为岁,极差达到26
16、岁,说明离散程度较大。从分布的形状上看,年龄呈现右偏,而且偏斜程度较大。某银行为缩短顾客到银行办理业务等待的时间,准备采用两种排队方式进行试验。一种是所有顾客都进入一个等待队列;另一种是顾客在3个业务窗口处列队3排等待。为比较哪种排队方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为分钟,标准差为分钟,第二种排队方式的等待时间(单位:分钟)如下:(1)计算第二种排队时间的平均数和标准差。比两种排队方式等待时间的离散程度。如果让你选择一种排队方式,你会选择哪一种试说明理由详细答案:(1)(岁);(岁)。(2);。第一中排队方式的离散程度大。(3)选方法二
17、,因为平均等待时间短,且离散程度小。在某地区随机抽取120家企业,按利润额进行分组后结果如下:按利润额分组(万元)企业数(个)300以下19300400304005004250060018600以上11合计120计算120家企业利润额的平均数和标准差(注:第一组和最后一组的组距按相邻组计算)。详细答案:=(万元);(万元)。一家公司在招收职员时,首先要通过两项能力测试。在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。一位应试者在A项测试中得了115分,在B项测试中得了425分。与平均分数相比,该位应试者哪一项测试更为理想详细答案:通过计算
18、标准化值来判断,说明在A项测试中该应试者比平均分数高出1个标准差,而在B项测试中只高出平均分数个标准差,由于A项测试的标准化值高于B项测试,所以A项测试比较理想。一种产品需要人工组装,现有3种可供选择的组装方法。为检验哪种方法更好,随机抽取15个工人,让他们分别用3种方法组装。下面是15个工人分别用3种方法在相同的时间内组装的产品数量(单位:个):方法A方法B方法C16412912516713012616812912616513012717013112616513012816412912716812712616412812716212812716312712516612812616712811
19、61661251261651321251你准备用哪些统计量来评价组装方法的优劣2.如果让你选择一种方法,你会做出怎样的选择试说明理由详细答案:3种方法的主要描述统计量如下:方法A方法B方法C平均平均平均中位数165中位数129中位数126众数164众数128众数126标准差标准差标准差峰度峰度峰度偏度偏度偏度极差8极差7极差12离散系数离散系数离散系数最小值162最小值125最小值116最大值170最大值132最大值128(1) 从集中度、离散度和分布的形状三个角度的统计量来评价。从集中度看,方法A的平均水平最高,方法C最低;从离散度看,方法A的离散系数最小,方法C最大;从分布的形状看,方法A
20、和方法B的偏斜程度都不大,方法C则较大。(2) 综合来看,应该选择方法A,因为平均水平较高且离散程度较小第五章1.3.4.5.6.(1)(%。(2)(%。7.详细答案:(,)。详细答案:139。详细答案:57。769。第6章假设检验一项包括了200个家庭的调查显示,每个家庭每天看电视的平均时间为小时,标准差为小时。据报道,10年前每天每个家庭看电视的平均时间是小时。取显著性水平,这个调查能否证明“如今每个家庭每天收看电视的平均时间增加了”详细答案:,=,拒绝,如今每个家庭每天收看电视的平均时间显著地增加了。为监测空气质量,某城市环保部门每隔几周对空气烟尘质量进行一次随机测试。已知该城市过去每立
21、方米空气中悬浮颗粒的平均值是82微克。在最近一段时间的检测中,每立方米空气中悬浮颗粒的数值如下(单位:微克):颗粒的平均值显著低于过去的平均值详细答案:=,拒绝,该城市空气中悬浮颗粒的平均值显著低于过去的平均值。安装在一种联合收割机的金属板的平均重量为25公斤。对某企业生产的20块金属板进行测量,得到的重量数据如下:假设金属板的重量服从正态分布,在显著性水平下,检验该企业生产的金属板是否符合要求详细答案:,不拒绝,没有证据表明该企业生产的金属板不符合要求。在对消费者的一项调查表明,17%的人早餐饮料是牛奶。某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。为验证这一说法,生产商随机抽取
22、550人的一个随机样本,其中115人早餐饮用牛奶。在显著性水平下,检验该生产商的说法是否属实详细答案:,拒绝,该生产商的说法属实。某生产线是按照两种操作平均装配时间之差为5分钟而设计的,两种装配操作的独立样本产生如下结果:操作A操作B=100=50=对=,检验平均装配时间之差是否等于5分钟详细答案:,=,拒绝,两种装配操作的平均装配时间之差不等于5分钟。某市场研究机构用一组被调查者样本来给某特定商品的潜在购买力打分。样本中每个人都分别在看过该产品的新的电视广告之前与之后打分。潜在购买力的分值为010分,分值越高表示潜在购买力越高。原假设认为“看后”平均得分小于或等于“看前”平均得分,拒绝该假设就表明广告提高了平均潜在购买力得分。对=的显著性水平,用下列数据检验该假设,并对该广告给予评价。购买力得分购买力得分个体看后看前个体看后看前165535264698r377775443866详细答案:设,。,=,不拒绝,广告提高了平均潜在购买力得分某企业为比较两种方法对员工进行培训的效果,采用方法1对15名员工进行培训,采用方法2对12名员工进行培训。培训后的测试分数如下:方法1方法2565145595753475243525665425352
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 课题申报参考:教育家精神融入公费师范生培养的实践模型与长效机制研究
- 课题申报参考:家庭综合能源系统优化运行及其干扰管理研究
- 2025年度个人快件运输合同范本(快递服务版)2篇
- 二零二五版龙门吊设备维修配件供应与库存管理合同4篇
- 影视作品2025年度海外发行合同3篇
- 2025年智能交通系统建设投资合同2篇
- 二手房买卖合同按揭贷款范文(2024版)
- 二零二五年度国际文化交流捐赠协议3篇
- 二零二五年度城市排水管网疏浚承包合同样本4篇
- 2025年新能源汽车电池更换服务合同模板4篇
- 广东省佛山市2025届高三高中教学质量检测 (一)化学试题(含答案)
- 人教版【初中数学】知识点总结-全面+九年级上册数学全册教案
- 2024-2025学年人教版七年级英语上册各单元重点句子
- 公司结算资金管理制度
- 2024年小学语文教师基本功测试卷(有答案)
- 项目可行性研究报告评估咨询管理服务方案1
- 5岁幼儿数学练习题
- 新版药品批发企业质量管理体系文件大全
- 项目管理实施规划-无锡万象城
- 浙大一院之江院区就诊指南
- 离婚协议书电子版下载
评论
0/150
提交评论