




已阅读5页,还剩20页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学思考题一、名词解释1.参数:描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。所关心的参数主要有总体均值、标准差、总体比例等。总体参数通常用希腊字母表示2.残差: 因变量的观测值与根据估计的回归方程求出的预测值之差,用e表示。反映了用估计的回归方程去预测而引起的误差,可用于确定有关误差项的假定是否成立 3.标准分数:变量值与其平均数离差除以标准差后的值就是标准分数也称标准化值或z分数。P874.次序统计量:一组样本观测值X1,X2,Xn由小到大的排序X(1)X(2) X(i) X(n)后,称X(1),X(2),X(n)为次序统计量 。中位数、分位数、四分位数等都是次序统计量5.错误:原假设为伪是没有拒绝,犯这种错误的概率用表示,所以也称错误或取伪错误6.错误:原假设为真时拒绝原假设,犯这种错误的概率用表示,所以也被称为错误或弃真错误。7.多元回归方程:描述因变量 y 的平均值或期望值如何依赖于自变量 x1, x2 ,xk的方程。多元线性回归方程的形式为 E( y ) = b0+ b1 x1 + b2 x2 + bk xk8.多元回归模型:描述因变量 y 如何依赖于自变量 x1 , x2 , xk 和误差项e 的方程,称为多元回归模型。 其一般形式为 :E( y ) = b0+ b1 x1 + b2 x2 + bk xk + 9.多重判定系数:是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量y的变差中被估计的回归方程所解释的比例。10.F分布:设随机变量Y与Z相互独立,且Y与Z分别服从于自由度为m和n的 分布,随机变量X有如下表达式:F=nYmZ,则称X服从于第一自由度为m,第二自由度为n的F分布,记作XF(m,n)11.方差分析:检验各个总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。12.分布:设随机变量X1,X2,Xn相互独立,且Xi(i=1,2,n)服从标准正态分布N(0,1)则他们的平方和 服从自由度为n的分布。期望为:E(c2)=n,方差为:D(c2)=2n(n为自由度) 13.非平稳序列:是有趋势、季节性和周期性的序列,他可能只含有一种成分也可能含有几种成分的组合。14.偏态:由统计学家皮尔逊提出,它是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。偏态系数=0为对称分布,偏态系数 0为右偏分布,偏态系数 0为右偏分布,偏态系数 0为左偏分布。偏态系数大于1或小于-1,被称为高度偏态分布;偏态系数在0.51或-1-0.5之间,被认为是中等偏态分布;偏态系数越接近0,偏斜程度就越低峰态系数:峰态是对数据分布扁平程度的测度。峰态系数=0扁平峰度适中,峰态系数0为尖峰分布13.简述评价估计量好坏的标准。(1) 无偏性:估计量抽样分布的数学期望等于被估计的总体参数(2) 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效(3)一致性:随着样本量的增大,估计量的值越来越接近被估计的总体参数14.简述样本量与置信水平、总体方差、边际误差的关系。样本量与置信水平成正比。在其他条件不变的情况下,置信水平越大,所需的样本量也就越大。样本量与总体方差成正比,总体的差异越大所要求的样本量也就越大。样本量与估计误差的平方成反比,即可以接受的估计误差的方差越大,所需的样本量就越小。15.假设检验和参数估计有什么相同点和不同点。参数估计和假设检验是统计推断的两个组成部分,他们都是利用样本对总体进行某种推断,但推断的角度不同。参数估记讨论的是用样本统计量估计总体参数的方法,总体参数在估计前是未知的。而在假设检验中,则是先对的值提出一个假设,然后利用样本信息进行检验这个假设是否成立。16.什么是假设检验中的两类错误?第一类错误(弃真错误):原假设为真时拒绝原假设,第一类错误的概率为a,被称为显著性水平第二类错误(取伪错误):原假设为假时接受原假设,第二类错误的概率为17.在单侧检验中原假设和备择假设的方向如何确定?原假设:待检验的假设,又称“0假设”,表示为 H0 研究者想收集证据予以反对的假设,总是有等号 =,或 备择假设:与原假设对立的假设,也称“研究假设”,表示为 H1 研究者想收集证据予以支持的假设总是有不等号: , 18.方差分析包括哪些类型?它们有何区别?方差分析是检验多个总体均值是否相等,有单因素方差分析和双因素方差分析两类。单因素方差分析:涉及一个分类的自变量。双因素方差分析:涉及两个分类的自变量19.简述方差分析的基本步骤。方差分析包括提出假设,构造检验的统计量,统计决策等步骤。为检验自变量对因变量是否有显著影响,首先需要提出“两个变量在总体中没有关系”的原假设,然后构造一个用于检验的统计量来检验这一假设是否成立。单因素方差分析与双因素方差分析步骤类似。P251.P24020.简述相关系数显著性检验的步骤。(1)提出假设:H0:r = 0 ;H1:r 0(2)计算检验的统计量 (3)确定显著性水平a,并作出决策:若|t|ta/2,拒绝H0;若|t|F a,拒绝H0;若Fta/2,拒绝H0; tta/2,不拒绝H024.多重共线性的判别方法主要有哪些?检测多重共线性的最简单的一种办法是计算模型中各对自变量之间的相关系数,并对各相关系数进行显著性检验。若有一个或多个相关系数显著,就表示模型中所用的自变量之间相关,存在着多重共线性。具体来说:(1)模型中各对自变量之间显著相关(2)当模型的线性关系检验(F检验)显著时,几乎所有回归系数的t检验却不显著 (3)回归系数的正负号与预期的相反(4)容忍度与方差扩大因子25.在多元线性回归中,选择自变量的方法有哪些?变量选择的方法主要有:向前选择、向后剔除、逐步回归、最优子集等向前选择:不断地向模型中增加自变量,直到增加自变量不能导致SSE的显著增加为止。(这个过程通过F 检验完成) 向后剔除:与向前选择法相反,将自变量从模型中剔除,直到剔除一个自变量不会使SSE显著减小为止(通过F检验的P值来判断)逐步回归:将向前选择和向后剔除两种方法结合起来筛选自变量的方法。在增加了一个自变量后,它会对模型中所有的变量进行考察,看看有没有可能剔除某个自变量。如果在增加了一个自变量后,前面增加的某个自变量对模型的贡献变得不显著,这个变量就会被剔除按照方法不停地增加变量并考虑剔除以前增加的变量的可能性,直至增加变量已经不能导致SSE显著减少26.简述时间序列的构成要素。时间序列同一现象在不同时间上的相继观察值排列而成的数列。构成要素有:趋势:持续向上或持续下降的状态或规律 季节性:也称季节变动,时间序列在一年内重复出现的周期性波动 周期性:也称循环波动,围绕长期趋势的一种波浪形或振荡式变动 随机性:也称不规则波动,除去趋势、周期性和季节性之后的偶然性波动27.简述复合型时间序列的预测步骤。(1)确定并分离季节成分:计算季节指数,以确定时间序列中的季节成分。将季节成分从时间序列中分离出去,即用每一个观测值除以相应的季节指数,以消除季节性(2)建立预测模型并进行预测对消除季节成分的序列建立适当的预测模型,并根据这一模型进行预测(3)计算出最后的预测值用预测值乘以相应的季节指数,得到最终的预测值三、计算题第7章 区间估计1.某居民小区共有居民500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。采取重复抽样方法随机抽取了50户,其中有32户赞成,18户反对。已知。(1)求总体中赞成该项改革的户数比例的置信区间,置信水平为95%。(2)如果小区管理者预计赞成的比例能达到80%,估计的边际误差不超过10%,应抽取多少户进行调查? 2.从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。 。3.某居民小区为研究职工上班从家里到单位的距离,抽取了由16人组成的一个随机样本,他们到单位的距离(单位:km)分别为:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。要求:列表计算,并写出详细计算步骤,其中。4.从两个总体中各抽取一个的独立随机样本,来自总体1的样本比例为,来自总体2的样本比例为,请构造的95%的置信区间。()第8章 假设检验5.已知某炼铁厂的含碳量服从正态分布,现在测定了9炉铁水,其平均含碳量为4.484。如果估计方差没有变化,可否在显著性水平0.05下认为现在生产的铁水平均含碳量为4.55?()解:不能拒绝原假设,可认为现在生产的铁水平均含碳量为4.55。6.一种元件,要求其使用寿命不得低于700小时。现从一批这种元件中随机抽取36件,测得其平均使用寿命为680小时。已知该元件寿命服从正态分布,小时,试在显著性水平0.05下确定这批元件是否合格。()解:拒绝原假设。在显著性水平0.05下这批元件不合格。7.某地区小麦的一般生产水平为亩产250公斤,其标准差为30公斤。现用一种化肥进行试验,从25个小区抽样,平均产量为270公斤。在显著性水平为0.05的情况下,这种化肥是否使小麦增产。()解:拒绝原假设。在显著性水平为0.05的情况下,这种化肥使小麦增产。8.糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下:99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试在显著性水平为0.05的情况下检验该日打包机工作是否正常?()解:不拒绝原假设。在显著性水平为0.05的情况下,该日打包机工作正常。9.某种大量生产的袋装食品,按规定不得少于250克。今从一批该食品中任意抽取50袋,发现有6袋低于250克。若规定不符合标准的比例超过5%就不得出厂,问在显著性水平为0.05的情况下该批食品能否出厂?()拒绝原假设。在显著性水平为0.05的情况下该批食品不能出厂。10.某厂家在广告中声称,该厂生产的汽车轮胎在正常行驶条件下超过目前的平均水平25000公里。对一个由15个轮胎组成的随机样本做了试验,得到样本的均值和标准差分别为27000公里和5000公里。假定轮胎寿命服从正态分布,问在显著性水平为0.05的情况下该厂家的广告是否真实?() 解:拒绝原假设。在显著性水平为0.05的情况下该厂家的广告不真实。11.某电子元件的寿命(单位:小时)服从正态分布。现测得16只元件的寿命如下:159 280 101 212 224 379 179 264 222 362 168 250 149 260 485 170问在显著性水平为0.05的情况下是否有理由认为元件的平均使用寿命显著地大于225小时?()解:不拒绝原假设。在显著性水平为0.05的情况下没有理由认为元件的平均使用寿命显著地大于225小时。12.随机抽取9个单位,测得结果分别为:85 59 66 81 35 57 55 63 66 以的显著性水平对下述假设进行检验:。()解:拒绝原假设。13.A,B两厂生产同样材料。已知其抗压强度服从正态分布,且,。从A厂生产的材料中随机抽取81个样品,测得;从B厂生产的材料中随机抽取64个样品,测得。根据以上调查结果,能否在显著性水平为0.05的情况下认为A,B两厂生产的材料平均抗压强度相同?()解:拒绝原假设。在显著性水平为0.05的情况下不能认为A,B两厂生产的材料平均抗压强度相同。14.装配一个部件时可以采用不同的方法,所关心的问题是哪一个方法的效率更高。劳动效率可以用平均装配时间反映。现从不同的装配方法中各取12件产品,记录各自的装配时间(单位:分钟)如下:甲方法: 31 34 29 32 35 38 34 30 29 32 31 26乙方法: 26 24 28 29 30 29 32 26 31 29 32 28两总体为正态总体,且方差相同。问在显著性水平为0.05的情况下两种方法的装配时间有无显著差异?()解:拒绝原假设。在显著性水平为0.05的情况下两种方法的装配时间有显著差异。15.调查了339名50岁以上的人,其中205名吸烟者中有43个患慢性气管炎,在134名不吸烟者中有13人患慢性气管炎。调查数据能否支持“吸烟者容易患慢性气管炎”这种观点()?()解:在0.05显著性水平下拒绝原假设。调查数据支持“吸烟者容易患慢性气管炎”这种观点。第9章 列联分析16.欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯分为:经常购买,不购买,有时购买。调查结果如下表所示。项目低收入组偏低收入组偏高收入组高收入组经常购买25404746不购买69517457有时购买36261937要求:(1)提出假设;(2)计算值;(3)以的显著性水平进行检验。解:(1)提出假设 低收入组、 偏低收入组、偏高收入组和高收入组的购买习惯相同不完全相等。低收入组、 偏低收入组、偏高收入组和高收入组的购买习惯不完全相同(2)计算值期望值计算项目低收入组偏低收入组偏高收入组高收入组合计经常购买:25:38.975:40:35.078:47:41.973:46:41.973158不购买:69:61.917:51:55.725:74:66.679:57:66.679251有时购买:36:29.108:26:26.197:19:31.347:37:31.347118合计130117140140527计算表步骤一步骤二步骤三2538.975-13.975195.3005.0114035.0784.92224.2270.6914741.9735.02725.2710.6024641.9734.02716.2170.3866961.9177.08350.1690.8105155.725-4.72522.3260.4017466.6797.32153.5970.8045766.679-9.67993.6831.4053629.1086.89247.5001.6322626.197-0.1970.0390.0011931.347-12.347152.4484.8633731.3475.65331.9561.019步骤四 17.626(3)作出决策:拒绝原假设。17.从总体中随机抽取的样本,调查后按不同属性归类,得到如下结果:,依据经验数据,各类别在总体中的比例分别为:,以的显著性水平进行检验,说明现在情况与经验数据相比是否发生了变化。解:(1)提出假设。 没有变化原假设中至少有一个不成立。 有变化(2)计算值第一类第二类第三类第四类第五类观察频数2856483632期望频数2000.1=202000.2=402000.3=602000.2=402000.2=40(3)作出决策:拒绝原假设。18.某报社关心其读者的阅读习惯是否与其文化程度有关,随机调查了254位读者,得到如下数据:阅读习惯大学以上大学和大专高中高中以下早上看6131417中午看121688晚上看3840116有空看2122913以0.05的显著性水平检验读者的阅读习惯是否与文化程度有关。解:(1)提出假设:阅读习惯与文化程度无关。:阅读习惯与文化程度有关。(2)计算值期望值计算阅读习惯大学以上大学和大专高中高中以下总计早上看:6:15.157:13:17.913:14:8.268:17:8.66150中午看:12:13.339:16:15.764:8:7.276:8:7.62244晚上看:38:28.799:40:34.035:11:15.709:6:16.45795有空看:21:19.705:22:23.287:9:10.748:13:11.26065总计77914244254计算表步骤一步骤二步骤三615.157-9.15783.8515.5321213.339-1.3391.7930.1343828.7999.20184.6582.9402119.7051.2951.6770.0851317.913-4.91324.1381.3481615.7640.2360.0560.0044034.0355.96535.5811.0452223.287-1.2871.6560.071148.2685.73232.8563.97487.2760.7240.5240.0721115.709-4.70922.1751,412910.748-1.7483.0560.284178.6618.33969.5398.02987.6220.3380.1140.015616.457-10.457109.3496.6451311.2601.7403.0280.269步骤四 31.859(3)作出决策:拒绝原假设,认为阅读习惯与文化程度有关。19.教学改革后学生有了更多的选课自由,但学院领导在安排课程上也面临新问题。例如,MBA研究生班的学生选课学年之间的变化常常很大,去年的学生很多人选会计课,而今年的学生很多人选市场营销课。由于事先无法确定究竟有多少学生选各门课程,所以无法有效地进行教学资源的准备。有人提出学生所选课程与其本科专业所学课程有关。为此,学院领导将学生本科所学专业和MBA三门课程的选修情况做了统计,得到如下结果:本科专业MBA所选课程会计统计市场营销专业一311316专业二8167专业三121017其他专业1057要求:(1)以0.05的显著性水平检验学生本科所学专业是否影响其读MBA期间所选课程。(2)计算列联相关系数。解:(1)1)提出假设 不影响不完全相等。影响2)计算值期望值计算会计统计市场营销总计专业一:31:24.079:13:17.368:16:18.55360专业二:8:12.441:16:8.974:7:9.58631专业三:12:15.651:10:11.289:17:12.05939其他专业:10:8.829:5:6.368:7:6.80322总计614447152计算表步骤一步骤二步骤三3124.0796.92147.9001.989812.441-4.44119.7221.5851215.651-3.65113.3300.852108.8291.1711.3710.1551317.368-4.36819.0791.099168.9747.02649.3655.5011011.289-1.2891.6620.14756.368-1.3681.8710.2941618.553-2.5536.5180.35179.586-2.5866.6870.6981712.0594.94124.4132.02476.8030.1970.0390.006步骤四 14.7013)作出决策拒绝原假设。认为本科专业与MBA选课有关。(2)第10章 方差分析20.一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上是一致的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是低级管理者。该咨询公司认为,不同层次的管理者对讲座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准从110,10代表非常满意):高级管理者中级管理者低级管理者77879898109108565748取显著性水平,检验管理者的水平不同是否会导致评分的显著性差异?()解:(1)提出假设(2)构造检验统计量1)计算各样本均值管理者层次高级管理者中级管理者低级管理者778798981091085657482)计算各误差平方和3)计算统计量(3)统计决策拒绝原假设,管理者水平对评分有显著影响。21.为研究食品的包装和销售地区对其销售量是否有影响,在某周的三个不同地区中用三种不同包装方法进行销售,获得的销售数据如下:销售地区(A)包装方法(B)B1B2B3A1A2A3455035755065304050在显著性水平为的条件下,用无交互作用双因素方差分析方法检验不同地区和不同包装方法对该食品的销售量是否有显著影响?() 22.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项实验,考察三种广告方案和两种广告媒体,获得的销售数据如下:广告方案广告媒体报纸电视A812128B22142630C10181814在显著性水平为的条件下,检验广告方案、广告媒体或其交互作用对销售量的影响是否显著?(;)1123.学生在期末考试之前用于复习的时间(单位:h)和考试分数(单位:分)之间是否有关系?为研究这一问题,一位研究者抽取了由8名学生构成的一个随机样本,得到的数据如下:复习时间x20 16 34 23 27 32 18 22考试分数y 64 61 84 70 88 92 72 77(1)绘制复习时间和考试分数的散点图,判断二者之间的关系形态。(2)计算相关系数,说明两个变量之间的关系强度。(3)利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。24.根据下面数据建立回归方程,计算残差、判定系数,估计标准误差,并分析拟合程度。x15 8 19 12 5y 47 36 56 44 21第12章 多元回归分析25.飞鸽公司的管理人员认为自行车的销售量依赖于本公司自行车的价格及其竞争对手的价格,并希望建立自行车销售量与该公司自行车价格和竞争厂商自行车价格的回归方程。下表列出了10个城市的价格资料。竞争厂商的价格(x1)/元该公司的价格(x2)/元销售数量(y)/千辆25628038026031035025029036030024026035230032030030030040035010210012077469326696585(1)建立线性回归方程。(2)对回归方程的系数作出解释。(3)预测当飞鸽公司价格为270元,竞争厂商价格为280元时,自行车的销售量。四、分析题1.为研究工资水平与工作年限和性别之间的关系,在某行业中随机抽取10名职工,得到关于工资水平、工作年限、性别的数据,并引入虚拟变量,男性为1,女性为0。EXCEL输出的关于工资水平、工作年限、性别的线性回归结果如下:回归统计Multiple R0.926928R Square0.859195Adjusted R Square0.818964标准误差459.0483观测值10方差分析dfSSMSFSig F回归分析29000923450046121.3570.001048残差71475077210725.3总计910476000Coefficients标准误差t StatP-valueLower 95%Upper 95%Intercept930.4954466.97411.9926060.086558-173.7232034.714X Variable 1387.616162.565196.1953960.000447239.6729535.5593X Variable 21262.693314.12674.0196950.005062519.90192005.485(1)根据上表数据写出回归方程,并进行显著性检验。(2)
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版个人长期贷款财产抵押担保合同
- 早餐厅承包管理协议合同书范例二零二五年
- 二手房独家代理协议合同模板
- 二零二五简单的旅游免责协议书
- 二零二五版动产拍卖委托代理合同范例
- 区域代理合同标准模板
- 二零二五版二手房交易中介协议合同范例
- 会计职工合同标准文本
- 企业无偿租车合同标准文本
- 2025年航空制造和材料专用设备项目发展计划
- 湖北2023年中国邮政储蓄银行湖北分行春季校园招聘(第一批)考试参考题库含答案详解
- T-DLSHXH 002-2023 工业干冰标准规范
- 典型示功图应用与分析
- 出凝血完整版终版
- LY/T 2006-2012荒漠生态系统服务评估规范
- GB/T 31190-2014实验室废弃化学品收集技术规范
- 《地铁突发大客流应急管理》论文11000字
- 第五章-项目时间管理课件
- 导游人员管理法律制度课件
- 木箱检验作业指导书
- 初中级档案职称《档案事业概论》档案事业题库一
评论
0/150
提交评论