版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章导论1.1.1(4)顺序变量.(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。(1)总体是所有IT从业者的集合.(1)总体是所有在网上购物的消费者的集合。(3)参数是所有在网上购物者的月平均花费。(5)推断统计方法.第二章数据的搜集资料称为“二手资料”。使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免况下适合采用非概率抽样.概率抽样是指抽样时按一定概率以随机原则抽取样本。每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。如果调查的目的在于掌握和研究总体的数量特征,得到总体非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用更深入的数量分析提供准备。非概率抽样也适合市场调查中的概念测试.自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。分发挥调查员的作用。缺点:成本比较高,对调查过程的质量控制有一定难度。对于敏感问题,被访者会有压力。有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服.5.请举出(或设计)几个实验数据的例子。不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。6.你认为应当如何控制调查中的回答误差?对于理解误差,要注意表述中的措辞,学习一定的心里学知识。对于记忆误差,尽量缩短所涉及问题的时间范围。对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。7.怎样减少无回答?请通过一个例子,说明你所考虑到的减少无回答的具体措施。对于随机误差,可以通过增加样本容量来控制。对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。无回采取补救措施。比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高第三章数据的图表搜集一、思考题3.2分类数据和顺序数据的整理和显示方如果是两个或两个以上变量可以制作交叉表.对于分类数据可以绘制条形图、帕累托图、饼对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率.可根据需要绘制条形图、饼图、环形图等。3。3数值型数据的分组方法有哪些?简述组距分组的步骤.答:单变量值分组和组距分组。其中组距分组:第一步,确定组数,组数多少由数据的根据分组整理出频数分布表,注意遵循“不重不漏"和“上限不在内”的原则.答:1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示型数据.3。5绘制线图应注意问题?0开始,数据与0距离过大的话用折断符号折断。3。6饼图和环形图的不同?答:饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总3.7茎叶图比直方图的优势,他们各自的应用场合?3表中的上下两条横线一般用粗线,中间的其他用细线(1)表中数据属于顺序数据。(2)用Excel制作一张频数分布表.服务等级家庭数目(个)(3)绘制一张条形图,反映评价等级的分布。)个30(数家0家服务等级好较好一般较差差服务等级服务等级的条形图(4)绘制评价等级的帕累托图。率0一般较好较差差好其他售后服务等级的帕累托图150.00%100.00%50.00%0.00%频3.2某行业管理局所属40个企业2002年的产品销售收入数据如下:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。组距最大值—最小值)÷组数=(152—87)÷6=10。83,取103、分组频数表销售收入销售收入频率%向上累计频率%252537。55922。5782。5492。525。097。51-—企业进行分组.频率%向上累计频率%先进企业一般企业977。5落后企业9-—3.3某百货公司连续40天的商品销售额如下:单位:万元要求:根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。组距最大值—最小值)÷组数=(49—25)÷6=4,取53、分组频数表(根据实际资料,调整成分5个组)销售收入(万元)频率%44662。5922。56--频率(天)频率(天)5030-3535-4040-4545以上商店40天销售额的直方图150.00%100.00%50.00%0.00%频率累积%销售额(万元)30以下3.4利用下面的数据构建茎叶图和箱线图。答:茎叶图FrequencyStem&Leaf68889993。00箱线图灯泡寿命灯泡寿命22%660-67057%670-680613%680-690690—70084%720—73094%730—740397%3—直方图频率(个)50120.00%100.00%80.00%60.00%40.00%20.00%0.00%灯泡寿命(小时)灯泡寿命的直方图从直方图看,数据的分布呈左偏分布.2,取k=7组距最大值—最小值)÷组数=(61—40)÷7=3,取33、分组频数表(根据实际资料,调整成分5个组)频率%33439977——520.00%00.00%43以下43-4646-4949-5252-5555-5858以上食品重量的直方图从直方图看,数据的分布呈双峰分布.频率%向上累计频率%557849-59969—79624-—率频50误差的直方图从直方图看,数据的分布呈左偏分布,取k=7组距最大值—最小值)÷组数=(9+25)÷7=4.86,取5气温(℃)气温(℃)(ℴ25,-20)66840.00(-10.-5)(ℴ5.0)(0,5)4(5,10)7——50气温的直方图从直方图看,数据的分布呈左偏分布.年龄分布直方图年龄分布直方图5018~1920~2122~2425~2930~3435~3940~4445~59自学考试人员年龄分布集中在20-24之间,分3。10503。12(1)复式条形图202086420优良中及格不及格人数人数环形图优良中良中(2)甲班成绩分布图近似正态分布,分布较均衡;乙班成绩分布图右偏.优20不及格5中及格中0福美来夏利捷达松花江富康哈飞路宝进口车销售排行前10名进口车销售排行前10名68603030230丰田现代日产奔驰宝马大众汽车克莱斯勒本田雷克萨斯6奥迪402080国产车销售排行前10名4%19%福美来夏利4%19%福美来夏利捷达松花江富康哈飞路宝高尔夫东方之子长安奥拓爱丽舍6%7%7%19%10%13%10%13%进口车销售排行前10名4%2%1%4%5%7%7%15%23%32%丰田现代奔驰宝马大众汽车克莱斯勒本田雷克萨斯奥迪国内生产总值国内生产总值01995199619971998199920002001200220032004第一、二、三产业国内生产总值8000070000600005000040000300002000001995199619971998199920002001200220032004第一产业第二产业第三产业第四章习题答案平均数:9.6(4)峰度—0.25,偏度—0.69(1)众数:19;23L位置=-=6.25.所以Q=19+0.25^0=19Q位置=75=18.75,所以Q=25+2^0。75=26。5(3)标准差:6。654.3(1)茎叶图略(3)第一种方式的离散系数v=-=─—=0.28第二种方式的离散系数v=-=─=0.10所以,第二种排队方式等待时间更集中。(4)选择第二种,因为平均等待的时间短,而且等待时间的集中程度高(2)QL位置==7。5.所以QL=258+0.25^3=258.75Q位置=90=22.5,所以Q=284+7^0.75=289.254.5.总成本/元总成本/元产品名称ABC单位成本产量ΣMifi6600甲企业总平均成本x=i=1=──=19.41(元)ΣMifi6255多,所以把总平均成本提高了。(x_x)2f400~500450421890022860ΣMifi51200Σ(x-x)2*f利润总额标准差σ=nΣ(M-x)4fii44Σ(M-x)3fΣ5(M-426.67)3fiiii33(3)不同,调查1000名的样本容量得到最4。8对于不同的总体的差异程度的比较采用标准差系数,计算如下:(1)女生的体重差异大,因为离散系数大;磅,标准差为11.05磅ii=i==i=ziiii;产量0。22。20可以看出,周一和周六两天生产线失去了控制。4.11(1)采用离散系数,因为如果比较身高差异,儿童和成年人属于不同的总体;所以,儿童的身高差异更大.4。12(1)对集中程度和离散程度分别评价,选择集中趋势数值大的,而且离散程度数值小数量的离散系数只有0.012,所以选择A方法。4。13(1)用离散系数(3)高科技⑴变量之间确实存在着数量上的依存关系;⑵变量之间数量上的关系是不确定、不严格强度如何?⑷样本所反映的变量之间的关系能否代表11.3.在进行相关分析时,对总体主要有以下两个假定:⑴两个变量之间是线性关系;⑵两个变量都是随机变量。间的相关系数r相等;⑶相关系数与原点和尺度无关;⑷相关系数是线性关联或线性相依的一个度量,它不能用于描述非线性关系;⑸相关系数只是两个变量之间线性关联的一个度数为零;但r=0不等于说两个变量是独立的。即零相关并不一定意味着独立性。11.5.在实际的客观现象分析研究中,相关系数一般都是利用样本数据计算的,因而关系数的可靠性,因此要进行显著性检验.11.6.相关系数显著性检验的步骤:⑴提出假设;⑵计算检11.7.回归模型是对统计关系进行定量描述的一种数学模型,例如:对于具有线性关系和误差项ε的方程称为回归模型。回归方程是对变量之间统计关系进行定量描述的一种数学表达式.指具有相关的随机变量和固定变量之间关系的方程.当总体回归系数未知时,必须用样本数据去估计,用样本统计量代替回归方程中的未知参数,就得到了估计的回归方程。互独立。即εN(0,2)。11.9.参数最小二乘法的基本原理是:因变量的观测值与估计值之间的离差平方和最分,是不能由回归直线来解释的部分。它们之间的关系是:总平方和=回归平方和+残差平方和.11.11.回归平方和占总平方和的比例称为判定系数。判定系数测量了回归直线对观测过均方回归与均方残差之比,构造F检验统计量,提出假设,根据显著性水平,作出判断。t检验是回归系数的显著性检验,要检验自变量对因变量的影响是否显著,通过构造t检验统计量,提出假设,根据显著性水平,作出判断。11.13.线性关系检验的步骤:⑴提出假设;H:β=0;⑵构造F检验统计量;s11.15.置信区间估计是对x的一个给定值x,求出y的平均值的区间估计。预测区00估计的区间长度通常较短,而预测区间估计的区间长度要长,也就是说,估计y的平均值比11.16.残差分析在回归分析中的作用:回归分析是确定两种或两种以上变量间的定量关系的一种统计分析方法.判断回归模型的拟合效果是回归分析的重要内容,在回归分析中,通常用残差分析来判断回归模型的拟合效果,并判定关于误差项的正态假设是否成立。二、练习题20020016012080400050100150产量从散点图可以看出,产量与生产费用之间为正的线性相关关系。计算检验的统计量222C2C绝原假设。表明产量与生产费用之间的线性关系显著.100100806040200010203040复习时间从散点图可以看出,复习时间与考试分数之间为正的线性相关关系。表明复习时间与考试分数之间有较强的正线性相关关系。=90%表示,在因变量y取值的变差中,有90%可以由x与y之间的线性关系来解s=0.5表示,当用x来预测y时,平均e11.51)散点图如下:66543210050010001500运送距离从散点图可以看出,运送距离与运送时间之间为正的线性相关关系。表明运送距离与运送时间之间有较强的正线性相关关系。MultipleR0.9489430。900492AdjustedRSquare0.888054标准误差0.480023观测值MSFSignificanceF72.395852.79E—05Coefficients标准误差P-value0.1181290。332620。74797XVariable10。0035850.0004218.5085752.79E-050。002613111.61)散点图如下:1400014000120001000080006000400020000010000200003000040000人均GDP从散点图可以看出,人均GDP与人均消费水平为正的线性相关关系。表明人均GDP与人均消费水平之间有非常强的正线性相关关系。MultipleR0.9981280.996259AdjustedRSquare0。995511标准误差247.3035观测值7方差分析MSFSignificanceF1568144496981750764814449692.91E—07Coefficients标准误差P-valueXVariable1734.69280。3086830.00845991E—071GDP每增加1元,人均消费水平平均增加0.308683元。均GDP决定的.性关系显著.置信区间为:20(x(xx)20Σ(xx)2in即(1990.7,2565。5)。(x(xx)20Σ(xx)200i27即(1580.3,2975。9)11.71)散点图如下:140140120100806040200020406080100航班正点率从散点图可以看出,航班正点率与被投诉次数之间为负的线性相关关系。MultipleR0。8686430。75454AdjustedRSquare0。723858标准误差观测值方差分析MSFSignificanceF24.591870。001108残差22Coefficients标准误差P-value430.18925.962029—4.95900.000337XVariable1—4。7006221%,(3)回归系数检验的P—Value=0.0011置信区间为:(x(xx)20Σ(xx)2in即(37.7,70.7)(x(xx)20Σ(xx)2in2即(7.6,100。8)MultipleR0.79510。6322AdjustedRSquare0.6117标准误差2.6858观测值方差分析dfSSMSFSignificanceF1223.1403223。140330.93322.79889E-05残差352。9855Coefficients标准误差P-valueXVariable149.31770。24920.04480。00000.00001R2=63.22%,表明在出租率的变差中被出租率与租金之间为63.22%,回归方程的拟合程度一般。估计标准误差s=2.6858表示,当用月租金来预测出租率时,平均的预测误差为2。e6858%,表明预测误差并不大。著。回归系数检验的P—value=0.0000<a=0.05,表明回归系数显著,即月租金是影响出租率的显著性因素.11.91)方差分析表中所缺的数值如下变差来源残差11422708。640158。071642866。67MS1422708。64015.807—F354.277—-SignificanceF2。17E-09—-表明汽车销售量的变差中有86.60%是由于广告费用的变动引起的。1每增加一个单位,销售量平均增加1.420211个单位.(5)由于SignificanceF=2.关系显著.MultipleR0.9681670.937348AdjustedRSquare0.916463标准误差3。809241观测值5方差分析dfSSMSFSignificanceF0.006785残差3443.53094Coefficients标准误差P-value4.399428XVariable12.3029320.3437476.6994910.006785e11.111)检验统计量:(4)根据相关系数与判定系数之间的关系可知,4(xx)2nn0Σ(xx)20i即(15。95,18.05)(2)预测区间为:011n(xx)20Σ(xx)2i2即(14。65,19.35)MultipleR0.9476630.898064AdjustedRSquare0.881075标准误差观测值8方差分析MSFSignificanceF残差167696215.50。000344Coefficients标准误差P—valueXVariable1-46.29182.096101—0。7.2705330.5024020(x(xx)20Σ(xx)2in2即(270.65,685。04).回归1回归1残差32.5210.50-0.5-1-1.5回归1残差210-0.5-1.5结论:回归1的残差基本上位于一条水平带中间,说明变量之间的线性假设以及对误差项正态假设是成立,用一元线性回归方程描述变量间的关系是合适的。(2)由于SignificanceF=0。020〈C=0.05,表明广告费支出与销售额之间的线性(3)残差图0XVariable1残差从图上看,关于误差项ε的假定不满足。kk销售额y销售额y400销售额y从广告费支出x与销售额y关系的散点图上看,用二次函数或其它曲线模型会更好.第十二章多元线性回归12.1解释多元回归模型、多元回归方程、估计的多元回归方程的含义。答:设因变量为y,k个自变量分别为x,x,…,x,描述因变量y如何依赖于自变ββ0本统计量本统计量 ,去估计回归方程中的未知参数β,β,…,β时,就得到了估计的多元回归方程=+x+x+…+x.答:(1)误差项ε是一个期望值为0的随机变量,即E(ε)=0。(3)误差项ε是一个服从正态分布的随机变量,且相互独立,即ε~N(0,σ2).12。3解释多重判定系数和调整的多重判定系数的含义和作用.答:多重判定系数R2是多元回归中的回归平方和占总平方和的比例,它是度量多元回归方程拟合程度的一个统计量,反映了在因变量的变差中被估计的回归方程所解释的比例。为避免增加自变量而高估R2,统计学家提出用样本量n和自变量的个数k去调整R2,计算出调整的多重判定系数R2=1(1a量和模型中自变量的个数进行调整后,在因变量的变差中被估计的回归方程所解释的比例。12。5多重共线性对回归分析有哪些影响?答:首先,变量之间高度相关时,可能会使回归的结果混乱,甚至会把分析引入歧途;其次,多重共线性可能对参数估计值的正负号产生影响,特别是β的正负号有可能同预期的i(2)当模型的线性关系检验(F检验)显著时,几乎所有回归系数β的t检验却不i(3)回归系数的正负号与预期的相反.答1)将一个或多个相关的自变量从模型中剔除,使保留的自变量尽可能不相关.(2)如果要在模型中保留所有的自变量,那就应该:避免根据t统计量对单个参数β进行检验;对因变量y值的推断(估计或预测)限定在自变量样本值的范围内。二、练习题1a表示,在x不变的条件下,x每增加1个单位,会使y平均减少0。049714个单位;928169个单位。多重判定系数R2和调整的多重判定系数R2显示:该多元回归方程的拟合效果较差,在a因变量y的变差中,能被估计的回归方程所解释的比例很少。t检验表明,自变量aa用样本量和模型中自变量的个数进行调整后,在因变量y的变差中,能被估计的回归方程所解释的比例为63。0463%.xx212xx313(3对因变量y的影响均显著,但x对因变量y的影响不显著。211221aa(3)上述(1)和(2)所建立的估计的回归方程,电视广告费用的系数符号相同但数值11表示,电视广告费用x表示,电视广告费用x1表示,在报纸广告费用x不变的条件下,电视广告费用x每增加1万元,会使月销售收入y平均增加2.290184万元.(4)根据问题(2)所建立的估计的回归方程,在月销售收入的总变差中,被估计的回归方程所解释的比例是88.6650%.(5)根据问题(2)所建立的估计的回归方程,,故β显著。1,故β显著.2a22.386461kg/hm2;。C,会使早稻收获量y平均增加327。671713kg/hm2。(3)可能存在.因为自变量春季降雨量x与春季温度x的简单线性相关系数为0.965067。且模型的线性关系检验(F检验)显著,但回归系数的t检验不显著。1a(2)在销售价格的总变差中,被估计的回归方程所解释的比例是87。83%.,故回归系数β不显著。1,故回归系数β显著。2,故二元回归模型的线性关系显著.,故β显著,22nn-21-r2xx2故无证据表明二者之间存在线性关系。y,x2xx1-r22故无证据表明二者之间存在线性关系。对预测y无用.a这与(3)所得结论不相同。x1,x2x2故无证据表明销售价格与购进价格之间存在线性关系。x2故无证据表明销售价格与销售费用之间存在线性关系。(2)根据(1)中结果,用购进价格和销售费用来预测销售价格无用。aF检验表明,y与x、x之间的线性关系不显著。t检验表明,自变量x、x对因变量y的影响均显著.(4)调整的多重判定系数R2显示:在用样本量和模型中自变量的个数进行调整后,在a因变量y的变差中,能被估计的回归方程所解释的比例仅为24。4537%.这与(2)中的判断x1,x2第十四章统计指数计量产量单位成本(元)报告期报告期报告期6基期6。2基期产品名称(1)计算产量与单位成本个体指数。(2)计算两种产品产量总指数以及由于产量增加而增加的生产费用.(3)计算两种产品单位成本总指数以及由于成本降低而节约的生产费用。解:指数(%)产量单位成本指数(%)产量单位成本台件报告期报告期单价(元)销售数量(2)分析销售量和价格变动对销售额影响的绝对值和相对值。q0q1p0p1 -Σpq31475Σpq31475Σpq28800Σpq-Σpq=28800-26000=2800(元)3.试根据下列资料分别用拉氏指数和帕氏指数计算销售量指数及价格指数。基期报告期销售数量基期报告期甲乙丙甲乙丙销售量Σpq0.40。360.50。6Σpqp1pqpq10=—销售量指数Σpq480Σpq11=Σ11=4。某公司三种产品的有关资料如下表,试问三种产品产量平均增长了多少,产量增长产品名称个体产量指数产品名称个体产量指数基期产值(万元)报告期产值(万元)解:q1q0qkqΣqpΣq1=Σq1p0=Σp
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 煤矿木材采购合同范例
- 天津滨海职业学院《自主移动机器人》2023-2024学年第一学期期末试卷
- 帐篷加工承揽合同范例
- 耐磨地坪漆施工方案
- 天府新区信息职业学院《生物化学(5)》2023-2024学年第一学期期末试卷
- 天津渤海职业技术学院《系统管理》2023-2024学年第一学期期末试卷
- 公司货架改造合同范例
- 特许经营权合同范例
- 企业推广策划服务合同范例
- 考试二类职业适应性测试模拟练习题(附答案)
- 2024年中国电信山东分公司招聘笔试参考题库含答案解析
- 2023年江苏省普通高中学业水平信息技术模拟试卷
- 电子银行案防自我评估报告
- 小学科学实验图片大全
- 体育教研室教学大纲-身体运动功能训练
- 肿瘤微环境与结直肠癌
- 液压与气压传动课程设计
- 专题05 探索与表达规律(解析版)
- 重庆医科大学人体机能学实验报告
- 中金所杯全国大学生金融知识大赛题库及答案(单选题)
- 疼痛科护士职业规划书
评论
0/150
提交评论