数据分析师CPDA复习主观题.ppt_第1页
数据分析师CPDA复习主观题.ppt_第2页
数据分析师CPDA复习主观题.ppt_第3页
数据分析师CPDA复习主观题.ppt_第4页
数据分析师CPDA复习主观题.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复习大题,中国商业联合会数据分析专业委员会 数据分析师认证培训课程,主观题1,一元回归,复习题:,主观题1,一元回归,复习题: (1)绘制散点图,并计算相关系数,说明二者之间的关系; 步骤:展示分析-散点图,主观题1,一元回归,复习题: (1)绘制散点图,并计算相关系数,说明二者之间的关系; 步骤:展示分析-散点图-计算相关系数,Excel,Datahoop,相关系数的值介于-1与+1之间,即-1r+1。 当r0时,表示两变量正相关,当r0时,表示两变量为负相关。当|r|=1时,表示 两变量为完全线性相关即函数关系。当r=1时,称为完全正相关,而当r=-1时,称为完全负相关。当r=0时,表示两

2、变量间无线性相关关系。 r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。 r虽然是两个变量之间线性关系的一个度量,却不一定意味着x与y一定有因果关系。 当r0.8时,可视为高度相关;当0.5r0.8时,可视为中度相关;当0.3r0.5时,视为低度相关;当r0.3时,说明两个变量之间的相关程度极弱。,人均GDP与人均消费水平间的相关系数为0.998,说明两者间存在强烈的正相关关系。,主观题1,一元回归,复习题: (2)人均GDP作自变量,人均消费水平作因变量,求出估计的回归方程,并解释回归系数的实际意义;,Excel:,利用系数表中的结果,回归方程为 ,其含义是人均GDP每增加1

3、元,人均消费水平增加0.309元。,主观题1,一元回归,复习题: (3)计算判定系数,并解释其意义;,R2:判定系数/拟合优度(Y的总变动由X带来的有多少),Excel:,判定系数是0.996,说明方程解释人均消费水平变化的99.6%可以由人均GDP的变化来解释。,主观题1,一元回归,复习题: (4)检验回归方程线性关系的显著性(a=0.05);,F检验:回归线性关系检验(P值),T检验:回归系数检验(X对y的影响),小于拒绝,大于不拒绝:原假设,假设,Excel:,系数表中的Sig./P-value值a,说明回归方程的线性关系显著性。,主观题1,一元回归,复习题: (5)如果某地区的人均GD

4、P为5000元,预测其人均消费水平; 步骤:预测分析,Excel输入公式得出结果,人均GDP为5000元时,人均消费水平为2278.107元,主观题1,一元回归,复习题: (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。,人均消费水平95%的置信区间为1990.749,2565.464和预测区间为1580.463,2975.75。,主观题2,多元回归,复习题:,主观题2,多元回归,复习题: 分析,主观题2,多元回归,复习题: 分析,R2:判定系数/拟合优度(Y的总变动由X1、X2、X3带来的有多少,每增加一个变量,不管相不相关,拟合优度就会提高,因此要调整拟合优度),

5、F检验:回归线性关系检验(概率P值/sig) 原假设H0:所有系数都为0 H1:至少一个不为0,T检验:回归系数检验(X1、X2、X3对y的各自影响) 多重共线性-,主观题2,多元回归,复习题: 分析,主观题2,多元回归,复习题: 分析,去掉X1,主观题2,多元回归,复习题: 分析,单独X2,单独X3,主观题2,多元回归,复习题: 分析,销售价格的预测值以及95%的置信区间和预测区间见上表。,回归方程为,去掉的原则之一:模型对数据较好的拟合,如果去掉后拟合数据差异较大就不合适去掉,主观题3,哑变量回归,复习题:,主观题3,哑变量回归,分析:,回归方程为 y=732.06+111.22x1+45

6、8.68x2 男性职工的平均月薪是732.06+458.68=1191,女性职工的平均月薪是732.06, 男性职工的平均月薪与女性职工的平均月薪之间的差值是 458.68 。 工龄每增加1年,男性或女性月薪的平均增加值111.22 。,主观题4,已知某厂家的产量和生产费用数据,如下表,请根据生产费用和产量数据进行如下分析:(所有结果保留两位小数),(1)请用生产费用作为因变量(Y),产量作为自变量(X),利用线性回归最小二乘法估计回归方程,显著性水平=0.05,根据分析结果判断是否可以做线性回归,并解释原因,列出回归方程,并且解释回归系数的实际意义。 (2)根据回归分析结果,写出判定系数(R

7、2)的值,并解释其值代表的实际意义。(提示:列出调整后的R2) (3)请根据第一问中求得的回归方程,估计如果产量为180,估计生产费用。,主观题4,(1)请用生产费用作为因变量(Y),产量作为自变量(X),利用线性回归最小二乘法估计回归方程,显著性水平=0.05,根据分析结果判断是否可以做线性回归,并解释原因,列出回归方程,并且解释回归系数的实际意义。,:通过线性回归分析结果可以看出,线性回归方程Y=aX+b检验结果F检验p值=3.06*10-9,X回归系数检验结果p=3.06*10-9,均小于0.05,因此F检验和T检验均通过,所以可以做线性回归,根据结果列出回归方程为Y=5.12X+276

8、.24。 其中X的系数为5.12,截距为276.24,因此可以看出产量增加1,,生产费用增加5.12。 得分点:列出F检验的p值和X系数检验的p值;列出回归方程Y=5.12X+276.24;解释含义,主观题4,(2)根据回归分析结果,写出判定系数(R2)的值,并解释其值代表的实际意义。(提示:列出调整后的R2),:根据回归结果可以看出调整后的R2=0.86,R2代表模型的拟合度,它越接近1代表拟合度越好,根据此模型的R2的值可以看出模型拟合度良好。 得分点:列出R2的值;解释含义,主观题4,(3)请根据第一问中求得的回归方程,估计如果产量为180,估计生产费用。,根据题目可知,当X=180时,

9、Y=5.12*180+276.24=1197.84,Datahoop预测分析:,主观题5,一家货物运输公司想研究运输费用与货物类型的关系,并建立运输费用与货物类型的回归模型,以此对运费作出预测。 该运输公司所运输的货物分为两种类型:易碎品和非易碎品。下表给出了15个路程大致相同、而货物类型不同的运输费用数据,(1)写出运输费用与货物类型之间的线性方程。 (2)对模型中的回归系数进行解释。 (3)检验模型的线性关系是否显著(a=0.05),主观题5,(1)写出运输费用与货物类型之间的线性方程。,回归方程:y=4.543+7.082x,主观题5,(2)对模型中的回归系数进行解释。 回归方程:y=4

10、.543+7.082x,解释:“易碎品”的预期运输费用比非易碎品的预期运输费用多7.082元,(3)检验模型的线性关系是否显著(a=0.05),p0.05,所以通过检验,主观题6,某厂生产甲乙两种产品,都经过A、B两个工序,分别有A1、A2和B1、B2两台设备。甲产品可在A、B任何一种设备上加工,乙产品可在工序A的任一种设备上加工,但B工序只能在B1设备上加工。单位产品的工序加工时间、原材料费用、售价,以及各设备的单位时间加工费用、设备有效使用时间如下表所示。 要求:合理安排生产计划,使该厂获利最大。,主观题6,1.列生产计划方案:,变量设置:甲产品的四种方案A1B1、A1B2、A2B1、A2

11、B2的产量分别为X11、X12、X21、X22;乙产品的两种方案A1B1、A2B1的产量分别为Y11、Y21,2.目标函数: 获利=收入-成本(两项:原材料和设备加工费) 收入-原材料成本 (1.25-0.25)*(x11+x12+x21+x22)+(2-0.35)*(y11+y21) 设备加工费 0.05*(x11+x12)*5+y11*10)+0.03*(x21+x22)*7+y21*9)+0.06*(x11+x21)*6+(y11+y21)*8)+0.11*(x12+x22)*4,max(1.25-0.25)*(x11+x12+x21+x22)+(2-0.35)*(y11+y21)-0.

12、05*(x11+x12)*5+y11*10)-0.03*(x21+x22)*7+y21*9)-0.06*(x11+x21)*6+(y11+y21)*8)-0.11*(x12+x22)*4,主观题6,规划结果:X11、X12、X21、X22分别为0、965、0、785,Y11、Y21分别为0、500,总利润为1023.9元。,约束条件:5*(x11+x12)+10*y11=0,且为整数,主观题7,某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。,主观题7,某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成

13、时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。,主观题7,某公司生产某种铸件,如下为该铸件的制造作业,各作业计划完成时间以及各作业的紧前作业。指定用PERT图和线性规划的方法求解下面的问题。,主观题8,假设一个地区的总悬浮微粒(TSP)来源于当地的三个工厂。若工厂1 和工厂2 燃煤TSP 排放因子为95kg/t(煤),工厂3 的TSP 排放因子为85kg/t(产品)。工厂3 产量为250000 t (产品)/a,工厂1 和工厂2 的燃煤量分别为400,000 t/a 和300,000t/a,为了满足环境质量要求,TSP 最大允许排放量为17,600 ,000kg/a,各种除尘设备效率和各种除尘方法的费用如下表所示: 要求:以最小的治理费用达到环境目标。,主观题8,变量设置:工厂1四种方案X10X11X14X15费用分别为C100.0,C111.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论