数学建模统计分析_第1页
数学建模统计分析_第2页
数学建模统计分析_第3页
数学建模统计分析_第4页
数学建模统计分析_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数学建模统计分析第一页,共八十页,编辑于2023年,星期六SPSS是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”,标志着SPSS的战略方向正在做出重大调整。

第二页,共八十页,编辑于2023年,星期六非专业统计人员的首选统计软件SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。第三页,共八十页,编辑于2023年,星期六SPSS的功能样本数据的描述和预处理;假设检验(包括参数检验、非参数检验及其他检验);方差分析相关分析回归分析聚类分析判别分析因子分析时间序列分析可靠性分析第四页,共八十页,编辑于2023年,星期六应用广泛的应用于统计、应用数学、经济、市场营销、心理、卫生统计、生物、企业管理、气象、社会学等领域。其分析过程包括:调查设计、数据收集、数据存取和管理、数据分析、数据检验、数据挖掘、数据展示等。还有一系列附加模块和独立模块产品以加强它的分析功能。它的图形窗口界面使其非常简单易用但却具有满足各种分析要求的数据管理、统计分析功能及各种报表方法。第五页,共八十页,编辑于2023年,星期六SPSS的窗口类型数据编辑窗口程序编辑窗口输出窗口简式输出窗口第六页,共八十页,编辑于2023年,星期六1、数据编辑窗口:(1)启动SPSS直接进入

(2)文件→新建→数据文件

File/New/Data第七页,共八十页,编辑于2023年,星期六2、程序编辑窗口:文件→新建→语句文件

File/New/Syntax第八页,共八十页,编辑于2023年,星期六3、输出窗口:

现实统计方法运行输出的结果,对输出结果可以进行模块裁剪、编辑、存档等第九页,共八十页,编辑于2023年,星期六第1节描述统计设变量X有一组观测数据x1,,x2,…,xn,常用的描述统计量有:(1)中心趋势:平均值、中位数、众数、和(2)离中趋势:方差、标准差、最大最小值、极差(3)百分位数:四分位数、给定间距的等间距分位数(4)分布度统计量:偏态度、峰态度第十页,共八十页,编辑于2023年,星期六利用频数分析可以方便地对数据按组进行归纳整理,对变量的数据有一个整体上的认识。(1)建立数据文件:例1.sav(2)选择统计方法:Analyze→DescriptiveStatistics→Frequencies,送入变量,点击确定(3)输出结果:例1:对某大学10名学生测量他们的血压x,得到如下数据:120120120134128102130132126126第2节频数分析第十一页,共八十页,编辑于2023年,星期六其他:描述统计分析Descriptive等

,图表

第十二页,共八十页,编辑于2023年,星期六SPSS统计图第十三页,共八十页,编辑于2023年,星期六SPSS统计图1单个变量的频数统计图例2:测量30株小麦的株高x得到如下数据(单位:cm):例2.sav(1)频数直方图(加上一条正态曲线,直观比较频数图与正态分布的差异程度。)(2)频数连线图:简单2两个变量的统计图对两个变量(x,y)的样本,作图观察两个变量的关系例3某研究所对200只北京鸭进行实验,得到的周龄(x)与平均日增重(y)的数据,对(x,y)作出散点图,拟合线Smoother第十四页,共八十页,编辑于2023年,星期六条图散点图线图直方图饼图面积图箱式图正态Q-Q图正态P-P图质量控制图Pareto图自回归曲线图高低图

交互相关图序列图频谱图误差线图

统计图汇总第十五页,共八十页,编辑于2023年,星期六

第3节

参数检验与置信区间提出原假设:选择统计方法:Analyze→Means→One-simpleTtest,在底部Testvalue框输入检验值100具体判断:根据t分布计算出显著性概率(在许多书中称为P值),SPSS中为sig.对于给定的显著性水平,若sig.<,则拒绝原假设,即认为打包机的工作不正常。否则,接受原假设,认为工作正常。例4

某糖厂用自动包装机装糖,其装糖量服从正态分布,且每包标准重量为100kg.某天开工后,需对打包机工作进行鉴定,测得9包糖的重量(kg)为:数据例4.sav(1)这天打包机的工作是否正常?()

(2)求这天打包机平均装糖重量的置信区间第十六页,共八十页,编辑于2023年,星期六单一样本T检验结果分析样本个数9,样本均值99.978,样本标准差1.2122,

样本均值标准误差0.4041显著性概率0.957>0.05,接受H0;

平均差95%的置信区间为(-0.954,0.910),则均值的95%置信区间为(100-0.954,100+0.910)第十七页,共八十页,编辑于2023年,星期六均数间的比较-CompareMeans菜单详解1Means过程求分类变量的综合描述统计量,目的在于比较2One-SamplesTTest过程检验单个变量的均值是否与给定的常数之间存在差异。3Independent-SamplesTTest过程

检验两个不相关的样本来自具有相同均值的总体,例如想知道购买某产品的顾客与不购买该产品的顾客的平均收入是否相同。4Paired-SamplesTTest过程检验两个相关的样本是否来自具有相同均值的总体。常用与被观测对象在实验前后是否有差异。5One-WayANOVA过程单因素方差分析,在下节介绍。第十八页,共八十页,编辑于2023年,星期六第4节方差分析第十九页,共八十页,编辑于2023年,星期六方差分析概述

一个事物的变化总是某些因素影响的结果。例如,某种农作物的收获量受到种子品种、土质、施肥量以及气候等因素的影响。在众多因素中,有些因素影响大些,有些则小些。在现实生活中常常要找到有显著影响的那些因素,以便更有效地组织生产。

方差分析从分析数据的差异入手,分析哪些因素是影响数据差异的众多因素中的主要因素.

第二十页,共八十页,编辑于2023年,星期六方差分析概述

方差分析正是要分析观测变量的变动主要是由控制因素造成的还是由随机因素造成的,以及控制变量的各个水平是如何对观测变量造成影响的.相关概念:

(1)观测变量:作为观测的对象(如:亩产量、推销量等).

(2)控制因素:人为可以控制的因素(如:施肥量、品种、推销策略、价格、包装方式等),在方差分析中称为控制因素.将控制变量的不同情况称为控制变量的不同水平.

(3)随机因素:人为很难控制的因素(如:气候、推销人员的形象、抽样误差等),方差分析中主要指抽样误差。第二十一页,共八十页,编辑于2023年,星期六核心问题从数据差异角度看:观测变量的数据差异(ST)=控制因素不同水平造成(组间差异SB)+随机因素造成(组内差异SW)当控制因素对实验结果有显著影响时,和随机因素共同作用必然使观测变量产生显著变动;反之,观测变量的变动较小,将归结为随机性造成的(这里指抽样误差造成的).第二十二页,共八十页,编辑于2023年,星期六方差分析概述方差分析的类型单因素方差分析:只考虑一个控制因素的影响多因素方差分析:考虑两个以上的控制因素和它们的交互作用对观测变量的影响协方差分析:在尽量排除其他因素的影响下,分析单个或多个控制因素对观测变量的影响.(引入协变量)第二十三页,共八十页,编辑于2023年,星期六例5用四种饲料喂猪,共19头猪分为4组,每组用一种饲料。一段时间后沉重,猪体重增加数据(见下表)比较四种饲料对猪体重增加的作用有无不同。

观测变量:猪体重增加量;控制因素:饲料该问题是考察饲料这一个控制因素的变化对猪体重增加是否有显著性影响。通常把饲料因素A

的四个不同的变化,分别记为A1、A2、A3、A4,成为A的4个不同水平。把观测变量记为X,而第i种饲料在第j次试验下增加的体重记为xij,即因素的第i个水平的第j次观测(试验)值为xij,问因素A的变化对观测变量X的变化是否有显著性影响?第二十四页,共八十页,编辑于2023年,星期六…ni………………x3kx33x32x313x2k…x32x22x212x1k…x31x21观测值x11j=1Ak…A3A2水平A1第二十五页,共八十页,编辑于2023年,星期六1、基本原理设表示在水平下观测值的真实平均值,则在下每次观测结果应该是在真实平均值的左右随机波动,这个随机波动量记为,因此,方差分析的数学模型为,;其中相互独立且,是在每个水平下重复进行试验的次数,为未知。研究因素A的影响是否显著,归结不同水平下的总体是否具有相同的均值,也即要检验统计假设:拒绝则认为不同水平有显著性差异。具体判断:根据F分布计算出显著性概率sig.若sig.<

显著性水平,则拒绝原假设。第二十六页,共八十页,编辑于2023年,星期六~F(k-1,n-k)总均值:其中:第i种水平组均值:总偏差平方和:组间偏差平方和:自由度为:组内偏差平方和:自由度为:第二十七页,共八十页,编辑于2023年,星期六假设检验P值判别法F值临界值F值P值临界值法:F>F,拒绝原假设H0P值法:P<,拒绝原假设H0P值法更灵活第二十八页,共八十页,编辑于2023年,星期六一维方差分析步骤1、编辑数据文件:定义两个数值型变量,一个为因素变量(也成为分组变量)fodder(饲料),要求是数值型变量,有四个不同水平1,2,3,4;一个为观测变量weight(体重),输入数据。保存为:例5.sav2、选择统计方法:Analyze→CompareMeans→One-WayANOVA将weight送入因变量列框,将fodder送入因子(因素)框,点击“确定”3、输出结果:sig.=0.000<0.05,认为不同饲料对猪体重增加的作用有显著不同。第二十九页,共八十页,编辑于2023年,星期六方差分析其他选项方差齐性检验:分析所研究的问题是否满足方差分析模型。Sig.=0.995>0.05,认为满足方差分析模型。第三十页,共八十页,编辑于2023年,星期六多重比较检验:两两不同水平进行比较,看是否有显著差异。检验假设为无显著差异。选择PostHot…按钮当方差齐性检验显著时,选LSD;当方差齐性检验不显著时,选Tamhane’sT2,用t检验进行配对比较表中用*标示的组均值在0.05水平上有显著性差异第三十一页,共八十页,编辑于2023年,星期六例6同种三叶草被接种上不同的菌种测量三叶草植物中的含氮量。每组数据中的前面一个是菌种代码,变量名是strain,数值型变量。后一个是含氮量nitrogen。分析不同细菌对三叶草含氮量的影响。(数据例6.sav)第三十二页,共八十页,编辑于2023年,星期六第三十三页,共八十页,编辑于2023年,星期六练习1对6种不同的农药在相同的条件下分别进行杀虫试验,试验结果(杀虫率)如下表:

农药试验号A1A2A3A4A5A61879056559275285886248997238087958149491问杀虫率是否因农药的不同而有显著性的差异(显著性水平为0.01)?第三十四页,共八十页,编辑于2023年,星期六数据文件:练习1.sav选择方法:一维方差分析,方差齐性检验,多重比较检验LSD结果分析:方差是齐性的,不同农药的杀虫率有显著性差异第三十五页,共八十页,编辑于2023年,星期六单因变量多因素方差分析温度B浓度AB1B2B3B4A121,2322,2325,2327,25A223,2526,2428,2726,24A326,2329,2724,2524,23对一个独立变量是否受到多个因素或变量影响而进行的方差分析,在这个过程中,可以分析每一个因素的作用,也可以分析因素之间的交互作用。例7在某化工厂产品的生产过程中,对三种浓度、四种温度的每一种搭配重复试验2次,测得产量如下表。试检验不同的浓度,不同的温度以及它们之间的的交互作用对产量有无显著性影响.(完全随机化设计)第三十六页,共八十页,编辑于2023年,星期六编辑数据文件:例7.sav选择方法:Analyze→GeneralLinearModel→Univariate,送入变量结果分析:浓度A因素的sig.=0.042<0.05,认为浓度对产量有显著性影响;温度B因素sig.=0.116>0.05,认为温度对产量无显著性影响;A与B的交互作用a*b的sig.=0.016<0.05,认为交互作用对产量有显著性影响。第三十七页,共八十页,编辑于2023年,星期六一般线性模型――GeneralLinearModel菜单详解1两因素方差分析univarate对话框界面说明结果解释2协方差分析分析步骤结果解释3其他较简单的方差分析问题4多元方差分析分析步骤结果解释5重复测量的方差分析Repeatedmeasures对话框界面说明结果解释

第三十八页,共八十页,编辑于2023年,星期六区组号A营养素B营养素C营养素150.1058.2064.50247.8048.5062.40353.1053.8058.60463.5064.2072.50571.2068.4079.30641.4045.7038.40761.9053.0051.20842.2039.8046.20练习2对小白鼠喂以A、B、C三种不同的营养素,目的是了解不同营养素增重的效果。采用随机区组设计方法(无重复试验),以窝别作为划分区组的特征,以消除遗传因素对体重增长的影响。现将同品系同体重的24只小白鼠分为8个区组,每个区组3只小白鼠。三周后体重增量结果(克)列于下表,问小白鼠经三种不同营养素喂养后所增体重有无差别?第三十九页,共八十页,编辑于2023年,星期六步骤Analyze→GeneralLinealmodel→UnivariateDependentVariable框:选入weightFixedFactors框:选入group和foodModel钮:单击选择自定义Custom在BuildTerms的参数框中选择Maineffects定义主效应,将group和food送入effectModel框单击OK不同窝别对体重增加有显著影响,即遗传因素作用;不同营养素对体重增加无显著性差异。第四十页,共八十页,编辑于2023年,星期六协方差分析

例如考虑药物对患者某个生化指标变化的影响,要比较实验组和对照组该指标的变化均值是否有显著性差异以确定药物的有效性,可能要考虑患者病程的长短、年龄以及原指标水平对疗效的影响。要消除这些因素的影响,考虑药物疗效,才是科学的分析方法。

有些实验可以考虑观测对象的选择,使这些条件都一致,例如选择同品种、同一胎的大白鼠分组,在相同的饲养条件下进行实验,可以相应地避免许多混杂因素的影响。其他实验很难避免,因此要考虑使用协方差分析方法。这些混杂因素变量称为协变量。

协方差分析中要求因变量应该是等间隔测量的变量(Scale型),理论上要求正态分布。因素变量是分类变量,并且相互独立。协变量是与因变量存在一定相关关系的等间隔测量的变量,是否线性相关,可以通过经验或作散点图来做初步的直观判断。第四十一页,共八十页,编辑于2023年,星期六例8本例采用镉作业工人年龄与肺活量的资料镉作业工人按暴露于镉粉尘的年数分为大于等于10年和不足10年两组。两组工人的年龄未经控制(人随着年龄的增长,肺活量也会有所下降),测量了每个工人的肺活量。数据变量:time(接触粉尘时间分组)取值1代表大于等于10年,2代表不足10年;age(年龄);vitalcp(肺活量,单位:升)操作步骤:Analyze→GeneralLinealmodel→Univariatevitalcp选入DependentVariable作为因变量time选入FixedFactors作为因素变量age选入Covariate(s)作为协变量Options单选钮:time移入右侧框,选择显示参数估计在Displays栏内选中ParameterEstimates,要求输出年龄做自变量,肺活量做因变量的线性回归方程的系数。OK第四十二页,共八十页,编辑于2023年,星期六结果分析方差分析表:time的sig.=0.330>0.05,age的sig.=0.000<0.001.因此得出结论,肺活量的差异是由于被试者的年龄差异所致,与被试者接触镉粉尘的时间是否大于10年无关。参数估计值输出结果:age作为自变量,vitaclp作为因变量的线性回归方程的斜率为-0.087.也符合生理常识,即成年人随着年龄的增长,肺活量有所下降。按时间分组的肺活量均值表:10年以下的均值为3.919,10年以上的均值为4.291.协方差分析结果表明,这两组肺活量均值无显著差异。

第四十三页,共八十页,编辑于2023年,星期六方差分析应用小结:单因素方差分析:只考虑一个控制因素的影响多因素方差分析:考虑两个以上的控制因素和它们的交互作用对观测变量的影响协方差分析:在尽量排除其他因素的影响下,分析单个或多个控制因素对观测变量的影响.(引入协变量)第四十四页,共八十页,编辑于2023年,星期六练习数据:练习3.sav是474个职工的数据。试分析银行职员(jobcat)起始工资是否与职工的性别、民族有关?分析时考虑其他因素的影响。第四十五页,共八十页,编辑于2023年,星期六第5节回归分析第四十六页,共八十页,编辑于2023年,星期六变量之间的联系确定型的关系:指某一个或某几个现象的变动必然会引起另一个现象确定的变动,他们之间的关系可以使用数学函数式确切地表达出来,即y=f(x)。当知道x的数值时,就可以计算出确切的y值来。如圆的周长与半径的关系:周长=2πr。非确定关系:例如,在发育阶段,随年龄的增长,人的身高会增加。但不能根据年龄找到确定的身高,即不能得出11岁儿童身高一定就是1.40米公分。年龄与身高的关系不能用一般的函数关系来表达。研究变量之间既存在又不确定的相互关系及其密切程度的分析称为相关分析。第四十七页,共八十页,编辑于2023年,星期六回归分析如果把其中的一些因素作为自变量,而另一些随自变量的变化而变化的变量作为因变量,研究他们之间的非确定因果关系,这种分析就称为回归分析。回归分析是研究一个自变量或多个自变量与一个因变量之间是否存在某种线性关系或非线性关系的一种统计学方法。第四十八页,共八十页,编辑于2023年,星期六回归分析线性回归分析;曲线回归分析;二维Logistic回归分析;多维Logistic回归分析;概率单位回归分析;非线性回归分析;权重估计分析;二阶段最小二乘分析;最优尺度回归。第四十九页,共八十页,编辑于2023年,星期六5.1一元线性回归基本问题

例9某公司近年来科研支出x与利润y的统计资料如下表(单位:10万元)。将x与y的数据绘制出散点图,观察x与y具有线性关系。计算出y关于x的线性回归模型y=ax+b,并检验该模型是否显著以及给出模型的标准误差。科研支出x5114532利润y314030342520第五十页,共八十页,编辑于2023年,星期六问题分析一般地,设变量x与y适合线性回归模型对x和y进行观察试验,得到n组数据(x1,y1)、(x2,y2)、…、(xn,yn).我们的任务是:(1)计算y关于x的线性回归模型y=a+bx(2)提出假设:H0:a=b=0(不是线性回归模型)(3)计算模型的标准误差。基本原理:根据最小二乘法原理,选择a,b,使Q(a,b)=∑(yi-a-bxi)2达到最小值,由此解出a,b第五十一页,共八十页,编辑于2023年,星期六选择方法:Analyze→Regression→Linear→将y送入Dependent框,将x送入Independent(s)框→ok第五十二页,共八十页,编辑于2023年,星期六结果分析判定系数R=0.909,R2=0.826,说明y有82.6%是由变量x引起的方差分析表:对回归模型进行显著性检验,回归显著性概率sig.=0.012<0.05,所以回归显著。第五十三页,共八十页,编辑于2023年,星期六回归模型为:y=20+2xStd.Error列为相应回归系数的标准误差。鉴于模型的各项检验均有显著性,可以认为该模型是一个较好的模型第五十四页,共八十页,编辑于2023年,星期六用“Statistics”按钮设置相关参数:√第五十五页,共八十页,编辑于2023年,星期六增加结果分析第五十六页,共八十页,编辑于2023年,星期六5.2多元线性回归模型一个因变量,多个自变量的回归模型

y^=b0+b1x1+…+bnxn

其中y^为根据所有自变量x计算出的估计值,b0为常数项,b1、b2····bn称为y对应于x1、x2···

xn的偏回归系数。提出假设为:b0=b1=b2=····=bn=0

偏回归系数表示假设在其他所有自变量不变的情况下,某一个自变量变化引起因变量变化的比率。第五十七页,共八十页,编辑于2023年,星期六筛选变量:当模型中包含变量较多且有不重要变量时,要对变量进行筛选。变量选择是否恰当,是选择最佳模型的关键。(1)全模型法,即强行进入法,将指定的变量全部放入回归方程中,不管变量在模型中的作用是否显著。(2)消去法,根据设定的条件剔除部分变量(3)向前引进变量法,按显著性大的优选的原则选入变量(4)向后剔除变量法,与(3)相反(5)逐步回归法,每选入一个变量,立即对前一个引进的变量进行显著性检验,及时剔除不显著的变量,再考虑引进新的变量。是一种较理想的选模方法。第五十八页,共八十页,编辑于2023年,星期六例10某水泥厂在凝固时放出的热量y与水泥中下列四种化学成分有关。x1:3CaO·Al2O3的成分(%)x2:3CaO·SiO2的成分(%)x3:4CaO·Al2O3·Fe2O3的成分(%)x4:2CaO·SiO2的成分(%)

观测得数据:例10.sav,试求y对x1,x2,x3,x4的最佳线性模型。选择统计方法:Analyze→Regression→Linear选入因变量和自变量(1)系统默认强行进入法Enter

结果分析:回归模型的显著性概率sig.=0.000<0.01,回归模型非常显著。但回归系数b1,b2,b3,b4相应的显著性概率分别为0.071,0.501,0.896,0.844,均>0.05,所以没有一个变量在模型中是重要变量。因此需要对变量进行筛选。(2)改用逐步回归法Stepwise

结果分析:第一次引进x4,第二次引进x1,引进的变量没有被剔除第一模型为y=492.233-3.091x4,第二模型为y=431.648-2.571x4+6.029x1

相关系数有明显提高,标准误差有明显减少。两个模型的回归检验均具有非常高的显著性,回归系数均具有非常高的显著性,即为重要变量。没有引进的变量均不显著。可以认为第二模型为最好模型。第五十九页,共八十页,编辑于2023年,星期六练习3使用数据:练习3.sav,建立一个以初始工资、工作经验、受教育年数等为自变量,当前工资为因变量的回归模型。第六十页,共八十页,编辑于2023年,星期六5.3曲线回归模型在实际中,变量与变量之间的相关关系并非一定是线性相关,非线性相关关系的情形也会常常遇到。例11

某研究所对200只鸭子进行试验,得到鸭子的周龄x与平均日增重y的数据(前例3),从散点图看到x与y呈现出曲线的相关关系。我们希望计算出x与y的曲线模型y=f(x),并检验该模型的显著性以及计算它的标准误差。第六十一页,共八十页,编辑于2023年,星期六基本原理:解决曲线回归模型的基本方法是将曲线回归模型转化为线性回归模型进行计算,过程如下:(1)确定模型的形式。这是根据所研究问题相关专业知识或散点图的形状,选择f(x)的具体表达形式,如上例,可以选择f(x)为二次曲线模型,即

y=f(x)=b0+b1x+b2x2(2)将确定的模型作线性转换,如令u=x2,则有

y=f(x)=b0+b1x+b2u从而y关于x,u是线性回归模型。又如对指数模型y=aebx,先两边去对数有lny=lna+bx,然后令y’=lny,a’=lna,则y’=a’+bx,于是y’关于x是线性回归模型。(3)对转换后的线性模型利用线性回归模型方法进行计算、检验,最后回代还原为曲线模型。

第六十二页,共八十页,编辑于2023年,星期六计算过程:(1)建立数据文件:原始数据:例1.sav(2)变量变换需作变换u=x2.选择:Transform→Compute→在目标变量框输入变量u,在右边框输入计算表达式x*x→确定(3)选择统计方法:线性回归方法第六十三页,共八十页,编辑于2023年,星期六结果分析模型:y=-8.360+34.827x-3.762u回代为:y=-8.360+34.827x-3.762x2模型非常显著,复相关系数为R=0.997,标准误差S=2.251,回归检验的显著性概率sig.=0.000<0.01注:也可以直接使用曲线回归的方法,选择模型:平方第六十四页,共八十页,编辑于2023年,星期六练习牙膏的销售量

问题建立牙膏销售量与价格、广告投入之间的模型

预测在不同价格和广告费用下的牙膏销售量

收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其它厂家同类牙膏的平均售价(数据:牙膏销售量.sav)9.260.556.804.253.70307.930.055.803.853.80298.510.256.754.003.7527.38-0.055.503.803.851销售量(百万支)价格差(元)广告费用(百万元)其它厂家价格(元)本公司价格(元)销售周期第六十五页,共八十页,编辑于2023年,星期六基本模型y~公司牙膏销售量x1~其它厂家与本公司价格差x2~公司广告费用x2yx1yx1,x2~解释变量(回归变量,自变量)

y~被解释变量(因变量)

0,1

,2,3~回归系数

~随机误差(均值为零的正态分布随机变量)第六十六页,共八十页,编辑于2023年,星期六牙膏的销售量模型选择方法:Analyze→Rgression→Linear将销售量送入因变量框,将x1、x2和x22送入自变量框“Statistics”按钮选择结果分析:总:y的90.5%可由模型确定

Sig.远小于=0.05

模型从整体上看显著分:x2对因变量y的影响不太显著但由于x22项显著

可将x2保留在模型中

参数参数估计值置信区间17.324[5.72828.921]1.307[0.6831.931]-3.696[-7.4990.108]0.349[0.0380.659]R2=0.905F=82.941p=0.00000123第六十七页,共八十页,编辑于2023年,星期六回归预测的方法如果我们要用SPSS来预测x1=0.2,x2=6.5时y的值,需要在数据表的续后空格输入x1,x2的值,对应y的值为空值(缺失值)。在建立模型时SPSS会进行自动调整,只使用前面30个数据建立模型,但可以预测第31个观测的y值。选择AnalyzeRegressionLinear,将相应变量送入变量框,单击对话框中的“save”按钮,在弹出的对话框中,在PredictedValues栏中选中“Unstandardized”复选框(这样可以得到预测值),在“PredictionIntervals”栏中选中“Means”(均值预测置信区间)和“Individual”(个值预测置信区间),单击“Continue”返回主对话框,其它选项采用默认值,“确定”后就可以得到回归方程和预测结果了。第六十八页,共八十页,编辑于2023年,星期六第六十九页,共八十页,编辑于2023年,星期六第七十页,共八十页,编辑于2023年,星期六销售量预测价格差x1=其它厂家价格x3-本公司价格x4估计x3调整x4控制价格差x1=0.2元,投入广告费x2=650万元销售量预测区间为[7.82298,8.76362](置信度95%)上限用作库存管理的目标值下限用来把握公司的现金流若估计x3=3.9,设定x4=3.7,则可以95%的把握知道销售额在7.822983.729(百万元)以上控制x1通过x1,x2预测y(百万支)第七十一页,共八十页,编辑于2023年,星期六模型改进不考虑x1和x2的交互作用参数参数估计值置信区间17.3244[5.728228.9206]1.3070[0.68291.9311]-3.6956[-7.49890.1077]0.3486[0.03790.6594]R2=0.905F=82.9409p=0.0000123参数参数估计值置信区间29.113[13.70144.525]11.134[1.97820.291]-7.608[-12.693-2.523]0.671[0.2541.089]-1.478[-2.852-0.104]R2=0.921F=72.777p=0.00030124考虑x1和x2的交互作用所有参数都是显著的第七十二页,共八十页,编辑于2023年,星期六两模型销售量预测比较(百万支)区间[7.82298,8.76362]区间[7.88673,8.76777]

(百万支)控制价格差x1=0.2元,投入广告费x2=6.5百万元预测区间长度更短(精度提高)略有增加第七十三页,共八十页,编辑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论