数据分析举例_第1页
数据分析举例_第2页
数据分析举例_第3页
数据分析举例_第4页
数据分析举例_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

时间序列分析和Eviews李小玲电子商务教研室目标根据历史销售数据,估计未来的销售数据根据以往营销策略(广告,促销),研发投入,分析市场表现与这些策略的关系根据商家的产品销售,用户评价,商品周转率,评估商家竞争质量共同点:根据时间点建立起来的样本集主流的分析方法:回归模型描述因变量y如何依赖于自变量x和误差项

的方程称为回归模型一元线性回归模型可表示为

y=b0+b1x+ey是x的线性函数(部分)加上误差项线性部分反映了由于x的变化而引起的y的变化误差项

是随机变量反映了除x和y之间的线性关系之外的随机因素对y的影响是不能由x和y之间的线性关系所解释的变异性0和1称为模型的参数最小二乘估计使因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法。即用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小变差的分解

(图示)xyy{}}预测值解释了平均值的程度真实值和平均值的差异判定系数r2

(coefficientofdetermination)回归平方和占总离差平方和的比例反映回归直线的拟合程度取值范围在[0,1]之间

R21,说明回归方程拟合的越好;R20,说明回归方程拟合的越差判定系数等于相关系数的平方,即R2=(r)2模型整体线性关系的检验

(检验的步骤)提出假设H0:1=0线性关系不显著2.计算检验统计量F确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F作出决策:若F>F,拒绝H0;若F<F,不能拒绝H0得到输出结果P<0.05如果样本太少,p<0.19基本假定:序列相关及其检验

如果线性回归方程的扰动项ut满足古典回归假设,样本的误差项是独立的。使用OLS所得到的估计量是线性无偏最优的。但是如果扰动项ut不满足古典回归假设,回归方程的估计结果会发生怎样的变化呢?10

如果回归方程的扰动项存在序列相关,那么应用最小二乘法得到的参数估计量的方差将被高估或者低估。因此,检验参数显著性水平的t统计量将不再可信。可以将序列相关可能引起的后果归纳为:②使用OLS公式计算出的标准差不正确,相应的显著性水平的检验不再可信;

③回归得到的参数估计量的显著性水平的检验不再可信。

①在线性估计中OLS估计量不再是有效的;11序列相关及其产生的后果

对于线性回归模型

(4.1.1)

随机扰动项之间不相关,即无序列相关的基本假设为

(4.1.2)

如果扰动项序列ut表现为:

(4.1.3)即对于不同的样本点,随机扰动项之间不再是完全相互独立的,而是存在某种相关性,则认为出现了序列相关性(serialcorrelation)。12

由于通常假设随机扰动项都服从均值为0,同方差的正态分布,则序列相关性也可以表示为:

(5.1.4)特别的,如果仅存在

(5.1.5)称为一阶序列相关,这是一种最为常见的序列相关问题。解决方法?dX=Xt—Xt-1如何分析时间序列数据1、检验序列平稳性UnitRootTest2、两个结果序列平稳,直接采用原值数据序列不平稳,一阶差分生成新数据3、回归分析同样看两个关键的指标EViews界面1.File(文件)功能健2.Edit(编辑)功能键3.Objects(对象)功能键4.View(视图)和Procs(处理)功能键5.Quick(快捷)功能键数据导入Eviews的数据(*.wf1)File——Open——Eviewsworkfile非eviews的数据(excel,spss)File——Open——Foreigndataasworkfile说明:数据文件的各列数据命名,必须是英文或者数字,不能是中文案例:淘宝发红包,新客户OR老客户1、分析程序(1)序列的平稳性分析:单位根检验存在单位根则采取差分方法生成新变量:Quick——Generateserisesbyequation①③④②序列平稳性检验结果收入Revenue,通过单位根检验老客户、新客户的数量,需要一阶差分dexting_cus=exiting_cus-exiting_cus(-1)dnew_cus=new_cus-new_cus(-1)分析程序(2)分析关系新客户发放红包金额与老客户发放红包金额对收入的影响Proc——makeequationrevenuecdexting_cusdnew_cus规则:因变量写第一个,自变量跟在因变量后①②③分析结果:老客户OR新客户分析程序(3)分析滞后影响Proc——makeequationrevenuecdexting_cusdnew_cusdexting_cus(-1)dnew_cus(-1)(4)分析结果的意义总结:时间序列数据的独特性(1)序列相关性,单位根检验(2)今天决策对明天的影响,变量滞后的影响2、练习:网站质量与公司价值网站质量指标:国内的访问量排名alexatraficrank(China)声誉指数reputation※到达率Reach%:用户数※平均下载时间averageloadtime(second):服务速度※平均每用户访问页面

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论