第十三章 多变量数据分析_第1页
第十三章 多变量数据分析_第2页
第十三章 多变量数据分析_第3页
第十三章 多变量数据分析_第4页
第十三章 多变量数据分析_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十三章多变量数据分析(1)《市场调查理论与方法》主编:徐映梅学习目的了解与掌握多变量方差分析的适用条件、原理及方法12《市场调查理论与方法》主编:徐映梅了解相关分析与回归分析的联系和区别掌握线性回归分析的适用条件、应用过程与结果解释理解分类模型的适用条件熟悉掌握Logistic模型的原理与应用2345第三节分类模型——Logistic模型第二节多变量相关与回归分析第一节多变量方差分析目录CONTENTS3《市场调查理论与方法》主编:徐映梅引例4CH13-1多变量方差分析随着线上移动支付的兴起,BAT(百度、阿里和腾讯)三足鼎立的格局已经形成。武汉某高校学生为了解客户对BAT移动支付的认知过程,对武汉市高校中使用移动支付软件的人群进行问卷调查。问卷分为两个部分,第一部分为基本信息及使用情况调查,包括被调查者的个人信息,如性别、受教育程度、月可支配金额,以及被调查者对BAT移动支付的基本使用情况,如最常用哪种移动支付软件、使用频率、使用场景等;第二部分采集的是用户对BAT移动支付使用意愿,包括BAT认知、感知利益、感知风险、个人创新力、方便性、安全性、娱乐性、使用意愿、是否投资理财等信息。第一节多变量方差分析一单因素单变量方差分析二单因素多变量方差分析三多变量方差分析注意事项5《市场调查理论与方法》主编:徐映梅一、单因素单变量方差分析单因素方差分析6CH13-1多变量方差分析在控制变量的不同水平下,检验各总体分布是否存在显著性差异,进而判断控制变量是否对观测变量具有显著性影响的分析方法。

单因素方差分析的一般步骤一、单因素单变量方差分析7CH13-1多变量方差分析

分析结果

二、单因素多变量方差分析多变量方差分析8CH13-1多变量方差分析同时检验因素的各个水平在两个以上观测变量是否有显著差异。

单因素多变量方差分析的一般步骤二、单因素多变量方差分析9CH13-1多变量方差分析

分析结果

应用实例13-110CH13-1多变量方差分析基于本章引例,如何推断受教育程度不同状态下对BAT移动支付功能层面的三个观测变量“安全性”、“方便性”、“娱乐性”感知的影响效应?上述研究问题中,分组变量(自变量)为受教育程度,共有四个水平,1为“专科及以下”,2为“大学本科”,3为“硕士研究生”,4为“博士研究生”。同时,检验的因变量包括“安全性”、“方便性”、“娱乐性”。问题描述:应用实例13-111CH13-1多变量方差分析打开数据集,执行工具栏“Analyze(分析)”,依次选择“GeneralLinearModel(一般线性模式)→Multivariate(多变量)”,在打开的“Multivariate(多变量)”对话框中,将学生对BAT移动支付功能层面的三个感知指标“安全性(sec)”、“方便性(con)”、“娱乐性(ent)”选入“DependentVariables(因变量)”方格中,将“受教育程度(degree)”选入“FixedFactor(s)”方格中。按“PostHoc…”按钮,开启PostHoc多重比较对话框,选取进行事后比较的方法,点击“Continue(继续)”返回多变量方差分析对话框。点击“Options”,选择要输出的统计量,单击“OK”,即得到分析结果。操作步骤:应用实例13-112CH13-1多变量方差分析输出结果:(一)多变量检验结果应用实例13-113CH13-1多变量方差分析输出结果:(二)受教育程度变量与三个因变量的单变量方差分析结果应用实例13-114CH13-1多变量方差分析输出结果:(三)多重比较结果应用实例13-115CH13-1多变量方差分析

补充因变量正态性和方差同质性检验因变量正态性检验操作步骤:依次选择“Analyze(分析)→DescriptiveStatistics(描述性统计)→Explore(探索)”,在打开的“Explore(探索)”对话框中(见图12-8),将学生对BAT移动支付功能层面的三个感知指标“安全性(sec)”、“方便性(con)”、“娱乐性(ent)”选入“DependentList(因变量列表)”框中,单击“Plots(图形)”按钮,选中“Nomalityplotswithtests(正态性图形检验)”复选框,单击“Continue(继续)”按钮返回,单击“OK(确定)”按钮进行正态性检验。检验结果:应用实例13-116CH13-1多变量方差分析

补充因变量正态性和方差同质性检验因变量方差同质性检验操作步骤:依次选择“Analyze(分析)→CompareMeans(均值比较)→One-WayANOVA(单因素方差分析)”,在打开的“单因素方差分析”对话框中(见图13-10),将学生对BAT移动支付功能层面的三个感知指标“安全性(sec)”、“方便性(con)”、“娱乐性(ent)”选入“DependentList(因变量列表)”框中,将“受教育程度(degree)”变量选入“Factor(因素)”框中。单击“PostHoc(多重比较)”按钮,选中“LSD”复选框,单击“Continue(继续)”按钮返回。单击“Options(选项)”按钮,选中“Homogeneityofvariancetest(方差齐性检验)”复选框,单击“Continue(继续)”按钮返回。单击“OK(确定)”按钮进行方差齐性检验。检验结果:三、多变量方差分析注意事项17CH13-1多变量方差分析对于多变量方差分析而言,需要满足的假定前提包括:数据来源于随机抽样,样本观察值之间相互独立;各因变量为正态分布且方差相等;各因变量之间为多元正态分布。方差分析要求因变量是间距测度等级变量,自变量为定类测度等级变量。方差分析要求因变量之间需要存在一定程度的线性相关,如果是非线性关系,需要转换为线性关系;相关程度达到一定的强度。方差分析要求总量足够大,分类样本足够大。在实际应用时,由于观测次数有限,影响因素可能只有有限的几个状态水平,这时一般只考察影响因素有限集中各状态的不同搭配对所观测变量的影响。在实际应用两因子方差分析方法时,影响因素之间是否存在交互作用,除可以依据有关专业理论及实践经验做出初步判断外,最终还应在对试验数据进行方差分析后才能得到可靠结论。18第二节多变量相关与回归分析一多变量相关分析二多变量回归分析三应用多元相关与回归分析的注意事项五《市场调查理论与方法》主编:徐映梅一、多变量相关分析19CH13-2多变量相关与回归分析相关系数可以精确地展示变量间的相关关系大小,多变量间两两相关系数可用相关系数矩阵来表示。

应用实例13-220CH13-2多变量相关与回归分析本章引例关于BAT移动支付的调查研究,采集到使用意愿、BAT认知、个人创新、感知风险、感知利益等数据。为了解BAT移动支付使用意愿与BAT认知、个人创新、感知风险、感知利益的相关性,可使用相关分析方法分析各变量之间的相关关系。问题描述:应用实例13-221CH13-2多变量相关与回归分析操作步骤:打开数据集,执行工具栏“Analyze(分析)”,依次选择“Correlate(相关)→Bivariate(双变量)”,打开双变量相关分析窗口。将“使用意愿(wil)”、“BAT认知(bat)”、“个人创新(inn)”、“感知风险(prs)”与“感知利益(pbe)”五个变量选入“Variables”方格中,点击“OK”,得到输出结果。应用实例13-222CH13-2多变量相关与回归分析输出结果:二、多变量回归分析23CH13-2多变量相关与回归分析多元回归,即一个因变量与多个自变量之间的回归。相关分析与回归分析的联系和区别二、多变量回归分析24CH13-2多变量相关与回归分析

它的估计方程为:

多元线性回归的基本模型形式二、多变量回归分析25CH13-2多变量相关与回归分析

多变量回归分析的基本假定

二、多变量回归分析26CH13-2多变量相关与回归分析

提出假设计算检验统计量

多变量回归分析的显著性检验应用实例13-327CH13-2多变量相关与回归分析前例分析了使用意愿与BAT认知、个人创新、感知风险、感知利益的相关程度,结果表明使用意愿与其他四个变量均存在显著的相关性。为有效了解四个变量对使用意愿的影响效应的大小,可进一步展开多元线性回归分析。初步考虑将BAT认知(bat)、个人创新(inn)、感知风险(prs)与感知利益(pbe)四个变量作为自变量,使用意愿(wil)作为因变量。问题描述:应用实例13-328CH13-2多变量相关与回归分析操作步骤:打开数据集,执行工具栏“Analyze(分析)”,依次选择“Regression(回归方法)→Linear(线性)”,开启线性回归对话窗口。在开启的“LinearRegression(线性回归)”对话框中,将“使用意愿(wil)”点送至“DependentVariables(因变量)”方格中,将“BAT认知(bat)”、“个人创新(inn)”、“感知风险(prs)”与“感知利益(pbe)”四个变量点选至“Independent(s)”方格中。在“Method(方法)”右侧的下拉式选项中选择“Enter(强迫进入变量法)”。按“Statistics…”钮,打开“LinearRegression:Statistics(统计量)”对话框,选取“Estimate(估计值)”、“Modelfit(模型拟合度)”、“Descriptives(描述性统计量)”、“Collinearitydiagnostics(共线性诊断)”以及“Durbin-Watson(杜宾统计量)”,点击“Continue”返回线性回归对话窗口。最后,单击OK按钮,即可得到回归过程的运行结果。应用实例13-329CH13-2多变量相关与回归分析输出结果:(一)相关系数矩阵(二)回归模型总结(三)方差分析表应用实例13-330CH13-2多变量相关与回归分析输出结果:(四)回归系数(五)共线性检验(六)残差统计量应用实例13-331CH13-2多变量相关与回归分析模型整理:多元回归输出结果摘要表(1)多元回归输出结果摘要表(2)三、应用多元相关与回归分析的注意事项32CH13-2多变量相关与回归分析注意多重共线性问题。如果自变量间存在完全共线性或者高度共线性,会直接影响模型参数估计与统计推断的准确性。在模型构建前,可先进行各解释变量之间的相关分析,初步判定解释变量之间有无共线性问题。在实际操作中,建立回归模型的过程非常复杂,变量之间的关系很难确切估计,实际被广泛应用的回归分析技术也比本书介绍的内容更为复杂,应用时必须结合具体情况进行探讨和分析。第三节分类模型——Logistic模型一Logistic回归模型的基本原理二应用Logistic回归模型的注意事项33《市场调查理论与方法》主编:徐映梅一、Logistic回归模型的基本原理34CH13-3分类模型—Logistic模型若因变量是分类变量,基于同方差、线性和正态性等假定的线性回归不再适用,可以考虑采用Logistic回归。当Logistic回归涉及的因变量为二分变量时,称为二分Logistic回归;当所涉及的因变量为两个及以上类别时,称为多分类Logistic回归。一、Logistic回归模型的基本原理Logistic回归模型的基本形式35CH13-3分类模型—Logistic模型

一、Logistic回归模型的基本原理36CH13-3分类模型—Logistic模型参数估计系数的显著性检验Logistic回归模型的参数估计使用极大似然估计法。模型拟合好坏通过似然值来测度(通常统计软件中将似然值取自然对数并乘以-2,记为-2LL),当似然值为1时,此时-2LL=0,达到最小取值,模型完全拟合。

应用实例13-437CH13-3分类模型—Logistic模型为研究武汉高校学生的感知利益、安全感、消费水平、BAT移动支付使用频率四个变量是否可有效解释以及预测他们的投资理财选择,将感知利益、安全感、消费水平、使用频率作为自变量,投资理财作为因变量,构建二分Logistic回归模型。其中,感知利益与安全感为连续变量;消费水平和使用频率为等级变量,共有5个等级,取值越高,表明消费水平和使用频率越高;因变量投资理财为二分变量,1表示使用BAT进行投资理财,0表示没有使用BAT进行投资理财。问题描述:应用实例13-438CH13-3分类模型—Logistic模型操作步骤:打开数据集,执行工具栏“Analyze(分析)”,依次选择“Regression(回归方法)→BinaryLogistic(二元Logistic)”,在打开的“LogisticRegression(Logistic回归)”对话框中,将“投资理财(tzlc)”选入“DependentVariables(因变量)”方格中,将“感知利益(pbe)”、“安全感(sec)”、“消费水平等级(consu)”与“使用频率(freq)”四个变量选入“Covariates”方格中。在“Method(方法)”右侧的下拉式选项中选择“Enter”,点击ok,即可得到回归结果。应用实例13-439CH13-3分类模型—Logistic模型输出结果:(一)样本基本信息表

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论