嵌套Logit模型对应分析法在消费者行为分析中的应用_第1页
嵌套Logit模型对应分析法在消费者行为分析中的应用_第2页
嵌套Logit模型对应分析法在消费者行为分析中的应用_第3页
嵌套Logit模型对应分析法在消费者行为分析中的应用_第4页
嵌套Logit模型对应分析法在消费者行为分析中的应用_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、嵌套Logit模型对应分析法在消费者行为分析中的应用阳长征1, 周永生1,李慧敏21.桂林理工大学管理学院 企业管理,广西 桂林 (541004) ;2.右江民族医学院附属医院 中医科,广西 百色 (533000) 摘要:文章通过对市场战略决策特点的分析, 阐述了嵌套Logit模型和对应分析在市场找略决策分析中的不足,提出了嵌套Logit模型和对应分析综合使用的方法,它克服了过去常单一使用的嵌套Logit模型或者对应分析法各自的缺陷。接着对嵌套Logit模型和对应分析综合法的基本理论作了详细叙述,并通过来自对“2010年百色市家庭选择不同休闲吧的情况”的调查资料进行了实例分析,具体展示了该模型

2、在实际应用的方法和步骤。经过对结果的分析得知构建的模型与实际相吻合,说明该模型在消费者行为分析中具有指导意义。关键词:嵌套Logit模型;对应分析;市场; 消费者行为分析; 应用0引言:在市场战略分析的各个方面,相关人员需面对纷繁复杂的信息和超负荷的信息量, 然而人们的决策能力和理性是有限的。人们不可能从众多的信息集中感知每个信息 ,考虑所有备选项和评估准则。因此, 人们采取简化策略来做出判断和决策。简化策略通过有意识地忽略一些信息以便减轻感知负载 ,因此决策者能抓住主要信息。分类作为一种简化策略能将信息量最小化, 利用相似性和有关准则将众多的信息分成较少的不同类别,有利于简化感知过程诸如交流

3、、 知觉、 行为计划和记忆存贮。1在市场战略决策过程中需要涉及很多错综复杂的的因素交织在一起分析,比如市场细分、 HYPERLINK /glpx/ebook/zlgl/72.htm 市场营销体系分析、 HYPERLINK /glpx/ebook/zlgl/73.htm 投资组合分析、 HYPERLINK /glpx/ebook/zlgl/76.htm 产品结构分析、 HYPERLINK /glpx/ebook/zlgl/68.htm 产品结构调整分析等都会受到很多因素的影响。以往学者在对上述影响因素进行定性和定量分析的过程中, 往往采用了嵌套(Nested Logit Model)模型。该模型

4、虽然能够随市场进行很好的细分并能检验该细分是否合理,也能大体分析一些市场影响因素间的关系,但是该模型仍然不能深入地分析市场及其影响因素之间作用和关系,也不能直观地将它们反映出来。2此外,在市场找略决策中,所获得的调查资料常常不是一个确定的数字,而是一个具体的范围,于是研究人员在进行数据统计分析时总需要把这些范围转化为名义变量、次序变量等虚拟变量。针对这些问题,对应分析能很好的弥补嵌套logit模型的不足却又能很好的处理这些分类变量。对应分析法(Correspondence Analysis)是通过对二维交互汇总表的分析来确定定性变量及其类型之间的关系,并把每个变量的类别差异通过直观图上的分值距

5、离直观地表现出来。于是可以把嵌套logit模型和对应分析结合起来应用于市场战略决策中,这样便能很好地兼容了它们的优点克服了它们的不足。3嵌套Logit模型对应分析法基本理论1.1嵌套Logit模型的构建1.1.1 IIA假设检验该假设可以采用Hausman方法(1978年)来检验,可先在条件Logit模型中拟合包括所有类别的模型和去除某类别后 的模型,再用Hausman方法比较各个估计系数之间的差异,因为它们服从联合分布,即进行检验,若P值小于0 .0 5,则 不服从IIA假设,则不能采用多项Logit模型,要用嵌套Logit模型。4 1.1.2效用函数消费者选择某一特定的消费单位进行消费 ,

6、可以得到每种需求的满足 ,这种需求的满足程度被定义为消费者做出这项决策而获得的效用。McFadden提出随机效用理论把总效用分解成非随机效用和随机效用两部分。效用函数为:uj = vj +j( j = 1, 2, , J )其中 , U是产生的总效用, V是非随机效用部分, 是可由被观察到的自变量解释的部分 ,一般情况下 ,该部分效用被假设为与各解释变量之间呈线性关系, 即 vj=x1j+x2j+xpj ,称为线性假设。是由未被观察到或者无法观察到的随机扰动变量所解释的效用。一个消费者收入、时间、精力等资源是有限的 , 他们总希望用有限的资源获得其需求的最大满足, 即通过选择某一特定的消费单位

7、消费带来最大的效用 ,即 ( i , j表示不同的消费单位 )。5要满足随机效用最大化必须遵循以下 2个假设:个体将在 j个选项中进行选择,无论他选择哪一个选项都可以获得一定水平的效用;个体能够权衡各个效用,并从中选择效用最大的消费单位消费,即个体选择行为合理。根据随机效用理论,消费者 n选择消费单位 i的概率可表示为:由于概率 Pni服从累计分布 ,因而,其中, I( )为指示函数 ,当括号内的条件满足时, 函数值取1, 否则函数值取 0。当得到随机扰动项的联合密度函数的具体形式后, 即可推出概率的确切表达式。61.1.3嵌套Logit模型根据嵌套Logit模型, 把全选择域分成若干个不同层

8、次子集的同时,也就相当于把个体的决策过程分成了若干的阶段。决定树可以形象地展现出人为划分的各个阶段。图 2例举了一个两阶段或两层的树状图。7图1 决策图Fig.1 the tree structure of the nested logit model嵌套Logit模型假设随机项服从广义极值分布(GEV) ,即在 GEV分布下 ,同一子集 Bk 内的j( j = 1, 2, k)之间是相关的 ,而子集间的j( jBk )与m (mB1 )之间是相互独立的。在嵌套Logit模型中 ,对较低层的决策取决于较高决策层 ,包含值用来解释各决策层之间的相互关系。概率估计从最低的决策层开始, 通过对较低层

9、的包含值系数估计,从而逐步推导出最初决策的概率。包含值系数是描述第 k个子集中所有选项的未观察到的效用之间的相互独立程度。的值越大表示其独立性越好。必须介于 (0, 1)之间才能保证效用的最大化。如果= 0,则说明子集内选项之间具有很高的替代性;如果= 1,则表示子集内选项之间完全独立 ,满足嵌套Logit模型对于选项的要求。8设这 2个过程分别为选择某一类型消费单位组h、选择某一特定消费单位l ,它给消费者带来的效用函数为: uhl = vh + vl + vhl (1)(1)式中, vhl为非随机部分, 剩下两项为随机变量, 代表了 2个层次的选择, 采用两层次嵌套Logit模型。根据模型

10、的 2个层次 ,将这个嵌套Logit模型分解为 2个子模型, 设 Sh表示第一层次可选的目标。首先在最后一个阶段, 当选择类型 h消费单位组,其最终选择某一特定消费单位l的条件概率为: (2),(2)式中 , vl=xhl, 是一个行向量参数, 表示各个因素对个人效用影响的权重; xh l为包含了所有可观测因素的列向量, 这里的因素既包括影响消费单位l和类型 h消费单位组的属性和其他消费单位因素, 以及这些因素和个人因素的交互作用; Ih=ln 表示包含值, 反映了该阶段所有目标选择对消费者的期望效用。在第一个阶段 ,选择类型 h消费单位组的边缘概率为: (3),(3)式中, vh =yh,

11、是一个行向量参数, yh为一个列向量, 包含影响类型h消费单位组属性的所有可观测变向量,为包含值的系数。因此 ,总概率为 (4),(4)式中, phl为在类型h消费单位组中选择消费单位l的概率。本模型的拟合优度采用似然比指标:= 1- ,介于 (0, 1)之间,越大说明模型拟合的程度越好。参数的 IIA假设检验采用对数似然比检验,统计量为, 等式的左边服从自由度为待检验变量个数的 2分布。91.2嵌套logit模型下的对应分析1.2.1数据预处理设有 n个样品, 每个样品有 p个观测指标, 列出原始数据矩阵为: 将原始数据矩阵 X转化为标准化的频率矩阵 P, 令其中。101.2.2计算两点距离

12、对应分析的实质是将研究样品点之间的关系转换成研究变量点之间的关系,而变量点间相互关系一般用两个变量点间的欧氏距离来表示, 为消除量纲的影响, 引入第 k个和第 l个样品间的加权平方距离公式3 =其中 pj为第 j个变量的边际概率。将 n个样品点到重心的加权平方距离的总和定义为总惯量 Q3 , 即: 111.2.3计算轮廓坐标并绘制对应分析图为绘图方便,先确定特征值累计比率和主成分因子个数,一般选取两个主成分因子。则对 R型,选取变量的协方差矩阵 A最大与次大两个特征值1与2 ,及相应特征向量 e 1与 e 2 ;对 Q型,选取样品的协方差矩阵 B最大与次大两个特征值1 与2 ,及相应特征向量

13、v 1 与 v 2. 将特征向量单位化后,把和分别记作 R1和 R2 ,把和分别记作 Q1和 Q2 ,即得 R型和 Q型轮廓坐标 (因子载荷矩阵)。在 R1 - R2 (即 Q1 - Q2 ) 直角坐标系绘制投影图, 即得对应分析图。以 R型因子分析为例 , 列轮廓坐标 (或因子载荷矩阵 ) 为:同理 , 得出行轮廓坐标 G, 并绘制在同一个二维平面上 ,得出对应分析图,并将邻近的变量和样品点归为一类 ,从而对其进行解释和推断。122. 嵌套Logit模型对应分析法实例分析2.1资料来源本文通过问卷调查的方式收集所需数据, 采用简单随机抽样方法调查百色市1800户家庭对当地7家休闲吧 ( A:

14、 榜样、B: 夜来香、C:布兰卡、D:皇家一号、E:不夜城、F: 远大文化、G: 文艺之家) 的消费选择情况, 样本数据全部来源于问卷。此次问卷发放1800份,回收1620份, 有效问卷1510份, 回收率为90%,回收问卷有效率为93.21%。在15100个被调查消费者中,男性占48.6%,女性占51.4%。由此可见,调查数据是可靠的。其中所涉及的变量包括:bar:休闲吧;income:家庭的收入; kids:孩子数; rating:休息吧环境设施; cost:每人每次平均花费; distance:家庭与休闲吧的距离; Family-id:家庭识别变量 ;chosen:选择休息吧的识别变量(

15、0为不选择1为选择)。调查表中变量income:家庭的收入; rating:休息吧环境设施; cost:每人每次平均花费; distance:家庭与休闲吧的距离均采用李克特5分量表, 1表示“极不重要”, 2表示“不重要”, 3表示“一般”, 4表示“重要”, 5表示“很重要”。 变量kids:孩子采用实际变量(实测数量),因为该数量一般为不大于5的非负整数,故亦可以把它视为分类变量来处理。2.2嵌套Logit模型的构建该模型包括两个水平:类型和休闲吧, 在嵌套 Logit 模型中的各层次及其解释变量构建嵌套Logit模型时, 根据相关的专业知识将7家休闲吧分为3个亚组即饮食性、娱乐性和文化性

16、,分别记为type l、type2、type3,每个亚组包含若干个选项: type l包含 A、B,type 2 包含C、D、E,type 3包含F、G。再分别确定第一层次 ( type)和第二层次(bar)的解释变量cost、rating和 distance为低层次(即第一层次)的解释变量,而高层次(即第二层次)的解释变量需重新产生,以type2为参照组, 产生type 分别与income、kids之间的交互项作为高层次的解释变量。 图2 休闲吧的分类Fig.2 classification of the bars 2.3 I I A假设的检验本文运用统计软件 stata 10 . 0进行数

17、据处理。因为该调查资料的解释变量既含有个体特征变量(bar), 也含有选择特征变量(income、kids, 故选用条件Logit模型进行IIA假设检验。在进行条件Logit模型估计时,为了放映个体特征如何影响其选择,必须用个体特征变量与选择的识别标识的虚拟变量(chosen)的交叉项来体现,所以还需产生incocho=income*chosen、kidscho=kids*chosen两个变量。估计时按照休闲吧(bar)进行分组,其运行结果见表1。13表1 条件logit模型的拟合结果Table1 fitness of the conditional logit model=19.52 pro

18、bchi2=0.0006,检验后p值远小于0.05, 不满足IIA假设,故采用嵌套Logit模型。2.4嵌套Logit模型的拟合该嵌套Logit模型的概率可以表达为两个简单Logit模型概率乘积:, 其中的条件概率为。概率 Pri 的计算前需定义高层次中每组的包含值(inclusive val ues,IVi ),因type分为3个亚组,即对应3个IV值。IVi 定义为:则,其中测量了高层次中每个亚组内未观察因子之间的相关性,范围在 0,1 之间, 越大,说明该亚组内各类别之间相关性越小。 若 各IVi 均为1,则两层嵌套Logit模型变成单层嵌套Logit模型,等价于条件Logit模型。14

19、 在 stata中 ,定义变量 family-id、bar、Chosen、rating、 cost、distance、 type1、type 2、type3。其中, family-id为被调查家庭编号; bar为休闲吧; chosen为被调查者选择某一特定旅游目的地的意图 (0为不选择, 1为选择)。拟合嵌套Logit模型时 ,先采用 nlogitgen命令来产生一个能识别第一层选项的新分类变量type。再分别确定第一层 ( type)和第二层 ( bar)的解释变量, rating、cost、distance为低层次的解释变量, income、kids为高层次的解释变量。采用 nlogit模

20、块, 以chosen为因变量, 分别设定第一层和第二层的解释变量, 数据处理结果如表 1所示。表2嵌套logit模型的拟合结果Table2 fitness of the nested logit model2.5 嵌套logit模型下的对应分析2.5.1嵌套logit模型第一水平的数据处理表3嵌套logit模型第一水平标准化统计结果Table3 Statistics for column categories in standard normalization上表类型type一栏中的1、2、3分别代表饮食性、娱乐性和文化性的休闲吧;kids一栏中的1、2、3为孩子数;income一栏中的“1”

21、表示收入很低,“5”表示收入很高。图3 嵌套logit模型第一水平分类点的散点图Fig.3 MCA coordinate plot2.5.2嵌套logit模型第二水平的数据处理表4嵌套logit模型第二水平标准化统计结果Table4 Statistics for column categories in standard normalization上表中的变量cost、distance 、rating的类型1、2、3、4、5均为用李克特5分量表。图4 嵌套logit模型第二水平分类点的散点图Fig.4 MCA coordinate plot2.5.3结果分析1. 从拟合的嵌套Logit模型的本

22、身来讲,(1)所得 到三个子集(type:文化性、娱乐性和饮食性)的值都处在( 0 ,1 )之间, 一方面说明拟合的模型满足效用最大化,另一方面也说明消费单位的决策树的构建比较合适。 (2) 模型的拟合优度检验得到 McFadden的似然比为=0.6325,拟合的效果比较好。由此可见本文所建立的决策树比较合适,即在研究消费者选择休闲吧时可以把它分为饮食性、娱乐性和文化性3个亚组。 2. 表2输出结果表明消费者的家庭收入对某类型休闲场所组的选择影响起主导作用,对于同一类型的休闲场所来说,家庭与休闲吧的距离和休闲吧的环境与设施是消费者选择该场所与否的主要因素,即距离比越近、环境设施越好则该休闲吧被

23、选择的机率也就越大。换言之, 家庭的收入是消费者选择哪类型的休闲场所的主要影响因素, 而距离与环境设施对某类型中的特定休闲吧的选择起决定作用。这些均与实际情况相吻合,说明该方法对市场战略策分析有一定的实用性和指导意义。3. (1)由图3可知变量income的类型1和变量kids的类型3最靠近type 1,说明很低收入以及多孩家庭更趋向选择饮食性的休闲吧;变量income的类型5、类型2和变量kids的类型1最靠近type 2,说明较低收入很高收入以及独生子女家庭更趋向选择娱乐性的休闲吧;变量income的类型3 、类型4和变量kids的类型2最靠近type 3,说明中等收入较高收入以及2个孩子

24、的家庭更趋向选择文化性的休闲吧。(2)由表4可知变量distance的类型3类型1、rating的类型4以及cost的类型2比较靠近chosen的类型1,说明离家庭的距离中等或很近、环境较好以及消费水平较低的休闲吧是人们的选择趋向;变量cost的类型3类型5、rating的类型1类型5以及distance的类型2比较靠近chosen的类型0,说明消费水平很高或中等、环境很差或很好以及距离较近的休闲吧一般不为人们所选择;rating的类型2类型3、distance的类型5类型4距离chosen的类型0或1都较远,说明环境较差或中等以及距离家庭很远或较远对人们选择休闲吧与否的影响不大,即人们在做选

25、择时这些不是它们考虑的主要因素。 4嵌套Logit模型正确应用的关键是合理地划分子集,应遵循该领域或专业上的要求, 而且每层内的属性特征需明确,使得子集间以及子集内的选项间都能够满IIA假设。判断子集划分的正确与否一方面需考察值是否在(0,1)之间,另一方面需要对子集IIA假设进行检验。本次研究经过对百色市的休闲场所选项的IIA假设的分析,可见市场战略决策中影响因素的分析很难满足条件Logit模型和多项Logit模型的要求,因此嵌套Logit模型为此提供了很好的分析方法。14 4.结语.企业的生存与发展离不开它的外部环境,它必须从外部获得必要的资源供应,又要把产品或服务贡献给社会,这些活动把企

26、业与其外部环境紧密联系在一起。外部环境的任何变化,如消费需求的变化,科学技术研究的突破,竞争对手策略的改变,国内外经济形势的动荡等,都会对企业产生深远的影响。随着这些企业环境的越来越复杂化,然而每一种单独的分析方法具有自身使用的局限性,所以仅仅依靠一种定性分析或者一种传统的定量分析已经是很不适合了,而是要把定性分析和定量分析相结合,这样才能得出更科学更合理的战略决策,企业只有作出正确的战略决策才能适应这些复杂的变化,才能掌握自己的命运,而嵌套logit模型对应分析法就是这样的一种有效地把多种定性分析和定量分析综合运用的分析方法。参考文献:1 Sung - kwon Hong, Jac - hy

27、un Kim, Hochan Jang, Seokho Lee.The roles of categorization, affective images and constraints on destination choice: An app licati on of the NMNL model J. Tourism Research,2009 27.2 Spiggle S, Sewall M. A choice sets model of retail selection J.Journal of Marketing, 2010, 51.3王群勇. STATA在统计与计量分析中的应用M

28、.天津:南开大学出版社,2007:179-180.4Um S, Crompton JL. Attitude determinants in tourism destination choiceJ. Annals of Tourism Research, 2009, 17.5聂冲,贾生华.离散选择模型的基本原理及其发展演进评价J.数量经济技术经济研究, 2008 (11) .6 McFadden D. Econometric models of probabilistic choice. In Structural Analysis of Discrete Data with Econometr

29、ic ApplicationsM . Cambridge, MA: MIT Press, 2010.7王显成,陈艳.旅游目的地选择行为分析J.经济论坛, 2009, 4.8张锦华,吴方卫.梯度二元融资结构下中国农村家庭的教育选择基于嵌套 Logit模型的实证分析J.农业技术经济, 2009 (2) .9Baloglu S, Bringberg D. Affective images of tourism destination J . Journal of Travel Research, 2008, 30.10 孟德顺,郭满才.对应分析方法的注记J. 西北林学院学报,2010.11何晓群.现

30、代统计分析方法与应用 M . 北京:中国人民大学出版社 , 2009.12余锦华,杨维权.多元统计分析与应用 M .广东:中山大学出版社 , 2010 .13刘宝,方可娟,高尔生.孕龄妇女避孕措施选择的影响因素分析J.离散选择模型的应用.中国公共卫生,2008.18 (12):1487-1489 14饶克勤,李青.多项式 logisti回归分析在患者就诊行为影响因素研究中的应用.中国卫生统计,2009,6(2):72 -7 5 15H.Goldstein原著;李晓松 主译.多水平统计模型M.第2版四川科学技术出版社.2010. Application of Correspondence Analysis of Nested Logit Model to the analysis of consumers behaviorsYANG Changzheng, ZHOU Yongsheng1, LI Huimin Enterprise Management,Sch

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论