全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基于空间关联规则的亿元商品交易市场专业化研究 摘要 商品交易市场专业化指数是用来衡量某地区各类商品交易市场 经济 总量在各类交易市场之间的集中程度。基于前人的 研究 基础,作者给出了亿元商品交易市场专业化指数 计算 公式,并将空间关联规则 分析 引入商品交易市场专业化水平与其他经济因素的关联分析中。在指定的最小支持度和可信度阈值下,获得了3条有意义的商品交易市场专业化水平与其他经济因素之间关联规则。通过这些关联规则,可以对一地区商品交易市场的专业化水平进行预测,为市场合理规划和建设提供决策支持。 关键词 亿元商品交易市场 专业化 关联规则 数据挖掘 亿元商品交易市场是指年成交额为1亿元及以上的大型和特大型市场(以后亿元商品交易市场简称商品交易市场)。经过几十年的 发展 , 中国 商品交易市场呈现出规模化、规范化、专业化、信息化和高效益化等特征,丰富了人们的物质、精神生活,增强了区域合作,推动了城乡的立体化发展。 目前 有关商品交易市场的研究多集中于政策研究和基于统计数据的发展趋势分析。在专业商品交易市场方面,更多的学者是不同区域的专业市场进行统计分析,以发现其发展变化的 规律 。游产业的发展,加强区域合作,形成高度区域一体化,合作立体化。寻找专业化水平高低和相应的区域其他因子之间关联关系对区域商品交易市场的规划和建设都有着重大的意义。商品交易市场专业化的 影响 因素是分布于一定的区域内,同时具有属性信息和空间信息,并且相互之间存在一定相关性。影响因素分析的 方法 ,一般是多元回归分析或经验模型。首先这些方法不能处理空间信息,其次它们要求数据要满足统计独立性。因此,传统的分析方法无法反应它们之间一种共生或因果关联模式。鉴于以上原因,本文将可以同时处理空间和非空间信息的空间关联分析引入区域商品交易市场的专业化研究中,通过分析相应影响或者共生因素,挖掘其与区域商品交易市场专业化之间的关联模式,为我国亿元商品交易市场的合理规划和建设提供 参考 依据。 一、数据来源 本文所用有关亿元商品交易市场数据来源于2001年到2007年中国商品交易市场统计年鉴(该统计年鉴最早起始于2001年)。此统计数据包括中国大陆地区的省、地区和直辖市,缺少西藏自治区、香港、澳门、 台湾 地区的相关统计数据。市场成交额反应了市场的规模,被用于进行商品交易市场专业化指数计算。专业化指数是指一个地区所有类型专业化市场的成交额或其他指标在该地区中所有类型专业市场中的分布情况。因此,专业市场的分类对专业化指数有着很重要的影响。本文采用中国商品交易市场统计年鉴对专业化市场的分类方法将亿元商品专业市场分成,纺织品服鞋帽装市场,食品饮料烟酒市场,家具市场等21类市场(详见中国商品交易市场统计年鉴)。 参与亿元商品交易市场专业化关联分析的要素主要包括,城镇居民恩格尔指数, 农村 居民恩格尔指数,人口密度,公路密度,铁路密度,个私经济发展水平,贸易竞争,城市化水平,第二产业占所有产业比重,市场化水平,邻域专业化水平。这些数据主要来源于2001到2007年的中国统计年鉴和中国人口统计年鉴。其中有些因素是通过计算得到,例如贸易竞争水平是通过出口额与进口额的比值得到。 二、研究方法 1.商品交易市场的专业化测度方法。在产业经济学中,区位商常被用于衡量区域内部的某一部门专业化水平的高低,如商建初等利用区位商研究了长三角地区 工业 的行业专业化程度;宗刚等利用?指数及区位商对北京产业结构进行研究。区位商反映的是一个研究区域内某一产业是否具有比较优势,但无法反映各种产业在空间上聚集后专业化的程度。贺灿飞等在研究中国制造业的省区专业化时,引入了一个专业化测度方法来度量各省区的诸产业相对集中指标。当研究区域中所有产值或其他考察变量集中于一个产业时,专业化指数应该最高, 理论 上应该是1,然而该公式测算的结果为(n-1)/n,只有当n趋于无穷大时才能得到1。当专业化水平较高时,n越大,计算的专业化指数就越精确。商品交易市场专业化指研究区域内所有类型交易市场的交易额或从业人口总数在各类交易市场间的集中程度。当交易额或其他参数在各类交易市场之间平均分布,专业化指数最小,是0;当交易额或其他参数集中于某一类市场,专业化指数最高,是1。为了正确衡量商品交易市场的专业化水平,本文对贺灿飞等人提出的模型进行改进,并用其对中国亿元商品交易市场的专业化水平进行度量。商品交易市场专业化指数的计算公式如下: (1) (1)式中,S是研究区域中商品交易市场类型的个数; 为研究区域中每类交易市场占所有类型交易市场的总成交额的比重的平均值;VAjn,VAkn 为研究区域n中j,k两种类型商品交易市场的成交额;VAn为研究区域n中所有类型商品交易市场的成交额。当研究区域中的商品交易市场类型个数为1时,不采用该计算公式,专业化指数为1。 2.空间关联规则。Agrawal等于1993年首先对顾客交易数据中购买物品之间的关联 问题 进行研究,提出了关联规则的概念,并给出了相应挖掘的算法。Koprski K对传统的关联规则进行了拓展,并成功地将其引入了空间数据挖掘领域。从此诸多地学工作者和区域经济学家对空间关联规则挖掘进行了大量的研究,主要包括概念,挖掘过程,挖掘算法等。这些基础性的研究工作大大地促进了空间关联规则在各领域中的 应用 。空间关联规则是通过蕴含表达式来进行描述,如AB(c,s)。A和B是交集为空(AB=)的谓词集合,且二者中至少包含一个空间谓词。s,是规则的支持度,指A和B在所有空间事务中同时发生的概率,P(AB)。c,规则的可信度,指在所有空间事务中A发生的前提下B发生的概率,P(B/A)。非空间谓词,指常规的逻辑谓词。空间谓词是包含空间关系的逻辑谓词。除了可信度和支持度,很多学者还开发出了其他的指标对空间关联规则进行衡量。蕴含表达形式直观、简单、明了。如规则,isa(x,house)closeto(x,urban center)is-expensive(x)(100%,95%)。该规则表明:95靠近市中心的房子价格都高,该规则的正确率为100。 3.邻域专业化空间滞后。一个研究区域的商品交易市场专业化的水平不但与该区域中的经济因素有关,而且还受到其邻域商品交易市场专业化程度的影响。本文中通过专业化指数滞后来反映邻域专业水平对当前研究区域商品交易市场专业化的影响。专业化指数滞后计算公式如式(2)所示。 (2) S是邻域亿元商品交易市场专业化指数空间滞后,N是研究区域的邻域个数,pn和n分别是第n相邻区域的专业化指数和相应的权重。 三、亿元商品交易市场区域专业化关联分析 1.亿元商品交易市场区域专业化计算。关联规则分析要求数据表中的属性是离散的数值或符号。在进行关联分析之前,应该将连续的专业化指数转换成离散的专业化水平。本文将商品交易市场专业化划分成三个等级:高专业化水平,中等专业化水平和低专业化水平。下图展示了2005年各省区亿元商品交易市场专业化水平的分布情况。 说明:(a)是亿元商品交易市场专业化指数(连续)分布图,(b)是离散化亿元商品交易市场专业化水平分布图统计数据主要包括大陆省区亿元商品交易市场成交额数据。西藏地区和港澳台地区没有统计数据,专业化指数设为0。为统一数据,专业化计算过程中没有包含计算机市场、通讯器材市场和花卉市场。 连续型专业化指数可以更精确地表示商品交易市场的专业化水平,但是其不符合人们的思维习惯,比较抽象不易理解。离散型的专业指数很容易被人们接受和理解,但精度不是很高。由于关联 分析 的需要,我们需要将连续的专业化指数进行离散化处理。 2.亿元商品交易市场区域专业化关联因素分析。关联规则分析可以发现专业化水平和区域其他因素之间让人感兴趣的关联知识。关联规则的支持度反映该规则在挖掘数据中的覆盖度;可信度反映规则的正确度。在对挖掘规则没有限制的情况下,会有大量的关联规则成为挖掘结果,但其中只有很小的一部分是有意义的。最小置信度和支持度分别设置为80和10。除了规则模版、最小支持度和置信度,我们通过专业知识对的挖掘结果进行分析评估来得出最终有意义的关联规则,如表1所示。 结合 中国 亿元商品交易市场的专业背景知识,这里我们得到了3条有用的规则。它们的支持度和置信度分别在14和81以上。其中第一规则说明:如果一个地区的城市化水平中等,第二产业占所有产业的比重高,市场化水平低,人口密度低,高速公路密度低,该地区的亿元商品交易市场专业化是中等水平,该规则的支持度是14.29,置信度是90%。 四、讨论与结论 商品交易市场专业化 影响 因素是分布于一定的区域空间中,具有属性信息和空间信息,且相互之间存在一定的相关性。由于空间信息的存在和统计独立性假设的无法满足,从而使得传统的分析 方法 无能为力。空间关联规则可以反映要素的空间、非空间信息之间的关系,适合进行商品交易市场专业化关联分析。空间关联规则分析要求数据表中的数据项是离散的,然而专业指数和影响因素数据都是连续的。连续数据离散化是空间关联分析的第一步工作。上图显示了2005年中国亿元商品交易市场省区专业化指数连续值和离散值的空间分布情况。通过对比我们可以发现:连续数据表达更精确;离散数据表达更易理解。上表显示了空间关联分析获得的强关联规则。在指定的最小置信度和最小支持度下,我们只能获得后件为商品交易市场专业化是中等水平的关联规则。不同的关联规则前件,对应的置信度和支持度也各不相同。连续数据离散化是关联分析前最为重要的数据处理过程。不同的离散化方法得到的离散化结果存在很大的差异,最终影响关联分析的结果。本文中采用的等距离离散化方法将所有连续数据转换成三个等级的离散值:高、中和低。由于专业化指数和影响因素的连续数值集中于一个很窄的数据范围内,从而导致了离散化后数据集中于中水平等级。如最终的挖掘结果所示,所有强规则的后件都是专业化水平中,其他两个等级为后件的规则都被最小支持度和可信度过滤掉了。同时缺失数据的插值算法和统计数据本身的精度对离散化的结果也有着重要的影响。商品交易市场专业化是衡量一个地区所有商品交易市场的 经济 总量在各类交易市场之间的集中程度,其反映了经济总量的一种分布模式。基于前人的 研究 基础,作者给出了商品交易市场专业化指数的 计算 公式。空间关联规则被用于对商品交易市场专业化与其影响因素之间关联分析,如最后分析结果所示,我们得到了
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《创业学》重点题集
- 年产1万吨碳酸二甲酯合成项目可行性研究报告
- 2024年动量守恒定律【八大题型】(含答案)
- 2023年传统银饰资金申请报告
- 高中生元旦晚会主持的开场白范文(35篇)
- 2024年中考历史考前速背知识梳理
- 离任发言:国企党委书记在离任干部大会上发言材料
- 每月实习报告
- 统计的实习报告
- 自由与自律演讲稿
- 公司负责人履职待遇和业务支出情况自查报告范文集团企业工作汇报总结
- 江苏省工程建设项目施工招标评标报告
- GB/T 5699-2017采光测量方法
- GB/T 40734-2021焊缝无损检测相控阵超声检测验收等级
- GB/T 22806-2008白卡纸
- GB/T 1910-1999新闻纸
- 药物性肝损害
- 第四章-世界区域经济贸易集团
- 产后出血教学版课件
- 【公开课】《农业专题复习》【课件】
- 中频电治疗仪操作培训课件
评论
0/150
提交评论