版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、成绩 江西财经大学 2010 2011学年第二学期期末考试论文题目:我国地区经济增长与税收收入增长的相关性分析及对策研究课程编码 06452 选课班 A01 课程名称 税收统计 任课教师 涂雄苓 62 1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111学 号 0082261 姓 名 刘起辉 个人收集整理,勿做商业用途文档为个人收集整理,来源于网络学 院 金融与统计学院 专业 统计学考试时间 2011年6月9日星
2、期四 江西财经大学20102011第2学期课程论文考试评分表课程名称及代码: 06452 提交时间:6。9学生姓名刘起辉学 号0082261成绩学 院金融与统计学院任课教师涂雄玲题 目我国地区经济增长与税收收入增长的相关性分析及对策研究项目评分点评分理由得分选题(010分)价值难度论点(15分)确定性新颖性论据(30分)阅读范围调研观察资料运用分析推理结论(15分)合理性说服力写作(3040分)结构表达规范 注:教师提供选题者,选题项不予评分 任课教师: 基于支持向量机的税收预测模型的研究摘 要:针对税收收入预测不稳定、非线性、动态开放性的特点,提出了支持向量机(SVM)的税收收入预测方法,并
3、将该方法 用于某市国税 系统的实际税收收入情况进行预测,和传统回归方法比较说明所提出的税收收入预测方法是可行和有效的。关键词:支持向量机;税收;预测 Forecasting model of tax based on SVMAbstract: Because the tax forecasting is an uncertain, nonlinear, dynamic and complicated system, it is difficult to describe such a nonlinear characteristics of this system by traditional
4、 methods, so the tax forecasting is not accurately forecasted. A novel tax method is presented in which an improved support vector machines (SVM) algorithm is applied. Applying the presented method to actual tax forecasting, the comparison among the forecasted results an d the true show that the pre
5、sented method is feasible and defective文档为个人收集整理,来源于网络个人收集整理,勿做商业用途Keywords: support vector machines; tax; forecasting引言税收预测就是以充分掌握影响税收收入变动的因素和税收历史资料为基础,以统计方法、数学方法为手段,经过严密的推理和计算,对未来税收收入的前景做出比较确定的判断的一项科学管理工作。其目的在于推测和预见税源、税收和税务工作未来的发展变化趋势。因此,税收预测工作对于加强组织收入工作,更好地完成税收任务,为领导 的科学决策和管理提供服务等,都具有重大意义.目前,估算税收
6、收入方法主要有因素计分法、因素回归法、系数调整法和人工神经网络 方法等。由于这些方法有的适用于大范围、多样本数据的处理,有的适用于较模糊情况的处理 ,有的则适用于一些不可比事件的量化处理。在实际情况中,必须进行深入细致的定性与定量分析,选择最适合税收特点的计算方法和模型方法。2O世纪 7O年代 ,Vapnik等人提出统计学习理论,并用其研究有限样本的机器学习理论,为有限样本尤其是小样本情况下机器学习提供了有力的理论依据,到2O世纪9O年代中期,随着其理论的不断发展和成 熟,也由于神经网络等学习方法在理论上缺乏实质性进展,统计学习理论开始受到越来越广泛的重视,并在此理论框架下产生了支持向量机(s
7、upport vector machine ,SVM)这一新的通用机器学习方法。目前,SVM已经在模式识别中取得了良好的应用效果,广泛应用于文本 识别、语音识别、人脸识别。近年来,人们又发展了回归型支持向量机,它可以任意精度逼近非线性函数,具有全局极小值点 ,收敛速的快。与人工经网络方法相比,SVM不存在容易陷于局部最优等问题,并且提高了泛化能力,因此有较大的优越性。针对税收收入预测的特点,时间、GDP等多重因素对税收收入的影响一直制约着预测精度的提高,本文根据XX市 国税系统税收特点,提出了基于支持向量机(SVM)进行税收收入预测,为税收分析提供了新思路。支持向量机(SVM)的基本原理1 S
8、VM的基本思想支持向量机(SVM)的基本思想是通过用内积函数定义的非线性变换将输入空间变换到一个高维空间,在这个高维空间中寻找输入变量和输出变量之间的一种非线性关系。SVM有严格的理论基础,是基于结构风险最小化原则的方法,明显优于传统的基于经验风险最小化的常规神经网络方法.其算法是一个 凸二次优化问题 ,保证找到的解是全局最优解,能较好的解决小样本、非线性、高维数等实际问题,问题的复杂度不取决于特征的维数,且具有良好的推广能力,正在成为继神经网络研究后的研究热点。2 改进的SVM算法 对 于 训 练 样 本 集 (x ,y)为输入变量的值,YER为相应的输出值,1为训练样本个数,回归问题就是寻
9、找一个从输入空间的输出空间的映射:一,使得 )=y.SVM的目标是 寻求 回归函数(1)y= )= · +6 作者简介:常青 (1970一),女,山东青岛人,硕士,高级工程师,研究方向为数据挖据; 刘强,副教授。收稿日期:200603-08Emaih _c玎维普资讯 http:/一l653 1654 一式中: -权重、z 一 样本输入值;6R-阈值。对 于 线 性 问 题 ,根 据 统 计 学 习 理 论 ,SVM 通 过 极 小 化 目 标 函 数 来 确定回归函数,即Min(丢ll+C·( 善l()(2) 约 束 条 件 为(1)多项式
10、核函数 J)=。 1)1,2,(14)(2)径向基(radialbasicfunction,I F)核函数 K(x,y)=exp()(15)( · )+6)一 一( · J+6)(4)O,sO(5) 式 (2 式 (5)中 : 旷 一 平 衡 模 型 复 杂 项 1 lJ f 和 训 练 误 差项的权重参数;不敏感损失函数。己 -松弛因子.对 于约束条件,我们引入相应的乘子a a,7,O,根据拉格 朗日算法,得出下式(,6,a,己“,s,7,7。):ll+Co 砉()一一 (叩 叩 )一a,( 一( - 一6+s)一a(+( 五)+6一 +s)(6)为了最小化式(2),需要
11、求出式(6)的鞍点,也就是最小化 变 量 ,s,b,己 并 且 最 大 化 变 量 a a礁 ,7, 。因 此 可 以 得 到 以 下4个方程=(a一a)(7) C·0一(a )一=O(8) 一a):O(9)导 一a 一,7')_o(1o) 求解上述问题,我们将得到SVM的回归函数,)= 一a)(+6(11)对于非线性问题,可以通过非线性变化将原问题映射到 某个高维特征空间中的线性问题上进行求解。在高维特征空间中,线 性问题 中的 内积运算 可以用核 函数来代 替,即 K(x,xj)=cp(x)((12)核函数可 以用 原空间中 的函数 实现 ,没有 必要知道非线 性变换的具
12、体形式。因此非线性问题的回归方程为。 , )=:一aJ+6(13)2 基于支持向量机 (sVM)的税收预测模型2.1 税 收 收 入 影 响 因 素 的 确 定 由于税 收收入预测 与很多 因素有关 ,为 了弄清楚 系统 中各 因素 的 内在联 系及其发展 规律 ,本文 采用灰色 系统理论对 影响税 收收入 的有 关经济指 标进行优 化选择 ,利 用灰色关 联 分析方法对税收收入的影响因素进行定量分析和宏观因素 的筛选,评估税收收入中诸多因素的作用,寻求未来发展中值得注重 的因素。灰色关联分析是根据 因素发展态势的相 似或相异程度来衡量因素间的关联度,是动态过程发展态势 的 量 化 分 析。
13、2.1.1 确定特征序列和因素序列表 1是某市 194年2004年相关经济指标数据,设税收 收入为特征行为序列 ,根据影响因素的大小,资料的可比性 及 预测模型 的要求等 原因,选择 以下 9个指标 :第一产业增加值 、第二产业增加值 、第三产业增加值咒、工业增加值 、 财政支出 、固定资产投资总额 、全国城乡储蓄存款年末余 额、社会 消费品零售 总额墨、进出 口总额蜀作 为相关因素序 列进行灰色关联分析.这些指标中,有直接影响税收收入水 平 的三 次产业 发展状 况的指标,如第 一、二、三产业增加值 ,有 直接或 间接反 映税 收规 模大小的指标,如进出 口总额 、固定资 产投资总额;有反映
14、人民生活水平和直接影响税收总量增长 状况 的指标 ,如社会消费 品零售总额 ;有反 映税 收增长 与经济 发展 相互关系 的指标 ,如全 国城 乡储 蓄存款年末余 额等。 2.1。2 数 据 初 始 化模型建立过程 中,由于指标 的量纲不 同,数据在数量上差 异性很大,无法进行关联计算,需要对各指标的数据进行归一税 收 收 入 ,亿 元 第 一 产 业 增 加 值 ,亿 元 第二产业增加值,亿元 250。34 第三产业增加值,亿元 185.45328。49 248。90 289.9lI95.64 145.94 746。97 607.27 680.96 478。25 124_39工业增加值,亿元
15、 2l9.50 固定资产投资总额,亿元 l78。50524。12 578.23 384.41 l09。78财政支出,亿元 全 国 城 乡 储 蓄 存 款 年 末 余 额 ,亿 元 社 会 消 费 品 零 售 总 额 ,亿 元 进 出 口 总 额 ,亿 美 元27。73 36I.06 l39.75 8 。8637.7064.96 477。79 594.13 170。76 l94.59 l30.75 l3.93l079.89 1304.48 352.840.49301.20 228。60 265。80 214.O0 2l0。03382。0l 298.72 340.00 2l0。20 56。48 6
16、50.88(3)sigmoid核 函 数 (3)-tanhb··。y)+(16)根据支持向量机回归函数的性质,只有少数(aa)不为 化处理,本文采用初值化算子对数据进行归一化. 零,这些参数对应的向量成为支持向量,回归函完全由2。13 计算灰色关联度 其决定 。根据灰色关联度计算步骤 ,经过运算 ,得 出税收收入与目前人们构造了lO多种核函数,其中常用的有如下几种: 的关联度分别为 表1 194年204年XX市相关经济指标数据塑l94 46_3O 84。97195 55。O9 Il2.23l96 l97 l98 64.0I79。6484.94l32.8l Il6.97 14
17、0。40l99 Io3。O3 137_36 472。20 383。27 420。70 278.95 74。09 894。57200 2ol 2o2158.63I78。62 l39。8143。2 560.0l 648.742o3 252。76 147。5l 937.2l 695.70 825.52 739_38 147.12 908。47 5l2.2 408.8l2O04 336.32 l6I.80 I17I.40 830。60 l024。10 1025。40 146.06 l089。49 605.50 269。88413。76 334.24 366。87 242_30 67。86 723。92
18、 2l6.18 242.03 270_3 l54。23 l46_37 l69。65450.18 5o_32 321。13 87.87 956。43 307。70 252。40 279。7l 3l2.80维普资讯 http:/(下转第 1694页)获 历 时 较 平 时 长 ,超 过 了 通 信 程 序 设 定 的 出 错 等 待 时 间 ,导 致 通信 失败 .于 是加长了上 、下位机通信程 序的延时时长 ,并 经 过 调 试 、使 用 ,达 到 了较 好 的 可靠 性 、较 高 的成 功 率 ,满 足 了应 用 的 需 求 。参考文献:【1吕捷 .GPRS技术【M】.北 京 :北京 邮 电学
19、 院 出版 社,201.51。 53。637O.【2 摩托罗拉工程学院。GPRS网络技术【M。北京:电子工业出版 社 .2005.6070。【3】 程起敏,杨崇俊,刘冬林,等。基于WebGIS/GPS/GSM的车辆监 控 网络 信息 系统【J】.计 算机工 程,205,31(7):4648.(上 接 第 1654 页 )yo1=o。751 154,y02=0。859 695, =0。822 426,yo4=0.814 76,yo严 0.773486,0.8l1631,=o。740 93,y佣=O。770 255,y呻=O.706 483由于>. >. 。.y蚰>。yo>
20、。y们.y呻,影响XX市国税税 收收入的主要经济因素依次为 :第二产业增加值 、第三产 业增 加值、工业增加值 、固定 资产投 资总额 、财政支 出、社会消费 品 零 售 总 额 、第 一 产 业 增 加 值 、全 国 城 乡 储 蓄 存 款 年 末 余 额 、进 出 口总 额 .2。2 税收收入预测模型的建立 由于税收收入预测与很多因素相关,假设置 为影响税收 收 入 的 因 素 , 为 税 收 收 入 预 测 值 (卢 1,2, 曲 。 根 据 支 持 向 量机 理 论 ,税 收 收 入 预 测 模 型 的 建 立 也 即 寻 求 如 下 的 表 达 式 成 立 I一+6 l式中: 影响税
21、收收入预测的因素;广 个样本中的第i 个样本;K(x,x核函数,可在式(14 式(16)中选择。然后利 用 M atlab 的 优 化 工 具 箱 求 解 支 持 向 量 机 的 二 次 规 划 问 题 。文中选取 XX市 194年2004年的税收统计,根据灰色 关联分析结果 ,以税收值为预测指标 ,第二、三产业 增加 值、固 定 资 产 投 资总 额 、进 出 口总 额 为 输 入 指 标 ,把 1994年1998年 的数据 为训练 样本 ,199年-203年 的数据 为测试样本 ,通过 对 各 种 核 函 数 的 测 试 ,最 终 选 择 RBF(径 向 基 )核 函 数 ,由 式 (7
22、式 (1O)解 得,a ,b,即 可 得 到 支 持 向 量 机 的 税 收 收 入 预 测 模 型 。训练 结束后 的支持 向量机模 型必须 经过测试集 的评定 , 以此来控制该模 型的预测性能 .本文 用 199年一203年的数 据 评价预测结果 ,将 预测值与 实际值进 行 比较 。预测结 果及 误差分析如表2所示,计算值与实际值很接近,说明该方法应表2 基于支持向量机 (SVM)模型预测的税收收入结果Regis (Bud)J Bates。GPRS:Generalpacketradio service【M . New York:M cGrawHil,2001.131.149。王庆 刚,杨
23、佃福 。GPRS技术在 嵌入 式系统 中的应用 【J】.微计算 机 信 息 ,20 5,(5)。69.70. 韩 斌 杰 。G PR S 原 理 及 其 网 络 优 化 M 匕京 :机 械 工 业 出 版 社 , 2003。2553,81147。胡峪,刘静 。VC+高级编 程技 巧与 示例 【M.西 安:西 安 电子科 技大学 出版 社,201.98.131,132。21.DavidMDikel揿 件架构组织原则与模式【M1=。北京:机械工业 出 版 社 ,2002.1 。24。全茜,郑雪峰。基于 GPRS的电力线路监控系统【J】。计算机工 程 与设 计,2005,26(11):3053。3055。用与 于税收收 入预测是可行 的。因为 SVM 算 法 的计算结果 稳定,不像一般算法具有一定的随机性,而且 SVM算法不会陷入局部最优值,用于税收收入预测具有一定的优势. 3 结束语税收收入预测受很多因素 的影响 ,很难在税收收入和这些 因素之间一种确定 的数学模型。一方面 ,这种关系是一种非常 复杂的非线性关系 ;另一方面 ,税收收入预测还与 具体 的因素 有很大的关系。本文基于灰色系统理论的灰色关联分析方法确 定了影响税收收入的经济指标 中的主要因素和次要 因素 ,并根 据 评 价 结 果 ,优 化 选 择 输 入 指 标 ,建 立 基 于 支 持 向 量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论