




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、财政收入的影响因素的回归分析 指导老师:李世纪姓 名:张晓倩 学 号:100311157 班 级:10级应数摘要国家的财政收入是国家的命脉,国家的财政收入与工业总产值,农业总产值,建筑业总产值,社会消费品销售总额,人口数目,受灾面积等有关。本文主要是要来研究影响财政收入的主要因素有哪些,之所以研究这一问题,是因为,财政收入对于国民经济的运行及社会发展具有重要影响。本文主要针对19882011年间,我国财政收入的变化及其影响因素进行分析。通过收集我国财政收入、工业总产值、农业总产值、建筑业总产值等数据,进行统计模型的建立,分析七者之间的关系。经过分析,发现工业总产值、农业总产值、建筑业总产值、社
2、会消费品销售总额等对我国财政收入有着重要影响。最后,根据相关分析结果提出了一些个人看法。关键词:多元线性回归分析;财政收入;影响因素目 录绪论1问题的提出12多元线性回归分析的原理和模型12.1一元线性回归模型12.2多元线性回归分析模型22.3多元线性回归参数的普通最小二乘估计32.4多元线性回归分析回归方程的显著性检验。42.5相关阵及偏相关系数53逐步回归64对国家财政收入及各项指标做多元线性回归分析和逐步回归分析74.1 指标的选取74.2结果输出及分析85结果分析与对策186结语18参考文献19绪论本文通过对1988到2011年影响财政收入的六大元素以及财政收入的数据做多元线性回归分
3、析,建立回归模型,并对2012年的财政收入进行预测,同时通过对回归系数做显著性检验与逐步回归来分析数据。从国民经济部门结构看,财政收入又表现为来自各经济部门的收入。财政收入的部门构成就是在财政收入中,由来自国民经济各部门的收入所占的不同比例来表现财政收入来源的结构,它体现国民经济各部门与财政收入的关系。我国财政收入主要来自于工业、农业、商业、交通运输和服务业等部门。其中工业和农业对财政收入的影响最大。第一步,根据所给的数据进行了描述性的分析,随后对数据进行了回归分析,剔除了数据中的异常点,在此基础上构造了多元线性回归模型,再通过Excel进行数据分析,获得模型的回归系数估计值。第二步,通过Ex
4、cel进行了数据分析,对模型进行了F-检验和t-检验,确定下面的所构造的模型是可用的。第三步,将所给数据的各项经济指标代入模型,得到预测值与实际值的拟合效果较好,预测较准确。最后,通过上网搜索,得到了2012年的各项经济指标,将其代入模型中,对2012年的财政收入进行预测,并对结果进行分析。211问题的提出财政收入对于国民经济的运行及社会发展具有重要影响。首先,财政收入是一个国家各项收入得以实现的物质保证。一个国家财政收入规模大小往往是衡量其经济实力的重要标志。其次,财政收入是国家对经济实行宏观调控的重要经济杠杆。宏观调控的首要问题是社会总需求与总供给的平衡问题,实现社会总需求与总供给的平衡,
5、包括总量上的平衡和结构上的平衡两个层次的内容。财政收入的杠杆既可通过增收和减收来发挥总量调控作用,也可通过对不同财政资金缴纳者的财政负担大小的调整,来发挥结构调整的作用。此外,财政收入分配也是调整国民收入初次分配格局,实现社会财富公平合理分配的主要工具。在我国,财政收入的主体是税收收入。因此,在税收体制及政策不变的情况下,财政收入会随着经济繁荣而增加,随着经济衰退而下降。我国的财政收入主要包括税收,国有经济收入,债务收入以及其他收入四种形式,因此,财政收入会受到不同因素的影响。从国民经济部门结构看,财政收入又表现为来自各经济部门的收入。财政收入的部门构成就是在财政收入中,由来自国民经济各部门的
6、收入所占的不同比例来表现财政收入来源的结构,它体现国民经济部门与财政收入的关系。我国财政收入主要来自于工业、农业、商业、交通运输和服务业等部门。本文根据1988到2011年中国财政收入的统计年鉴相关数据,利用多元线性回归分析,确定影响我国财政收入主要因素,探讨财政收入对于国民经济的运行及社会发展的重要影响。2多元线性回归分析的原理和模型2.1一元线性回归模型1. 普通最小二乘估计(Ordinary Least Square Estimation,简记为OLSE)最小二乘法就是寻找参数0、1的估计值 使离差平方和达极小称为yi的回归拟合值,简称回归值或拟合值 称为yi的残差 经整理后,得正规方程
7、组得OLSE 为记2. 最大似然估计连续型:是样本的联合密度函数:离散型:是样本的联合概率函数。似然函数并不局限于独立同分布的样本似然函数y1,y2,yn的为函数为对数似然:与最小二乘原理完全相同 2.2多元线性回归分析模型1. 多元线性回归模型的一般形式设随机变量y与一般变量的线性回归模型为对n组观测数据 (xi1, xi2,xip; yi), i=1,2,n,线性回归模型表示为:写成矩阵的形式为:2.3多元线性回归参数的普通最小二乘估计 1. 最小二乘估计 最小二乘估计要寻找经整理后得用矩阵形式表示的正规方程组 移项得存在时,即得回归参数的最小二乘估计为:.2. 回归值与残差3. 为回归值
8、称为帽子矩阵,其主对角线元素记为hii ,则此式的证明只需根据迹的性质tr(AB)=tr(BA),因而得D(ei)=(1-hii)2,i=1,2,n是2的无偏估计3. 回归参数的最大似然估计似然函数为 等价于使达到最小,这又完全与OLSE一样。2.4多元线性回归分析回归方程的显著性检验。1. F检验H0:1=2=p=0SST = SSR + SSE 当H0成立时服从方差来源自由度平方和均方F值P值回归残差总和pn-p-1n-1SSRSSESSTSSR/PSSE/(n-p-1)P(FF值)=P值2. 回归系数的显著性检验H0j:j=0, j=1,2,p(,(X)-1)记 (X)-1=(cij)
9、i,j=0,1,2, ,p构造t统计量 其中3. 回归系数的置信区间可得j的置信度为1-的置信区间为:4. 拟合优度决定系数为:y关于x1,x2,xp的样本复相关系数2.5相关阵及偏相关系数1. 样本相关阵自变量样本相关阵 增广的样本相关阵为: 2. 两个自变量的偏判定系数3. 一般情况在模型中已含有x2,xp时,y与x1的偏判定系数为:4. 偏相关系数对任意p个变量x1,x2,xp定义它们之间的偏相关系数其中符号ij表示相关阵第i行第j列元素的代数余子式验证3逐步回归3.1前进法前进法的思想是变量由少到多,每次增加一个,直至没有可引入的变量为止。首先分别对因变量y建立m个一元线性回归方程,并
10、分别计算这m个一元回归方程的m个回归系数的F检验值,记为,选其最大者记为:给定显著性水平,若F(1,n-2),则首先将xj引入回归方程,为方便,设xj就是x1。接下来因变量y分别与 (x1,x2),(x1,x3),(x1,xm)建立m-1个二元线性回归方程,对这m-1个回归方程中x2,x3,,xm的回归系数进行F检验,计算F值,记为,选其最大的记为:若F(1,n-3),则接着将xj引入回归方程。3.2后退法后退法与前进法相反,首先用全部m个变量建立一个回归方程,然后在这m个变量中选择一个最不重要的变量,将它从方程中剔除。设对m个回归系数进行F检验,记求得的F值为,选其最小者记为:给定显著性水平
11、,若F(1,n-m-1),则首先将xj从回归方程中剔除,为方便,设xj就是xm。接着对剩下的m-1个自变量重新建立回归方程,进行回归系数的显著性检验,像上面那样计算出,如果又有F(1,n-(m-1)-1),则剔除xj,重新建立y关于m-2个自变量的回归方程,依此下去,直至回归方程中所剩余的p个自变量的F检验值均大于临界值F(1,n-p-1),没有可剔除的自变量为止。这时,得到的回归方程就是最终确定的方程。3.3逐步回归法逐步回归的基本思想是“有进有出”。具体做法是将变量一个一个引入,当每引入一个自变量后,对已选入的变量要进行逐个检验,当原引入的变量由于后面变量的引入而变得不再显著时,要将其剔除
12、。这个过程反复进行,直到既无显著的自变量选入回归方程,也无不显著自变量从回归方程中剔除为止。这样就避免了前进法和后退法各自的缺陷,保证了最后所得的回归子集是“最优”回归子集。在逐步回归中需要注意的一个问题是引入自变量和剔除自变量的显著性水平值是不相同的,要求进出,否则可能产生“死循环”。也就是当进出时,如果某个自变量的显著性P值在进与出之间,那末这个自变量将被引入、剔除、再引入、再剔除、,循环往复,以至无穷。4对国家财政收入及各项指标做多元线性回归分析和逐步回归分析4.1 指标的选取从国家财政收入的各项主要指标体系中选取了5个指标(出自中国统计年鉴(2002年):工业总产值(亿元)农业总产值(
13、亿元) 建筑业总产值(亿元)社会消费品零售总额(亿元)受灾面积(十万公顷) 人口数目 (百万人)据此建立模型方程为:相关数据如下表:年份财政收入(亿元)工业总产值(亿元)农业总产值(亿元)建筑业总产值(亿元)社会消费品零售总额(亿元)受灾面积(十万公顷)人口数目 (百万人)obsYX1X2X3X4X5X619882357.2425296.745865.31131.656534.6508.71110.2619892664.929911.306534.71282.987074.2469.911127.0419902937.129934.907662.11345.017250.3384.741143
14、.3319913149.4834245.5881571564.338245.7554.721158.2319923483.3741912.799084.72174.449704.8513.331171.7119934348.9558473.7710995.53253.512462.1488.291185.1719945218.171854.1815750.54653.3216264.7550.431198.519956242.276511.0920340.95793.7520620546.881267.4319967407.9973041.4822353.78282.2524774.1458.
15、211211.2119978651.1479479.5223788.49126.4827298.9469.891223.8919989875.9576678.9424541.910061.9929152.5521.551276.27199911444.0885855.2524519.111152.8631134.7534.291236.26200013395.2396232.2624915.812497.634152.6471.191284.53200116386.04107283.2526179.615361.5637595.2501.451247.61200218903.64122837.
16、4127390.818527.1842027.1499.811257.86200321715.25158899.2829691.823083.8745842545.061292.27 200426396.47214272.613623925258.6859501371.061298.88200531649.29252586.8439450.932142.3468353388.181307.56200638760.20321423.4040810.843632.4879145410.911314.48200751321.78436324.894889357558.9893572489.92132
17、1.29200861330.3550744858002.267729.01114830399.91328.02200968518.3054831160361.076808132678472.141334.50201083101.5169859169319.891435.53156998374.261340.912011103874.4384426981303.9117060183919324.711347.35表3.14.2结果输出及分析1.利用spss软件,对如上数据做回归分析:系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-3870.7391967.075-1.968
18、.066VAR00002-.015.009-.119-1.687.110VAR00003-.320.112-.530-2.870.011VAR00004.532.109.5774.876.000VAR00005.409.098.9714.197.001VAR00006.6171.279.007.482.636VAR000074.6272.175.0752.127.048a. 因变量: VAR00001建立回归模型:因而y对六个自变量的线性回归方程为:对数据用spss软件计算出的方差分析如下:Anovab模型平方和Df均方FSig.1回归8.335E861.389E81929.222.000a残
19、差1224178.5251772010.501总计8.348E823a. 预测变量: (常量), VAR00007, VAR00006, VAR00004, VAR00002, VAR00003, VAR00005。b. 因变量: VAR00001输出结果中,Sig即为显著性P值,由P值=0.000(近似值)可知其回归方程高度显著。即可以以99.9%以上的概率断言自变量全体对因变量y产生显著性影响。由F检验知回归方程的整体是显著的,然而这种显著是6个自变量作为一个整体对因变量y有十分显著的影响。那么,每一个自变量是否对y有显著影响呢?利用spss软件计算得的t统计量及相应的P值,得到,并不是每
20、一个单独的对因变量y都有显著性影响,这说明尽管回归方程通过了显著性检验,但也出现某些单个变量对y并不显著的情况。样本相关阵如下:系数相关a模型VAR00007VAR00006VAR00004VAR00002VAR00003VAR000051相关性VAR000071.000-.554.073.280-.341.032VAR00006-.5541.000.163-.340.319-.193VAR00004.073.1631.000-.583.797-.971VAR00002.280-.340-.5831.000-.867.654VAR00003-.341.319.797-.8671.000-.89
21、5VAR00005.032-.193-.971.654-.8951.000协方差VAR000074.731-1.542.017.005-.083.007VAR00006-1.5421.636.023-.004.046-.024VAR00004.017.023.012.000.010-.010VAR00002.005-.004.0008.065E-5.000.001VAR00003-.083.046.010.000.012-.010VAR00005.007-.024-.010.001-.010.010a. 因变量: VAR00001某些自变量之间的相关性很高,例如.2. 前进法:对数据表3.1国
22、家财政收入y对其6个自变量做回归的数据,用前进法作变量选择,取显著性水平。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)1186.217152.7157.768.000VAR00004.918.018.99650.968.0002(常量)1421.763160.6148.852.000VAR000041.004.0361.09027.999.000VAR00002-.013.005-.105-2.695.0143(常量)966.172143.7516.721.000VAR00004.706.065.76610.833.000VAR00002-.035.006-.279-6
23、.311.000VAR00005.207.042.4904.947.0004(常量)1072.038138.5407.738.000VAR00004.462.122.5013.778.001VAR00002-.017.010-.130-1.703.105VAR00005.444.1101.0534.019.001VAR00003-.274.120-.453-2.288.0345(常量)-4207.0231799.564-2.338.031VAR00004.523.105.5684.970.000VAR00002-.014.008-.108-1.655.115VAR00005.419.094.9
24、934.469.000VAR00003-.337.103-.558-3.261.004VAR000075.2081.772.0852.940.009a. 因变量: VAR00001模型汇总模型RR 方调整 R 方标准 估计的误差1.996a.992.991564.492492.997b.994.993498.056443.999c.997.997342.259504.999d.998.997310.914705.999e.999.998262.56329a. 预测变量: (常量), VAR00004。b. 预测变量: (常量), VAR00004, VAR00002。c. 预测变量: (常量)
25、, VAR00004, VAR00002, VAR00005。d. 预测变量: (常量), VAR00004, VAR00002, VAR00005, VAR00003。e. 预测变量: (常量), VAR00004, VAR00002, VAR00005, VAR00003, VAR00007。Anovaf模型平方和Df均方FSig.1回归8.278E818.278E82597.692.000a残差7010338.87822318651.767总计8.348E8232回归8.296E824.148E81672.095.000b残差5209264.59421248060.219总计8.348E
26、8233回归8.324E832.775E82368.720.000c残差2342831.33720117141.567总计8.348E8234回归8.329E842.082E82154.108.000d残差1836691.0281996667.949总计8.348E8235回归8.335E851.667E82418.146.000e残差1240910.7061868939.484总计8.348E823a. 预测变量: (常量), VAR00004。b. 预测变量: (常量), VAR00004, VAR00002。c. 预测变量: (常量), VAR00004, VAR00002, VAR00
27、005。d. 预测变量: (常量), VAR00004, VAR00002, VAR00005, VAR00003。e. 预测变量: (常量), VAR00004, VAR00002, VAR00005, VAR00003, VAR00007。f. 因变量: VAR00001从输出结果中可以看出前进法依次引入了,最优回归模型为:复决定系数,调整的复决定系数为,而全模型的复决定系数为,调整的复决定系数为。3. 后退法对数据表3.1国家财政收入y对其6个自变量做回归的数据,用后退法作变量选择,取显著性水平。系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)-3870.739196
28、7.075-1.968.066VAR00002-.015.009-.119-1.687.110VAR00003-.320.112-.530-2.870.011VAR00004.532.109.5774.876.000VAR00005.409.098.9714.197.001VAR00006.6171.279.007.482.636VAR000074.6272.175.0752.127.0482(常量)-4207.0231799.564-2.338.031VAR00002-.014.008-.108-1.655.115VAR00003-.337.103-.558-3.261.004VAR0000
29、4.523.105.5684.970.000VAR00005.419.094.9934.469.000VAR000075.2081.772.0852.940.0093(常量)-4478.3091872.379-2.392.027VAR00003-.483.057-.799-8.512.000VAR00004.424.090.4604.687.000VAR00005.517.0751.2276.861.000VAR000075.5541.838.0903.022.007a. 因变量: VAR00001模型汇总模型RR 方调整 R 方标准 估计的误差1.999a.999.998268.347722
30、.999b.999.998262.563293.999c.998.998274.32700a. 预测变量: (常量), VAR00007, VAR00006, VAR00004, VAR00002, VAR00003, VAR00005。b. 预测变量: (常量), VAR00007, VAR00004, VAR00002, VAR00003, VAR00005。c. 预测变量: (常量), VAR00007, VAR00004, VAR00003, VAR00005。Anovad模型平方和Df均方FSig.1回归8.335E861.389E81929.222.000a残差1224178.52
31、51772010.501总计8.348E8232回归8.335E851.667E82418.146.000b残差1240910.7061868939.484总计8.348E8233回归8.333E842.083E82768.375.000c残差1429850.7351975255.302总计8.348E823a. 预测变量: (常量), VAR00007, VAR00006, VAR00004, VAR00002, VAR00003, VAR00005。b. 预测变量: (常量), VAR00007, VAR00004, VAR00002, VAR00003, VAR00005。c. 预测变量
32、: (常量), VAR00007, VAR00004, VAR00003, VAR00005。d. 因变量: VAR00001其中模型一是全模型,模型二和模型三依次剔除最优回归子集模型3的回归方程为复决定系数,调整的复决定系数为,而全模型的复决定系数为,调整的复决定系数为。前进法和后退法显然都有明显不足。前进法可能存在这样的问题,即不能反应引进新的变量后的变化情况。因为某个变量开始可能是显著的,但当引入某个自变量后它变得并不显著了,但是也没有机会将其剔除,即一旦引入,就是“终身制”的;这种只考虑引入,而没有考虑剔除的做法显然是不全面的。而且,我们在许多例子中会发现可能最先引入的某个变量,当其他
33、自变量相继引入后,它会变得对因变量y很不显著。后退法的明显不足是,一开始把全部自变量引入方程,这样计算量很大。如果有些自变量不太重要,一开始就不引入,就可以减少一些计算量;再就是一旦某个自变量被剔除了,它就再也没有机会重新进入回归方程。4. 逐步回归法以国家财政收入y为因变量,对其六个自变量做线性回归分析,用逐步回归法做变量选择,取显著性水平。首先进入线性回归对话框,将y与x1至x6分别选入各自的变量框,然后在方法对话框中点选逐步法,点选Options选项看到默认的显著性水平默认为。部分运行结果如下:模型汇总模型RR 方调整 R 方标准 估计的误差1.996a.992.991564.49249
34、2.997b.994.993498.056443.999c.997.997342.259504.999d.998.997310.914705.999e.997.997325.339956.999f.998.998274.32700a. 预测变量: (常量), VAR00004。b. 预测变量: (常量), VAR00004, VAR00002。c. 预测变量: (常量), VAR00004, VAR00002, VAR00005。d. 预测变量: (常量), VAR00004, VAR00002, VAR00005, VAR00003。e. 预测变量: (常量), VAR00004, VAR0
35、0005, VAR00003。f. 预测变量: (常量), VAR00004, VAR00005, VAR00003, VAR00007。Anovag模型平方和Df均方FSig.1回归8.278E818.278E82597.692.000a残差7010338.87822318651.767总计8.348E8232回归8.296E824.148E81672.095.000b残差5209264.59421248060.219总计8.348E8233回归8.324E832.775E82368.720.000c残差2342831.33720117141.567总计8.348E8234回归8.329E8
36、42.082E82154.108.000d残差1836691.0281996667.949总计8.348E8235回归8.327E832.776E82622.212.000e残差2116921.62120105846.081总计8.348E8236回归8.333E842.083E82768.375.000f残差1429850.7351975255.302总计8.348E823a. 预测变量: (常量), VAR00004。b. 预测变量: (常量), VAR00004, VAR00002。c. 预测变量: (常量), VAR00004, VAR00002, VAR00005。d. 预测变量:
37、(常量), VAR00004, VAR00002, VAR00005, VAR00003。e. 预测变量: (常量), VAR00004, VAR00005, VAR00003。f. 预测变量: (常量), VAR00004, VAR00005, VAR00003, VAR00007。g. 因变量: VAR00001系数a模型非标准化系数标准系数tSig.B标准 误差试用版1(常量)1186.217152.7157.768.000VAR00004.918.018.99650.968.0002(常量)1421.763160.6148.852.000VAR000041.004.0361.09027
38、.999.000VAR00002-.013.005-.105-2.695.0143(常量)966.172143.7516.721.000VAR00004.706.065.76610.833.000VAR00002-.035.006-.279-6.311.000VAR00005.207.042.4904.947.0004(常量)1072.038138.5407.738.000VAR00004.462.122.5013.778.001VAR00002-.017.010-.130-1.703.105VAR00005.444.1101.0534.019.001VAR00003-.274.120-.45
39、3-2.288.0345(常量)1169.190132.1018.851.000VAR00004.335.101.3633.302.004VAR00005.567.0871.3456.497.000VAR00003-.448.066-.741-6.798.0006(常量)-4478.3091872.379-2.392.027VAR00004.424.090.4604.687.000VAR00005.517.0751.2276.861.000VAR00003-.483.057-.799-8.512.000VAR000075.5541.838.0903.022.007a. 因变量: VAR00001逐步回归法依次引入进入回归模型,最终得回归方程同上:复决定系数,调整的复决定系数为,而全模型的复决定系数为,调整的复决定系数为。5结果分析与对策上网查询了2012年的财政收入,工业总产值,农业总产值,建筑业总产值,受灾
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 从教育改革视角探索创新人才培养的新方法
- 那个温暖的背影写人7篇范文
- 乡村绿色生态与健康生活方式推广
- 汽车维修技术实操训练题
- 2025年医学影像技术考试试题及答案
- 2025年环境法学专业考研复习试卷及答案
- 2025年基础教育与教育改革的呼应能力的测试试卷及答案
- 2025年法学专业实习考核试卷及答案
- 2025年大数据与人工智能相关知识考试试卷
- 2025年甘肃省民航机场集团校园招聘45人笔试备考试题带答案详解
- GB/T 21446-2008用标准孔板流量计测量天然气流量
- 无领导小组面试评分表
- 大学语文-第四讲魏晋风度和魏晋文学-课件
- 我们毕业啦毕业季通用模板课件
- 小升初数学复习八(平面图形)讲义课件
- (完整版)基建建设工程流程图
- 公司金融课件(完整版)
- 墙体开槽技术交底及记录
- 国家开放大学《调剂学(本)》形考任务1-4参考答案
- 公务员工资套改和运行案例
- 哥尼斯堡七桥问题PPT课件
评论
0/150
提交评论