版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、在校学生总数变动的多因素分析摘要:本文主要通过对中国各级各类学校在校学生总数的变动进行多因素分析,建立以在校学生总数为应变量,以其它可量化影响因素为自变量的多元线性回归模型,并利用模型对在校学生总数进行数量化分析,观察各因素是如何分别影响在校学生总数的。关键词:在校学生总数 多因素分析 模型 计量经济学 检验一、引言部分改革开放以来,中国的教育事业取得了长足的发展,各项教育指标都较以往有了很大提高,受教育的人数也是逐年上升,文盲比例直线下降。随着有知识、有文化的人数的不断增加,中国的经济也随之高速发展,众多毕业生们在各行各业上表现都十分出色,取得了一系列令人瞩目的成就。二、研究目的本文主要对中
2、国在校学生总数(应变量)进行多因素分析(具体分析见下图),并搜集相关数据,建立模型,对此进行数量分析。在得到在校学生总数与各主要因素间的数量关系后,据模型方程中的各因素系数大小,分析各因素的重要性,并找出影响在校学生总数最大的因素。影响在校学生总数变动的主要影响因素如下图:人口总数 这是影响在校学生总数的一个重要因素学校总数 这也是影响在校学生总数的重要因素人均gdp 我认为这个因素同样重要(注:1.由于其他因素或是不好量化,或是数据资料难于查找,故为了分析的简便,这里仅用此三个因素来进行回归分析。2.学校总数包括普通高等学校、普通中等学校、小学、特殊教育学校和幼儿园等,故学生总数也是以上学校
3、的人数之和。)三、建立模型 y=+1x1+2x2+3x3+u其中,y在校学生总数(应变量) x1人口总数(解释变量) x2 各级各类学校总数(解释变量) x3 人均gdp(解释变量)(注:有关模型的一些假定:(1)假定不考虑学生转学的影响。(2)假定各统计量计算准确。四、数据搜集数据说明在这里,使用同一地区(即中国)的时间序列数据进行拟合。 数据的搜集情况采用1985年到2003年的时间序列数据,具体情况见表一。表一:obsx1(人口总数/万)x2(学校总数/万)x3(人均gdp/元)y(学生总数/万)198510585111.108185320117198610750711.00635956
4、20325.8198710930010.90899110420248198811102610.71226135519848.8198911270410.54347151219489.4199011433310.40992163419532.519911158239.94932187919813.219921171719.85393228720215.319931185179.6081293920627.919941198509.5612839232146119951211219.46772485422418.119961223899.29882557623251.219971236269.06
5、617605423861.119981247618.85622630824074.219991257868.61273655124327.620001267438.25667708624369.920011276277.01097765124224.420021284536.62013821424389.320031292276.34737910124452.5 五、模型的参数估计、检验及修正1.模型的参数估计及其经济意义、统计推断的检验利用eviews软件,用ols方法估计,得:(见表二)表二:dependent variable: ymethod: least squaresdate: 0
6、6/07/05 time: 09:35sample: 1985 2003included observations: 19variablecoefficientstd. errort-statisticprob. c18008.664856.6553.7080380.0021x1-0.0803410.038584-2.0822410.0549x2851.4523174.17774.8884100.0002x31.3242340.12480010.610840.0000r-squared0.978300 mean dependent var21949.85adjusted r-squared0.
7、973960 s.d. dependent var2024.050s.e. of regression326.6198 akaike info criterion14.60013sum squared resid1600207. schwarz criterion14.79896log likelihood-134.7013 f-statistic225.4140durbin-watson stat1.074996 prob(f-statistic)0.000000y=18008.66-0.080341x1+851.4523x2+1.324234x3 (1.1) (3.708038)(-2.0
8、82241)(4.888410)(10.61084)r2=0.978300 r2 =0.973960 f=225.4140可见。x1, x2, x3的t值均是显著的,表明人口总数、学校总数、人均gdp都是影响在校学生总数的主要因素。x2, x3的系数符合经济意义,但x1的系数不符合经济意义,因为从经济意义上讲,在校学生的总人数应该都是随着人口总数(x1)、学校总数(x2)、人均gdp(x3)的增加而增加的。另外,可决系数为0.978300,修正可决系数为0.973960,都比较大,说明模型的拟合程度较高,而f值为225.4140,说明模型总体是显著的。2.计量经济学检验 (1)多重共线性检验用
9、eviews软件,得相关系数矩阵表:x1x2x3x1 1.000000-0.926023 0.962222x2-0.926023 1.000000-0.950977x3 0.962222-0.950977 1.000000由上表可以看出,解释变量x1与x3之间高度正相关,x1与x2,x2与x3之间高度负相关,可见存在严重的多重共线性。下面用逐步回归法进行修正:,用ols法逐一求y对各个解释变量的回归。dependent variable: ymethod: least squaresdate: 06/07/05 time: 11:14sample: 1985 2003included obse
10、rvations: 19variablecoefficientstd. errort-statisticprob. c-7419.8323436.949-2.1588430.0454x10.2467150.0288198.5608690.0000r-squared0.811715 mean dependent var21949.85adjusted r-squared0.800639 s.d. dependent var2024.050s.e. of regression903.7356 akaike info criterion16.55025sum squared resid1388454
11、8 schwarz criterion16.64967log likelihood-155.2274 f-statistic73.28848durbin-watson stat0.213248 prob(f-statistic)0.000000y=-7419.832+0.246715x1 (-2.158843) (8.560869) r2=0.811715 s.e.=903.7356 f=73.28848dependent variable: ymethod: least squaresdate: 06/07/05 time: 11:17sample: 1985 2003included ob
12、servations: 19variablecoefficientstd. errort-statisticprob. c33176.351653.65020.062490.0000x2-1203.754175.3386-6.8653080.0000r-squared0.734924 mean dependent var21949.85adjusted r-squared0.719331 s.d. dependent var2024.050s.e. of regression1072.306 akaike info criterion16.89231sum squared resid19547
13、273 schwarz criterion16.99173log likelihood-158.4770 f-statistic47.13246durbin-watson stat0.296483 prob(f-statistic)0.000003y=33176.35-1203.754x2 (20.06249) (-6.865308) r2=0.734924 s.e.=1072.306 f=47.13246dependent variable: ymethod: least squaresdate: 06/07/05 time: 11:19sample: 1985 2003included o
14、bservations: 19variablecoefficientstd. errort-statisticprob. c19004.71228.167383.292860.0000x30.7008990.04561015.367390.0000r-squared0.932848 mean dependent var21949.85adjusted r-squared0.928898 s.d. dependent var2024.050s.e. of regression539.7130 akaike info criterion15.51925sum squared resid495193
15、3. schwarz criterion15.61867log likelihood-145.4329 f-statistic236.1566durbin-watson stat0.344201 prob(f-statistic)0.000000y=19004.71+0.700899x3 (83.29286) (15.36739) r2=0.932848 s.e.=539.7130 f=236.1566经分析可见,在三个一元回归模型中,在校学生总数y对人均gdp x3的线性关系强,拟合程度好,即:y=19004.71+0.700899x3 (1.2) (83.29286) (15.36739)
16、 r2=0.932848 s.e.=539.7130 f=236.1566 逐步回归。将其余解释变量逐一带入式1.2中,得如下几个模型:dependent variable: ymethod: least squaresdate: 06/07/05 time: 11:28sample: 1985 2003included observations: 19variablecoefficientstd. errort-statisticprob. c30370.246464.9514.6976750.0002x1-0.1049180.059646-1.7589980.0977x30.9684340
17、.1580666.1267600.0000r-squared0.943729 mean dependent var21949.85adjusted r-squared0.936696 s.d. dependent var2024.050s.e. of regression509.2583 akaike info criterion15.44773sum squared resid4149504. schwarz criterion15.59685log likelihood-143.7534 f-statistic134.1703durbin-watson stat0.430949 prob(
18、f-statistic)0.000000y=30370.24-0.104918x1+0.968434x3 (1.3) (4.697675) (-1.758998) (6.126760) r2=0.936696 s.e.=509.2583 f=134.1703dependent variable: ymethod: least squaresdate: 06/07/05 time: 11:33sample: 1985 2003included observations: 19variablecoefficientstd. errort-statisticprob. c8767.1462167.8
19、974.0440780.0009x2898.7100189.84294.7339660.0002x31.1425950.09811311.645660.0000r-squared0.972028 mean dependent var21949.85adjusted r-squared0.968531 s.d. dependent var2024.050s.e. of regression359.0565 akaike info criterion14.74878sum squared resid2062745. schwarz criterion14.89790log likelihood-1
20、37.1134 f-statistic277.9958durbin-watson stat0.751167 prob(f-statistic)0.000000y=8767.146+898.7100x2+1.142595x3 (1.4) (4.044078) (4.733966) (11.64566)r2=0.968531 s.e.=359.0565 f=277.9958 在式1.3中x1对y的影响并不显著,故将x1删去,得如下模型:dependent variable: ymethod: least squaresdate: 06/07/05 time: 11:33sample: 1985 2
21、003included observations: 19variablecoefficientstd. errort-statisticprob. c8767.1462167.8974.0440780.0009x2898.7100189.84294.7339660.0002x31.1425950.09811311.645660.0000r-squared0.972028 mean dependent var21949.85adjusted r-squared0.968531 s.d. dependent var2024.050s.e. of regression359.0565 akaike
22、info criterion14.74878sum squared resid2062745. schwarz criterion14.89790log likelihood-137.1134 f-statistic277.9958durbin-watson stat0.751167 prob(f-statistic)0.000000从上表可以看出,在删去x1后,模型的统计检验效果均有较大改善。y=8767.146+898.7100x2+1.142595x3 (4.044078) (4.733966) (11.64566)r2=0.968531 s.e.=359.0565 f=277.9958
23、 (2)异方差检验(arch检验)利用y对x回归所得残差平方e2(=resid)在ols对话框的estimate equation 栏里键入e2 c e2(-1) e2(-2) e2(-3) 可输出结果:dependent variable: e2method: least squaresdate: 06/07/05 time: 11:56sample(adjusted): 1988 2003included observations: 16 after adjusting endpointsvariablecoefficientstd. errort-statisticprob. c1036
24、67.647344.292.1896530.0490e2(-1)0.0452740.2971700.1523490.8814e2(-2)-0.2479630.234276-1.0584230.3107e2(-3)0.0570590.2446420.2332350.8195r-squared0.085889 mean dependent var87868.45adjusted r-squared-0.142638 s.d. dependent var83723.94s.e. of regression89496.09 akaike info criterion25.85410sum square
25、d resid9.61e+10 schwarz criterion26.04724log likelihood-202.8328 f-statistic0.375838durbin-watson stat1.836162 prob(f-statistic)0.772076计算有(n-p)r2=130.085889=1.116557,查 分布表,给定=0.05,自由度为p=3,得临界值 0.05(3)=7.81,因为(n-p)r2=1.116557 0.05(3)=7.81,所以接受h0,表明模型中随机误差项不存在异方差。(3)自相关检验(dw检验)如下表:dependent variable:
26、 ymethod: least squaresdate: 06/07/05 time: 11:33sample: 1985 2003included observations: 19variablecoefficientstd. errort-statisticprob. c8767.1462167.8974.0440780.0009x2898.7100189.84294.7339660.0002x31.1425950.09811311.645660.0000r-squared0.972028 mean dependent var21949.85adjusted r-squared0.9685
27、31 s.d. dependent var2024.050s.e. of regression359.0565 akaike info criterion14.74878sum squared resid2062745. schwarz criterion14.89790log likelihood-137.1134 f-statistic277.9958durbin-watson stat0.751167 prob(f-statistic)0.000000dw=0.751167,给定显著性水平=0.05,查durbin-watson表,n=19,k(解释变量个数)=2,得下限临界值dl=1.
28、074, 得上限临界值du=1.536,因为dw=0.751167 dl=1.074,表明该模型中的随机误差项存在一阶自相关。修正:由dw=0.751167,根据 =1dw/2,计算得 =0.6244165。用genr分别对x2,x3,y作广义差分。即:genr dy=y-0.6244165*y(-1)genr dx2=x2-0.6244165*x2(-1)genr dx3=x3-0.6244165*x3(-1)然后用ols法估计其参数,得:dependent variable: dymethod: least squaresdate: 06/07/05 time: 14:27sample(adjusted): 1986 2003included observations: 18 after adjusting endpointsvariable
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025届山西省孝义市高考压轴卷语文试卷含解析
- 福建省泉州市马甲中学2025届高三第一次模拟考试数学试卷含解析
- 2025届山东省聊城市文苑中学高三适应性调研考试英语试题含解析
- 2025届吉林省长春市十一中高三二诊模拟考试数学试卷含解析
- 浙江省温州市永嘉县翔宇中学2025届高三第二次联考英语试卷含解析
- 北京市西城66中2025届高三最后一卷英语试卷含解析
- 2025届天津市七校静海一中杨村中学高考冲刺数学模拟试题含解析
- 江西省赣州市会昌县2025届高三压轴卷英语试卷含解析
- 浙江省杭州十四中2025届高考数学倒计时模拟卷含解析
- 云南省广南一中2025届高考临考冲刺数学试卷含解析
- 质量成熟度评价标准样本
- 小学科学期末测评方案设计
- 2024年中考作文十二大高频热点主题4-青春梦想(素材)
- 河北省药品流通非现场监管药品流通追溯系统操作手册
- 2024年四川省网格员招聘理论考试复习题库(含答案)
- (2024年)(完整版)24式太极拳教案全集
- 信访维稳工作培训
- 2024年职业卫生技术人员评价方向考试题库附答案
- 中建测评2024二测题库及答案
- 低代码开发智慧树知到期末考试答案2024年
- 考古勘探安全方案
评论
0/150
提交评论