




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
挑计等赦辔案例集
统计学精品课建设小组
2004年11月
【案例一】全国电视观众抽样调查抽样方案
一、调查目的、范围和对象
1.1调查目的
准确获取全国电视观众群体规模、构成以及分布情况;获取这些观众的收视习惯,
对电视频道和栏目的选择倾向、收视人数、收视率与喜爱程度,为改进电视频道和栏目、
开展电视观众行为研究提供新的依据。
1.2调查范围
全国31个省、自治区、直辖市(港澳台除外)中所有电视信号覆盖区域。
1.3调查对象
全国城乡家庭户中的13岁以上可视居民以及4T2岁的儿童。包括有户籍的正式住
户也包括所有临时的或其他的住户,只要已在本居(村)委会内居住满6个月或预计居
住6个月以上,都包括在内。不包括住在军营内的现役军人、集体户及无固定住所的人
口。
二、抽样方案设计的原则与特点
2.1设计原则
抽样设计按照科学、效率、便利的原则。首先,作为一项全国性抽样调查,整体方
案必须是严格的概率抽样,要求样本对全国及某些指定的城市或地区有代表性。其次,
抽样方案必须保证有较高的效率,即在相同样本量的条件下,方案设计应使调查精度尽
可能高,也即目标量估计的抽样误差尽可能小。第三,方案必须有较强的可操作性,不
仅便于具体抽样的实施,也要求便于后期的数据处理。
2.2需要考虑的具体问题、特殊要求及相应的处理方法
2.2.1城乡区分
城市与农村的电视观众的收视习惯与爱好有很大的区别。理所当然地应分别研究,
以便于对比。最方便的处理是将他们作为两个研究域进行独立抽样,但代价是,这样做
的样本点数量较大,调查的地域较为分散,相应的费用也就较高。另一种处理方式是在
第一阶抽样中不考虑区分城乡,统一抽取抽样单元(例如区、县),在其后的抽样中再
区分城、乡。这样做的优点是样本点相对集中,但数据处理较为复杂。综合考虑各种
因素,本方案采用第二种处理方式。
在样本区、县中,以居委会的数据代表城市;以村委会的数据代表农村。
2.2.2抽样方案的类型与抽样单元的确定
全国性抽样必须采用多阶抽样,而多阶抽样中设计的关键是各阶抽样单元的选择,
其中尤以第一阶抽样单元最为重要。本项调查除个别直辖市及城市外,不要求对省、自
治区进行推断,从而可不考虑样本对省的代表性。在这种情况下,选择区、县作为初级
抽样单元最为适宜。因为全国区、县的总数量很大,区、县样本量也会比较大,因而第
一阶的抽样误差比较小。另外对区、县的分层也可分得更为精细。
本抽样方案采用分层五阶抽样。各阶抽样单元确定为:
第一阶抽样:区(地级市以上城市的市辖区)、县(包括县级市等);
第二阶抽样:街道、乡、镇;
第三阶抽样:居委会、村委会;
第四阶抽样:家庭户;
第五阶抽样:个人。
为提高抽样效率,减少抽样误差,在第一阶抽样中对区、县采用按地域及类别分层。
在每一层内前三阶抽样均采用按与人口成正比的不等概率系统抽样(PPS系统抽样),而
第四阶抽样采用等概率系统抽样,即等距抽样,第五阶抽样采用简单随机抽样。
2.2.3自我代表层的设立
根据要求,本次调查需要对北京、上海两个直辖市以及广州、成都、长沙与西安四
个省会城市进行独立分析,因而在处理上将这些城市(包括下辖的所有区、县)每个都
作为单独的一层处理。为方便起见,以下把这样的层称为自我代表层。考虑到在这样处
理后,全国其他区县在分层中的一些具体问题以及各地的特殊情况,将天津市也作为自
我代表层处理。另外,鉴于西藏情况特殊,所属区县与其它省(自治区)的差别很大,
因此也将它作为自我代表层处理。这样自我代表层共有8个,包括以下城市与地区:
北京市、天津市、上海市;广州市、成都市、长沙市、西安市;西藏自治区。
三、样本区、县的抽选方法
3.1全国区、县的调查总体
根据2001年的全国行政区划资料,全国(港澳台除外)共有787个市辖区,此外
有5个地级市(湖州、东莞、中山、三亚、嘉峪关)不设市辖区,若将它们每个都视同
一个市辖区,则共有792个区;全国共有1674个县(包括自治县及旗、自治旗、特区
与林区等)、400个县级市,县级行政单位的总数为2074个,这中间包括福建省的金门县,
不能进行调查,因此除金门县以外的所有2865个区、县(792个区及2073个县)构成此
次调查的调查总体。
3.2区、县分层
为便于调查后的资料分类汇总及提高精度,应将全国区、县进行分层。分层可以按
多种标识进行,从理论而言,分层标识应选取与调查指标相关程度较高的那些变量。在
本次调查中也就是应选取与观众收视行为、习惯与爱好等密切相关的变量。关于这方面
已有一些相应的研究结果,例如观众的年龄、性别、文化程度、职业、居住地的生活习
惯与气候等。不过注意到我们不可能按观众的个体来分类,只能按观众居住的区、县来
分类。而对于区、县,许多表示人口特征(除人口总数)及经济文化发展指标(除所在
省的人文发展指数及县的人均GPT)的资料都无法得到,经过多方研究,我们对区县的
分层按以下两种标识进行。
⑴地域
我国幅员广大,各地经济、社会、文化与气候的地域差异极大,而所有这些因素都
与电视观众的收视行为密切相关。我们首先将所有县按所在省(自治区、直辖市)的地
理位置分成3大层13个子层,[各省括号内的数字为它们的人文发展指数(Human
DevelopmentIndex,简称HDI),在全国的排位,参见附表]。地域分层如表1:
表1全国区、县的地域分层
大层所含省、自治区、直辖市
子层10:上海(1)、北京(2)、天津(3)(每个都作为自我代表层)
第一大层子层11:辽宁(5)、山东(9)
(东部地区)子层12:江苏(7)、浙江(6)
子层13:福建(8)、广东(4)、海南(13)
子层21:黑龙江(10)、吉林(12)
第二大层子层22:河北(11)、河南(18)、山西(16)
(中部地区)子层23:安徽(20)、江西(23)
子层24:湖北(14)、湖南(17)
子层31:内蒙古(21)、新疆(15)、宁夏(26)
子层32:陕西(25)、甘肃(28)、青海(29)
第三大层
子层33:重庆(22)、四川(24)
(西部地区)
子层34:广西(19)、云南(27)、贵州(30)
子层30:西藏(自我代表层)
需要说明的是以上划分的层,还考虑了其他一些因素,各省按联合国制定的标准计
算的人文发展指数仅是考虑因素之一。例如,按人文发展指数,广西(第19位)实际
上可划在第二大层(中部地区),但考虑到国家西部大开发的范围将广西划入西部地区,
我们的划分与它一致,这样便于资料的汇总发布。又如海南,根据人文发展指数(第13
位)放在第一大层稍为勉强,但是根据它的地理位置以及它以旅游为主业,就观众行为
而言,与广东、福建划在一子层内是合理的。
(2)区、县类别
同一大层的各市辖区与所隶属的城市的规模、在城市中的地理位置(市区或郊区)
和居民成分构成(非农业人口占总人口的比例)有较大差异,各县也因经济文化发达程
度有较大差异。我们将各大层中所有的区、县除已划为自我代表层的以外,(如下称抽
样总体)分成以下5类,每类组成1个小层:
一类区,二类区,县级市,一类县,二类县。
全国抽样总体中所有区县共分成11X5=55个小层。其中区的划分标准为区中非农
业人口占总人口的比例,比例高于标准的为一类区,比例低于标准的为二类区;县的划
分标准为人均国内生产总值,高的为一类县,低的为二类县。区县划分类别的标准在三
大层中各不相同,具体标准如下:
区类别的划分标准:
东部地区与中部地区:非农人口在总人口中的比例大于或等于80%为一类区,小于
80%为二类区;西部地区:非农人口在总人口中的比例大于或等于70%为一类区,小于
70%为二类区。
县类别的划分标准:
东部地区:人均GDP在5000元以上为一类县;5000元以下为二类县。中部地区:
人均GDP在4000元以上为一类县;4000元以下为二类县。西部地区:人均GDP在3000
元以上为一类县;3000元以下为二类县。
3.3自我代表层的区、县情况
根据最新行政区划,自我代表层中的7个城市所辖的区、县构成情况如表1。
表2自我代表城市的辖区、县构成
直辖市中的县
城市一类区二类区县总计
及其它县级市
北京市855-18
天津市774-18
上海市973-19
广州市552-12
成都市524819
长沙市23139
西安市440513
西藏自治区包括1个地级市(拉萨市,下辖一个城关区)、一个县级市(日喀则市)
及71个县。
3.4抽样总体区县情况
按3.2划分标准,全国除自我代表层以外的抽样总体各小层的区、县数及人口在
(抽样总体)总人口中的比例如表3与表4所示。
表3抽样总体中各小层的区县数
地域子层一类区二类区县级市一类县二类县合计
东部地区114362471968239
东部地区123047533137198
东部地区132411515942217
中部地区215626403632190
中部地区22396756140148450
中部地区232634193195205
中部地区242044394269214
西部地区31278349161221
西部地区3211161551131224
西部地区33542145585201
西部地区3419273074175325
合计3004143986299432684
表4抽样总体各小层人口占总人口的比例(%)
地域子层一类区二类区县级市一类县二类县合计
东部地区111.35122.27663.17280.76723.629511.1972
东部地区120.69921.64873.88321.41052.28099.9226
东部地区130.50831.21873.44372.34971.71509.2354
中部地区211.02000.50231.77091.10351.00375.4004
中部地区220.92631.91282.78584.52916.359316.5133
中部地区230.52721.18001.06821.16374.93858.8776
中部地区240.61061.59282.54152.27573.251910.2726
西部地区310.43430.22190.73191.22651.36923.9838
西部地区320.29760.55130.42570.72333.05675.0546
西部地区330.14542.11320.95811.87153.89618.9843
西部地区340.36290.94781.32542.64995.272210.5582
合计6.883114.166222.107220.070536.7730100.0000
3.5区、县的抽样方法及样本量
抽样总体中各层(指小层,下同)内对区、县的抽样采用按人口的PPS系统
抽样,样本量一般为2;少数人口较多的小层样本量定为3。样本量的具体分配见表
5。样本区、县总量为121个。
表5各小层的区县样本量的分配
地域子层一类区二类区县级市一类县二类县合计
东部地区112332212
东部地区122232211
东部地区132232211
中部地区212222210
中部地区222233313
中部地区232222311
中部地区242222210
西部地区312222210
西部地区322222311
西部地区332222311
西部地区342222311
合计2223262327121
四、抽样总体中样本区、县内的抽样方法
4.1样本区内的抽样
每个一类样本区内采用街道(镇)、居委会、家庭户及个人的4阶抽样;每个二类
样本区内采用街道(乡、镇)、居(村)委会、家庭户及个人的4阶抽样,样本量皆为90。
具体方法如下。
4.1.1对街道(乡、镇)的抽样
样本区内对街道(乡、镇)抽样采用按人口的PPS系统抽样,每个样本区抽3个街
道(乡、镇),其中一类区不抽乡。
4.1.2对居委会的抽样
样本街道、镇(乡)内对居(村)委会的抽样采用按人口的PPS系统抽样,每个样
本街道、镇、乡各抽2个居(村)委会(其中一类区不抽村委会)。为操作方便,这里
的人口数也可用户数。
4.1.3对家庭户的抽样
样本居(村)委会内对家庭户的抽样采用随机起点的等概率系统抽样,即等距抽样。
每个居(村)委会固定抽取15户。在抽样时,必须首先清点居(村)委会管辖范围内
的实际家庭户数,且规定排列的顺序。
4.1.4样本户内具体调查对象的确定
对每个被抽中的样本户,在13岁以上(含13岁)的成员中,完全随机地确定一名
为具体调查对象。为确保家庭成员中的每一个这样的成员都有相等的概率被抽中,采用
二维随机表来确定。
表6确定户内调查对象的二维随机表
序姓
性另年龄123456789101112
号名
1111111111111
2212112211212
3321132213123
4413223143241
5541234123542
6631524351462
7714362525743
8845712637531
9951438276528
101035941728694
1111615104983276
12127294116183105
4.2样本县(县级市)内的抽样
每个样本县内采用乡(镇)、村(居)委会、家庭户及个人的4阶抽样,样本量为
60o具体方法如下。
4.2.1对乡、镇的抽样
确定县城所在的镇(城关镇)为必调查镇,对其余乡(镇)采用按人口的PPS系统
抽样,再抽2个乡(镇),每个样本县共调查3个乡(镇)。
4.2.2对村(居)委会的抽样
在每个城关镇中用按人口PPS抽样抽取2个样本居(村)委会。对其它两个样本乡、
镇内,也用同样的方法抽2个村委会。为操作方便,这里的人口数也可用户数。
4.2.3对家庭户的抽样
样本村(居)内对家庭户的抽样与样本居委会内对家庭户的抽样完全相同,仍采用
随机起点的等概率系统抽样,即等距抽样。每个村(居)固定抽取10户。
4.2.4具体调查对象的确定
在样本户中确定具体对象的方法与4.1.4中情形完全相同,即用二维随机表来确定。
4.3儿童样本的确定
在城乡每个样本户中,除抽取一位13岁以上的观众作为调查对象外,如果还有4
一12岁的儿童,则需要抽取1位进行儿童观众的调查。如果符合年龄的条件多于1位,
则仍按二维随机表的方法确定。
对于自我代表的7个城市中,为保证儿童的样本量,对每个样本户,调查所有满足
年龄的儿童。
五、自我代表层中的抽样方法
5.1自我代表城市的抽样方法
每个需要进行推断的城市皆作为自我代表层,在层内也进行分层抽样,层的划分标
准与其它子层中的区、县标准基本相同。只不过不再对县分类,且将县级市(仅长沙市
有一个)也作为一般县处理。这样每个城市皆分为一类区、二类区及县三层。考虑到上
海市浦东新区的特殊性(既包括完全城市化的市区,也包含相当广泛的农村),将该区作为
自我代表层处理。
考虑到在一个城市范围内的调查,交通比较方便,故为提高效率,根据每个城市的
实际情况,保证(或适当增加)样本区的数量,减少每个样本区、县内的的样本量。每
个样本区县规定都抽2个街道(乡、镇),每个样本街道、乡、镇抽2个居(村)委会。
样本区内每个居(村)委会样本量仍为本15户,样本县(县级市)内每个村(居)委
会样本量仍为10户。
如果有可能,对一类区也可不对区进行抽样,直接对街道进行抽样。
根据每个必调查城市所属的区县数,确定样本区、县数如下表(表中的数字为样本
区、县数,括号中的数字为每个区、县的样本户数):
表7自我代表城市的样本量
城市一类区二类区县总样本量
北京市4(60)2(60)2(40)440
天津市3(60)2(60)2(40)380
上海市4(60)3(60)*2(40)500
广州市3(60)2(60)2(40)380
成都市*3(60)2(60)2(40)380
长沙市2(60)3(60)2(40)380
西安市*4(45)2(60)2(40)380
总计13209605602840
*其中浦东新区在商业区抽一个街道,在农业区抽一个镇。
*成都、西安两市由于一类区数量较少,故对一类区进行全数调查,其中西安市每个一类区中
抽1个街道,每个街道抽3个居委会。若有条件在每个区中直接抽3个居委会最好。
5.2西藏自治区的抽样方法
西藏自治区的抽样也采用分层抽样法,其中拉萨市城关区抽4个居委会,日喀则市除
城关镇外,再抽两个乡镇,共6个居(村)委会。以上两市均作为自我代表层,每层各抽取
60户;其余71个县则采用按人口的PPS抽样抽2个县,每个县调查40户。西藏自治
区总样本量为200户。
六、总样本量与抽样误差的估计
6.1总样本量
根据前述抽样设计,本方案13岁以上观众总的样本量为:
1)自我代表层共2840+200=3040户,其中区样本为2400户,县样本为640户。
2)抽样总体分11个子层,55个小层,样本区县共121个,其中样本区45个,样
本县(县级市)76个。每个样本区抽90户,故区样本为4050户;每个样本县抽60户,
县样本共4560户,共计8610户。
3)全国总样本量为11650户,其中区样本为6390户,县样本为5260户。
6.2抽样误差的估计
本方案的设计效应deff估计为2.0,相当于简单随机抽样的样本量n。=5825,在
95%置信度下比例型目标量的绝对误差限d,经计算约为1.28%o
七、目标量的估计及其方差估计
根据方案设计,(小)层内样本是近似自加权的,因此层目标量的估计及其方差估
计较为简单。而地区(大层)与全国目标量的估计则可用表4中的人口比例为权加权并
汇总自我代表层得出,相应的方差估计也随之可得。具体公式另给。
参考文献
rn冯士雍,倪加勋,邹国华,《抽样调查理论与方法》,中国统计出版社,
1998.
[2]中华人民共和国民政部编,中华人民共和国行政区划简册,中国地图出版社,2001。
[3]联合国开发计划署,中国人类发展报告…1999,中国财政经济出版社,1999
[4]胡鞍钢,邹平等,中国发展报告社会与发展一中国社会发展地区差距研究,浙江
人民出版社,2000。
[5]L.基什(L.Kish)著,倪加勋等译,抽样调查,中国统计出版社,1997。
附表:1997年全国各省市人类发展指数(HDI)
省、市平均预期国内生产人类发展人类发展
教育指数
自治区寿命指数总值指数指数指数排位
上海0.8320.8240.9750.8771
北京0.7980.8400.9630.8672
天津0.7890.8100.9570.8523
广东0.7920.7890.9490.8434
辽宁0.7540.8010.9390.8315
浙江0.7800.7350.9490.8216
江苏0.7730.7350.9450.8177
福建0.7260.7370.9440.8028
山东0.7600.7020.8490.7709
黑龙江0.7000.7900.8090.76610
河北0.7560.7590.6760.73011
吉林0.7160.8040.6100.71012
海南0.7500.7450.6320.70913
湖北0.7040.7610.6550.70714
新疆0.6270.7730.6560.68515
山西0.7330.7820.5220.67916
湖南0.6990.7760.5110.66217
河南0.7530.7450.4870.66118
广西0.7290.7410.4780.64919
安徽0.7410.7130.4820.64620
内蒙古0.6780.7400.5170.64521
重庆0.6890.7270.4890.63522
江西0.6850.7640.4550.63523
四川0.6890.7230.4410.61724
陕西0.7070.7410.4040.61725
宁夏0.6990.6690.4400.60326
云南0.6420.6650.4420.58327
甘肃0.7040.6670.3390.57028
青海0.5930.5450.4450.52829
贵州0.6550.6590.2330.51630
西藏0.5770.4350.3450.45231
【案例二】请对下面的问卷客观地评价
汽油的销售
本次调查由国家汽油代理商组织,希望更多地了解消费者购买汽油时的期望。所有
信息都会被保密。表格填好后请返回给我们。
1.姓名和地址
2.年龄和性别
3.婚姻状况
4.年龄状况:21岁以下21—40岁
40—60岁60岁以上
5.大多数汽油是由您购买的还是您的妻子买的?
6.去年您买了多少汽油?
5000升以上5000—10000升10000—2000升20000升以上
7.您的汽油油箱容积多大?
8.在您选购汽油时,价格的重要程度如何?
9.请您尽可能充分地陈述什么原因使得您购买一种品牌的汽油而不买另外一种?
10.您喜欢那些免费提供礼物的加油站,是不是?
11.当您用车执行公务时,您将获赠的礼物或赠券留给自己,还是上交给您的雇主?
12.您每年行驶的里程是长是短?
谢谢您的合作。
根据您对上述问题的回答,重新起草上面的调查问卷。
【案例三】某市造纸行业产品产量与结构分析
某市造纸业在“十五”期间的产品产量、原材料消耗量、专用设备技术状况以
及调查预测的2006年各类产品的需求量等资料如下:
表1“十五”期间各类产品产量单位:万吨
产量
J口口名称预测的1996年需求量
2001年2005年
印刷用纸6.510.513.39
书写用纸5.04.96.86
技术配套用纸0.71.11.33
包装用纸5.98.210.12
其他用纸1.12.03.33
生活用纸7.51331.56
纸板6.211.428.78
其中:白纸板0.40.61.23
箱纸板1.32.04.32
挂面纸板0.050.51.20
瓦楞纸板2.32.47.89
合计26.739.766.59
表2“十五”期间主要原材料消耗量单位:万吨
原材料消耗量
原材料
2001年2005年
木浆5.56.7
苇浆2.83.6
蔗渣浆0.91.2
竹浆0.40.5
废纸浆4.18.6
麻、布、棉浆1.83.2
禾草浆9.915.6
其他浆0.71.0
合计26.140.4
表3专用设备技术状况单位:台
国内国内国内
专用设备合计国际水平
先进水平一般水平落后水平
磨木机5——31
蒸球190一—11674
蒸锅5—122
造纸设备170—343124
要求:根据以上资料,对该市造纸行业的产品产量和结构进行分析。
分析方法说明:
(1)对产品产量与结构进行分析,首先需要利用数字资料描述产品产量及其结构
现状以及发展趋势,其次根据一定的研究目的分析产品结构的合理性。
(2)分析研究可以采用静态分析与动态分析相结合的办法。静态分析主要是研究
产品结构的现状,分析当前的产品结构是否满足社会需要,是否适应现有的生产力发展
水平,从中确定哪些是合理的,哪些是不合理的;同时通过动态分析,反映产品结构演
变的历史过程,预测产品结构将沿着什么方向发展,这种发展是否适应经济发展的客观
而要。
在研究过程中,要结合本地区或本企业的实际情况,如原材料供应、设备状况、技
术力量、企业管理水平等,进行多因素的对比分析,找出调整产品结构与提高产品产量
的症结所在,并提出切实可行的措施。
【案例四】时间序列分析在经济预测中的应用
一、案例简介
为了配合《统计学》课程时间序列分析部分的课堂教学,提高学生运用统计方法分
析解决实际问题的能力,我们组织了一次案例教学,其内容是:对烟台市的未来经济发
展状况作一预测分析,数据取烟台市1978—1998年国内生产总值(GDP)的年度数据,
并以此为依据建立预测模型,对1999年和2000年的国内生产总值作出预测并检验其预
测效果。国内生产总值是指一个国家或地区所有常住单位在一定时期内生产活动的最终
成果,是反映国民经济活动最重要的经济指标之一,科学地预测该指标,对制定经济发
展目标以及与之相配套的方针政策具有重要的理论与实际意义。在组织实施时,我们首
先将数据资料印发给学生,并讲清本案例的教学目的与要求,明确案例所涉及的教学内
容;然后给学生一段时间,由学生根据资料,运用不同的方法进行预测分析,并确定具
体的讨论日期;在课堂讨论时让学生自由发言,阐述自己的观点;最后,由主持教师作
点评发言,取得了良好的教学效果。
经济预测是研究客观经济过程未来一定时期的发展变化趋势,其目的在于通过对客
观经济现象历史规律的探讨和现状的研究,求得对未来经济活动的了解,以确定社会经
济活动的发展水平,为决策提供依据。
时间序列分析预测法,首先将预测目标的历史数据按照时间的先后顺序排列成时间
序列,然后分析它随时间的变化趋势及自身的统计规律,外推得到预测目标的未来取值。
它与回归分析预测法的最大区别在于:该方法可以根据单个变量的取值对其自身的变动
进行预测,无须添加任何的辅助信息。
本案例的最大特色在于:它汇集了统计学原理中的时间序列分析这一章节的所有知
识点,通过本案例的教学,可以把不同的时间序列分析方法进行综合的比较,便于学生
更好地掌握本章的内容。
二、案例的目的与要求
(-)教学目的
1.通过本案例的教学,使学生认识到时间序列分析方法在实际工作中应用的必要
性和可能性;
2.本案例将时间序列分析中的水平指标、速度指标、长期趋势的测定等内容有机
的结合在一起,以巩固学生所学的课本知识,深化学生对课本知识的理解;
3.本案例是对烟台市的国内生产总值数据进行预测,通过对实证结果的比较和分
析,使学生认识到对同一问题的解决,可以采取不同的方法,根据约束条件,从中选择
一种合适的预测方法;
4.通过本案例的教学,让学生掌握EXCEL软件在时间序列分析中的应用,对统计、
计量分析软件SPSS或Eviews等有一个初步的了解;
5.通过本案例的教学,有助于提高学生运用所学知识和方法分析解决问题的能力、
合作共事的能力和沟通交流的能力。
(二)教学要求
1.学生必须具备相应的时间序列分析的基本理论知识;
2.学生必须熟悉相应的预测方法和具备一定的数据处理能力;
3.学生以主角身份积极地参与到案例分析中来,主动地分析和解决案例中的问题;
4.在提出解决问题的方案之前,学生可以根据提供的样本数据,自己选择不同的
统计分析方法,对这一案例进行预测,比较不同预测方法的异同,提出若干可供选择的
方案;
5.学生必须提交完整的分析报告。分析报告的内容应包括:选题的目的及意义、
使用数据的特征及其说明、采用的预测方法及其优劣、预测结果及其评价、有待于进一
步改进的思路或需要进一步研究的问题。
三、数据搜集与处理
时间序列数据按照不同的分类标准可以划分为不同的类型,最常见的有:年度数据、
季度数据、月度数据。本案例主要讨论对年度数据如何进行预测分析。考虑到案例设计
时的侧重点,本案例只是对烟台市国内生产总值进行预测,故数据的搜集与处理过程相
对简单。我们通过查阅《烟台统计年鉴》、《烟台五十年》等有关的资料获得烟台市1949
一2000年23年的国内生产总值资料数据(原始数据详见表3)。该指标是反映国民经济
发展情况最重要的指标之一,我们选择该指标进行预测具有较强的实用价值。此外,预
测的方法具有普遍的适用性,使用者也可以将其应用于其它的研究领域。
资料数据是预测的依据和基础,一般是根据确定的预测目标及影响因素搜集有关的
资料和数据,并结合初步拟定的预测模型,对所搜集的数据进行分析和处理,然后再选
取适当的预测模型。
我们可以将整个数据处理过程概括如下,见图1。
图1经济预测流程图
四、建议使用的预测分析方法
(一)确定性时间序列分析法
1.指标法:平均增长量法、平均发展速度法;
2.趋势预测法:移动平均法、指数平滑法、曲线拟合法。
(二)随机性时间序列分析法
1.ARIMA模型预测;
2.组合模型预测。
五、案例分析过程
(-)确定性时间序列分析法
1.平均增长量法
该方法是利用历史资料计算出它的平均增长量,然后再假定在以后各期当中,它仍
按这样一个平均增长量去增长,从而得出在未来一段时期内的预测值。根据烟台市的国
内生产总值1949年一1998年的观察值,我们计算出GDP的平均增长量为150647.69万
元(水平法)和38437.81万元(总和法),利用其对烟台市1999年和2000年的GDP值
进行预测并与实际GDP值⑴比较,结果见表1。
表1平均增长量法预测结果
1999年2000年
GDP预测值(万元)预测相对误差(%)GDP预测值(万元)预测相对误差(%)
水平法7550647.75.697701295.412.44
累计法7438437.87.107476875.615.00
教师点评:①平均增长量法不仅得到了GDP数据未来取值的预测值,而且还让学
生更加深刻地认识到平均增长量在计算时水平法与总和法的区别所在,图1较明显地反
映出平均增长量计算水平法与累计的区别,即水平法仅考虑首尾年份的数值,而不考虑
中间年份的数值变化,因而有“。+(,-)△="“;②而总和法则考虑了整个样本区间上的总体
变化情况,有(«o+△)+(«()+2A)+-••+(a0+nA)=X,从而图2中A的面积和B的面积应
Z=1
该相等。
.原始GDP—■一水平法GDP—△一总和法GDP
1111999年为8010(X)0万元,2000年为87(X)000万元。
图2由平均增长量推算出的时间序列变化图
2.平均发展速度法
该方法就是利用时间序列资料计算出它的平均发展速度,然后再假定在以后各期当
中,它仍按这样一个平均发展速度去变化,从而得出时间序列的预测值。我们计算出
GDP在1978年一1998年间的平均发展速度为118.277%(几何法)和118.170%(方程
法)⑵,利用其对烟台市1999年和2000年的GDP进行预测得到结果见表2。
表2平均发展速度法预测结果
1999年2000年
GDP预测值(万元)预测相对误差(%)GDP预测值(万元)预测相对误差(%)
几何法8364664-4.479455081.6-7.49
方程法8306352-3.749323713.9-6.00
教师点评:①同平均增长量的计算一样,平均发展速度的计算方法也有两种,其中
几何法也只是考虑起始年份的取值,有册=劭文",而方程法则要考虑到整个年份取值的
变化,有&无+劭斗+…+劭后一之《,方程法的内插预测曲线与原始曲线所夹的面积A
i=l
和面积B也相等;②在方程式法计算中,计算平均增长速度可以采取试错法(让学生尝
试着编写小的循环程序求解)或插值法;③同平均增长量的计算一样,平均发展速度的
计算方法也有两种,其中几何法也只是考虑起始年份的取值,而方程法则要考虑到整个
年份取值的变化;④由预测的结果可以看出,无论是平均增长量法还是平均发展速度法
只适于作短期预测,否则预测相对误差会显著提高。
⑵在该问题中几何法与方程法计算出的平均发展速度差别不大。
8(X)0tXX).<
--原始GDPT-几何法GDPf-方程法GDP
图3由平均发展速度推算出的时间序列变化图
3.移动平均法
移动平均法是根据时间序列资料,采取逐项移动平均的办法,计算一定项数的序时
平均数,以反映长期趋势的方法。移动平均法主要有简单移动平均法,加权移动平均法,
趋势移动平均法等。这里主要介绍简单移动平均法。
记.=¥+fNN为t期移动平均数;N为移动平均项数。由于移动
,N
平均可以平滑数据,消除周期变动和不规则变动的影响,使长期趋势显示出来,可以利
用其进行外推预测。预测公式为:yl+i=M,,即以第t期移动平均数作为第t+1期的预
测值。
表3移动平均预测结果
年份序号t原始GDP三期移动平均值(T=3)五期移动平均值(T=5)
194918263——
1950125639——
1951229327——
195233499324409.67—
195343672529986.33—
195454079633681.6728989.40
195564175237504.6733496.00
195674820439757.6736718.60
195784660843584.0040494.00
19589
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 药物合同范本
- 抖音广告合同范本
- 2025至2030年中国环保型干洗机数据监测研究报告
- 科学教育中的综合性问题探索课程
- 社交平台运营策略内容为王的时代
- 科技企业中的师徒传承文化构建
- 科技企业如何通过社交媒体提升品牌忠诚度
- 2025至2030年中国消光型脂肪族聚氨酯水分散液数据监测研究报告
- 生物医药产业投资趋势与商业机会分析
- 喜欢信贷协议
- 2025年初中主题班会课件:好习惯成就好人生
- 学校教职工代表大会全套会议会务资料汇编
- 新部编版小学六年级下册语文第二单元测试卷及答案
- 2025年山东传媒职业学院高职单招高职单招英语2016-2024历年频考点试题含答案解析
- 《中医基础理论》课件-中医学理论体系的基本特点-整体观念
- 2025年广东省深圳法院招聘书记员招聘144人历年高频重点提升(共500题)附带答案详解
- 2025年人教版新教材数学一年级下册教学计划(含进度表)
- 2025年春西师版一年级下册数学教学计划
- 课题申报书:“四新”视域下地方高校学科建设与人才培养研究
- 企业员工退休管理规章制度(3篇)
- 中国干眼临床诊疗专家共识(2024年)解读
评论
0/150
提交评论