大数据在CPI统计中的应用研究(36p)课件_第1页
大数据在CPI统计中的应用研究(36p)课件_第2页
大数据在CPI统计中的应用研究(36p)课件_第3页
大数据在CPI统计中的应用研究(36p)课件_第4页
大数据在CPI统计中的应用研究(36p)课件_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、大数据在CPI统计中的应用以1号店价格指数为例第1页,共37页。2022/8/52主要内容居民消费价格(CPI)统计简介1大数据物价统计的应用现状21号店价格指数编制方法研究及实例3数据比较评估4第2页,共37页。 城乡居民购买并用于日常生活消费的商品和服务项目的价格。 调查内容按用途划分为八大类、262个基本分类。 包括食品、烟酒、衣着、家庭设备用品及维修服务、医疗保健 和个人用品、交通和通信、娱乐教育文化用品及服务、居住。2022/8/53居民消费价格(CPI)统计简介调查内容分类固定国家规定代表品抽样地方自定第3页,共37页。 消费量较大的消费项目。 价格变动具有较强的代表性。 同基本分

2、类下代表品异质性越大越好。 合格产品。注册商标、产地、规格等级等标识齐全。2022/8/54居民消费价格(CPI)统计简介抽样原则2014年,上海CPI代表品共抽选1300多种第4页,共37页。 调查方法:采用定人、定点、定时的方法直接采集代表品价格。 调查频率:与居民生活密切相关、价格变动频繁的商品,五天一次。 一般性商品(服务),每月2-3次。 政府统一定价或价格稳定的商品(服务),每月一次。 报告周期:月度,每月10日前公布上月数据。2022/8/55居民消费价格(CPI)统计简介方法频率2014年,上海每月采集价格笔数为35000多笔第5页,共37页。 权数测算:主要根据居民家庭消费支

3、出资料,辅以典型调查。 权数五年固定不变。 计算方法:先计算代表品月度时点平均价格变动幅度,代表品之间 几何平均得出基本分类月度变动幅度,基本分类以上按 逐级拉氏加权平均得出各级分类月度变动幅度。 2022/8/56居民消费价格(CPI)统计简介计算方法第6页,共37页。 抽样代表性:代表品、网点抽选仍以重点、典型性为主。 抽多少,怎么抽? 权数变动性:五年固定,拉氏加权计算。 消费结构变动如何体现? 计算科学性:代表品之间几何平均计算。 相当与等权计算? 数据及时性:月度指数存在滞后性。 如何反映短期波动? 2022/8/57居民消费价格(CPI)统计简介疑惑和挑战第7页,共37页。2022

4、/8/58大数据物价统计的应用现状及比较应用现状 每日网上价格指数:美国麻省理工学院对全世界海量网上零售 价格进行价格指数计算,每天抓取70多个国家的50万条价格信息。 淘宝网价格指数:阿里巴巴公司基于淘宝网、天猫网、支付宝等 网络平台的数据,推出网络购物消费价格指数。 谷歌搜索数据CPI:国内学者通过谷歌搜索平台选取对CPI相关系数 高的几十个关键词,跟踪测算出搜索CPI指数。第8页,共37页。2022/8/59大数据物价统计的应用现状及比较应用比较统计方法比较 指数名称每日网上价格指数淘宝网ISPI谷歌搜索数据CPI官方CPI分类主要包括食品饮料、家居用品、家具、服装、鞋类、卫生、能源等。

5、食品、衣着、家庭设备用品及服务、医疗保健护理、交通和通讯、教育文化娱乐服务、居住等九大类。分为宏观形势指数和供求关系指数。宏观形势指数主要与货币政策、经济走势相关;供求关系指数主要与关注和购买商品相关。食品、烟酒及用品、衣着、家庭设备用品及维修服务、医疗保健和个人用品、交通和通信、娱乐教育文化用品及服务、居住等。权重成交额的比重成交额的比重根据关键词搜索数据与CPI的相关性大小根据居民总消费支出中所占的比重,五年固定。计算方法采用链式加权的拉氏指数采用链式加权的拉氏指数综合指数合成法链式拉氏指数数据来源全球网上商品服务交易淘宝网、天猫网、支付宝等网络平台交易数据谷歌解析平台搜索数据全国31个省

6、市500个市县,6.3万个价格调查点第9页,共37页。2022/8/510大数据物价统计的应用现状及比较应用比较统计功能比较 指数名称每日网上价格指数淘宝网ISPI谷歌搜索数据CPI官方CPI指数用途物价变动趋势网络零售价格变动趋势和变化程度预测物价变动趋势居民消费价格变动趋势和变化程度发布频率日、周、月、年日、周、月、年日、周、月、年月、年预警能力领先官方CPI领先官方CPI预测官方CPI转折点预测经济形势感受符合度较高很高较高一般第10页,共37页。2022/8/511大数据物价统计的应用现状及比较应用比较不足比较 指数名称存在的主要不足网络零售CPI1不能反映服务消费价格情况2不能综合性

7、反应价格变动情况搜索数据CPI 1不能反映价格变动程度2不能反映价格的变化结构官方CPI1不能提供日、周等短周期数据2不能及时体现消费市场结构变化3数据发布滞后时间偏长第11页,共37页。 以现行CPI编制框架为基础,确保数据可比性和衔接性 充分利用大数据,改进现行CPI不足: 抽样代表性? 代表品抽选更有依据 权数变动性? 权数设置更为灵活 计算科学性? 计算方法更加多样 数据及时性? 指数周期更趋高频 2022/8/5121号店价格指数编制方法及实例编制思路第12页,共37页。2022/8/5131号店价格指数编制方法及实例分类体系 方法: 以1号店现有的后台商品分类体系(三级分类目录)为

8、基础 两大原则: 代表性 体现营运状况及线上销售特点 稳定性 不应频繁变动,确保指数延续性 第13页,共37页。实例:分类筛选过程: 第三级目录数量较大(1500多个)、稳定性不高 不符基本要求的分类,如集团消费、团购消费、购物卡、礼品等 消费未成气候的分类,如生鲜食品、服装、交通工具、珠宝饰品等 消费量大、有特色分类,如休闲速食食品、进口食品、母婴产品、 厨卫清洁 、家居用品等 研究初期,不宜纳入过大规模的分类目录 2022/8/5141号店价格指数编制方法及实例分类体系第14页,共37页。实例:分类筛选结果:10个一级分类45个二级分类2022/8/5151号店价格指数编制方法及实例分类体

9、系一级分类二级分类一级分类二级分类食品休闲零食家居厨具锅具厨房调料床上用品干货收纳洗晒方便面/速食装饰/日用粮油餐具水具糖果/巧克力美容护理口腔护理罐装食品女性护理饼干/糕点男士护理进口食品进口乳制品缤纷彩妆进口休闲零食美容工具进口果干/坚果身体护理进口饮用水/饮料面部护肤饮料乳制品生活电器个人 护理冲调饮品厨房电器酒大家电饮料生活电器厨卫清洁一次性用品电器附件 家庭清洁护理手机手机通讯清洁用具手机配件纸制品数码数码影像衣物清洁护理数码影音母婴奶粉系列数码配件母婴营养品第15页,共37页。2022/8/5161号店价格指数编制方法及实例代表品选取 方法: 将各二级分类下所有在报告期有销售的商品

10、按销售额大小排序 几种方案: 全部选取 可比性问题,带入奇异值 固定数量 排位前n个的选取为代表品 固定金额 累加销售额达到该类别总销售额固定比例的前n个 选取为代表品 第16页,共37页。实例: 使用固定金额的方法,比例定为七成。 优点:有足够的代表性 有足够的稳定性 留出一定数量作为备用 最终选取结果:各二级分类下的平均代表品数量在 100个左右, 食品、厨卫清洁等商品繁多的分类在200-300个。 2022/8/5171号店价格指数编制方法及实例代表品选取第17页,共37页。2022/8/5181号店价格指数编制方法及实例权数设置 方法: 代表品权数:该商品在报告期或基期的销售额占同分类

11、下 所有代表品销售额的比重 分类权数:该分类在报告期或基期的销售额占上级分类总 销售额的比重 第18页,共37页。2022/8/5191号店价格指数编制方法及实例计算过程 方法: 代表品平均价格 : ,t期均价=销售总额/销售量 代表品环比指数: ,t期指数=t期均价/t-1期均价 第19页,共37页。2022/8/5201号店价格指数编制方法及实例计算过程 方法: 基本分类环比指数 : 派氏指数,报告期权数 拉氏指数,基期权数 费雪指数,综合权数第20页,共37页。2022/8/5211号店价格指数编制方法及实例计算过程 方法: 逐级分类环比指数: 派氏指数,报告期权数 拉氏指数,基期权数

12、费雪指数,综合权数第21页,共37页。实例: 2022/8/5221号店价格指数编制方法及实例计算过程代表品 环比 权数拖把 92.3 40百洁布 101.5 15扫帚 100.2 25脸盆 103.4 10浴帘 104.8 10加权平均二级分类 环比 权数清洁卫浴 98.0 30代表品 环比 权数保鲜膜 102.5 30垃圾袋 105.3 25纸杯 90.9 20牙签 95.7 15鞋套 107.6 10加权平均二级分类 环比 权数一次性用品 100.4 20二级分类 环比 权数纸制品 102.8 20二级分类 环比 权数厨具餐具 104.9 30加权平均一级分类 环比 权数厨卫清洁 101

13、.2 30一级分类 环比 权数 食品 105.4 30一级分类 环比 权数 母婴 108.7 40几何平均100.3第22页,共37页。2022/8/5231号店价格指数编制方法及实例计算过程 方法: 链式法推算其他指数 定基指数t-1期定基指数 t期环比指数 同比指数t期定基指数 / t-x期定基指数, x为周期 第23页,共37页。2022/8/5241号店价格指数编制方法及实例数据筛选 方法: 指标筛选产品编码、分类编码、商品名、计量单位、规格信息 销售时间、销售价格、销售量 奇异剔除赠品价格、极低极高价格等 第24页,共37页。2022/8/5251号店价格指数编制方法及实例数据处理

14、方法: 主要是代表品缺失或变动时的价格延续性处理,一般需要寻找新代 表品继续进行价格跟踪,但新老代表品间的价格需要进行过渡处理。 现行CPI统计中常用方法:替代法、备用虚拟法 大数据物价统计方法:后备代表品更替法 其他方法:主要特征折算法、成本因素分解法、 Hedonic回归法等 第25页,共37页。实例:现行CPI备用虚拟法2022/8/5261号店价格指数编制方法及实例数据处理商品第一期价格第二期价格第二期环比指数第三期价格第三期环比指数第四期价格第四期环比 指数A8085106.3 8296.5 84102.4 B9095105.6 97102.1 9395.9 C100105105.0

15、 缺失100(虚拟)缺失102.9(虚拟)D7072第26页,共37页。实例:1号店价格指数后备代表品更替法2022/8/5271号店价格指数编制方法及实例数据处理商品第一期价格第二期价格第二期环比指数第三期价格第三期环比指数第四期价格第四期环比 指数A8085106.3 8296.5 84102.4 B9095105.6 97102.1 9395.9 C100105105.0 缺失缺失D747094.672102.9第27页,共37页。 签署战略合作协议,数据保密协议。 统计局提供编制方法,1号店负责实际测算操作。 测算结果由统计局负责评估。 定期以1号店名义发布指数,统计局协助数据分析,宣

16、传推广。2022/8/528数据比较评估合作模式第28页,共37页。 利用1号店的销售数据测算8个月有关商品分类的环比价格指数。 分别使用拉氏指数、派氏指数、费雪指数方法测算出三套结果。 其中乳制品、饮料、厨房调料、大家电、奶粉系列等12类与现行 CPI口径一致,可进行比较。2022/8/529数据比较评估测算情况第29页,共37页。拉氏和派氏指数结果比较2022/8/530数据比较评估指数比较分 类相关系数涨跌不同(个月)乳制品0.94622饮料0.97791厨房调料0.97222大家电0.96211奶粉系列0.94542床上用品0.82063手机通讯0.97530糖果/巧克力0.82042

17、缤纷彩妆0.94430美容工具0.95130酒0.83300饼干/糕点0.97711波动一致性很高涨跌一致性不高第30页,共37页。 拉氏指数权数固定为基期,无法体现权数结构变化。 派氏指数使用报告期权数,结构变化较大时会影响指数平稳性。 费雪指数综合使用基期和报告期权数,充分汲取两者优势。2022/8/531数据比较评估指数比较第31页,共37页。拉氏、派氏、费雪指数与CPI差异度比较2022/8/532数据比较评估指数评估分 类与CPI差异度绝对值(%)拉氏指数派氏指数费雪指数乳制品1.1781.3051.165饮料1.1601.7751.453厨房调料1.1961.3431.206大家电

18、3.6693.2853.270奶粉系列1.9482.7902.281床上用品4.5973.9204.266手机通讯3.5433.4083.476糖果/巧克力1.2332.2521.378缤纷彩妆1.5041.5321.504美容工具1.2941.0011.148酒2.1321.3881.763饼干/糕点1.9422.6752.159平均2.1162.2232.089第32页,共37页。 1号店分类指数与CPI的差异度较小,与CPI衔接性较强。 费雪指数优于拉氏、派氏指数。 样本量偏少,无法深入评估。2022/8/533数据比较评估指数评估第33页,共37页。 长期数据测算,加入同比指数,更好的

19、比较评估。 加快测算周期频率,加入旬指数、周指数,甚至日指数。 扩大分类体系,关注网络新兴消费领域和服务项目。 推广至更多网络销售平台。 研究如何将网络价格纳入CPI统计中。2022/8/534数据比较评估后期方向第34页,共37页。 大数据应用应从点上突破,先行先试,后图推广。 大数据统计方法研究应注意与传统方法衔接。 数据研究过程:2022/8/535数据比较评估心得体会数据筛选数据整理指标选取分类分层奇值过滤数据处理标准化平滑处理季节处理滞后处理方法选取计算方法计量模型结论评估第35页,共37页。谢谢!第36页,共37页。1、不是井里没有水,而是你挖的不够深。不是成功来得慢,而是你努力的

20、不够多。2、孤单一人的时间使自己变得优秀,给来的人一个惊喜,也给自己一个好的交代。3、命运给你一个比别人低的起点是想告诉你,让你用你的一生去奋斗出一个绝地反击的故事,所以有什么理由不努力!4、心中没有过分的贪求,自然苦就少。口里不说多余的话,自然祸就少。腹内的食物能减少,自然病就少。思绪中没有过分欲,自然忧就少。大悲是无泪的,同样大悟无言。缘来尽量要惜,缘尽就放。人生本来就空,对人家笑笑,对自己笑笑,笑着看天下,看日出日落,花谢花开,岂不自在,哪里来的尘埃!5、心情就像衣服,脏了就拿去洗洗,晒晒,阳光自然就会蔓延开来。阳光那么好,何必自寻烦恼,过好每一个当下,一万个美丽的未来抵不过一个温暖的现在。6、无论你正遭遇着什么,你都要从落魄中站起来重振旗鼓,要继续保持热忱,要继续保持微笑,就像从未受伤过一样。7、生命的美丽,永远展现在她的进取之中;就像大树的美丽,是展现在它负势向上高耸入云的蓬勃生机中;像雄鹰的美丽,是展现在它搏风击雨如苍天之魂的翱翔中;像江河的美丽,是展现在它波涛汹涌一泻千里的奔流中。8、有些事,不可避免地发生,阴晴圆缺皆有规律,我们只能坦然地接受;有些事,只要你愿意努力,矢志不渝地付出,就能慢慢改变它的轨迹。9、与其埋怨世界,不如改变自己。管好自己的心,做好自己的事,比什

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论