资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,*,课题组成员:,秦丽萍,孔黎明,刘,慧,朱国众,2014.6,大数据在,CPI,统计中的应用,以,1,号店价格指数为例,课题组成员:大数据在CPI统计中的应用,2024/11/13,2,主要内容,居民消费价格(,CPI,)统计简介,1,大数据物价统计的应用现状,2,1,号店价格指数编制方法研究及实例,3,数据比较评估,4,2023/10/62主要内容居民消费价格(CPI)统计简介1,城乡居民购买并用于日常生活消费的商品和服务项目的价格。,调查内容按用途划分为八大类、,262,个基本分类。,包括食品、烟酒、衣着、家庭设备用品及维修服务、医疗保健,和个人用品、交通和通信、娱乐教育文化用品及服务、居住。,2024/11/13,3,居民消费价格(,CPI,)统计简介,调查内容,分类固定,国家规定,代表品抽样,地方自定,城乡居民购买并用于日常生活消费的商品和服务项目的价格。20,消费量较大的消费项目。,价格变动具有较强的代表性。,同基本分类下代表品异质性越大越好。,合格产品。注册商标、产地、规格等级等标识齐全。,2024/11/13,4,居民消费价格(,CPI,)统计简介,抽样原则,2014,年,上海,CPI,代表品共抽选,1300,多种,消费量较大的消费项目。2023/10/64居民消费价格(C,调查方法:采用定人、定点、定时的方法直接采集代表品价格。,调查频率:与居民生活密切相关、价格变动频繁的商品,五天一次。,一般性商品(服务),每月,2-3,次。,政府统一定价或价格稳定的商品(服务),每月一次。,报告周期:月度,每月,10,日前公布上月数据。,2024/11/13,5,居民消费价格(,CPI,)统计简介,方法频率,2014,年,上海每月采集价格笔数为,35000,多笔,2023/10/65居民消费价格(CPI)统计简介方法频率,权数测算:主要根据居民家庭消费支出资料,辅以典型调查。,权数五年固定不变。,计算方法:先计算代表品月度,时点平均价格,变动幅度,代表品之间,几何平均,得出基本分类月度变动幅度,基本分类以上按,逐级,拉氏加权平均,得出各级分类月度变动幅度。,2024/11/13,6,居民消费价格(,CPI,)统计简介,计算方法,2023/10/66居民消费价格(CPI)统计简介计算方法,抽样代表性:代表品、网点抽选仍以重点、典型性为主。,抽多少,怎么抽?,权数变动性:五年固定,拉氏加权计算。,消费结构变动如何体现?,计算科学性:代表品之间几何平均计算。,相当与等权计算?,数据及时性:月度指数存在滞后性。,如何反映短期波动?,2024/11/13,7,居民消费价格(,CPI,)统计简介,疑惑和挑战,2023/10/67居民消费价格(CPI)统计简介疑惑和挑战,2024/11/13,8,大数据物价统计的应用现状及比较,应用现状,每日网上价格指数:,美国麻省理工学院对全世界海量网上零售,价格进行价格指数计算,每天抓取,70,多个国家的,50,万条价格信息。,淘宝网价格指数:,阿里巴巴公司基于淘宝网、天猫网、支付宝等,网络平台的数据,推出网络购物消费价格指数。,谷歌搜索数据,CPI,:,国内学者通过谷歌搜索平台选取对,CPI,相关系数,高的几十个关键词,跟踪测算出搜索,CPI,指数。,2023/10/68大数据物价统计的应用现状及比较应用现状,2024/11/13,9,大数据物价统计的应用现状及比较,应用比较,统计方法比较,指数名称,每日网上价格指数,淘宝网,ISPI,谷歌搜索数据,CPI,官方,CPI,分类,主要包括食品饮料、家居用品、家具、服装、鞋类、卫生、能源等。,食品、衣着、家庭设备用品及服务、医疗保健护理、交通和通讯、教育文化娱乐服务、居住等九大类。,分为宏观形势指数和供求关系指数。宏观形势指数主要与货币政策、经济走势相关;供求关系指数主要与关注和购买商品相关。,食品、烟酒及用品、衣着、家庭设备用品及维修服务、医疗保健和个人用品、交通和通信、娱乐教育文化用品及服务、居住等。,权重,成交额的比重,成交额的比重,根据关键词搜索数据与,CPI,的相关性大小,根据居民总消费支出中所占的比重,五年固定。,计算方法,采用链式加权的拉氏指数,采用链式加权的拉氏指数,综合指数合成法,链式拉氏指数,数据来源,全球网上商品服务交易,淘宝网、天猫网、支付宝等网络平台交易数据,谷歌解析平台搜索数据,全国,31,个省市,500,个市县,,6.3,万个价格调查点,2023/10/69大数据物价统计的应用现状及比较应用比较统,2024/11/13,10,大数据物价统计的应用现状及比较,应用比较,统计功能比较,指数名称,每日网上价格指数,淘宝网,ISPI,谷歌搜索数据,CPI,官方,CPI,指数用途,物价变动趋势,网络零售价格变动趋势和变化程度,预测物价变动趋势,居民消费价格变动趋势和变化程度,发布频率,日、周、月、年,日、周、月、年,日、周、月、年,月、年,预警能力,领先官方,CPI,领先官方,CPI,预测官方,CPI,转折点,预测经济形势,感受符合度,较高,很高,较高,一般,2023/10/610大数据物价统计的应用现状及比较应用比较,2024/11/13,11,大数据物价统计的应用现状及比较,应用比较,不足比较,指数名称,存在的主要不足,网络零售,CPI,1,不能反映服务消费价格情况,2,不能综合性反应价格变动情况,搜索数据,CPI,1,不能反映价格变动程度,2,不能反映价格的变化结构,官方,CPI,1,不能提供日、周等短周期数据,2,不能及时体现消费市场结构变化,3,数据发布滞后时间偏长,2023/10/611大数据物价统计的应用现状及比较应用比较,以现行,CPI,编制框架为基础,确保数据可比性和衔接性,充分利用大数据,改进现行,CPI,不足:,抽样代表性?,代表品抽选更有依据 ,权数变动性?,权数设置更为灵活 ,计算科学性?,计算方法更加多样 ,数据及时性?,指数周期更趋高频 ,2024/11/13,12,1,号店价格指数编制方法及实例,编制思路,2023/10/6121号店价格指数编制方法及实例编制思路,2024/11/13,13,1,号店价格指数编制方法及实例,分类体系,方法:,以,1,号店现有,的,后台商品分类体系,(三级分类目录),为基础,两大原则:,代表性,体现营运状况及线上销售特点,稳定性,不应频繁变动,确保指数延续性,2023/10/6131号店价格指数编制方法及实例分类体系,实例:,分类筛选过程:,第三级目录,数量较大,(,1500,多个),、稳定性不高,不符基本要求的分类,如集团消费、团购消费、购物卡、礼品等,消费未成气候的分类,如生鲜食品、服装、交通工具、珠宝饰品等,消费量大、有特色分类,如休闲速食食品、进口食品、母婴产品、,厨卫清洁、家居用品等 ,研究初期,不宜纳入过大规模的分类目录,2024/11/13,14,1,号店价格指数编制方法及实例,分类体系,实例:2023/10/6141号店价格指数编制方法及实例分类,实例:,分类筛选结果:,10,个一级分类,45,个二级分类,2024/11/13,15,1,号店价格指数编制方法及实例,分类体系,一级分类,二级分类,一级分类,二级分类,食品,休闲零食,家居,厨具锅具,厨房调料,床上用品,干货,收纳洗晒,方便面,/,速食,装饰,/,日用,粮油,餐具水具,糖果,/,巧克力,美容护理,口腔护理,罐装食品,女性护理,饼干,/,糕点,男士护理,进口食品,进口乳制品,缤纷彩妆,进口休闲零食,美容工具,进口果干,/,坚果,身体护理,进口饮用水,/,饮料,面部护肤,饮料,乳制品,生活电器,个人 护理,冲调饮品,厨房电器,酒,大家电,饮料,生活电器,厨卫清洁,一次性用品,电器附件,家庭清洁护理,手机,手机通讯,清洁用具,手机配件,纸制品,数码,数码影像,衣物清洁护理,数码影音,母婴,奶粉系列,数码配件,母婴营养品,实例:2023/10/6151号店价格指数编制方法及实例分类,2024/11/13,16,1,号店价格指数编制方法及实例,代表品选取,方法:,将各二级,分类,下所有在,报告期,有销售的,商品按销售额大小,排序,几种方案:,全部选取,可比性问题,带入奇异值,固定数量,排位前,n,个的选取为代表品,固定金额,累加销售额达到该类别总销售额固定比例的前,n,个,选取为代表品,2023/10/6161号店价格指数编制方法及实例代表品选取,实例:,使用固定金额的方法,比例定为七成。,优点:,有足够的代表性,有足够的稳定性,留出一定数量作为备用,最终选取结果:各二级分类下的平均代表品数量在,100,个左右,,食品、厨卫清洁等商品繁多的分类在,200-300,个。,2024/11/13,17,1,号店价格指数编制方法及实例,代表品选取,实例:2023/10/6171号店价格指数编制方法及实例代表,2024/11/13,18,1,号店价格指数编制方法及实例,权数设置,方法:,代表品权数,:,该商品在报告期,或基期的,销售额,占同分类下,所有代表品销售额的,比重,分类权数:,该,分类,在报告期,或基期的,销售额,占上级分类总,销售额的比重,2023/10/6181号店价格指数编制方法及实例权数设置,2024/11/13,19,1,号店价格指数编制方法及实例,计算过程,方法:,代表品,平均价格 :,,t,期均价,=,销售总额,/,销售量,代表品环比指数:,,t,期指数,=t,期均价,/t-1,期均价,2023/10/6191号店价格指数编制方法及实例计算过程,2024/11/13,20,1,号店价格指数编制方法及实例,计算过程,方法:,基本分类环比指数 :,派氏指数,报告期权数,拉氏指数,基期权数,费雪指数,综合权数,2023/10/6201号店价格指数编制方法及实例计算过程,2024/11/13,21,1,号店价格指数编制方法及实例,计算过程,方法:,逐级,分类环比指数:,派氏指数,报告期权数,拉氏指数,基期权数,费雪指数,综合权数,2023/10/6211号店价格指数编制方法及实例计算过程,实例:,2024/11/13,22,1,号店价格指数编制方法及实例,计算过程,代表品 环比 权数,拖把,92.3 40,百洁布,101.5 15,扫帚,100.2 25,脸盆,103.4 10,浴帘,104.8 10,加权平均,二级分类 环比 权数,清洁卫浴,98.0 30,代表品 环比 权数,保鲜膜,102.5 30,垃圾袋,105.3 25,纸杯,90.9 20,牙签,95.7 15,鞋套,107.6 10,加权平均,二级分类 环比 权数,一次性用品,100.4 20,二级分类 环比 权数,纸制品,102.8 20,二级分类 环比 权数,厨具餐具,104.9 30,加权平均,一级分类 环比 权数,厨卫清洁,101.2 30,一级分类 环比 权数,食品,105.4 30,一级分类 环比 权数,母婴,108.7 40,几何平均,100.3,实例:2023/10/6221号店价格指数编制方法及实例计算,2024/11/13,23,1,号店价格指数编制方法及实例,计算过程,方法:,链式法推算其他指数,定基指数,t-1,期定基指数,t,期环比指数,同比指数,t,期定基指数,/t-x,期定基指数,,x,为周期,2023/10/6231号店价格指数编制方法及实例计算过程,2024/11/13,24,1,号店价格指数编制方法及实例,数据筛选,方法:,指标筛选,产品编码、分类编码、商品名、计量单位、规格信息,销售时间、销售价格、销售量,奇异剔除,赠品价格、极低极高价格等,2023/10/6241号店价格指数编制方法及实例数据筛选,2024/11/13,25,1,号店价格指数编制方法及实例,数据处理,方法:,主要是代表品缺失或变动时的
展开阅读全文