企业的经济政策不确定性感知指数简介
“近几年,学术界和实业界高度关注经济政策不确定性。确实,这个时代最大的确定性就是充满不确定性。目前度量经济政策不确定性的主要指标,是BBD(2016)开发的EPU指数。然而,每个地区或国家在每个时点只有一个EPU指数,从而在计量上它无法与时间固定效应区分,而且它也无法区分不同企业的政策不确定性感受差异。”
——公众号:聂辉华教授
2020年,聂辉华、阮睿和沈吉老师在《世界经济》杂志发表了《企业不确定性感知、投资决策和金融资产配置》一文,提供了一种计算企业层面的经济政策不确定性指数的方法,并利用该数据分析了不确定性感受对企业投资和融资的影响。该论文发表后,受到了学界广泛关注。
为了推动经济政策不确定性的研究,同时减少不必要的时间成本,聂辉华老师及其研究团队将企业经济政策不确定性感知指数公开给学术界使用。经授权,CnOpenData将本数据收录于CnOpenData官方网站的公共数据版块,便于各位学者浏览。
本数据下载及更多信息请跳转白鲨在线。
数据库应用指南
数据构建方法
本文衡量经济政策不确定性的指标从上市公司年报文本中使用文本挖掘方法提取得到。
随着计算机技术的发展,把文本等非结构化数据引入公司金融研究的做法越来越普遍(Tetlock,2007;Li,2008;Tetlock等,2008;Loughran和McDonald,2014、2016)。本文参考Baker等(2016)和Hassan等(2019)的做法,使用“词表法”筛选特定的内容文本 ,在一段文本中如果出现特定词语,就把这段文本识别为表达某些特定含义的文本。本文认为如果一句话中同时出现“政策词语”和“不确定性词语”,就认为这句话是年报撰写人表述公司面临经济政策不确定性的内容。
具体方法如下:
- 首先通过格式转换工具把每份上市公司年报的PDF文件转换成文本文件,使用正则表达式取出“管理层讨论与分析”(简称MD&A,有些年报中是“董事会报告”)的内容,剔除所有数字、英文字母和除句号以外的所有标点符号和特殊符号。
- 然后,以中文句号为分隔符把MD&A文本分割为句子,考虑到中文的语言习惯,本文以句子作为分析的基本单位。假定上市公司i在年份t的年报中MD&A句子数量为s,使用编程语言Python调用jieba分词模块对每个句子进行分词,并在分词的同时剔除停用词(stopwords)。为尽量降低分词带来的歧义,本文在分词时定义了用户词表,词表包括所有A股上市公司的全称和简称、会计科目名称、后续文本处理用到的表示不确定性的词语以及与政府(政策)含义相关的词语。分词以后每个句子都变成一系列词语的组合,再对每个句子(s)逐一进行以下操作:搜索每个句子中出现的词,如果出现表示不确定性的词,就认为是表示不确定性的句子;如果一个句子中同时出现政府、政策等内容相关的词和表示不确定性的词,就认为是一个表示政策不确定性的句子(P)。用经济政策不确定性句子中不确定性词语数量(n)占MD&A总词语数量(N)的比例衡量企业面临的经济政策不确定性(FEPU)。
参考文献
注:任何基于企业的经济政策不确定性感知指数的使用均需注明引用来源:
- 聂辉华、阮睿、沈吉,2020,《企业不确定性感知、投资决策和金融资产配置》,《世界经济》,第6期,77-98页。
数据更新频率
不定时更新