|
股票网络平台中的噪音会影响股价同步性吗*
肖争艳 谢 聪 陈彦斌
[提 要] 股价同步性是衡量资本市场信息效率的重要指标。股价同步性的影响机制一直以来都是金融研究的热点问题。本文使用文本分析的方法,通过机器学习度量了东方财富股吧中股民发帖评论中的非理性噪音,检验了股票网络平台中的噪音与股价同步性之间的关系。研究发现:第一,股票网络平台中的噪音会促使投资者做出非理性的投资决策,进而降低股价变动的同步性。噪音评论占全部评论的比例越高,上市公司的股价同步性越低,而且两者之间呈现倒U型的非线性关系。第二,公司个股新闻与公告数量的增加、分析师关注度的提高与外部审计质量的提升,均可以减弱股票网络平台中的噪音对股价同步性的影响。本文关注网络新媒体中的噪音对股价同步性的影响,研究结论对于监管部门加强网络信息监测以及上市公司进一步完善信息披露渠道具有现实意义。
[关键词] 股价同步性;非理性噪音;文本分析;信息披露
一、引言
股价同步性是指在某一时间段内绝大多数股票价格出现同时上涨或者同时下跌的现象,通常使用个股收益与市场收益回归模型的拟合优度R2来衡量。股价同步性反映出个股价格波动和市场价格波动之间的关联性,是金融学领域广受关注的重要问题。已有研究表明,在充分有效的股票市场中,股价中包含市场、行业及公司三种信息,股价同步性越高意味着股价中包含的公司特质信息越少,反映出资本市场的信息效率越低。但在非充分有效的股票市场中,市场充斥着大量与公司基本面无关的噪音且受到套利限制,低股价同步性可能意味着股价因融入了噪音而偏离公司基本价值,同样也破坏了公司信号的传递机制、降低了资本市场的信息效率。中国股票市场是新兴市场,投资者以散户为主而且受非理性情绪影响严重,信息不对称问题相对突出,资产价格中更有可能包含着较大噪音而无法真实反映公司基本面信息。因此,在这一背景下,研究中国股票市场股价同步性的形成原因与影响机制,对增强投资者获取公司信息的全面性和准确性、提高资本市场信息效率具有重要的意义。
关于股价同步性的产生主要有两种解释。第一类观点也即最主要的观点是以Roll(1988)和Morck et al.(2000)为代表的“信息效率观点”。该观点认为股票的特质性价格变动反映了公司特质信息或私有信息纳入股价的程度,股价同步性与股票市场的信息效率之间呈现负向关系。现有国内研究大多基于这一思路,将股价同步性作为股价中公司特质信息含量的度量,探讨可能影响股价同步性的其他因素,比如分析师关注(朱红军等,2007;伊志宏等,2015;2019)、所有权结构和审计质量(Gul et al.,2010)、财务透明度(Jin & Myers,2006;Hutton et al.,2009)等。第二类观点是以West(1988)为代表的“非理性行为观点”。该观点认为噪音、泡沫以及投资者心理偏见等非理性行为使得股票价格的变化远远超过公司基本面所能解释的程度,导致股价包含更多噪音、偏离公司基本价值。此时较低的股价同步性意味着资本市场的定价效率也较低。例如,Shiller(1981)认为公司基本面因素无法解释股价的超额波动现象,并将股价的特异性波动归因于噪音。Barberis et al.(2005)发现噪音交易者相互关联的情绪也可能导致股价同步性的提高。即使在中国这样高股价同步性的股票市场内,也有部分学者质疑将股价同步性等价于股价中公司特质信息含量的做法,认为中国股市的R2在更大程度上体现了市场噪音而非信息效率(王亚平等,2009)。还有一些学者发现股价同步性高低与信息含量大小两者之间的关系并不是简单的线性关系,而是呈现出U型或倒U型的非线性关系,这说明了同步性不是信息或噪音变量的单调递增函数(张永任和李晓渝,2010;林忠国等,2012;刘海飞等,2017)。上述关于股价同步性解释的两类观点差异较大,至今仍存在争论。研究结论不一致的重要原因之一在于缺少直接与噪音相关的指标,使得噪音影响股价同步性这一观点缺乏直接有效的证据支持。
在已有的理论研究中,噪音往往指的是噪音交易,对应的是不基于公司基本面进行交易的市场参与者,这部分交易者的决策是外生的,对股价产生直接的影响。这些文献对于噪音的定义多基于代理变量,未能直接有效地刻画噪音信息的强弱,例如林忠国等(2012)使用了交易量对公司基本面变量做回归后的残差项定义噪音指标。虽然噪音信息与噪音交易之间存在本质的差异,噪音信息要通过投资者的决策才能反映在股价中,即噪音交易才是影响股价变动的直接因素。但实际上,噪音交易者与知情交易者的主要区别在于其无法获取公司私有信息,完全取决于非公司基本面因素进行交易。因此,本文希望从信息内容本身这一角度出发,以与公司基本面不相关为主要原则,区分出噪音信息并验证其对股价同步性的影响。
近年来,大数据时代下信息技术的发展深刻地改变了公司信息的数量、类型及其传播方式。以股吧、微博、微信公众号等为代表的股票网络平台逐渐成为投资者获取信息的重要来源,因此股票网络平台中存在的海量信息数据为本文继续深入研究股价同步性的影响机制提供了新的切入点。一方面,股票网络平台是资本市场中噪音信息传播的重要途径。以股吧为例,海量的用户发帖评论中只有少部分内容与公司的特质信息有关,大多数帖子都是股民的简单情绪表达,甚至是与事实不符的公司层面信息。因此本文从社交网络平台中的评论文本出发,定义刻画噪音变量的指标是可行的切入点。另一方面,股票网络平台将原本不相互沟通的孤立投资者个体联系在一起。当投资者分散的意见通过网络进行沟通和融合时,便有可能影响现实中的投资决策(何贤杰等,2018;孙鲲鹏和肖星,2018)。那么,股票网络中的噪音评论是否通过平台强大的用户附着力导致了资产价格偏离基本面,进而影响了市场的定价效率,这是本文主要关注的问题。
然而,到目前为止,鲜有文献专门研究股票网络平台中的噪音信息对股价同步性的影响。首先,在研究股票网络平台的已有文献中,多数学者只探讨投资者有限理性对股票市场的影响,如投资者关注、投资情绪对股价运行、股价波动率和收益率的影响,但对股价同步性等资本信息效率问题的研究较少,也不够深入。其次,关于股票网络平台对投资者决策影响的已有研究,在构建股票网络平台相关的度量指标时多采用了发帖量、阅读量和搜索量等数值型变量(胡军和王甄,2015;刘海飞等,2017)。这些变量包含的信息较为简单,只能间接地体现投资者的意见,损失了股票网络平台中蕴含的大量文本信息,从而导致信息提取的不充分、利用率不高,结论不全面。
有鉴于此,本文关注股票网络平台的噪音评论对股价同步性的影响。本文爬取了东方财富股吧中沪深A股共3 310只样本股的有效发帖评论数据,利用文本分析与机器学习方法,将股票评论的内容分为公司特质信息和噪音两大类,并基于分类结果构建了噪音评论的相关指标,试图为其影响股价同步性提供直接证据。通过实证研究,本文发现,股评中的噪音评论比例越高,越容易影响投资者的实际投资决策,从而使股价同步性降低。此外,噪音评论比例与股价同步性之间并不是简单的线性关系。本文还进一步研究了公司新闻、分析师报告以及公司财务报告三类渠道信息传播是否会减弱股票网络平台中的噪音对股价同步性的影响。本文研究发现,公司的个股新闻与公告数量越多,股票网络平台中的噪音越难以降低股价同步性;上市公司受到跟踪的分析师团队数量越多,投资者越容易获取分析师的研究报告,就更难被股票网络平台中的噪音误导,从而噪音评论对股价同步性的降低作用越弱;在上市公司审计质量较高的情况下,投资者更愿意以官方披露的财务报告与公告作为判断公司基本价值的主要依据,进而减弱了噪音评论对股价同步性的影响。
本文的边际贡献主要体现在以下三个方面。第一,本文使用机器学习和文本分析的方法丰富了股评文本信息含量的研究。已有研究中对股票评论文本信息的利用多从投资者看涨或看跌的情绪出发,而忽视了对信息质量的衡量。此外,已有研究绝大部分使用代理变量来刻画影响股价的噪音,本文基于文本分析的结果给出了股票网络平台中噪音的直接度量。第二,本文丰富了非理性噪音与股价同步性之间关系的研究,为解决现有研究存在的争议提供了新视角。本文以股票网络平台的评论文本作为切入点,直接区分了股评中的公司特质信息与噪音,并探讨了股评中噪音比例和数量对股价同步性的影响。本文发现在投资者之间存在直接沟通机制的情况下,投资者的非理性噪音会通过股吧等交流平台传播,并降低股价同步性。这表明股票网络平台存在噪音传导效应,并会影响投资者行为和资本市场波动。第三,本文的工作进一步丰富了已有文献对于股价同步性形成机制的理解,为噪音降低股价同步性提供了经验证据,为解决关于股价同步性成因的争议提供了新视角。
二、研究假说
(一)股票网络平台的噪音评论与股价同步性
以东方财富股吧为代表的股票网络平台已经成为机构投资者和中小散户信息交流的主要平台。投资者群体在股吧等股票网络平台中不仅是信息接收者,同样也扮演了信息传播者和情绪传染者的角色。股吧中个股的每日发帖量、阅读量和评论量均保持在一定数量以上,这种高活跃度保证了各类信息、情绪甚至噪音传播的高效率。已有文献以股票网络论坛中帖子数或帖子情绪作为投资者关注和投资者情绪的代理变量,发现股票网络平台对股票市场收益率(如董大勇和肖作平,2011;杨晓兰等,2016)、成交量(易洪波等,2015)和波动率(Sabherwal et al.,2011;段江娇等,2017)有显著短期影响。
根据本文对东方财富股吧帖子内容的文本分析,发现平均超过70%的发帖与公司基本面信息不相关。本文将这些帖子统一视为噪音评论。股票网络平台的噪音评论可能影响股价同步性的机制主要包括两方面。第一,噪音评论中存在部分与事实不符的虚假公司特质信息。这些信息误导投资者使其自认为掌握了正确的公司特质性信息,进而做出投资决策并造成了股票价格的特异性变动,使得股价同步性降低。第二,大量噪音评论与公司价值投资不相关,而只是简单发表对股价看涨或看跌的看法。此类评论数量占整体评论的比例越多,越容易影响投资者看涨或看跌的投资情绪,甚至会引发股市的羊群效应(肖争艳等,2019),导致大量投资者“追涨杀跌”,进一步加剧个股股票的价格波动,降低了其股价同步性。
此外,已有研究发现股价同步性与信息或与噪音交易之间并不是简单的线性关系。为了说明这一点,Lee & Liu(2011)提出了噪音理性预期均衡模型,将股价收益率的波动来源拆分为由特质信息引起与由噪音引起两部分,从理论上证明了存在非线性关系。林忠国等(2012)从经济学角度对股价同步性与噪音交易的倒U型关系进行了详细分析。刘海飞等(2017)则证实上市公司的微博平台信息质量与股价同步性之间存在非线性关系。一般认为,市场中存在知情交易者、非知情交易者与噪音交易者三类投资者。当信息获取成本较低时,非知情交易者更愿意支付信息成本变为知情交易者,从而使得更多特质信息反映在股价的波动中,这时股价同步性随着信息交易的增加而降低。而在信息获取成本较高时,非知情交易者不愿意支付信息成本,而是基于噪音进行交易,使得由噪音交易引起的股价波动大于由信息引起的部分,此时噪音交易是股价同步性降低的主要原因。因此由信息和噪音交易引起的股价波动在叠加之后形成了倒U型关系。由于东方财富股吧中的股评以噪音评论为主,高活跃度的股吧浏览量很有可能导致噪音交易,进而反映在股价中。因此,本文预期噪音评论所占比例越高,股价同步性越低;股价同步性与股票网络平台中的噪音之间同样会呈现倒U型的非线性关系。
综上,下面提出本文的研究假说:
假说1 股票网络平台中的噪音评论所占比例越高,股价同步性越低。
假说2 股价同步性与股票网络平台中的噪音评论比例呈现倒U型的非线性关系。
(二)公司新闻及公告数量对噪音与股价同步性之间关系的影响
除了股票网络平台股吧外,投资者获取公司层面特质性信息的主要渠道还包括来自各类财经网站的公司新闻、公司官方披露的公告和券商研究所的分析师报告等。相对于普通用户在股吧中以不负责任的方式发表的股评,来自专业财经网站的个股新闻和公告可信度更高,而且以实际事件作为依据更能反映公司层面的特质性信息。在理论上,个股层面的新闻与公告数量越多、公司的信息披露越充分,投资者就越容易获取公司层面特质性信息,股票网络平台中的噪音就越难进入股价中。已有文献也表明,媒体报道提供的有关公司层面的信息会影响投资者决策(例如,Barber & Odean,2008;游家兴和吴静,2012)。因此,随着公司新闻和公告的增多,投资者会更加依赖公司的公开信息进行交易,从而更多公司特质信息会被融入股价中,因此股价同步性将会显著降低。有鉴于此,本文认为上市公司的信息披露渠道越完善、信息透明度越高,股票网络平台中的噪音评论就越难以误导投资决策或情绪,对股价同步性可能的降低作用也会越弱。由此,本文提出以下假说:
假说3 公司新闻和公告数量越多,股票网络平台中的噪音评论对股价同步性的影响也会越弱。
(三)分析师关注度对噪音与股价同步性之间关系的影响
作为信息中介,分析师具有信息搜集渠道广泛、专业知识丰富等相对优势。分析师对行业和公司特质信息进行综合整理分析,以盈利预测报告、荐股报告和自媒体等多种形式,显性地或隐性地对外传递信息。相比于股吧中的股评,分析师的评论与报告显然是一种更加可靠而稳定的信息获取方式,更能影响投资者的交易行为,使得股价更多地吸收公司特质信息,这使得股价的同步性下降(朱红军等,2007;伊志宏等,2019)。因此,对于分析师关注度较高的上市公司股票,投资者较容易获得公司特质信息,股票网络平台中的噪音评论更难降低股价同步性。基于上述观点,本文认为分析师跟踪人数越多的公司,股票网络平台中的噪音评论对股价同步性的影响越弱。由此,本文提出以下假说:
假说4 上市公司分析师关注度越高,越能减弱股票网络平台中的噪音评论对股价同步性的影响。
(四)审计质量对噪音与股价同步性之间关系的影响
上市公司定期披露的财务报告也是投资者进行决策的重要信息来源。高质量的外部审计服务可以提高财务信息可信度、增加财务信息有用性,从而减少管理层和投资者的信息不对称程度、抑制管理层机会主义行为、防止管理层提供虚假信息。因此,聘请 “四大” 会计师事务所作为年度报告审计师的上市公司,其财务报告的可信度更高、公司的内部控制信息披露更加透明,可以更好地保护中小投资者(Rice & Weber,2012;田高良等,2010;方红星等,2009)。对于进行长期价值投资的投资者而言,通过真实的财务指标对公司基本投资价值做出自己的判断,不会轻易地被股票网络平台中噪音评论误导,从而使得噪音评论对股价同步性的影响变得更弱。根据以上分析,本文提出以下假说:
假说5 对上市公司的高质量审计能减弱股票网络平台中的噪音评论对股价同步性的影响。
三、研究设计
(一)数据与样本
本文选取2018年 1月1日至2019年9月30日期间中国沪深A股所有上市公司作为初始样本,使用了Python爬虫技术,爬取了研究区间内所有样本股在东方财富股吧中的发帖评论及相关信息,经数据清洗后获得的有效股票评论共计50 561 408条。本文的个股收益率与公司主要财务数据来自CSMAR数据库与WIND数据库,公司的个股新闻与公告数据全部来自新浪财经网。
参照已有文献,本文对初始样本进行了如下筛选处理:(1)剔除了数据缺失严重的样本;(2)根据证监会2019年第三季度行业分类结果,剔除了行业分类为金融业的股票;(3)剔除了 ST及*ST这类被特殊处理的上市公司股票;(4)为了保证股价同步性计算的有效性和准确性,剔除了考察区间内个股的周频收益率数不足40的股票。本文最终获得共3 310只有效样本股票数据。
(二)主要变量的定义与计算
1. 股价同步性的衡量与计算。本文参考已有文献中广泛使用的方法计算股价同步性(Piotroski & Roulstone,2004;Gul et al.,2010;伊志宏等,2015)。对第i只股票,首先计算个股在研究区间内的周收益率。然后,对全部样本股按照流通市值加权法分别计算行业周收益率与市场周收益率,在加权计算行业与市场收益率的过程中剔除了样本股自身。对每只样本股进行如下回归:
ri,w=αi+βirmkt,w+γirind,w+εi
式中,ri,w表示第i只样本股在第w周的收益率,rmkt,w表示第w周的市场收益率,rind,w表示第w周的行业收益率。对经计算得到模型的R2做如下对数化处理,得到第i只股票在研究区间内的股价同步性SYN:
width=170,height=15,dpi=110
2. 噪音评论变量的定义与计算。基于对噪音解释股价同步性的已有研究以及行为金融文献的梳理,本文将股评中一切与公司基本面或个股层面特质信息的对立因素均视为噪音。本文首先将评论内容只包含表情、数字、符号等完全跟股票市场无关的评论进行了剔除。然后对剩余的股票评论,按照评论内容是否包含公司层面特质信息将股评逐条划分为信息评论或噪音评论。划分为信息评论的具体标准包括:(1)评论对象为该个股股吧对应的上市公司;(2)该信息表述的范围仅限于公司层面;(3)该信息包含的公司特质信息为真实信息(1) 本文在获取文本评论的过程中,同时保留了对应的个股及日期信息。并且在人工标注的过程中,对于包含公司特质信息的评论按如下规则进行了严格的筛查,确保虚假信息不会被划分为信息评论中:(1)以公司官方或第三方机构为来源可获取相同信息的,例如业绩公告、持仓变动、融资融券动向、引用分析师个股研报等,均确认为信息评论。(2)评论中包含的信息为已发生事件的,例如业务新动向、历史价格变动对比等,可通过个股新闻或历史数据进行查证的均确认为信息评论。(3)信息来源为发帖者个人或无法确认、信息内包含事件未发生、或已发生但无法通过第三方渠道查证的,统一划分为虚假信息,即噪音评论。等标准筛选出信息评论。对于投资者情绪表达、行业及市场层面的信息(2) 市场与行业信息包括宏观经济条件、行业政策等可以公开获取的信息,此类信息通常会影响整个市场或整个板块的股价,而只有公司层面的特质信息能够造成个股价格的特异性变动,从而影响其股价同步性(Roll,1998)。、个人对股价的预测及其他与公司基本面信息无关的评论统一划分为噪音。(3)噪音评论所包含的范围较为广泛繁杂,对于少数无法按上述规则进行具体分类的评论,依照与公司基本面信息无关的原则,本文将其统一划分至噪音评论。通过海量评论文本内容的阅读与分析,本文将实际情况下可能出现的评论归纳为如表1中所示的类型。
本文采取了文本分析加机器学习的方法完成对全体股评的分类。首先,随机抽取10 000条股评,按照表1分类标准对其进行了人工标注并作为训练样本。其次,使用了Word2Vec模型获取了所有股票评论文本的向量化表示。最后,基于SVM模型完成了对全体股评文本的分类。训练完毕的分类模型经过十折交叉验证得到的预测准确度为89%,因此可以认为较准确地对股票评论属于噪音或信息进行分类。分类结果包含每一只样本股具体到每一天的噪音评论与信息评论数量,本文采用噪音评论数占总评论数的比例来衡量股票网络平台中的噪音比例。由于个别日期的股票评论总数过少,采用日频的噪音比例会存在着较多的极端值,因此模型中使用了月度的评论数来计算噪音评论比例:
NOISEi,m=NOISE×NUMi,m/NUMSi,m
式中,NOISE×NUMi,m表示第i只股票第m个月的噪音评论总数,NUMSi,m表示第i只股票第m个月的总发帖评论数,最后对研究区间内的月度数据取均值,得到第i只股票的平均噪音比例:
width=190,height=35,dpi=110
表1 股票评论文本的分类标准及示例
width=736,height=332,dpi=110
3.控制变量的选取。为了检验股票网络平台中的噪音对股价同步性的影响,需要加入其他可能影响股价同步性的解释变量和控制变量。
首先,参照已有文献,本文从信息披露质量与受关注度出发,加入了以下控制变量。(1)个股新闻及公告数量(NEWS)。个股新闻及公告数量越多,公司管理层与股东之间的信息不对称程度就越低,公司层面特质性信息就越容易进入到股价中,从而股价同步性越低(游家兴和吴静,2012;黄俊和郭照蕊,2014)。(2)分析师关注度(ANALYST)。本文采用研究区间内对上市公司进行过跟踪分析的团队数量进行度量。随着跟踪的分析师增加,投资者将更容易从各种渠道获得公司的信息,降低公司和投资者之间的信息不对称,使得股票价格能够反映其特质信息,进而降低股价同步性(朱红军等,2007)。(3)投资者关注度(NUMS)。本文采用研究区间内样本股吧内的发帖评论总数进行衡量。投资者的关注程度在很大程度上决定了噪音评论的扩散程度与传播效率,从而对股价同步性造成影响。投资者关注度越高的个股,无论是股票网络平台中的噪音或信息,都更易于被多数投资者所接收,从而造成股价的特异性波动,降低股价同步性(叶德磊等,2017)。(4)机构投资者持股比例(INST)。相较于中小散户投资者,机构投资者获取公司特质信息的渠道更多,与公司管理层之间的信息不对称程度更低。机构投资者持股比例越高,公司层面的特质性信息越容易经由机构投资者反映在股价中,股价同步性会越低(侯宇和叶东艳,2008;张永任和李晓渝,2010)。
其次,参照已有文献,从公司基本面的角度,本文控制了其他可能影响股价同步性的因素,包括公司规模(SIZE)、账面市值比(BTM)、财务杠杆比率(LEV)、净资产收益率(ROE)、董事会规模(ABOARD)、审计质量(AUDIT)、股票换手率(TOV)、上市地点(MARKET)、所属行业(INDUSTRY)等。
以上控制变量的定义和计算方法如表2所示。
表2 控制变量的定义
width=736,height=387,dpi=110
(三)实证模型
为了验证假说1中股票网络平台中的噪音评论比例对股价同步性的影响,本文建立了如下的截面数据回归模型:
SYN=αi+β1NOISE+β2NUMS
+∑jγjCONTROLSj+εi
(1)
width=327,height=193,dpi=110
图1 股价同步性与噪音评论比例间的倒U型关系
为了验证假说2,首先,本文从图形上对股价同步性与噪音评论比例之间是否存在倒U型关系进行了检验。参考林忠国等(2012)的方法,按照噪音评论比例NOISE从小到大的顺序,将样本区间内的观测等分为100组,分别计算每组R2与噪音的均值,然后绘制成图1中的散点图。从图1中可以看出,R2与噪音之间并不是简单的线性关系,即R2随着噪音评论比例的上升呈现出先增大后减弱的趋势。本文使用二次曲线对散点图进行拟合,得到的拟合优度达到71.61%。噪音评论比例较低代表着信息评论的比例较高,说明信息与噪音均可能是影响股价同步性的原因,甚至噪音对股价同步性的影响更明显。这一结论与张永任和李晓渝(2010)以及林忠国等(2012)一致。
其次,本文在模型中引入噪音评论比例的平方项NOISE2,建立式(2)检验股价同步性与股票网络平台中的噪音评论比例是否存在倒U型非线性关系。其中NOISE2为NOISE与其均值之差的平方。如果平方项NOISE2前的系数β2显著为负,则说明噪音评论比例与股价同步性之间确实存在显著的非线性关系。
SYN=αi+β1NOISE+β2NOISE2
+β3NUMS+∑jγjCONTROLSj
+εi
(2)
为了进一步验证假说3~假说5,参考已有文献中的方法(王亚平等,2009;何贤杰等,2018),本文在式(1)中分别引入噪音评论比例与个股新闻及公告数量、分析师关注度以及审计质量的交叉项,以检验它们是否会对噪音评论比例与股价同步性间的关系产生影响。
SYN=αi+β1NOISE+β2NEWS
+β3NOISE×NEWS
+∑jγjCONTROLSj+εi
(3)
SYN=αi+β1NOISE+β2ANALYST
+β3NOISE×ANALYST
+∑jγjCONTROLSj+εi
(4)
SYN=αi+β1NOISE+β2AUDIT
+β3NOISE×AUDIT
+∑jγjCONTROLSj+εi
(5)
对于式(3)~式(5),交叉项前的系数表示各变量对股价同步性与噪音评论比例之间关系的额外作用,在预期噪音评论比例前的系数为负的假设下,若交叉项前的系数显著为正,则表明该变量的增大会减弱噪音评论比例对股价同步性的影响;若交叉项前的系数显著为负,则表明该变量的增大会增强噪音评论比例对股价同步性的影响。
四、实证结果
(一)描述性统计
表3报告了主要变量的描述性统计结果。可以看出,在样本期内,股价同步性均值约为-0.517,标准差约为0.708,反映出不同上市公司之间的股价同步性差异较大。噪音评论比例NOISE均值约为70.8%,说明大部分股吧评论是与公司无关的信息。噪音评论比例的标准差约为7.3%,计算得到变异系数为10.3%,这表明不同股票对应的噪音评论比例具有充分的变异性。图2为所有样本股的噪音评论比例的直方图,显示噪音评论比例接近于正态分布。
表3 主要变量的描述性统计结果
width=736,height=330,dpi=110
表4报告了回归模型中主要变量之间的相关系数及显著性检验结果。从相关性分析的结果来看,被解释变量股价同步性与噪音评论比例之间存在显著的负相关关系,与假说1的预期相符。解释变量之间最大相关系数不超过0.5,不存在明显的多重共线性,这表明变量选取与模型设计是合理的。
(二)回归模型结果
1.股票网络平台的噪音评论对股价同步性的影响。表5的列(1)和列(2)分别报告了式(1)与式(2)的回归结果。从列(1)的结果来看,噪音比例前的回归系数显著为负,说明股票网络平台中的噪音评论比例越高,股票价格波动的同步性越低,验证了假说1的正确性。在主要控制变量中,投资者关注度前的系数显著为负,与模型设计部分的预期相符;说明投资者关注度越高的个股,股吧中的噪音就越容易融入个股的价格变动中,造成了股价同步性的降低。
width=324,height=256,dpi=110
图2 噪音评论比例的直方图
从表5列(2)的回归结果来看,在加入噪音比例的平方项之后,噪音比例与噪音比例平方项前的回归系数在1%的水平下均显著为负,说明股票网络平台中的噪音与股价同步性存在显著的倒U型非线性关系,进一步从回归模型上验证了假说2的正确性。
表4 主要变量的相关系数
width=736,height=194,dpi=110
注:*表示在0.01的水平下显著。
以上结果改进了已有文献的认知。第一,与现有关注了股价同步性的非线性影响机制的实证研究相比,本文在结果中一致性地得到了倒U型(或U型)关系的结论,说明股价同步性或R2不能简单地反映出股价信息含量的多少。不同之处在于,本文从信息内容本身出发构建了噪音的度量变量,相较于使用机构投资者持股比例、ARIMA模型的残差项等作为信息或噪音代理变量的方法,本文的实证结果更加直观。第二,现有的关注股票网络平台与股价同步性的文献,更多考察的是公司特质信息对股价同步性的影响(胡军和王甄,2015;刘海飞等,2017;何贤杰等,2018),而忽视了同时存在于股票网络平台中的海量噪音。本文的实证结果从噪音的角度进一步证实了股票网络平台在资本市场中能够扩散投资者情绪,进而影响资产价格的形成。
2.信息获取方式对噪音与股价同步性之间关系的影响。表6的列(1)~列(3)分别报告了式(3)~式(5)的回归结果。从列(1)的结果可以看出,新闻与公告数前的系数在1%的水平下显著为负,说明个股新闻与公告的数量越多,投资者越容易获取到及时有效的信息,特质性信息越容易反映在股价当中。而新闻公告数与噪音比例交叉项前的系数在10%的水平下显著为正,反映出公司新闻与公告数的增多会减弱股票网络平台中的噪音评论对股价同步性的影响,这与假说3的预期相符。
表5 噪音比例与股份同步性的基准模型结果
width=736,height=415,dpi=110
注:*,**和***分别代表p<0.1,p<0.05和p<0.01;括号内是t值;模型经过VIF值的检验,不存在明显的多重共线性。下表同。
表6的列(2)检验了分析师关注度对噪音与股价同步性之间关系的影响。分析师关注度前的系数显著为负,说明对上市公司进行跟踪研究的团队越多,其股价同步性越低。这与国内已有研究的结论一致,即证券分析师可以使股价中包含更多公司信息,从而降低股价同步性(朱红军等,2007;伊志宏等,2019)。分析师关注度与噪音比例的交叉项前的回归系数在1%的水平下显著为正,说明当高质量的研究报告受到投资者的广泛关注时,股票网络平台中的虚假信息将更难影响投资者的判断,噪音评论对股价同步性的降低作用也就会减弱,验证了假说4的正确性。
3. 审计质量对噪音与股价同步性之间关系的影响。表6的列(3)检验了外部审计质量对噪音与股价同步性之间关系的影响。外部审计质量的系数在1%的水平下显著为负,说明审计质量越高,越能减少投资者与公司管理层之间的信息不对称程度,越有利于公司特质信息进入股价中。而交叉项前的系数在1%的水平下显著为正,表明审计质量越高,公司财务报表的可信度越高,投资者更愿意基于公司基本面做出自己的投资判断,股票网络平台中的噪音评论越难以影响股票价格的变动。已有研究中认为会计信息质量的提高能够显著提升股价中的信息含量(Jin & Meyers,2006)。本文的实证结果说明了会计信息质量的提高能够有效减少噪音进入股价中,进一步验证了已有研究中的结论。
五、稳健性检验
本文分别从样本选择、更换股价同步性计算方式、更换股票网络平台中噪音指标衡量方式等方面进行稳健性检验,并对模型的内生性和遗漏变量等可能存在的问题进行探讨。结果表明,本文的计量结果具有稳健性。
表6 信息获取方式和审计质量对噪音比例与股价同步之间关系的影响
width=736,height=893,dpi=110
1. 考虑样本选择问题。为了证明回归结果不受特异点的影响,本文分别剔除股价同步性最高与最低的10%部分重新进行回归。结果显示,主要解释变量前的系数在符号与显著性上均没有根本性的变化,说明实证结果具有稳健性。(4)鉴于篇幅限制,剔除股价同步性最高与最低的10%部分重新回归结果没有报告在正文中,如有需要可向笔者索取。
2. 更换股价同步性的计算方式。考虑到中国沪深A股上市公司的特点,根据证监会的分类结果,超过2/3的上市公司均归属于制造业,部分行业的上市公司数目不足30只。因此,本文删除行业收益率,只使用个股收益率与市场收益率做回归,重新计算R2与股价同步性。重新回归的实证结果与原回归模型一致。(5) 鉴于篇幅限制,更换股价同步性的计算方式后的回归结果没有报告在正文中,如有需要可向笔者索取。
3. 更换股票网络平台中噪音指标的衡量方式。本节直接采用噪音评论数量的月度均值作为解释变量,并且为了避免模型产生严重的多重共线性,在控制变量中剔除个股评论的总数。表7中列(1)
表7 稳健性检验结果
width=736,height=655,dpi=110
检验了噪音评论的数量对股价同步性的影响,列(2)~列(4)分别检验了个股新闻与公告数、分析师关注度与外部审计质量对噪音数与股价同步性之间关系的影响。结果显示,股票网络平台中的噪音评论的数量也会使得股价同步性降低。这也说明本文的研究结论是稳健的。
4. 内生性问题。鉴于股价同步性和股票网络平台之间的关系存在着一定的内生性问题,本文使用两阶段回归模型对两者之间的实际作用关系进行了实证研究。由于处于同一行业中的上市公司在股吧中面临相似的讨论环境,本文使用了同一行业中的其他公司噪音评论比例变量的平均值作为工具变量,并使用两阶段最小二乘回归的方法重新对模型的主要结论进行检验。表8报告了两阶段最小二乘回归的结果。本文计算得到工具变量在第一阶段回归中F统计值为31.09(大于10),Cragg-Donald Wald F统计量53.692,大于Stock-Yogo 弱工具变量检验10%偏误的临界值16.38,因此认为工具变量与内生变量之间的相关性足够强,不存在弱工具变量的问题。Sargan检验表明不存在过度识别的问题。综上,表8的结果显示,噪音评论比例与股价同步性仍然显著负相关,本文的研究结论在考虑内生性后依旧稳健。
5. 潜在的遗漏变量影响。为了解决潜在的遗漏变量问题,本文进一步控制了其他可能影响噪音与股价同步性之间关系的变量,增加了以下几个控制变量。(1)考虑到越年轻、学历越高的上市公司管理层,可能越重视股票网络平台等新媒体中信息的传播,并加强在股吧中与投资者的互动频率,进而使噪音评论的比例降低。因此,本文在控制变量中加入了上市公司高管的平均年龄、受教育程度等变量。(2)考虑到如果上市公司违规并被交易所公告次数越多,就越容易引发投资者的负面情绪,并在股吧中传播大量不实信息与非理性情绪表达。同样地,涉及诉讼仲裁越多的上市公司,也越容易引发投资者的不信任,并造成股票网络平台中的噪音评论比例上升。因此,本文对考察区间内上市公司被公告的违规次数和涉及诉讼仲裁的次数进行了控制。(3)考虑到媒体更多起到信息中介作用,可能对公司发布的信息进行再加工使新闻更具有诱导性;公司公告的数量与公司自身的经营投资活动密切相关,公司新闻及公告数量可能无法准确地反映出公司的信息透明度,在已有研究中信息透明度也多用盈余管理衡量。因此本文参考Hutton et al.(2009)的方法,使用上市公司过去三年操控性应计项目的绝对值之和计算盈余管理,并加入式(1)~式(5)的控制变量中。
表8 两阶段最小二乘回归模型结果
width=368,height=734,dpi=110
实证结果显示(6)鉴于篇幅限制,遗漏变量、非线性关系以及异常值的稳健性检验结果没有报告在正文中,如有需要可向笔者进一步索取相关结果。,在考虑了上述遗漏变量后,股票网络平台中的噪音与股价同步性之间的负相关关系仍然是显著的。
6. 非线性关系的检验。考虑到文中构建非线性关系检验的式(2)时,计算噪音评论比例平方项的过程中进行了中心化处理,可能无法直观地反映出二者间是存在倒U型关系还是非线性的单调关系。在稳健性检验中,本文直接对NOISE进行平方得到二次项NOISE2,并重新对式(2)进行了回归。为了避免回归模型产生严重的多重共线性,在解释变量中剔除了噪音评论比例的一次项,重新回归的结果显示平方项前的系数仍旧显著为负,与假说部分的预期结果相符。
7. 异常值及其他影响。考虑到分析师关注度变量可能存在右偏,本文在稳健性检验中对其进行了自然对数化处理。此外,为了消除其他异常值对回归结果可能产生的影响,同时对回归中的主要数值型变量,包括机构投资者持股比例、资产负债率、账面市值比等进行了5%的缩尾处理,并对式(1)~式(5)重新进行了回归,未产生结论性的变化。
六、结论与政策建议
股价同步性代表的是信息还是非理性噪音,至今仍没有统一的结论。本文以沪深A股所有上市公司为样本,搜集了东方财富股吧中超过五千万条发帖评论,通过文本分析和机器学习的方法度量了公司特质信息和噪音,实证检验了股票网络平台中的噪音评论与股价同步性的关系。本文有如下发现:第一,股票网络平台作为资本市场重要的信息传播中介,在传递信息的同时也会促使非理性噪音融入股票价格,甚至噪音才是主导股价同步性降低的因素。股票网络平台中的噪音评论比例越高,公司的股价同步性越低,且呈现倒U型的非线性关系。第二,公司个股新闻与公告数量越多、受到分析师的关注度越高、公司信息透明度与财务报告可信度较高,投资者就越能够通过更加可靠的方式获取公司特质信息来做出理性的投资决策,从而减弱了股票网络平台中的噪音对股价同步性的影响。本文的研究丰富了网络新媒体与股价同步性两方面的研究,同时为噪音降低股价同步性提供了经验证据,为解决关于股价同步性成因的争议提供了新视角。
本文研究得到如下几点启示: 第一,在公司没有新的重大新闻或基本面信息情况下,股票网络论坛对股票市场的影响是不能忽视的。论坛作为一个大量股民言论的聚集处,为获取和衡量投资者情绪和投资者关注提供了直接有效的途径。第二,对于投资者而言,需要提升自己信息获取与分析的能力,形成良好的投资理念,不要轻易被股票网络平台中的噪音所误导,减少非理性的投资决策。第三,对于上市公司而言,同样应该重视股票网络平台对公司信息传递机制的影响。上市公司可以通过股票网络平台加强与投资者之间的直接沟通,如提高董秘在股吧中回复问题的频率,以减少公司与投资者间的信息不对称程度,从而减弱股票网络平台中的噪音对股价变动带来的影响。第四,对于监管部门而言,除了要健全制度建设和维护透明信息环境之外,还要注重在网络平台引导投资者根据信息而不是噪音来进行交易。
参考文献
董大勇、肖作平,2011:《证券信息交流家乡偏误及其对股票价格的影响:来自股票论坛的证据》,《管理世界》第1期。
段江娇、刘红忠、曾剑平,2017:《中国股票网络论坛的信息含量分析》,《金融研究》第10期。
方红星、孙翯、金韵韵,2009:《公司特征、外部审计与内部控制信息的自愿披露——基于沪市上市公司2003—2005年年报的经验研究》,《会计研究》第10期。
何贤杰、王孝钰、孙淑伟、朱红军,2018:《网络新媒体信息披露的经济后果研究——基于股价同步性的视角》,《管理科学学报》第6期。
侯宇、叶冬艳,2008:《机构投资者、知情人交易和市场效率——来自中国资本市场的实证证据》,《金融研究》第4期。
胡军、王甄,2015:《微博、特质性信息披露与股价同步性》,《金融研究》第11期。
黄俊、郭照蕊,2014:《新闻媒体报道与资本市场定价效率——基于股价同步性的分析》,《管理世界》第5期。
林忠国、韩立岩、李伟,2012:《股价波动非同步性——信息还是噪音?》,《管理科学学报》第6期。
刘海飞、许金涛、柏巍、李心丹,2017:《社交网络、投资者关注与股价同步性》,《管理科学学报》第2期。
孙鲲鹏、肖星,2018:《互联网社交媒体对投资者情绪传染与股价崩盘风险的影响机制》,《技术经济》第6期。
田高良、齐保垒、李留闯,2010:《基于财务报告的内部控制缺陷披露影响因素研究》,《南开管理评论》第4期。
王亚平、刘慧龙、吴联生,2009:《信息透明度、机构投资者与股价同步性》,《金融研究》第12期。
肖争艳、周欣锐、周仕君,2019:《网络情绪能够影响股市羊群效应吗?》,《财经问题研究》第9期。
杨晓兰、沈翰彬、祝宇,2016:《本地偏好、投资者情绪与股票收益率:来自网络论坛的经验证据》,《金融研究》第12期。
叶德磊、姚占雷、刘小舟,2017:《公司新闻、投资者关注与股价运行——来自股吧的证据》,《华东师范大学学报》第6期。
伊志宏、李颖、江轩宇,2015:《女性分析师关注与股价同步性》,《金融研究》第11期。
伊志宏、杨圣之、陈钦源,2019:《分析师能降低股价同步性吗——基于研究报告文本分析的实证研究》,《中国工业经济》第1期。
易洪波、赖娟娟、董大勇,2015:《网络论坛不同投资者情绪对交易市场的影响——基于VAR模型的实证分析》,《财经论丛》第1期。
游家兴、吴静,2012:《沉默的螺旋:媒体情绪与资产误定价》,《经济研究》第7期。
张永任、李晓渝,2010:《R2与股价中的信息含量度量》,《管理科学学报》第5期。
朱红军、何贤杰、陶林,2007:《中国的证券分析师能够提高资本市场的效率吗——基于股价同步性和股价信息含量的经验证据》,《金融研究》第2期。
Barberis, N., A. Shleifer, and J. Wurgler, 2005, “Comovement”, Journal of Financial Economics, 75(2): 283-317.
Barber, B. M., and T. Odean, 2008, “All That Glitters: The Effect of Attention and News on the Buying Behavior of Individual and Institutional Investors”, Review of Financial Studies, 21(2): 785-818.
Gul, F. A., J. B. Kim, and A. Qiu, 2010, “Ownership Concentration, Foreign Shareholding, Audit Quality, and Stock Price Synchronicity: Evidence from China”, Journal of Financial Economics, 95(3): 425-442.
Hutton, A. P., A. J. Marcus, and H. Tehranian, 2009, “Opaque Financial Reports, R2, and Crash Risk”, Journal of Financial Economics, 94(1): 67-86.
Jin, L., and S. C. Myers, 2006, “R2 around the World: New Theory and New Tests”, Journal of Financial Economics, 79(2): 257-292.
Lee, D. W., and M. H. Liu, 2011, “Does More Information in Stock Price Lead to Greater or Smaller Idiosyncratic Return Volatility?”, Journal of Banking and Finance, 35(6): 1563-1580.
Morck, R., B. Yeung, and W. Yu, 2000, “The Information Content of Stock Markets: Why Do Emerging Markets Have Synchronous Stock Price Movements”, Journal of Financial Economics, 58(1): 215-260.
Piotroski, J. D., and D. T. Roulstone, 2004, “The Influence of Analysts, Institutional Investors, and Insiders on the Incorporation of Market, Industry, and Firm-specific Information into Stock Prices”, Accounting Review, 79(4): 1119-1151.
Rice, S. C., and D. P. Weber, 2012, “How Effective Is Internal Control Reporting under SOX 404? Determinants of the (Non-) Disclosure of Existing Material Weaknesses”, Journal of Accounting Research, 50(3): 811-843.
Roll, R., 1988, “R2”, Journal of Finance, 43(3): 541-566.
Sabherwal, S., S. K. Sarkar, and Y. Zhang, 2011, “Do Internet Stock Message Boards Influence Trading? Evidence from Heavily Discussed Stocks with No Fundamental News”, Journal of Business Finance & Accounting, 38(9): 1209-1237.
Shiller, R. J., 1981, “Do Stock Prices Move Too Much to Be Justified by Subsequent Changes in Dividends?”, American Economic Review, 71(3): 421-436.
West, K., 1988, “Dividend Innovations and Stock Price Volatility”, Econometrica, 56(1): 37-61.
CAN THE NOISE COMMENT IN STOCK NETWORK PLATFORM AFFECT THE STOCK PRICE SYNCHRONICITY
XIAO Zheng-yan1,2 XIE Cong2 CHEN Yan-bin3
(1.Center for Applied Statistics, Renmin University of China;2.School of Statistics, Renmin University of China; 3.School of Economics, Renmin University of China)
Abstract: Stock price synchronization is an important index to measure the information efficiency of capital market.The influence mechanism of stock price synchronization has always been a hot issue in financial research.Through text analysis and machine learning, this paper measures the irrational noise in the comments posted by Chinese investors in the Oriental Fortune Forum, and tests the relationship between the noise in the stock network platform and the stock price synchronization.The research finds that, first, the noise in the stock network platform will induce irrational investment decisions, thus reducing the synchronicity of stock price changes.The higher the proportion of noise comments, the lower the synchronicity of share price of listed companies, and there is an inverted U-shaped non-linear relationship between the two.Second, the increase in company stock news and announcements, the increase in analyst attention, and the improvement of external audit quality can all reduce the impact of noise in the stock network platform on stock price synchronization.This paper focuses on the impact of the noise in network new media on stock price synchronization.The conclusions are of practical significance for the regulatory authorities to strengthen the network information monitoring and for the listed companies to further improve the information disclosure channels.
Key words: stock price synchronization; irrational noise; text analysis; information disclosure
*肖争艳,中国人民大学应用统计科学研究中心,统计学院; 谢聪,中国人民大学统计学院;陈彦斌(通讯作者),中国人民大学经济学院,邮政编码:100872,电子信箱:cyb@ruc.edu.cn。本文得到国家自然科学基金重点项目/应急管理项目《国内经济政策与金融风险防范》(71850003)和 “中央高校建设世界一流大学(学科)和特色发展引导专项资金”的资助。本研究获得中国人民大学校级计算平台支持。感谢匿名审稿人提出的修改建议,笔者已做了相应修改,本文文责自负。
(责任编辑:张雨潇)
|
|