查看原文
其他

陆铭:实证研究的锦囊(下)

政邦智库 2024-07-02
摘 要


最近十余年来,计量经济学的方法在中国内地高校得到了普及。在技术层面,研究的质量得到了极大的改善。但与此同时,实证研究却出现了三大弊病:第一,因为缺乏对于所研究问题的具体背景的了解,研究方法的适用性在不少研究中被忽视了,一些研究得到的政策结论,甚至南辕北辙;第二,研究普遍关注于系数的统计显著性及内生性的处理,其他一些在实证研究中非常重要的基本问题被忽略了;第三,因为追求方法的所谓现代性和科学性,一些无法用到最酷炫的技术的最基本事实和重要问题缺乏关注。


各位现在看到的这一系列讲座,目的是为了澄清一些实证研究中的相关误区。这些讲座不能取代实证研究方法本身的学习,事实上,计量经济学方法本身的学习材料已经非常容易找到,上海对外经贸大学和中国青年经济学家联谊会联联合办的实证研究暑期学校也致力于普及实证研究方法。


在各位听到和看到的这一系列讲座中,为了增加实际问题的理解,我举了一些例子,仍然是围绕着我自己的研究(参见文末目录),而较少涉及到其他研究,原因有两点:第一,我自己就处在城市和区域发展相关问题的最为核心的争论当中,所以这些例子有助于大家理解研究和政策讨论的关系,顺便也澄清一些相关的问题;第二,我对自己的研究中存在的问题最为了解,而对于讲座中提到的其他人的研究,则不宜过多贸然评论,相信各位能独立判断。

因此,各位听众和读者各取所需,有一分用,取一分,有十分用,则取十分。


05理论对于经验研究到底意味着什么?


在我们这一系列的讲座当中,我们讲到了经验研究,主要是用数据和事实来说话的那些研究。那么相比之下,理论模型则主要来讲一个逻辑关系,特别是对于经济学研究来讲,理论模型其实特指是用数学来写的一些模型。现在数学方法的应用,不仅在经济学当中非常流行,而且越来越多的在政治学、社会学这样的其他社会科学门类当中也在使用数学的工具。由于数学工具的流行,就给很多的读者和年轻学生朋友们造成了一个印象,一个研究如果离开了数学就不好。是不是那些没有数学来表述的模型的文章就不好呢?既然这样的话,我们又实际上看到了很多其实没有数学模型的文章,这又是怎么回事呢?我今天所讲的话题里要讲到理论的重要性,以及应用理论模型的时候出现的一些误区。关于理论模型对于实证研究的重要性,我想就不用再多说了,正好非常巧的是,美国的克拉克大学的华人学者张俊富教授最近有一篇文章,题目就叫理论模型有多重要。在这篇文章当中他讲的已经非常清楚了,哪怕是对于实证的研究、经验的研究,理论模型有的时候都是非常重要的。比如说对于有一些实证研究来说,可以用一个理论模型来讲述他研究的目的和意义。再比如说有一些非常重要的经验研究发现的现象,是基于数字和统计的。那么这时候如果有一个理论模型,可以把这些现象背后的逻辑能够有一个非常严谨的表述和解释。再比如在做实证研究的时候,我们经常要用一些回归分析技术,那么对于这样一些回归模型,函数是怎么设定的,变量是怎么选取的,如果有一个理论模型加以说明的话,那也会好很多。   最后再比如说,在社会科学研究里,我们都希望能够对不同变量之间的因果关系和机制能够有所解释,那么这个时候,数学模型也能够帮助我们更加清楚的认识到因果关系和它们的作用机制。在讲明了理论模型、数学模型对于经验研究的重要性后,是不是每一篇实证的研究都需要去写一个数学模型呢?这个其实也不一定,从而也就可以解释为什么哪怕是在国际、国内的顶尖杂志上发表的很多文章,其实它里面也并不一定有一个数学模型。这至少有两种情况。第一种就是变量和变量之间的作用机制其实非常直接。举一个例子来说,在经济学和社会科学的研究当中,有一个概念非常重要叫peer effects,翻成中文我把它叫“同群效应”,也就是说他要研究一个人的行为是不是会受到周围其他人的影响。这件事情在理论上非常简单,他主要的问题来自于人和人之间的行为是否相互影响,是不是有经验证据。所以如果要做一个经验研究去验证同群效应是否存在,或者说有多大的话,那么大多数的研究恐怕就不会去写一个数学模型把这个事情搞的特别复杂。第二种情况是关于有一些问题,已经有太多的理论了。有些理论说X和Y这两个变量之间是正相关的,有的理论说它们是负相关的,那么到底是正相关还是负相关,就需要通过实证研究、经验研究用数据进行检验,这个时候理论和经验研究之间的关系,就好比在物理学里面讲的理论物理和实验物理之间的关系。做实验物理的学者,并不一定要去发明一个新的物理理论,而只需要在实验室里对于既有的物理理论进行检验就可以了。在社会科学里,如果已经有的理论非常多,只需要去检验一下到底哪个更对,那么这个时候就并不一定需要去建立一个新的理论模型。比如说以前我自己做过关于收入差距和经济增长之间的关系,这个问题的理论已经非常多了,我自己的工作也并不是要去提供一个关于收入差距和经济增长之间关系的新的理论机制,而只是要回答一下两者之间的关系到底是正的还是负的,以及他们作用的相互渠道。而且我还用了中国的数据,这样的话就可以为我们理解在中国经济当中这两个变量之间的关系增加一个新的证据,这个时候我们也就没有去写一个理论的模型来说这件事。再接下来我就要回答关于理论研究和经验研究之间的关系有几个疑问,也是大家经常会存在的困惑,我谈一点自己的看法。首先,很多人可能误认为,如果要是有一个文章,他是既有理论,又有数据和实证研究,就一定好于没有写理论的实证研究。其实这是一个很大的误解。对于社会科学研究来讲,如果我们能够用一个实证的方法,比如说大家都知道有一些实证的方法,像工具变量法,像双差分的方法,断点估计这样的方法,都能够比较好的识别两个变量之间的因果关系,那么相比之下,如果有一篇文章他写了一个数学模型,但是在实证方面就做得不够好的话,恐怕就未见得是比纯粹的经验研究更加能够去说明变量之间的因果关系。第二种误解,经常认为一篇文章如果没有一个理论在文章前面,就是没有理论。这句话本身就是有问题的,其实我们经常讲理论模型,在狭义上来讲,当然是指用数学方法写的理论模型,其实在理论这个词上面,本质上来讲,它要表述的其实就是一种逻辑关系。而逻辑关系所构成的理论,并不一定要用数学来表述。比如说在我前面所讲到的同群效应这样一个例子当中,这个逻辑关系就并不一定需要借助一个数学模型写出来。而且其实哪怕对于一个纯粹的经验研究来说,模型的形式、变量的选取,其实都是依赖于理论逻辑的,不能随便的构建实证的模型,包括选取变量。并不是说没有数学模型,就是没有理论。第三种误解,经常有人认为,我们看一篇论文的时候,往往这篇论文里是先有一个理论模型,然后再出现经验证据去验证理论模型的逻辑机制,很多人就以为,在实际做研究的时候,都是要先写一个理论,然后再去找数据。其实在研究中往往不是这样的。一个有经验的研究者,往往在心里面先要预估一下变量之间的理论逻辑关系,这个时候未见得他要用数学去写这个逻辑关系,而是要先去看看数据,如果数据最后得到验证了,然后再用数学把这个理论逻辑写下来。实际研究当中经常发生的情况是,在看数据的时候,恐怕会发现,数据所呈现的结论,跟事先所想到的理论逻辑不太一致。于是我们就要去想,为什么出现这样的情况,在你想的时候,其实你的心里就是在建立另外一套替代性的理论逻辑,然后再去看数据,直到心里所想的理论逻辑和数据最后呈现的结果一致,才停下来,然后你再用数学把这个理论逻辑写下来。所以不能单纯的简单的理解,在做研究的时候都是一定先有理论再有经验研究的,而实际上这两者是互动的。在写数学模型这个意义上,并不一定是先要写数学,然后再去看实际的数据,但是如果我们把理论理解为是一种逻辑的话,那么一定是先有理论逻辑,再去看经验的结果的最后,我想讲一个看法,有的时候还会有这样一种误解,我觉得是非常严重的,那就是有些人可能觉得当我在X和Y这样两个变量之间的逻辑关系在数据上看不太清楚的时候,我就去写一个理论模型来说明它,这样做是不是一个好的研究?我觉得不是。因为在数据上X和Y这两个变量之间的关系,其实是有可能存在多个理论逻辑的,如果你离开数据本身,就只用一个数学模型来写X和Y之间为什么会发生这样的关系,除非你这是一个重大的新的发现,或者你的理论模型本身所讲的这个机制,也是一个非常重要的新的理论机制,这个时候,这篇文章本身其实它是一个理论文章,经验研究只是一个装点。但是如果这些条件都不吻合,仅仅作为一个经验研究,你要讲一个逻辑,然后数据本身没有讲清楚,只是借助一个数学模型来讲的话,我看就不行了。因为就像我之前所说的那样,数据上呈现出来的两个变量之间的关系,可能有N种解释,我怎么知道你所讲的那种解释就是那一个正确的、最好的理解变量之间关系的解释呢?有没有可能存在其他的机制或者其他的渠道呢?在这个意义上我就用一句话来作为这一节的结尾,那就是,理论是重要的,但是对于那些迷信理论,甚至以为理论可以取代经验研究的学生和青年朋友来讲,请不要忘记,理论不是经验研究的遮羞布。


06横截面数据可以用来干什么?


我先从我自己的一项研究开始说起,这项研究是我和陈斌开、钟宁桦一起做的。

大家知道一段时间以来,中国经济有一个非常重要的现象,那就是消费占GDP的比率一直不高,而且在相当长的一段时间里,这个比率或者说消费率还持续下降。这个现象非常重要,因为它表明了中国经济存在一些结构性失衡的一种现象,如果经济增长当中靠消费来拉动的比率不高,并且持续下降的话,那么经济增长就更多的依赖投资和出口来拉动。这不仅是一种中国经济国内结构失衡的一种表现,甚至成为中美贸易争端的一个非常重要的背景,因为中国经济一直在大量出口,形成了国际贸易的一些失衡的现象。

那么对于这样一个非常重要的现象,如何进行解释呢?如何中国经济的消费率一直低,甚至有些年份还在下降呢?于是就需要找一些解释。那么我们自己的研究是怎么解释的呢?我们就从户籍身份和消费的关系开始入手。我们观察到,在城市里,有大量的外来人口,这些外来人口没有本地的户籍身份,他们的消费如果比一般的城市居民要来得少的话,那么,由于外来人口在持续的增长,就可以解释为什么中国经济的消费率比较低,而且持续在下降了。

根据我们的研究,我们的确发现,在所有其他的因素都一样的情况下,一个城市的外来移民由于缺乏本地城镇户籍,他的消费就会比同样是生活在一个城市的城市本地居民要低17%-21%。而这样的人口数量有多少?大约有2.6亿左右,平均每6个中国人,就有一个属于我们今天所讲的,在城市里生活和居住,但是却没有本地城镇户籍的这样一个人群。

这样我们就解释了中国的消费率一直很低,并且持续下降的现象。在政策上这个研究就有非常重要的意义,它成为推进中国户籍制度改革的一个非常重要的实证依据,尤其是当中国经济的内需一直不足时,我们的研究说明,如果在未来的城镇化过程中,能够持续不断的给外来人口本地户籍身份和平等的待遇,那么就可以利用这样的城镇化进程,来启动内需。在当前的国际环境日益有些恶化,中国和其他的以美国为代表的国家之间的经贸关系出现了一些争端的时候,启动内需对于未来得中国经济发展来讲,可谓意义重大。

我讲了我们自己研究的重要性,我们的研究有没有缺陷呢?有的,其中最为重要的一点,我们的研究用了所谓的叫截面数据,截面数据的意思就是说,给定一个既定的时间点,我们所用的数据是在同样的时间点里的不同的人之间的差异,来看一个变量和另外一个变量之间的关系。但是这里就会碰到一个问题,我们想说的故事是说,没有城镇户籍的外来人口的消费要比城镇居民来得低,但是这里的户籍身份到底代表着什么呢?我们想说的是,户籍身份代表的是制度歧视,但是从逻辑上来讲,其实当一个人没有城镇户籍的时候,他很可能在其他方面,也有一些跟城镇居民之间的差异。比如说消费的偏好,这一点就很难观察到,当你观察到一个农民工朋友,他不大到饭店里吃饭的时候,也很可能是因为这个农民工他不喜欢到外面吃饭,而不是因为他想省钱。也就是说,如果我们所看到的户籍身份带来的消费差异,仅仅是因为偏好和文化的差异的话,那么即便你把户籍给了这个农民工朋友,他的消费行为也不会发生变化,那么相应来说政策的改革就没有效果。

那么既然存在这样的问题,我们怎么办呢?如果说从技术上来解决类似这样的问题,当然有一些办法,我们学过计量经济学的人都知道,有一些办法的确可以克服截面数据模型所存在的那些问题,比如说我举两个例子。

第一例子是用面板数据,所谓面板数据就是我们持续去跟踪一个个体,在不同的时间点里,我们能够看到同样一群人他的行为变化,具体到今天我们讲的户籍和消费的关系里,如果我们能够看到有些人今天没有户籍,而明天他就有了,我们来观察同样这个人,在其他一些因素,比如说偏好、习惯、文化都没有发生变化的时候,仅仅因为户籍身份发生了变化,我们来看一下他的消费有没有发生变化。这个时候这种户籍对于消费的影响就不是因为类似于偏好或者习惯和文化这样的因素了。但是遗憾的是,理想当中的数据在实际研究的生活当中,其实是没有的,即使有这样的面板数据,在这个面板数据里,发生了户籍身份变化的样本,也非常少,而且即便是那些发生了户籍身份变化的样本,他们的户籍身份的变化也不是随机的,而有可能是一些其他的因素导致的,这个时候你看到的户籍身份的变化,对于消费的影响恐怕也不仅仅是因为户籍发生了变化,而可能是因为其他的原因导致的,这就很遗憾了。

还有一种可能想到的办法就是利用实验的办法,我们的文章投稿到一些杂志上的时候,的确就有审稿人建议我们用实验的方法,这里我想吐个槽。什么叫实验方法?就是如果我们有办法对一群人进行一个随机的实验,改变这个人群当中一部分人的特征,我们来看这个特征的改变以后,对我们所关心的一些现象,比如说消费,产生什么样的影响,那么这个时候由于这个实验是可控的、随机的,我们就能够识别出来我们想看到的这个因素会产生什么样的影响。

但是我们所研究的问题,是户籍身份对于消费的影响,请大家想想看,在我们实际生活当中,存在着这样的随机的实验来改变人们的户籍身份吗?恐怕没有。那么我们可以自己去做这样一个随机实验吗?不要开玩笑了,如果我真有本事这样做的话,我就发财了,那意味着我可以随机的给一部分外来农民工发户籍,而且就算我有这样的本事,这样的研究根本过不了所谓的道德审查。我凭什么动用一个个人的权利,就给一部分人户籍身份,而另外一部分人没有这样的户籍身份,而且这个户籍身份的给和不给,要关系到一大群人一辈子的福利。

所以我通过刚刚讲的这两个看上去能够解决问题的办法,说明了,对于一个特定的研究问题来讲,恐怕在这个问题仍然是一个非常重要的问题的时候,能够使用的数据真的就只是截面的数据。

当然在实证研究当中,也存在一些其他的高科技手段,比如说非常流行的双差分模型,断点估计,这些东西都是非常依赖于数据所生成的制度背景。往往在一些特定的问题里也没法使用。

那么既然这些高科技手段都没法使用,我们是不是就不要去做那些重要的问题?我认为是不行的,对于一些重要的政策问题,或者说应用问题,如果我们能够用截面的数据来做出变量之间的关系,总比我们对这样的一些重要的问题毫无认识要来得好得多。

当然我这样说我也不希望给大家造成一种误解,那就是在做研究的时候,永远强调我做的研究非常重要,所以你不要管,我就用截面数据,我随便报告几个方程就OK了,我觉得也不是这样。如果大家有机会去看一下我们发表的户籍和消费之间的关系的文章,我们这个文章有早期版本和晚期版本两个版本。比较早期的中文版本我们发表在《经济研究》2010年,后来我们有一个用了新的数据和新的估计方法的一个版本,发表在英文的World Development上面,大家如果有机会去看一下我们的文章就会发现,我们虽然是用的截面回归的一个分析,但是我们仍然做了很大的努力,来尽量的排除是不是有可能因为其他的机制来影响我们的结果。

我这里也举一两个例子,比如说大家都会关心,是不是我们看到的外来人口少消费的现象,是因为文化的差异?换句话说,是因为外来移民不喜欢多消费,因为他们跟城镇居民的文化不一样。如果这个逻辑是对的,我们可以想两个办法来解决,第一我们在拿外来人口跟本地城镇人口做比较的时候,我们不去比较那些出生在城市的城市居民,而去比较那些出生在农村,但是现在已经是城里户籍的这样一些居民,如果我们相信出生在很大程度上是决定了一个人的文化和习惯的话,那么将外来人口跟出生在农村,并且已经获得城镇户籍的居民进行比较,就更加可以相信这种差异是来自于户籍制度造成的差异,而不是文化差异。

另外一个办法,我们就去观察一下那些在城市里居住时间比较长的人,如果真的是因为没有本地城镇户籍的人在文化上有差异的话,你应该相信随着时间的推移,他在城市里居住的时间越长,他越会像一个城市居民。但是我可以告诉大家,这一点在数据里是看不出来的,不管你在城市里居住多长时间,只要你是一个没有本地城镇户籍的外来人口,你的消费就是要比本地的城镇居民要来得更低。通过这样的一种比较,我们也基本上可以排除这是因为文化差异所导致的。

所以通过今天我讲的这个例子,我给大家讲了在有一些非常重要的实证的应用研究当中,不要过于片面的追求高科技,有一大堆非常重要的问题,来不及秀技术。类似像这样的问题实在是太多了,比如说在我长期关注的其他问题,包括留守儿童的问题,包括一段时间以来,由于我们的超大城市抬高了外来孩子进入本地公立学校的门槛,造成了一些返乡的儿童。这样重要的问题,具有很强的政策含义,但是如果我们要想研究留守儿童和城市孩子之间有什么差别,我们想看一看返乡的儿童,是不是跟那些留在城市的儿童形成了一些差异,这些问题,恐怕当我们去研究它的时候,能够收集到的数据,在很大程度上就是一个截面的数据。

在这个意义上,我觉得中国真的是有一大堆的重要的政策问题,来不及等到数据已经完全完备了再去研究,也来不及去秀我们高科技的技术。但是同时非常遗憾的是,现在我们的学术界,特别是一些年轻的学生,恐怕很多时候都首先看到了一篇文章的技术,却忽略了重要的问题


07面板数据到底有何用?

今天的话题是面板数据不能解决什么问题?我们先从一个例子开始讲起,现在大家都非常关心城市的经济增长,特别是对于那些欠发达地区,很多人出了很多的主意,希望对欠发达地区的发展能够起到一些促进作用。
比如说有人提出要促进欠发达地区的投资,要给予他们优惠的政策。还有人认为领导人的能力非常重要,所以要把比较有能力的领导人安排到欠发达地区,去当当地的行政长官。还有人认为一个地方的行政级别如果高的话,可以带来很多的资源,所以把一些原来属于县的地区,如果提升为城市的话,也可以促进当地的经济发展。但是所有这些因素讲完了之后,大家可能忽略了一个非常重要的,决定一个地区或者一个城市经济发展潜力的重要因素,那就是地理。在我之前做过的研究里,我从两个维度来捕捉了影响一个地方经济发展的地理因素,一个就是到沿海大港口的距离,另外一个就是到区域性的中心大城市的距离。在我的研究当中,如果我们把各种影响经济发展的因素全部都放在模型例如的话,那么在影响一个地方经济的那些因素当中,大概到港口的距离和到大城市的距离,可以解释城市与城市经济增长差异的大约25%左右。而所有的解释经济增长因素全部放在一起,大概可以解释城市之间经济增长差异的50%,而剩下的一半我们就不知道是什么样的因素导致的了,也有可能是因为一些随机的度量误差的因素都是有可能的,反正我们不知道。那么,在我们已经可以知道的可以解释城市间增长差异的因素当中,到港口的距离和到大城市的距离这两个地理因素,解释了大约一半。这样就足以证明地理这个因素在决定一个城市的经济增长当中所起到的作用,几乎是决定性的,当然我们也不是说它是唯一决定性的,只是说它的重要性要远远远远的超过那些其他影响经济增长的因素。举了这个例子之后,我们再来讨论一下面板数据到底可以用来解释什么问题。首先要解释一下什么是面板数据,面板数据同时有截面的维度,也有时间的维度,比如说我们观察一些城市,如果只在一年当中去观察这些城市的话,他所形成的数据就是截面数据。但是如果我们在若干年当中,对同一群城市反复的进行观察,那么这个时候它就具有了时间的维度,就构成了一个叫“面板数据”的数据集。通常来讲,如果我们想在截面上看解释变量对于被解释变量的影响,可能就不能很好的去分析一个经济问题,比如说我们想知道投资对于经济增长的影响,我们看到了投资能够促进经济增长,这个时候我们是不是就能够把投资对于经济增长影响的系数,当作投资对于增长影响大小的度量呢?恐怕不一定的,因为一个地方投资多的时候,往往是由一些其他因素导致的,这个时候你就不能把投资这个变量之前的系数,完成理解为是投资对于增长的影响的大小。这个例子就是非常著名的所谓叫“遗漏变量的偏误”,那么如果我们要是有一个面板数据的话,我们就可以去看解释变量的变化如何影响了被解释变量的变化。仍然拿投资对于经济增长的影响作为例子,我们可以在面板数据里去看,同样的地方的投资的变化如何影响当地增长的变化,这个时候我们假设那些影响投资的因素是不随时间变化的,比如说像地理这样的因素,那么给定地理这样的因素以后,如果一个地方投资增长的快,它的经济增长率就会更高的话,那么我们就大概可以把这样的一个影响的程度,当作是投资对于经济增长的影响了。但是在我刚刚举的这个例子里,请千万注意一个问题,如果我们的研究问题本身是想知道类似于像地理这样的因素,对于经济增长有多少影响的时候,面板数据恐怕就无能为力了,因为地理这样的因素,通常是不随时间变化的,由于它没有变化,所以你就很难通过解释变量的变化,来看被解释变量相应发生什么样的改变。用经济学的术语来讲,那就是类似于像地理这样的因素,其实是不随时间变化的固定效应,而面板数据的长处,恰恰是控制住那些固定效应之后,看其他可变的因素对于被解释变量的影响。在这个例子当中,我提醒我的朋友们,特别是年轻的学生,不要盲目的相信某种特定的方法,而是要看到这个特定的方法是不是有助于你回答你想关心的这些问题,甚至有没有可能当你去使用一个方法的时候,你可以看到一个变量对另外一个变量的影响,但是,是不是有可能当你这样做的时候,遗漏掉了更为重要的影响因素,而那个影响因素可能在面板数据里就是不随时间变化的。我们再举一个例子,在经济学文献当中有一个问题叫“资源诅咒”,它的意思就是说在不同的国家,有一些国家的经济增长恐怕在长期里是不可持续的,有一类国家就有这样的情况,那就是一些资源非常丰富的国家,由于这些国家有丰富的资源,比如说石油,于是这些国家的制度建设就不是很完善,往往到现在他们仍然都是一些威权国家,还有这些国家可能腐败也非常严重。同时,由于资源实在太丰富了,大家很容易挣钱,结果这样的国家就不太重视教育和科技的发展。所以,从长期来看,这样一些国家的经济发展的表现也不太好,这就叫“资源诅咒”,表面上看起来拥有资源是件好事,但是从比较长的时间来看,这似乎又成了一件坏事。那么为了研究资源诅咒这样的一个故事是不是存在,于是就有人用中国年度的省级或市级面板数据来研究资源诅咒。但是请大家注意一下,在资源诅咒的这组文献当中,其实他研究的本身就是一个长期的问题,他不是要研究今年跟去年相比较而言,我这里多了一些石油资源,于是今年是不是就会比去年的制度更差,腐败更严重,更加不重视教育和科技。而是说资源诅咒这个问题,本身就是一个长期的经济发展问题,是要看至少10年,甚至几十年的时间跨度里,有些国家有比较丰富的自然资源,是不是会导致这些国家制度不好、腐败严重,以及不重视教育和科技。所以对于这样一个特定的经济学研究的问题来讲,恐怕面板数据也不是一个好的研究这个问题的数据来源,而是说它可能比较适合在比较长的时间里,用截面的方式来看国家和国家之间的差异,是不是资源的丰腴程度,导致了这些国家的制度差异、腐败差异等等。在今天我举的这两个例子里,我想告诉大家,面板数据可以解决一些问题,但是它不能解决所有的问题。我建议大家在做研究的时候,还是要回到你所要研究的问题本身。有的时候对于一些特定的问题来讲,它的重要的问题本身就是截面的差异,比如说今天所举到的资源诅咒的例子。而另外一些问题,本身重要的问题就是那些固定不变的因素,到底怎样影响到了我们关心的被解释变量,比如说地理因素如何影响到了城市的经济发展。所以我最后就用一句话来结束这一节,那就是,我们在研究一个问题的时候,首先要多想想,多想想,再多想想,要把自己想关心的问题和什么是重要的问题想清楚,然后再去想用什么样的数据和方法来研究我们的问题,而不是反过来让研究的方法和数据束缚我们的思想。


08交互项有什么用?看差异的差异


很多时候我们在讨论一些具体的现实问题的时候,就涉及到解释变量对被解释变量的影响是如何相互依赖的。我来举几个例子,比如说在城市发展当中,很多人都认为当城市长大了,特别是那些比较大的产业结构比较高端的城市,只需要高技能劳动者,而不需要低技能劳动者。那么高技能劳动者和低技能劳动者之间的关系到底是怎样的?从经济理论角度来讲,有一种说法叫“技能互补性”,也就是说,当高技能劳动力增加的时候就会带来很多对于低技能劳动者的需求,来进行生产上的辅助性的工作,这时候增加雇佣一些低技能劳动力,其实是可以提高高技能劳动力的劳动生产率的。这个时候高技能劳动力对于生产的影响,其实就取决于低技能者的数量。

同样的道理,我刚才所说的高技能劳动力和低技能劳动力之间的相互依赖关系,其实也存在于本地劳动力和外来劳动力之间。因为往往本地劳动力平均来讲它的教育水平比较高,而外来劳动力的平均教育水平要相对来说低一点,他们所从事的工作岗位也有非常大的差异。比如说在我们的城市生活当中,大量的环卫工人、送快递的、做早餐的,其实都是外来劳动力,这时候本地劳动力的生产力或者他们的生活质量也是取决于外来劳动力的数量,换句话说本地劳动力和外来劳动力之间,恐怕也是相互依赖的关系。

还有一个例子涉及到推迟退休年龄这样的问题,大家都知道中国现在出现了比较明显的老龄化的趋势,那么为了缓解养老金的压力,如果我们可以推迟退休年龄,这个时候就可以延长大家工作的时间,从而缓解劳动力供给不足和老龄化的问题。但是这个时候大家可能会担心一种问题,那就是推迟退休年龄是不是会导致老年人口仍然占着工作岗位,从而导致年轻人失业,对于这个问题本身又取决于,相对来说比较老年的人口和年轻的劳动力的关系,是相互替代的还是互补的。如果担心推迟退休年龄会导致失业,本质上来说,就是认为老年人和年轻人之间是相互替代的,你有工作了,我就没工作了。但其实可能还有另外一种可能性,那就是老年人和年轻人其实是互补的,一方面,老年人有经验,他们可以通过传帮带这样的做法,来提高年轻人的劳动生产率。反过来说,年轻劳动力如果从事一些辅助性的岗位,也有可能提高老年人的工作效率。那么他们到底是互相替代的还是互补的,本身就对于我们理解推迟退休年龄这样的公共政策会导致什么样的后果,具有非常重大的意义。

对于我刚刚讲的这些例子来说,在实证研究当中,都需要使用到交互项,也就是说在方程右边的解释变量里,可能我们需要把两个决定被解释变量的影响因素进行相乘,来看这样一个交互项或者交叉项的系数是正还是负。比如说在我刚刚所讲的几个例子里,如果高低技能劳动者,本地和外来劳动者,老年人和年轻人之间是互补的,那么它们之间的交互项对于产出的影响的系数,就应该是正的,如果是互替的,它们就应该是负的。

再比如说在我之前做的一个研究里,我研究了新城建设的问题,当时我发现,在中国大量建设了很多新城,而这些新城往往建得密度非常低,同时这些新城又建设在距离当地的老城非常远的地方。于是我们发现,如果一个地方新城建设的密度非常低,同时又建得非常远的话,那这个地方的投资效率就比较低,从而带来债务负债率比较高这样的现象。当时我就问了一个问题,如果一个新城建得离老城非常远,在这种情况下,同时如果这个新城建设的密度比较高一点,是不是可以缓解远距离对于债务这种负面的影响呢?于是我们在研究中也构造了一个密度和距离之间的交互项,这样我就可以回答是不是密度增加,可以有助于缓解距离远这样新城建设当中的负面影响,结果的确如此。

在上面这样一些例子当中,我都讲了一些关于交互项的实际运用的例子,但是我今天所想讲的另外一个意思可能更为重要,那就是交互项的巧妙运用,有的时候能够帮我们在没有很好的因果关系识别的方法的时候,能够帮我们靠近因果识别。

比如说在之前我举过一个例子,那就是户籍与消费之间的关系,我们当时想说的一个道理就是,在城市里居住但是却没有本地城镇户籍的外来劳动力,他会挣钱,但是相对来说消费就不会消费那么多。换句话说,外来人口这样一个户籍身份,会对消费不利,但是可能你会反问我,这种农村户籍或者说外来人口户籍,它到底是一个制度的影响还是一个文化的因素?也就是说是不是因为农村居民有某种特定的文化或者消费习惯,他进到城里来,他也不太习惯增加消费。

这个问题其实是合理的,当时为了回答这个问题,我们就想了这样一个逻辑,如果农村户籍的身份,真的只代表文化的话,那么我们应该看到,当这些人在城市里居住的时间越来越长的时候,那么农村户籍对于消费的负面影响应该会逐渐的变小,因为它有一个在城市里逐渐适应城市文化的这样一个过程。所以在做这个研究的时候,就可以在方程的右边放入农村户籍身份乘以在城市里居住时间这样一个因素,构成一个交叉项或者交互项,来看它的系数会怎样。

最后我再举一个例子,最近我和上海对外经贸大学的王丹利老师做了一个研究,我们想研究在中国农村教育有的时候水平比较低是由什么样的因素导致的?其实我们想讲,在有些地方可能具有这样一种传统文化,那就是当宗族的势力比较强的时候,这个地方很容易产生宗族之间的冲突,如果宗族冲突非常激烈的话,就需要进行一些武力的斗争,比如说我们会发现有一些现象叫做“械斗”。我们发现在一个地方械斗比较严重的话,这个地方就会产生武力的冲突,而大家就会少投资于教育,从而导致教育水平会比较偏低。

但这其中会有一个问题产生了,我们所看到的械斗这样一个现象,到底是不是真的代表了宗族的冲突,还是由于一些其他的因素所导致的,比如说是不是因为在械斗比较严重的地方,同时也是资源比较贫乏的地方呢。为了回答这样的问题我们想了很多办法,其中有一个办法是跟交互项的使用有关的,那就是在逻辑上,如果械斗的确代表的是一种宗族冲突,大家可以想,这种影响主要会影响男性,因为男性是参与械斗的主力,女性不大会参与械斗的。与此同时,这种影响估计主要会产生在农村地区,而对于城市地区来讲,恐怕就不大会通过械斗来进行宗族之间的冲突,从而影响教育。所以我们就可以把械斗发生的度量指标和是否在农村地区以及个体是男性还是女性这样的变量进行交乘,从而观察这些交互项的作用,来看它是不是真正的是因为宗族冲突的作用影响了教育

其实我讲到这里,如果一些熟悉微观实证研究方法的听众朋友就已经反应过来了,其实在我们使用交互项的时候,其实本质上就是在看difference in difference,或者说差异的差异。比如说在刚才械斗这样一个例子里,我们就是想看械斗对于教育的影响是否在农村和城市之间存在差异,是否在男性和女性之间存在差异,这个本质上其实就是一个双差分的分析。

我要说的一个意思就是,交叉项可以帮助我们解释变量之间的相互依赖性,同时也可以近似的被认为是一个双差分的分析,来接近因果的识别




往期回顾










































调研笔记丨带一本书回故乡

 调研笔记丨如何撰写一份好的调查报告


 调研笔记丨为什么要不断推敲“基本概念”


 对话董岩:为何、如何为“梁衡先生”立传


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存