中国农村剩余劳动力估计:2O1O－2O17年

奥鹏网院作业 · 发表于 2022-4-5 15:30:09

中国农村剩余劳动力估计:2O1O－2O17年*
王庆芳郭金兴

［提要] 本文在准确界定乡村就业人员统计口径基础上，利用国家计生委2015年流出地监测专项调查数据，构建基于农村劳动力就业类型选择的多分类预测模型，采用有监督的机器学习的AdaBoost算法，对2010—2018年农村绝对剩余劳动力和相对剩余劳动力数量进行估算。研究结果发现，2018年农村绝对剩余劳动力数量为3 692万，其中80.6%是以公开失业为表现形式的显性剩余劳动力；2018年农村相对剩余劳动力数量为5 369万，其中能够向外出就业转移的相对剩余劳动力仅为1 051万。本文判断我国已经从总体上跨越刘易斯第一转折点，并且将持续面临农业生产劳动力紧张和非农部门劳动力供给不足的双重困境。对此本文提出促进农业劳动力充分就业、提升农村生产要素配置效率、推动农村劳动力就地转移以及消除劳动力跨区域转移障碍等政策建议。

［关键词] 绝对剩余劳动力；相对剩余劳动力；隐蔽性剩余劳动力；显性剩余劳动力；刘易斯转折点

一、引言
改革开放以来，农村剩余劳动力向非农部门和城镇地区的转移，是推动中国经济增长和转型、建立“世界制造工厂”并成为世界第二大经济体的根本动力之一。然而2003年以来，东南部沿海地区的“民工荒”和非熟练工人工资上涨，引发了关于中国是否通过刘易斯转折的争论。剩余劳动力的估算是争论的焦点之一。经过十多年的持续发酵，“民工荒”和非熟练工人工资上涨已经扩散至全国大部分城市和地区，预示着劳动力供求格局正在发生某种结构性变化（李建伟，2020）。但是这种变化是否意味着农村剩余劳动力已经枯竭，学术界却并未达成共识。随着中国经济进入中高速增长的“换挡期”，劳动供给变化对经济增长和转型的影响越来越明显（都阳和贾鹏，2018）。在此背景下，准确估计农村剩余劳动力数量及其转移潜力，对于判断我国所处二元经济阶段、挖掘农村劳动力供给潜力、提升劳动力资源配置效率，具有重要的理论和现实意义。

当前我国农村剩余劳动力数量估算的争论可以大致归纳为以下两种观点：一是以蔡昉为代表的学者关注剩余劳动力的人力资本结构以及与之相关的流动意愿，发现农村剩余劳动力数量远远低于通常认为的水平，因而最早作出我国剩余劳动力已经从无限供给转向短缺的论断（蔡昉，2007；蔡昉和王美艳，2007；都阳和王美艳，2010；蔡昉，2016）。另一种是以南亮进等为代表的国内外学者基于农村剩余劳动力数量过亿、农业从业人员平均年龄远低于发达国家水平、农业从业人员并未实现充分就业等证据，认为中国农村剩余劳动力总量依然充足（孙自铎，2008；贾先文等，2010；Golley＆Meng，2011；Minami＆Ma，2010；Yao＆Zhang，2010；Wei＆Kwan，2018）。

本文通过梳理发现，当前农村剩余劳动力估算的争论可归因于以下三个方面：第一是使用的剩余劳动力概念不同。根据费景汉和古斯塔夫·拉尼斯（1992）对刘易斯模型的扩展，剩余劳动力包括农业部门劳动边际产出小于或等于零，以及农业部门劳动边际产出大于零但是低于非农部门劳动边际产出的两部分，分别对应于通常所讲的刘易斯第一转折点和刘易斯第二转折点。从理论上看，根据这两种概念估算的剩余劳动力结果是不可比的，但是大多数学者在争论中并未对此进行明确区分。① 蔡昉（2018）明确指出，其之前提出、争辩和研究刘易斯转折点时，主要的工作是作出了第一个刘易斯转折点到来的判断。而Minami＆Ma（2010），Yao＆Zhang（2010）研究估算的是刘易斯第二转折点。第二是估算原理不同。部分学者对剩余劳动力的估算着眼于可向非农部门转移或者说是具有非农部门转移潜力的剩余劳动力数量（蔡昉，2007；都阳和王美艳，2010）。其他大部分研究则着眼于剩余劳动力总量，而没有对剩余劳动力总量和可转移剩余劳动力数量进行区分。第三是数据来源不同。其中最主要的区别在于使用的农业从业人员数据不同。目前农村剩余劳动力估算中使用的农业从业人员数据来源主要有两个：一是直接使用官方公布的第一产业从业人员数据。二是部分学者认为官方公布的第一产业从业人员数据存在高估② 岳希明（2005）指出，在官方调查中由于不能准确地确定农村就业人口的行业归属，而将一部分不再从事农业的劳动力笼统地归并到了第一产业中，这造成中国官方统计资料高估了农业就业人员的数量。蔡昉（2016）对农业劳动力比重的重新估算表明，官方数据把农业从业人员高估了10个百分点。，因此使用农村劳动力资源减去农村已转移劳动力作为农业从业人员数据，所估算的剩余劳动力结果一般低于前者。然而由于城乡就业统计口径的模糊以及农村劳动力“候鸟式”的流动方式，获取准确的农村劳动力资源和已转移劳动力数据似乎更加困难，这也加剧了估算结果的矛盾。此外，在我国农业从业人员中存在普遍的兼业现象。一方面，相当一部分已转移农村劳动力并未放弃承包地，依然从事农业生产；另一方面，即使被统计为第一产业就业的劳动力也可能从事非农就业活动。这也是难以获得准确的农业从业人员数据的原因之一。③ 在农业从业人员中存在的兼业现象，还会使得实际参加农业生产的劳动力数量甚至高于第一产业从业人员数量。根据第三次全国农业普查数据，2016年全国农业经营户或农业经营单位中从事农业生产活动累积30天以上的人员数（包括兼业人员）为31 422万人，比《中国统计年鉴》公布的2016年第一产业从业人员（21 496万）高出46.2%。

通过以上分析可知，解决上述三个方面的问题，是准确估算农村剩余劳动力数量的前提。本文试图对2010—2018年我国剩余劳动力数量和变动趋势进行估算，并尝试从两个方面解决以上冲突：第一，对于前两个问题，本文在区分剩余劳动力总量和可转移剩余劳动力数量的基础上，提出基于农业部门劳动边际产出为零的绝对剩余劳动力和基于农业劳动力非农就业转移潜力的相对剩余劳动力两种估算方法，并利用这两种估算方法对农村剩余劳动力数量和比例进行估算。本文同时明确指出利用绝对剩余劳动力估算方法估算的是刘易斯第一转折点。第二，对于第三个问题，本文摒弃当前文献中常用的两种农业从业人员数据获得方式，而是在准确界定官方乡村就业人员统计口径的基础上，利用微观数据构建基于农村劳动力就业类型选择的多分类预测模型，对乡村就业人员中从事纯农业、兼业和纯非农就业的劳动力数量进行估算。这不仅首次从宏观上估算出我国从事兼业就业的劳动力数量，而且将纯农业和兼业劳动力作为农业从业人员数据，为估算绝对剩余劳动力和相对剩余劳动力提供更为准确的数据基础。

除引言外，本文其他部分安排如下：第二部分是文献综述，第三部分是估算方法和数据说明，第四部分是估算结果及分析，第五部分是刘易斯转折和进一步分析，第六部分是本文小结。

二、文献综述
按照刘易斯（Lewis，1954）最初的定义，剩余劳动力指的是传统部门边际产出为零的劳动力，也就是说，如果将这些剩余劳动力转移到现代部门，农业产量不会下降，也被称为“零值剩余劳动力”或“绝对剩余劳动力”。由此得出绝对剩余劳动力的估算方法：在既定农业生产技术条件下，农业必需劳动力以外的农业劳动力即为剩余劳动力（姚洋，2018）。其中农业必需劳动力的估算方法包括经验法、基准估算法和劳动定额法（Taylor，1988）。经验法和基准法是20世纪90年代以前国内学者采用的主要方法。目前文献最常用的估算方法是劳动定额法：根据农业生产统计资料，估算农业生产需要投入的劳动力工日，然后通过设定农业劳动力合理工作负荷工日，折算出农业生产必需劳动力数量。

蔡昉和王美艳（2007）采用劳动定额法对2005年农业必需劳动力进行估算，将农业劳动力合理工作负荷工日设定为每年250天、300天和320天三种情形，得到农业生产必需劳动力数量分别为17 802万、18 989万和22 787万，剩余劳动力数量分别为10 698万、6 279万和2 481万，且即使以第一种情形计算，40岁以下的剩余劳动力的也不足5 000万。考虑到40岁以上劳动力转移意愿较低，这意味着劳动力供给结构性变化是“民工荒”与工资上涨的主要原因，有力地支持了中国经济已经通过刘易斯拐点的论断。郭金兴和王庆芳（2014）沿用其估算思路对农村剩余劳动力的年龄、性别和受教育程度三种人力资本结构进行估算，发现2010年农村剩余劳动力总量为5 643万，其中40岁以上、小学及以下和女性劳动者的比例分别为72.3%，48.1%和57%，因此认为刘易斯拐点已经到来。Kwan et al.（2018）利用随机前沿模型分别对17种农产品和13种畜产品中的剩余劳动力数量进行估算，加总后得到2013年农产品和畜产品的剩余劳动力数量分别为2 183.3万和399万，剩余劳动力比例为12%，因此认为我国已经基本通过了刘易斯第一转折点。但是，还有部分学者利用该方法得出相反的结论。孔祥智（2019）将农业劳动力合理工作负荷工日设定为300天，并利用农村住户调查中的整劳动力、半劳动力数据对农业就业人员进行折算，得到2016年农业生产必需劳动力和农业就业人员分别为13 032万和17 734万，并认为农业劳动力中的1／3左右是剩余劳动力。赵卫军等（2018）在考虑了农业生产的季节性和天气变化影响之后，将农业部门合理工作负荷工日确定为250天。然后引入农业劳动力知识系数和农业技术指数计算出农业劳动力效用最大化工日，得出2015年农业生产必需劳动力和剩余劳动力数量分别为12 001万和9 917万，剩余比例为45.3%。

二元经济理论描绘了一个以农业为主的经济体向工业化转型的过程。其核心机制在于农业部门能够为工业部门提供源源不断的剩余劳动力，从而促进工业部门资本积累，完成工业化过程。因此在剩余劳动力估算中，我们不仅关心农业剩余劳动力数量，而且更关心农业部门能够为非农部门提供的可转移劳动力数量。很明显，从农业部门劳动边际产出角度定义的绝对剩余劳动力，并不等同于农业部门可转移到非农部门的劳动力供给。都阳和王美艳（2010）指出，从农业部门劳动边际产出角度对剩余劳动力的估算是基于加总数据，因此很难考虑劳动者的个体差异性，而非农劳动力市场对农村劳动力具有很强的选择性，从而使得年龄、受教育程度等个人特征，成为决定农村剩余劳动力流动方向的最主要因素。本文认为，除了劳动力个体人力资本特征的异质性导致农村剩余劳动力数量高于可转移剩余劳动力供给以外，还有一些因素可能导致二者关系更为复杂。一方面，即使劳动力转出会对农业生产产生不利影响，但是如果转移到非农部门能够获得更高的净收益，那么农业部门劳动力仍然可能选择转移。这表现为各地农业部门出现不同程度的撂荒、农业机械化生产对劳动的替代以及农业种植结构的调整（蔡昉，2018）。另一方面，如果由于劳动力转移成本的提升或非农部门工资水平相对较低，降低了转移到非农部门的净收益，那么即使在农业部门不能实现充分就业，劳动力也可能不转移，这表现为农业劳动力更偏好“闲暇”或“暂时”退出劳动力市场（赵显洲，2010）。周健和张桂文（2020）指出，城市的住房、医疗和教育等生活成本，以及由于背井离乡、与家人分离和歧视等原因所产生的精神成本的大大提高，使得农业劳动力的迁移成本上升而迁移收益下降，是“劳动力无限供给时代结束”的主要原因之一。因此，如果从农村劳动力非农部门转移成本收益的角度考量，只有转移到非农部门能够获得更高的收益，但是由于非农部门工作机会不足而未能转移的剩余劳动力，才能构成潜在的非农部门劳动力供给。本文把这部分剩余劳动力称之为“相对剩余劳动力”。这里的“相对”指的是相对于在农业部门就业，转移到非农部门能够获得更高的净收益。由此得出相对剩余劳动力的估算方法：在劳动力个体决策下未转移农业劳动力中具有非农就业转移潜力的那部分劳动力，即为相对剩余劳动力。

目前相对剩余劳动力的主要估算方法为建立农村劳动力就业选择模型，将未转移农业劳动力选择非农就业的预测概率视为其转移潜力，进而估算出农业相对剩余劳动力数量。比如，都阳和王美艳（2010）利用2005年1%人口抽样调查微观数据资料，建立农村劳动力外出决策的Probit模型，估计劳动力年龄、性别、受教育程度和健康状况等个体特征对外出决策影响，然后计算不同教育程度和年龄阶段未外出劳动力选择外出的预测概率，乘以对应的未外出劳动力数量，得出2005年农村可转移剩余劳动力数量仅为4 357万人。约翰·奈特等（2011）采用类似的方法，建立年龄、性别、受教育程度，以及婚姻、子女年龄和父母年龄等家庭特征因素对劳动力外出决策影响的Probit模型，并利用CHIP 2002年和CHIP 2007年数据，估算出2002年和2007年未外出人员中可转移数量分别为7 400万和7 100万。

通过以上分析，本文得出农村剩余劳动力的两种估算方法：第一种是通过计算农业生产必需劳动力，估算农业部门劳动边际产出为零的绝对剩余劳动力。第二种是从劳动力个体决策角度，估算农业劳动力中具有非农就业转移潜力的相对剩余劳动力。需要说明的是，绝对剩余劳动力是从行业总体上来衡量和估算的；相对剩余劳动是从个体和微观的角度来衡量的。因为相对剩余劳动力就业决策需要比较农业就业和非农就业的成本和收益，这与以农业劳动和非农业劳动的边际产出相等作为衡量标准的刘易斯第二转折点（即费景汉和古斯塔夫·拉尼斯（1992）所谓的商品化点）有相似之处。但是本文提出的相对剩余劳动力，不仅考虑纯粹的劳动边际产品或工资收入，还要考虑影响劳动力转移的其他因素，如个体特征、家庭负担等。因此，相对剩余劳动力的消失并不完全等同于通过刘易斯第二转折点。此外，本文认为，相对剩余劳动力是一个动态的、发展的概念。一方面，在经济发展初期，非农部门就业创造能力较弱，只能吸引少部分男性、年轻、受教育程度较高的农村劳动力到非农部门就业，由此估算的相对剩余劳动力数量也较低，并且低于绝对剩余劳动力数量。另一方面，随着经济发展水平的提高和农村劳动力人口结构的转变，男性、年轻、受教育程度高的农村劳动力基本转移殆尽，非农部门只能继续吸引人力资本水平较低的农业劳动力转移，这使得原来受到人力资本水平限制不能转移的农业部门劳动力的转移潜力提升，因此相对剩余劳动力的数量开始超过绝对剩余劳动力的数量，甚至可能呈现出与绝对剩余劳动力完全相反的变化趋势。基于此，本文将对两种剩余劳动力数量和比例进行估算，并对估算结果进行对比分析。

三、估算方法和数据说明
为了避免现有文献中使用的两种农业从业人员数据的缺陷，本文在准确界定官方乡村就业人员统计口径的基础上，利用微观调查数据建立农村劳动力就业类型选择的概率预测模型，对绝对剩余劳动力和相对剩余劳动力数量进行估算。具体估算过程如下：第一，乡村就业人员的统计界定。界定宏观统计中的乡村就业人员统计口径，并对微观调查数据中农村劳动力不同类型就业样本进行分类。第二，预测模型选择。基于不同的有监督的机器学习算法，利用微观调查数据构建农村劳动力就业类型选择预测模型，并通过模型预测效果评价指标的对比，选择分类效果最好的预测模型，对乡村就业人员中从事纯农业、兼业和纯非农三种就业类型的劳动力数量进行估算。第三，绝对剩余劳动力估算。将纯农业和兼业劳动力作为农业从业人员，计算农业从业人员投入农业生产劳动时间，减去农业生产必需劳动时间，得到绝对剩余劳动力数量。第四，相对剩余劳动力估算。将纯非农和外出就业作为非农就业人员，再次利用机器学习模型估算农业劳动力向非农就业转移的预测概率，从而得到相对剩余劳动力数量。

(一)乡村就业人员的统计界定
明确宏观统计中乡村就业人员的统计标准，然后界定微观调查数据中与之对应的样本范围，是利用微观调查数据进行宏观估算的前提。根据《中国统计年鉴（2019）》的说明，2001年以后的全国经济活动人口、就业人员、城镇和乡村就业人员的总计资料，是根据第六次全国人口普查资料及历年劳动力调查资料推算的。对比《中国统计年鉴（2011）》和第六次全国人口普查资料可以发现，二者城乡就业人员占城乡常住人口比例的数据基本一致（见表1）。由于2010年人口普查中的就业数据是按照常住人口口径统计的，由此笔者可以推断，2010年及以后的《中国统计年鉴》中“乡村就业人员”数据也是按照农村常住人口口径统计的。① 关于这一点，笔者还可以从另外两个角度加以印证：第一，根据《中国统计年鉴》数据，2010—2018年，城镇就业人员占城镇常住人口的比例一直稳定在51.8%～52.4%，乡村就业人员占乡村常住人口的比例则稳定在60.2%～61.7%之间，这表明城乡就业数据与城乡常住人口数据存在稳定的比例关系。第二，将《全国农民工监测报告》“农民工总量”减去“居住在城镇地域内”的“进城农民工”，与《统计年鉴》“乡村就业人员”减去“第一产业就业人员”数据对比，发现二者在2015—2018年间差距仅为93万～1 421万之间。由此可以推断，现行城镇就业人员统计中包含的农民工数量大致等于“进城农民工”数量。换言之，无论工作地点是否在城镇地区，只要不在城镇地区居住的农民工都已经被计入“乡村就业人员”统计中。由此也可以说明，城乡就业数据是按照居住地原则统计的。

表1 不同数据来源的2O1O年城乡常住人口和就业人员数量和比例

pagenumber_ebook=99,pagenumber_book=97
说明：2010年人口普查中的常住人口和就业人员数据来自10%长表数据资料。

本文使用的微观调查数据为国家计生委2015年流出地监测专项调查（以下简称“流出地2015”）。“流出地2015”调查以全国第六次人口普查分县数据、2015年上半年分县全员流出人口数据为初级抽样框，采取分层、多阶段、与户籍人口规模成比例的PPS方法进行抽样。调查范围包括河北、辽宁、吉林、黑龙江、江苏、浙江、安徽、河南、广东、四川10个省份230个区县。该调查详细询问了16岁～59岁以上农村劳动力的个人特征、家庭特征，以及从事农业和非农业生产情况。该调查中农村劳动力包括三类：一是在农村常住6个月以上或在城镇常住6个月以下，且工作地点也在农村的劳动力；二是在农村常住6个月以上，但是工作地点在城镇地区劳动力；三是在城镇常住6个月以上，但是户口登记地仍然在农村本户的劳动力。

根据上文对乡村就业人员统计口径的推断，本文将“流出地2015”调查中户口在农村本户，且在农村常住6个月以上的劳动力视为“乡村就业人员”，将户口仍在农村本户，但是在城镇常住6个月以上的劳动力视为“外出”就业。表2给出了“流出地2015”调查中“农村劳动力”的配置状况。如表2所示，户口仍在农村的劳动力中，只有48.9%的劳动力就业地点也在农村，而19.8%的农村劳动力已经实现在城镇地区的“就近就业”，但是由于常住在农村，仍被统计在“乡村就业人员”中。忽略了这部分劳动力，是当前研究中认为乡村就业人员比例存在高估的主要原因之一。另外，有31.3%的农村劳动力选择外出就业，其中省内就业和省外就业的相对比例为53.7%和46.3%。

表2 "流出地2O15"调查中"农村劳动力"配置状况

pagenumber_ebook=100,pagenumber_book=98
进一步地，本文按照农村劳动力农业和非农就业情况，将只从事农业生产的劳动力划分为纯农业劳动力，将既从事农业生产、也从事非农生产的劳动力划分为兼业劳动力，将只从事非农生产的劳动力划分为纯非农劳动力。划分结果如表3所示。“乡村就业人员”中纯农业、兼业和纯非农劳动力的比例分别为34.1%，19.1%和15.5%，三者之间的相对比例分别为49.7%，27.7%和22.5%。

表3 "流出地2O15"调查中农村劳动力就业类型构成

pagenumber_ebook=100,pagenumber_book=98
(二)MNL，SVM和AdaBoost三种算法的模型构建和估算方法
在获得“流出地2015”调查中不同就业类型劳动力的统计范围之后，本文构建有监督的机器学习算法模型，并找到相对应的宏观数据变量，对乡村就业人员中从事纯农业、兼业和非农业就业的劳动力数量进行估算。经过几十年的发展，有监督的机器学习算法已经比较成熟，但是用于劳动力就业类型选择的文献尚不多见。当前比较常用的机器学习算法包括传统的线性回归和Logit回归，以及比较现代的广义可加模型（GAM）、支持向量机（SVM）和提升方法等（加雷斯·詹姆斯等，2020）。不同的机器学习算法各有优缺点，本文基于构建多分类评估预测模型的需要，综合考虑不同算法的原理，选择传统的多项Logit模型（MNL）、支持向量机（SVM）、基于提升方法的AdaBoost三种算法进行建模，并通过模型预测效果评价指标的对比，选择分类效果最好的模型进行预测分析。

1.多项Logit模型（MNL模型）。MNL模型是一种建立在随机效用理论的传统分类预测方法，具有变量易解释、计算速度快等优点。其缺点是假定前提比较严格，包括不同选择的随机效用部分相互独立、并服从相同的二重指数分布等。

第一步，利用“流出地2015”数据建立基于纯农业、兼业和纯非农三类型MNL模型。假设劳动力个体i的就业可选方案集合为y，包含了纯农业、兼业和纯非农三种不同的方案，其中方案j的效用记为Uij。根据效用最大化原则，如果选择方案j能带给劳动者最大的效用，则个体i将选择j方案。其公式表示如下：

pagenumber_ebook=100,pagenumber_book=98
式中，A j表示回归系数矩阵，X表示影响劳动力就业类型选择的变量，ε表示随机误差项。在确保所使用的微观数据变量能够找到与之对应的宏观数据变量前提下，本文参考夏怡然和陆铭（2015）、张景娜和朱俊丰（2020）等研究，从以下几个方面选择变量：劳动力个体特征（受教育程度、年龄及其平方项、性别）、家庭特征（14岁及以下少儿比例、65岁及以上老人比例、家庭承包地面积和家庭人均可支配收入）、地区经济特征（经济发展水平、第二产业产值比重和第三产业产值比重）、地区交通通信特征（交通运输能力、邮政服务水平、电信服务水平和互联网普及率）、区域特征（东部、中部、西部和东北地区虚拟变量）。

第二步，找到与X相对应的宏观数据变量X M。其中个体特征变量利用历年《中国人口和就业统计年鉴》公布的全国和城镇就业人员按性别分就业人员年龄构成数据，计算出乡村就业人员年龄结构和分年龄性别结构。2010年和2015年受教育程度变量分别采用《2010年中国人口普查资料》和《2015年人口抽样调查资料》中16岁及以上乡村人口的分年龄受教育程度数据代替。其余年份采用算术平均法得到。家庭特征、地区经济和交通通信特征变量来源于历年《中国统计年鉴》和《中国城市统计年鉴》。

第三步，假设其余年份劳动力就业选择影响变量X的回归系数矩阵A j与2015年相同，然后将宏观数据变量X M和变量回归系数矩阵A j带入到式（2）中，计算宏观数据条件下三种就业类型劳动力的比例。将纯农业作为“参照方案”，则个体i选择j方案的预测概率可表示为：

pagenumber_ebook=101,pagenumber_book=99
最后，将历年《中国统计年鉴》中乡村就业人员的数量乘以第三步计算的三种就业类型劳动力比例，即可得到乡村就业人员三种就业类型劳动力总量。

2.支持向量机（SVM）。SVM是建立在统计学基础上的一种机器学习方法。其基本思想是：假定在一个n维空间中存在两种不同类型的数据，为了在空间中将两类数据区分开来，需要构造一个可以划分两种数据的超平面，并使得两类数据距离该平面的边界最大化。其中刚落在间隔上和落在间隔错误一侧的样本点叫作支持向量。SVM的一个重要特点是，只有支持向量在构建分类器时发挥作用，落在间隔之外被正确分类的观测并不影响分类器。一般来说，当不同类别的观测可以更好地被分隔时，SVM的表现比MNL好，但是如果不同类别存在较多重叠，选择MNL更加合适。用公式可表示为：

pagenumber_ebook=101,pagenumber_book=99
式中，w是超平面的法向量，b为位移项。求解式（3）可以得到分类函数为：

pagenumber_ebook=101,pagenumber_book=99
式中，a i为拉格朗日系数。由于本文构建的是多分类预测模型，因此需要将支持向量扩展到多分类情形。本文采用一类对一类（One-versus-one）的分类方法进行处理。其估算步骤为：首先，对于J＞2的多分类模型，建立pagenumber_ebook=101,pagenumber_book=99个SVM，每个SVM用来分隔两个类别，使用所有pagenumber_ebook=101,pagenumber_book=99个SVM对一个样本点进行分类。然后，记录这个样本点被分到每个类别的次数。最后，这个样本点的最终预测类别就是预测次数最多的那一类，并把预测到每个类别的比例作为预测概率。SVM模型构建中使用的微观和宏观数据变量与MNL相同，此处不再赘述。

3.AdaBoost算法。AdaBoost算法由Freund＆Schapire（1997）提出，是一种基于提升（boosting）方法的一种经典算法。提升方法的基本思想是：对于一个复杂任务来说，将多个专家的判断进行适当综合所得出的判断，要比其中任何一个专家单独的判断好。其计算过程为从弱学习算法出发，反复学习，得到一系列弱分类器，然后组合这些弱分类器，构成一个强分类器。基于训练数值的权值分布和强分类器组合方法的不同，形成不同的算法。AdaBoost算法在训练数值赋权方面，将关注点放在被错误分类的样本上，减少上一轮被正确分类的样本权值，提高被错误分类的样本权值。在强分类器组合方式上，采用加权投票的方法，分类误差小的弱分类器的权值大，而分类误差大的弱分类器的权值小。AdaBoost算法的优点在于它能在学习过程中不断减少训练误差，即在训练数据集上的分类误差率。其主要缺点是对异常样本敏感，异常样本在迭代中可能会获得较高的权值，从而产生噪声影响强分类器的预测准确性。

本文首先使用“流出地2015”数据进行数据训练，然后利用宏观数据变量进行预测。其数据训练过程如下：给定训练数据集T＝{（X 1，y 1），（X 2，y 2），…，（X n，y n）}。首先，假定训练集上样本的初始分布为pagenumber_ebook=101,pagenumber_book=99计算弱分类器h t。其次，根据弱分类器在分布Dt上的误差为εt＝P Dt（h t（X i）≠y i），计算弱分类器的权值为pagenumber_ebook=101,pagenumber_book=99再次，更新训练样本的分布为pagenumber_ebook=102,pagenumber_book=100其中Z t为归一化常数。最后，得到强分类器为H final（X）＝pagenumber_ebook=102,pagenumber_book=100

(三)绝对剩余劳动力估算方法
在估算出乡村就业人员中三种就业类型劳动力数量之后，本文将乡村就业人员中的本地纯农业和兼业劳动力视为农业从业人员。① 外出劳动力也可能农忙时返乡从事农业生产，但是由于外出就业离乡6个月以上，实际从事农业生产的时间很短。根据CHIP 2013年数据，外出劳动力平均从事农业生产12.6天。为了方便起见，本文假设外出就业完全脱离农业生产。通过计算农业必需劳动工日和农业从业人员从事农业生产的劳动工日，估算绝对剩余劳动时间数量和比例。

首先，计算农业必需劳动工日。本文借鉴蔡昉和王美艳（2007）、孔祥智（2019）的研究，采用“劳动定额法”对农业必需劳动力数量进行估算。根据《全国农产品成本收益资料汇编》公布的我国各类农产品单位播种面积或单位产量的用工数量，以及《中国统计年鉴》和《中国农村统计年鉴》公布的相应农产品的播种面积或总产量，估算按标准劳动日（每天8小时）计算的当年农业产出必需投入的用工总工日。由于2009年之后的《全国农产品成本收益资料汇编》不再汇报水产品的劳动用工情况，因此只估算了种植业、饲养业和畜牧业的农业必需劳动力工日。

其次，获取农业从业人员从事农业生产劳动工日。由于纯农业和兼业这两类农业从业人员在农业生产中投入的劳动时间差别较大，不能直接利用农业劳动力合理工作负荷工日折算剩余劳动力数量，对此本文将分别利用纯农业和兼业劳动力投入的平均农业劳动时间，估算农业生产实际投入劳动时间。由于“流出地2015”调查中没有询问不同就业类型劳动力的劳动时间情况，本文使用的劳动时间数据来自中国居民收入项目（CHIP）2013年的农村住户调查数据。CHIP 2013年数据调查覆盖了北京、山西、辽宁、江苏、安徽、山东、河南、湖北、湖南、广东、重庆、四川、云南、甘肃14个省份126个城市234个县区的11 013户农村住户样本。该调查询问了16岁及以上劳动力农业和非农就业类型，以及在不同就业类型中投入的劳动时间。按照上文对“乡村就业人员”的界定，对CHIP 2013年数据进行处理，得到农村劳动力样本25 584个，其中纯农业、兼业、纯非农和外出劳动力数量分别为9 249，5 021，6 114和5 200个。表4给出了四种就业类型劳动力农业和非农劳动投入的平均劳动时间结果。

如表4所示，2013年纯农业劳动力平均农业投入时间为210.8天，低于通常文献使用的农业劳动力合理工作负荷工日240天、270天或320天。纯非农劳动力的平均工作天数为270.2天，接近城镇劳动力平均工作天数275.5天（CHIP 2013年数据）。外出劳动力的平均工作天数为253.4天，略高于《2013年农民工监测调查报告》公布的外出农民工平均从业时间249.5天。值得注意的是，兼业劳动力的农业劳动和非农劳动平均时间分别为122.2天和166.2天，二者合计为288.4天，高于其他三种就业类型劳动力的平均工作天数，表明兼业劳动力的平均劳动时间更长，并且如果按照农业劳动力合理工作负荷日270天计算，兼业劳动力已经基本处于充分就业状态。

表4 2O13年CHIP数据中不同就业类型劳动力农业和非农劳动平均时间

pagenumber_ebook=102,pagenumber_book=100
另外，纯农业劳动力的平均劳动时间仅为210.8天，低于通常认为的农业劳动力合理工作负荷工日，表明纯农业劳动力中存在以公开失业为表现形式的显性失业。如果这部分纯农业劳动力能够增加农业劳动时间，那么就可以置换出更多的农业劳动力转移到非农部门就业。因此这部分劳动时间可以看作是农业部门劳动边际产出为零的绝对剩余劳动时间，本文称之为显性剩余劳动时间。在估算农村剩余劳动时，应将显性剩余劳动时间也包含在内，这也符合早期对剩余劳动力的界定。① 在剩余劳动理论发展的早期，Mathur（1964）在分析剩余劳动产生的原因时指出，传统部门的剩余劳动应包含隐蔽性失业和公开失业两部分。同时为了与实际投入农业生产但超出农业生产必需劳动时间的剩余劳动时间进行区分，本文把后者称为隐蔽性剩余劳动时间，把包含显性剩余劳动时间的剩余劳动时间称为绝对剩余劳动时间。

(四)相对剩余劳动力估算方法
本文将农业劳动力中具有向非农就业转移潜力，但是尚未转移的部分视为相对剩余劳动力。借鉴都阳和王美艳（2010）、约翰·奈特等（2011）的估算思路，如果已知农业劳动力的变量特征，那么农业劳动力选择非农就业的概率可以看作是农业劳动力向非农就业的转移潜力。因此需要对农业劳动力选择非农就业的概率进行预测。本文将纯农业和兼业就业视为农业劳动力，将纯非农和外出就业视为非农就业，分别估算纯农业和兼业向纯非农和外出就业的转移数量和比例。具体估算过程如下：

第一，利用“流出地2015”数据建立农村劳动力纯农业、兼业、纯非农和外出就业的四分类就业选择模型。第二，再次利用以上介绍的三种机器学习算法，对不同算法下四分类就业选择模型的预测精度进行评价，得出分类效果最好的模型。第三，将与微观数据相对应的宏观数据变量，代入上述机器学习算法，分别预测出纯农业和兼业劳动力选择纯非农和外出就业的概率。最后，将预测概率乘以相对应的宏观数据中纯农业和兼业劳动力数量，加总得出相对剩余劳动力的数量和比例。其中，宏观数据变量的构建方法如下：纯农业和兼业劳动力的个体特征变量根据三分类模型估算的纯农业和兼业劳动力年龄、性别、受教育程度结构数据计算得到。纯农业和兼业劳动力的家庭特征、地区特征和区域特征变量不能直接获得。本文根据“流出地2015”中纯农业和兼业样本与三种就业类型样本均值的相对比例进行调整。

(五)变量说明和描述性统计
根据以上估算方法，本文需要建立三分类和四分类两个劳动力就业选择模型，并且需要两部分变量。一是基于“流出地2015”的微观数据变量矩阵X。二是与之相对应的宏观数据变量矩阵X M。表5给出了三分类和四分类预测模型的变量说明和基于微观数据的变量的描述性统计结果。通过对变量显著性和分类效果的对比，地区经济特征以地级城市指标表示，地区交通通信特征以省级城市指标表示。宏观数据变量中使用的分产业GDP变量和邮政业务变量均采用GDP平减指数进行平减。

表5 变量说明和描述性统计结果

pagenumber_ebook=104,pagenumber_book=102
四、估算结果及分析
(一)MNL，SVM和AdaBoost三种算法的评价和选取结果
本文使用Python对模型进行处理，所用程序为Python自带程序包或自己编写的程序。在模型训练过程中，采用十折交叉训练方法，通过对数据集数据的随机排序和抽取，降低模型的测试错误率。由于不同算法各有优缺点，本文采用ROC曲线和AUC值对模型分类效果进行评价，从而选出分类效果最好的模型对宏观数据进行预测。ROC曲线能够同时展示出所有阈值出现的假阳性率（False Positive Rate，FPR）和真阳性率（True Positive Rate，TPR）。AUC值是ROC曲线下面的面积。ROC曲线越贴近左上角，AUC值越大，表明分类效果越好。一般来说，AUC值大于0.8，表示模型具有良好的预测性质。图1和图2分别绘制出基于MNL，SVM和AdaBoost三种机器学习方法，对应于三分类和四分类数据的ROC曲线和AUC值。

为了更直观地反映评估效果，本文计算了基于三种机器学习方法AUC均值。三分类数据MNL，SVM和AdaBoost三种算法的AUC均值分别为0.797 0，0.804 6，0.822 4，四分类数据三种算法的AUC均值分别为0.827 4，0.835 4，0.855 4，可以看出三种算法的分类精度均值基本在0.8上下，表明分类预测效果良好，具有较强的预测能力。对比来看，无论是从AUC均值，还是从不同类别来看，三种机器学习方法的分类效果排序都是MNL＜SVM＜AdaBoost，表明AdaBoost的分类精度最好，预测能力最强。因此，本文选择Ada-Boost算法对宏观数据进行预测。另外，从Ada-Boost结果来看，纯农业、纯非农和外出三个类别的AUC值相对较高，在0.83以上，尤其是外出类别的AUC值在0.96以上，表明本文使用数据对这三种类型就业的分类精度较高。而兼业类别的AUC值在0.75～0.76之间，表明本文数据对兼业类型的识别能力相对较差，这可能是由于兼业劳动力的变量特征与其他三种类别的相似度较高，因而分类效果较差。① 根据不同就业类型变量的描述性统计结果，兼业劳动力的人力资本特征和家庭特征与其他三类样本的相似度较高。限于篇幅，笔者并未将该结果列于文中。如有需要，可向笔者索要。

(二)乡村就业人员三种就业类型劳动力数据的估算结果
在得到基于AdaBoost机器学习算法的三分类预测模型后，假定其他年份农村劳动力的三种就业类型的就业选择模型与2015年相同，代入宏观数据变量，计算出乡村就业人员中三种就业类型劳动力数量。估算结果见表6。

表6 乡村就业人员三种就业类型比例和数量

pagenumber_ebook=106,pagenumber_book=104
说明：乡村就业人员数据来自《中国统计年鉴（2019）》。

pagenumber_ebook=105,pagenumber_book=103
图1a 三分类MNL分类器的ROC曲线

pagenumber_ebook=105,pagenumber_book=103
图1b 三分类SVM分类器的ROC曲线

pagenumber_ebook=105,pagenumber_book=103
图1c 三分类Adaboost分类器的ROC曲线

pagenumber_ebook=105,pagenumber_book=103
图2a 四分类MNL分类器的ROC曲线

pagenumber_ebook=105,pagenumber_book=103
图2b 四分类SVM分类器的ROC曲线

pagenumber_ebook=105,pagenumber_book=103
图2c 四分类Adaboost分类器的ROC曲线

伴随着快速的城镇化进程，我国乡村就业人员总量呈现快速下降趋势。与2010年相比，2018年乡村就业人员总量下降7 251万，年均下降2.4个百分点。但是乡村就业人员中三种就业类型劳动力数量呈现不同的变动趋势。首先，纯农业劳动力数量和比例一直呈现下降趋势，而且下降数量和速度都超过乡村就业人员。与2010年相比，2018年纯农业劳动力数量下降11 697万，年均下降7.5个百分点，表明纯农业劳动力数量的下降是乡村就业人员数量下降的主要原因。其次，兼业劳动力数量和比例呈现波动变化趋势。2018年兼业劳动力数量为9 091万，比2010年下降1 771万，兼业劳动力比例为26.2%，比2010年上升0.4个百分点。兼业既为农户家庭兼顾消费和农产品价值增长目标提供条件，也为劳动力离开农业、进入城市从事非农生产准备人力资本积累（孔祥智，2019）。随着经济发展水平和农业机械化水平的提高，以及农村劳动力老龄化的加剧，兼业在农村劳动力就业决策中的相对比例保持相对稳定。最后，纯非农劳动力的数量和比例呈现出高速增长趋势。2018年纯非农劳动力数量和比例为11 509万和33.7%，分别比2010年增加6 216万和20.9个百分点。纯非农劳动力数量的年均增长速度为10.2%，是三种就业类型中增长幅度最大的就业类型。随着小城镇和乡村地区经济发展水平的提高以及基础设施、公共服务体系的日益完善，本地非农就业机会将不断增加，乡村就业人员中从事纯非农就业的数量和比例快速提升。

本文进一步将农业从业人员估算结果，与官方汇报的第一产业就业人员和第三次全国农业普查汇报的全国农业生产经营人员进行对比。首先，本文估算的2018年纯农业劳动力占乡村就业人员的比例为39.7%，比官方汇报的第一产业就业人员占乡村就业人员比例低19.6个百分点。但是2018年纯农业和兼业劳动力合计数量为22 658万，高于官方汇报的第一产业从业人员数字（20 258万）。产生这一矛盾的根源就在于当前官方乡村就业人员统计中没有反映农村劳动力的兼业从业情况。本文的估算结果，为摸清我国乡村就业人员真实的农业和非农就业情况提供了数据基础。其次，本文估算的2016年纯农业和兼业劳动力合计数字（26 528万）比第三次全国农业普查汇报的2016年全国农业生产经营人员数字（31 422万）低4 894万。但是分年龄组的对比可以发现，二者55岁及以上农业劳动力差值为3 395万人，占总差值69.4%。① 本文估算的2016年纯农业和兼业劳动力合计数据中，55岁及以下和55岁以上劳动力数量分别为19 372万和7 156万。第三次全国农业普查汇报的2016年全国农业生产经营人员数据中，55岁及以下和55岁以上劳动力数量分别为20 871万和10 551万。这表明我国农村有相当一部分55岁及以上实际从事农业生产，但是并没有被乡村就业人员统计在内的农业劳动人员，反映了我国农村老年人实际劳动参与率高于现有官方统计水平。而二者55岁以下劳动力数量差值仅为1 499万，则表明本文的估算结果良好，能够反映我国当前农村劳动力的真实农业从业情况。

(三)绝对剩余劳动力的估算结果
本文采用劳动定额法对农业必需劳动工日进行估算，并假定纯农业和兼业劳动力年投入农业劳动工日与CHIP 2013年数据具有相同绝对剩余劳动时间。② 受数据可得性限制，本文作此假定。考虑到本文所考察时期较短，且纯农业（210.8天）和兼业劳动力（288.4天）年投入劳动时间已相对较高，可以认为此假定是合理的。为了更直观地表现劳动时间的大小，本文将估算的劳动时间按照270个工作日，折算成劳动力数量。表7汇报了折算后的估算结果。

如表7所示，首先，随着农业机械化水平提升和农业生产结构的调整，农业生产必需劳动力数量呈现下降趋势。与2010年相比，2018年农业生产必需劳动力数量下降2 867万人，下降幅度为17%。其次，与纯农业和兼业劳动力数量（表6列（5）和列（6））的变动趋势相一致，纯农业劳动力投入农业生产的劳动力数量呈现快速下降趋势，而兼业劳动力投入农业生产的劳动力数量的下降速度相对较慢。2018年纯农业和兼业劳动力投入农业生产的劳动力数量分别为10 592万和4 115万，年均下降速度分别为7.5和2.2个百分点。从合计结果（表7列（4））来看，2018年纯农业和兼业劳动力合计投入农业生产的劳动力数量为14 707万，比2010年下降40.3%，高于农业生产必须投入劳动时间的下降比例，这意味着隐蔽性剩余劳动力数量将呈现下降趋势。另外，2018年兼业劳动力投入农业生产的劳动力数量占合计投入农业生产的劳动力数量比例为28%，比2010年上升8个百分点，表明兼业劳动力的农业劳动投入对于稳定农业生产发挥越来越重要的作用。

表7 按照27O个工作日折算后的2O1O－2O17年绝对剩余劳动力估算结果

pagenumber_ebook=107,pagenumber_book=105
说明：1.农业必需劳动工日根据历年《全国农产品成本收益资料汇编》《中国统计年鉴》《中国农村统计年鉴》数据计算整理而得。2.纯农业劳动力投入农业生产劳动力数量＝纯农业劳动力数量×210.8／270。3.兼业劳动力投入农业生产劳动力数量＝兼业劳动力数量×122.2／270。4.显性剩余劳动力数量＝纯农业劳动力数量×（270－210.8）／270。

第三，隐蔽性剩余劳动力数量和比例呈现快速下降趋势。一方面，隐蔽性剩余劳动力数量从2010年的7 783万下降到2018年的717万，下降幅度为85.1%，表明我国当前隐蔽性剩余劳动力已经极低，在不影响农业生产的条件下，农业部门能够转移出来的剩余劳动力数量非常有限。另一方面，隐蔽性剩余劳动力比例从2010年的31.6%下降至2018年的4.9%，相当于每年下降3.3个百分点。在其他情况不变的条件下，如果按照这个速度继续下降，那么到2020年，我国隐蔽性剩余劳动力比例将接近于0。这意味着按照实际投入的农业劳动力数量计算的农业部门劳动力边际产出将开始大于0，隐蔽性剩余劳动力将会基本消失。

第四，显性剩余劳动力数量呈现下降趋势。2018年显性剩余劳动力数量为2 975万，比2010年下降46.3%，表明我国显性剩余劳动力数量相对比较充足，如果能够增加纯农业劳动力的农业劳动时间，便能够在不影响农业生产的条件下，转移出更多农业剩余劳动力。值得注意的是，显性剩余劳动力数量的下降速度低于隐蔽性剩余劳动力，并且从2016年开始，显性剩余劳动力数量开始超过隐蔽性剩余劳动力数量，成为我国剩余劳动力的主要表现形式。2018年，显性剩余劳动力数量占绝对剩余劳动力数量的80.6%（表7列（6）除以列（7）），比2010年上升39个百分点，表明我国当前农村剩余劳动力问题主要体现在纯农业劳动力未能实现充分就业上，促进这部分劳动力充分就业是进一步挖掘剩余劳动力潜力的重要途径。

最后，绝对剩余劳动力数量和比例也呈现下降趋势。2018年绝对剩余劳动力数量3 692万，比2010年下降72.3%，表明即使包含显性剩余劳动力，绝对剩余劳动力总量也已经相当有限。从剩余比例来看，绝对剩余劳动力比例从2010年的44.1%下降到2018年的20.9%，相当于每年下降2.9个百分点。在其他情况不变的条件下，如果按照这个速度继续下降，那么在2026年我国农村劳动力将全面实现充分就业，从农业部门劳动边际产出为零角度衡量的农村劳动力剩余时代将彻底过去，城乡二元经济结构将发生根本性改变。

(四)相对剩余劳动力的估算结果
本文将不考虑农业部门边际产出，基于劳动力个体非农就业意愿，农业劳动力中具有非农就业转移潜力的那部分劳动力称为相对剩余劳动力。估算结果见表8。① 本文分别估算了纯农业和兼业劳动力分别向纯非农和外出就业的转移数量，由于其变动趋势与向纯非农和外出转移劳动力总量基本一致，为了突出关键信息，本文未汇报其结果。如有需要，可向笔者索要。

如表8所示，相对剩余劳动力数量和比例的估算结果与绝对剩余劳动力估算结果的变动趋势基本一致，但是变动幅度表现出较大差异。首先，随着纯农业劳动力数量的快速下降和平均年龄水平的上升，纯农业劳动力中相对剩余劳动力的数量和比例急剧下降。② 根据本文不同年份的分年龄组估算结果，2010—2018年间，纯农业劳动力中40岁以下劳动力占比从37.5%下降到18.7%，50岁及以上劳动力的占比从37.6%上升到60.7%。2018年纯农业劳动力中可向非农部门转移的相对剩余劳动力数量和比例为2 166万和16%，分别比2010年下降3 037万和4.6个百分点，表明能够从纯农业就业中向非农部门转移的农业劳动力数量已经相当有限。其次，由于兼业劳动力总量和年龄结构相对比较稳定③ 根据本文不同年份的分年龄组估算结果，2010—2018年间，兼业劳动力的40岁以下占比从48.5%下降到32.4%，50岁及以上占比从21.7%上升到35.5%，变动幅度低于总体乡村就业人员变动幅度。，兼业劳动力中相对剩余劳动力的数量和比例下降速度相对较慢。2018年兼业劳动力中可向非农部门转移的相对剩余劳动力数量和比例为3 203万和35.2%，分别比2010年下降1 876万和11.6个百分点，表明促进兼业劳动力向非农部门转移是增加非农部门劳动力供给的重要途径。

再次，从合计结果（表8列（5）和列（6））来看，相对剩余劳动力的数量和比例呈现下降趋势。2018年相对剩余劳动力数量和比例为5 369万和23.7%，分别比2010年下降4 913万和4.8个百分点，表明我国能够向非农部门转移的劳动力数量相对比较充足。另外，将该估算结果与表7汇报的绝对剩余劳动力估算结果进行对比发现，从2015年开始，相对剩余劳动力的数量开始超过绝对剩余劳动力数量，并且差距不断拉大。这表明随着经济发展水平的提高，非农部门创造的就业机会增加，使得原本受到人力资本限制不能转移的农业劳动力的非农就业转移潜力增加，能够向非农部门转移的相对剩余劳动力数量开始超过绝对剩余劳动力数量。另一方面，即使全部纯农业劳动力都实现充分就业，如果具有非农转移潜力的相对剩余劳动力全部转出，也会引起农业必需劳动力的不足。由于具有非农就业转移潜力的相对剩余劳动力主要由年龄较轻的40岁以下劳动力构成④ 根据本文估算结果，2018年相对剩余劳动力中40岁以下数量为3 047万，占相对剩余劳动力数量的70.6%，占40岁以下纯农业和兼业劳动力数量的60.8%。，如果这部分劳动力继续转移，那么将会使得农业劳动力的老龄化程度进一步加剧，对农业现代化产生不利影响。

表7 2O1O－2O17年相对剩余劳动力估算结果

pagenumber_ebook=109,pagenumber_book=107
最后，从转移方向来看，向本地纯非农就业和外出就业转移的相对剩余劳动力数量（表8列（7）和列（8））表现出不同的变动趋势。一方面，随着小城镇建设和乡村经济发展水平的提高，本地非农就业机会增加，具有向本地纯非农就业转移潜力的相对剩余劳动力数量有所增加。2018年，能够向纯非农就业转移的相对剩余劳动力数量为4 318万，比2010年增加1 331万，年均增长4.7个百分点。另一方面，由于城镇地区“掐尖式”吸纳农村劳动力方式① 根据《全国农民工监测调查报告》，本地农民工和外出农民工的平均年龄分别从2010年的36岁和31岁，上升至2019年的45.5岁和36岁，前者比后者上升幅度高出4.5岁。，随着纯农业和兼业劳动力的老龄化程度加剧，具有向外出就业转移潜力的相对剩余劳动力数量急剧下降。2018年，能够向外出就业转移的相对剩余劳动力数量仅为1 051万，比2010年下降6 244万，年均下降速度为21.5个百分点。另外，值得注意的是，向本地纯非农转移的剩余劳动力数量从2014年达到峰值之后，开始出现逐年下降趋势。这表明随着农业劳动力人力资本结构转变和经济进入中高速增长阶段，本地非农部门吸纳农业劳动力的能力呈现下降趋势，农业劳动力转移难度不断增加。

五、刘易斯转折和进一步分析
剩余劳动力作为二元经济理论的核心概念，其数量和比例的估算是判断刘易斯转折的关键证据。本文的估算结果表明，2010年以来，我国绝对剩余劳动力数量呈现快速下降趋势。2018年我国隐蔽性剩余劳动力仅为717万，表明按照当前实际农业生产投入计算的农业剩余劳动力数量已经处于极低水平。2018年显性剩余劳动力总量为2 975万，但是考虑到纯农业劳动力平均劳动时间已经达到210.8天，而且由于农业生产明显的季节性特征，纯农业劳动力劳动时间提升幅度已经相当有限。因此，本文判断我国已经从总体上跨越刘易斯第一转折点。由农业就业和非农就业之间的劳动边际产出或工资水平所决定的第二转折点是以后研究的重点，并具有更重要的现实意义。

从相对剩余劳动力估算结果来看，当前农业部门能够为非农部门提供的劳动力供给潜力也相当有限。根据本文估算，2018年具有向本地纯农业就业和外出就业转移潜力的相对剩余劳动力数量分别为4 318万和1 051万，其中59.6%来自兼业劳动力。而兼业劳动力的平均非农劳动投入时间已达到166.2天。如果兼业劳动力达到270天的充分就业劳动时间，假设兼业就业中的相对剩余劳动力全部向非农部门转移，那么可增加的非农部门劳动力供给数量为1 231万②1 231万＝3 203万×（1－166.2／270）。，加上纯农业就业中可转移出来的相对剩余劳动力2 166万，2018年可转移的相对剩余劳动力数量则应调整为3 397万。另外，目前相对剩余劳动力数量已经超过绝对剩余劳动力数量，这意味着在纯农业劳动力不增加平均农业劳动时间的前提下，如果相对剩余劳动力全部转移到非农部门就业，会造成农业部门生产所需劳动时间的不足。因此，本文判断，未来一段时期，我国面临的农业生产劳动力紧张和非农部门劳动力供给不足的问题将会持续加剧，这将导致农业部门边际劳动生产率的提升和工农贸易条件的改善，城乡劳动力供求和二元经济结构都将发生根本性转变。

此外，我国幅员辽阔，不同区域之间经济发展水平和农业生产条件差异较大，所处刘易斯转折阶段也可能不同。根据本文对2015年四大区域绝对剩余劳动力的估算① 本文利用2015年分省份《1%人口抽样调查资料》估算了分省份的绝对剩余劳动力和相对剩余劳动力情况。但是由于各省份农村劳动力配置情况差异较大，以及分省份劳动时间数据样本量相对较少，因此未将其作为主要估算结果放在文中，而是在此处汇报了分区域结果作为参考。，东部、中部、西部和东北地区的隐蔽性剩余劳动力比例分别为－2.7%，21.4%，26.9%和25.8%② 东部地区隐蔽性剩余劳动时间比例为负值，可能是由于本文使用的农业劳动力投入其实质为本省份农业劳动力投入，不包含省份外雇工的情况。而东部地区农忙时期的农业雇工，弥补了本省份农业劳动投入时间的不足。，绝对剩余劳动力比例分别为20.2%，65.5%，45.6%和54.3%。这表明东部地区农业实际投入劳动力已经低于农业生产必需劳动力数量，但是其他区域依然存在隐蔽性剩余劳动力，而且如果能够增加纯农业劳动力的劳动时间，各个区域农业生产劳动力数量还是比较充裕的。另一方面，根据本文对2015年四大区域相对剩余劳动力情况的估算，东部、中部、西部和东北地区相对剩余劳动力数量分别为2 121万、1 134万、1 255万和163万，相对剩余劳动力比例分别为35.9%，21.2%，23.8%和11.4%，表明由于经济越发达的地区，非农就业机会越多，农业劳动力能够向非农部门的转移潜力更大，因此我国农业生产劳动力越紧张的东部地区，能够向非农部门转移出来的相对剩余劳动力数量越多，而农业劳动力比较丰富的中西部地区，能够向非农部门转移出来的相对剩余劳动力数量相对较低，这可能是造成欠发达地区农业部门劳动力剩余和发达地区用工荒的原因之一。

六、小结
本文在准确估算乡村就业人员三种就业类型结构的基础上，对2010—2018年农村绝对剩余劳动力和相对剩余劳动力进行估算。结果发现，2018年农村绝对剩余劳动力数量为3 692万，其中80.6%是以公开失业为表现形式的显性剩余劳动力。2018年相对剩余劳动力数量为5 369万，能够向本地非农就业和外出就业转移的相对剩余劳动力数量分别为4 318万和1 051万，表明我国当前农业部门劳动力的外出就业潜力也已相当有限。本文判断我国已经从总体上跨越“剩余劳动力无限供给”的刘易斯第一转折点，正在跨进农业部门和非农业部门劳动边际产出相同的刘易斯第二转折点。本文认为，未来一段时期，我国将持续面临的农业生产劳动力紧张和非农部门劳动力供给不足的双重困境。对此本文提出政策建议如下：

第一，促进纯农业劳动力充分就业和兼业劳动力的分化。一方面，促进纯农业劳动力充分就业。一是增强农业规模化经营水平，增加纯农业劳动力的农业劳动时间，从而置换出更多的非农就业劳动力。二是增加本地打零工、散工等工作机会，促使有条件的纯农业劳动力向兼业或者纯非农就业转移。三是适当增加50岁及以上农村老年人口的农业劳动时间。另一方面，促进兼业劳动力分化。一是鼓励支持有能力的兼业户向新型农业经营主体转变，促进兼业户融入现代农业的发展。二是合理调节兼业劳动者的工资性收入水平，提高兼业劳动力从事非农就业的比较收益。三是引导有意退出农业的兼业户离开农业，比如保障兼业户土地流转收益、增加农户转移性收入等。

第二，提升农村生产要素配置效率。一是建立与产业升级相配套的农村劳动力技能培训体系，包括加强农村青少年劳动力中等职业教育，发展壮年农村劳动力的技能培训，合理安排返乡农民工再培训等。二是增加新型职业农民培训，完善职业农民教育培训、认定管理和政策扶持体系，提高农民农业生产经营能力。三是发挥市场基础性资源配置作用，完善土地流转制度，增强农业规模化经营水平。四是提升农业技术水平和其他农业生产要素的投入，提高农业劳动生产率，释放出更多的农业劳动力。五是加强农村地区交通电信、数字网络、物流等基础设施建设，通过信息化、现代化提升农村劳动力转移意愿和能力。

第三，推动农村劳动力就地转移。一是提高小城镇和乡村地区经济发展水平，增加农村劳动力本地纯非农就业机会。二是优化本地营商环境，激发市场活力，支持新产业、新业态、新模式发展，促进农民工本地自主创业和灵活就业。三是提升农村地区的教育、医疗、养老等社会保障水平，提升农村劳动力的健康劳动年限和劳动生产率。四是率先将已经实现在城镇地区“就近就业”的乡村劳动力纳入城镇劳动就业、教育和养老等基本公共服务体系，促进城乡公共服务一体化进程。五是完善农民工劳动合同、最低工资等劳动保护制度体系建设，保障农民工在获得劳动收入、安全卫生和社会保险等方面的合法权益。

第四，消除农村劳动力跨区域转移障碍。一是深入户籍制度改革，破除以户籍为核心的跨区域就业、教育和医疗等公共服务壁垒，消除农民工在大中城市落户的制度障碍。二是提升流动人口的服务意识和水平，打破“管理”思维，提高流动人口的城市融入感和生活质量。三是消除跨区域农村劳动力就业歧视和隐性就业壁垒，构建全国统一的劳动力市场。四是建立劳动力短缺地区和劳动力相对过剩地区的协作平台，提供信息服务，重点推动中西部少部分落后地区农村劳动力进一步转移。五是培育跨省份和跨区域农业劳动力市场服务体系，比如为中西部地区劳动力在农忙时节从事跨区域农业生产活动提供保障等。

参考文献

蔡昉，2007：《破解农村剩余劳动力之谜》，《中国人口科学》第2期。

蔡昉，2016：《从总量性矛盾到结构性矛盾——解读中国劳动力市场》，《中国经济学人》第1期。

蔡昉，2018：《农业劳动力转移潜力耗尽了吗?》，《中国农村经济》第9期。

蔡昉、王美艳，2007：《农村劳动力剩余及其相关事实的重新考察——一个反设事实法的应用》，《中国农村经济》第10期。

都阳、贾朋，2018：《劳动供给与经济增长》，《劳动经济研究》第3期。

都阳、王美艳，2010：《农村剩余劳动力的新估计及其含义》，《广州大学学报（社会科学版）》第4期。

［美］费景汉、［美］古斯塔夫·拉尼斯，1992：《劳动剩余经济的发展：理论与政策》（王璐等译），北京：经济科学出版社。

郭金兴、王庆芳，2014：《2002—2010年中国农村剩余劳动结构的估算》，《经济理论与经济管理》第4期。

［美］加雷斯·詹姆斯、［美］丹妮拉·威滕、［美］特雷弗·哈斯帖、［美］罗伯特·提布施瓦尼，2020：《统计学习导论：基于R应用》（王星等译），北京：机械工业出版社。

贾先文、黄正泉、黄蔡芬，2010：《论我国农村剩余劳动力转移的“拐点”》，《改革与战略》第1期。

孔祥智，2019：《我国农业劳动力数量和劳动生产率估算》，《改革》第5期。

李建伟，2020：《我国劳动力供求格局、技术进步与经济潜在增长率》，《管理世界》第4期。

孙自铎，2008：《中国进入“刘易斯拐点”了吗?——兼论经济增长人口红利说》，《经济学家》第1期。

夏怡然、陆铭，2015：《城市间的“孟母三迁”——公共服务影响劳动力流向的经验研究》，《管理世界》第10期。

姚洋，2018：《发展经济学》，北京：北京大学出版社。

［英］约翰·奈特、邓曲恒、李实，2011：《中国的民工荒与农村剩余劳动力》，《管理世界》第11期。

岳希明，2005：《我国现行劳动统计的问题》，《经济研究》第3期。

张景娜、朱俊丰，2020：《互联网使用与农村劳动力转移程度——兼论对家庭分工模式的影响》，《财经科学》第1期。

赵卫军、焦斌龙、韩媛媛，2018：《1984～2050年中国农业剩余劳动力存量估算和预测》，《人口研究》第2期。

赵显洲，2010：《关于“刘易斯转折点”的几个理论问题》，《经济学家》第5期。

周健、张桂文，2020：《刘易斯第一转折点是“短缺点”吗?——基于国际经验和中国的现实考察》，《当代经济研究》第3期。

Freund，Y.，and R.E.Schapire，1997，“A Decision-theoretic Generalization of On-line Learning and an Application to Boosting”，Journal of Computer and System Sciences，55（1）：119139.

Golley，J.，and X.Meng，2011，“Has China Runs out of Surplus Labor”，China Economic Review，22（4）：555572.

Kwan，F.，Y.Wu，and S.Zhuo，2018，“Surplus Agricultural Labour and China’s Lewis Turning Point”，China Economic Review，48：244257.

Lewis，W.A.，1954，“Economic Development with Unlimited Supplies of Labor”，The Manchester School，22（2），139191.

Mathur，A.，1964，“The Anatomy of Disguised Unemploy ment”，Oxf or d Economic Papers，16（2）：161193.

Minami，R.，and X.X.Ma，2010，“The Turning Point of Chinese Economy：Compared with Japanese Experience”，China Economic Journal，3（2）：163179.

Taylor，J.R.，1988，“Rural Employ ment Trends and the Legacy of Surplus Labour，197886”，The China Quarterly，116：736766.

Wei.Z.，and F.Kwan，2018，“Revisit China’s Lewis Turning Point：An Analysis froma Regional Perspective”，Asian Economic Journal，32（4）：333357.

Yao，Y.，and K.Zhang，2010，“Has China Passed the Lewis Turning Point?A Structural Estimation Based on Provincial Data”，China Economical Journal，3（2）：155 162.

ESTI MATION OF CHINA'S RURAL SURPLUS LABOR：2O1O—2O17

WANG Qing-fang1 GUOJin-xing2
（1．School of Economics，Tianjin University of Finance and Econo mics；2．Institute of Economic，Nankai University）

Abstract：Based on the accurate definition of the statistical caliber of rural employed persons，this paper uses the 2015 Special Survey Data of Outflow Monitoring released by the National Health and Family Planning Commission of China to construct a multi-class prediction model based on the selection of rural labor employ ment types．Then using the supervised machine methods of AdaBoost algorith m，this paper esti mates the absolute surplus labor force and relative surplus labor forcein rural areasin 2010—2018．The results show that the absol ute surplus labor force in rural areas in 2018 is 36.92 million，80.6%of which is the explicit surplus labor in the for m of open unemploy ment；the relative surplus labor force in 2018 is 53.69 million，and only 10.51 million of them are the outside transferable surpl us labor f orce．This paper judges that China has stridden across the first Lewis turning point，and will continue to face the dual dilemma of labor shortagein agricultural production and insufficient labor supply in non-agricultural sectors．In this regard，this paper puts for ward policy recommendations such as promoting full employ ment of agricultural labor，i mproving the efficiency of the allocation of rural production factors，pro moting thelocal transfer of rural labors and eli minating barriers to labor transfer across regions．

Key words：absolute surplus labor；relative surplus labor；hidden surplus labor；explicit surplus labor；Lewis turning point

* 王庆芳，天津财经大学经济学院；郭金兴（通讯作者），南开大学经济研究所，邮政编码：300071，电子信箱：guojinxing＠nankai．edu．cn。本文得到了国家社会科学基金项目（16BJL113）的资助。感谢匿名评审人提出的修改建议，笔者已做了相应修改，本文文责自负。

(责任编辑:刘舫舸)

		自动登录	找回密码
密码			立即注册