刘志|近代地权分配研究方法刍议基尼系数与统计方法的运用

放大字体  缩小字体 发布日期:2020-03-20  来源:来自互联网  作者:来自互联网  浏览次数:222
导读

利用基尼系数研究地权分配,可以清晰度量其不均的程度,在一定程度上避免阶级分组统计的局限,但是应该注意计算和分组的方法,其反映的地权分配不均程度该如何评价也需要探讨,直接照搬收入分配基尼系数的评价体系并不适当。…

作者刘志为华东师范大学历史学系博士后

近代地权分配研究方法刍议

——基尼系数与统计方法的运用

刘志

内容提要

近代地权分配需要在研究方法改进的基础上重新认识。利用基尼系数研究地权分配,可以清晰度量其不均的程度,在一定程度上避免阶级分组统计的局限,但是应该注意计算和分组的方法,其反映的地权分配不均程度该如何评价也需要探讨,直接照搬收入分配基尼系数的评价体系并不适当。近代以来调查统计资料非常丰富,良莠不一,研究近代地权分配,应先考辨甄选史料,尽量采用调查统计材料,使用统计的方法。经过重新计算证明,近代华北农村地权分配比较平均。

关键词

近代华北;地权分配;基尼系数;统计方法

对于近代中国地权分配的研究和认识,长期以来聚讼纷纭,争论至今未已。近代华北农村以自耕农为主,地权分散,几为学界定论。不过这一观点近来受到了质疑,胡英泽的研究得出“20世纪二三十年代,晋、冀、鲁三省乡村农户地权分配的基尼系数大致在0.5左右”,“说明三省乡村农户地权分配很不平均”。赵牟云不认同胡英泽的研究结论以及方法,计算得出抗战前山西土地分配的基尼系数仅为0.343,总体上可谓分散。胡英泽又指出赵冈的基尼系数计算方法存在重大错误,导致所统计计算的数值偏低,经修正赵书中76%的基尼系数在0.5以上,47%的基尼系数在0.6以上,因此认为从宋代到民国时期的地权分配越来越分散的结论需要重新讨论。龙登高、何国卿新近重新验算土改前全国范围的地权分配状况,认为土改前占农村总人口10%的富有阶层占有土地的比例,南方各省的“准确数据”为30%左右(±5%),而北方低于这一水平,考虑到一田二主、公田等因素的影响,实际数据更低,整体上全国范围的土地分配可能都比较平均。可见,近代地权分配这一老话题依然值得研究,重新认识近代华北乃至全国的地权分配非常必要,但如何认识和研究同样重要。

近代地权分配研究,除了传统的鱼鳞册等地册,还有大量的调查资料可资利用。20世纪20年代末,陈翰笙领导的无锡、保定农村调查,李景汉领导的定县社会调查,可谓开农村社会现代调查之先河。民国时期国民党、日本满铁调查机构、国内大专院校等方面关于农村的大量调查,使得近代农村的地权分配研究有了扎实可依的统计资料,特别是中共领导的农村调查和土改所形成的档案,使得农村地权分配有了“全覆盖”的统计资料——全国范围基本上每一县都有一定量的调查统计。大量的调查统计资料可资利用,却没有使研究者在地权分配这一问题上观点一致,甚至分歧颇大,主要原因在于研究方法存在不当之处。

为此,不仅需要继续讨论近代地权分配的集中或分散程度,而且有必要讨论研究方法问题,规范研究方法。科学合理的研究方法,是得出正确研究结论和认识历史真相的必要前提。

一、地权分配基尼系数的计算与评价

过去研究地权分配主要使用的是“阶级占地比例法”,即一般以地主、富农等阶级划分来测度其户口或人口与其占有的土地面积占全部的各自比例。或者,与此类似,以家庭占有土地之多寡分组排列(或可称之为“家庭占地比例法”)。赵冈较早使用基尼系数来研究中国的地权分配问题。之后,地权分配研究中基尼系数为更多的研究者所使用,但是也产生不少问题和争议。

(一)基尼系数的优点与利用

基尼系数(Gini Coefficient,又译为吉尼系数)是度量经济不平均的重要指标,在考察收入分配时应用广泛,已为人们所耳熟能详。虽然基尼系数度量收入的不平均最为普遍,但是同样可以用来度量财富、消费等的不平均程度。利用基尼系数研究土地分配,优点十分突出。

传统方法“阶级占地比例法”和“家庭占地分组法”,有明显的缺陷或不足,而基于这两种统计方法,使用基尼系数则可避免或在一定程度上避免一些问题。其一,传统方法反映的不平均程度往往不够直观明了。比如两组数据,有时很难分辨出哪组数据反映的地权分配更不平均,而基尼系数则是不平均程度的指标反映,高低立判,如同米之于长度、千克之于重量、秒之于时间。基尼系数使不同统计数据之间可以比较,既可以横向比较不同地区,也可以纵向比较同一地区不同时间。同时,也可以使上述两种不同标准的统计,进行大致比较(差异之处后文再论)。其二,近代地权分配的调查,很多是以阶级分组来统计,而占有多少土地就算是地主、富农以及各阶级户口(及人口)的比例数,并无统一标准。因此,如果只以地主、富农占有多少土地来说明地权分配的集中程度,并不可取,而基尼系数可以一定程度上避免这一因素的影响。龙登高、何国卿以“土改前农村前10%的富有阶层占有土地的比例”来研究地权分配,正是对各地地主、富农阶级户口(及人口)比例不一的修正,不过,这一修正难免主观估计带来的误差。还有,即使修正得当,仍然有上一个问题的困扰,即使前10%的富有阶层占有的土地比例不高,也难断言地权分配分散,诚如胡英泽所指出,也有“地权不均,地主很少”的情况,即地权不均主要不是由于地主占地太多造成,而是由于无地和少地农民较多所造成。不过胡英泽认为,“基尼系数和传统地权研究所用的方法并没有高下之分、优劣之别”。此说不确,如果二者无分别,就没必要基于前者的统计数据再计算基尼系数。

另外,过去地权分配研究还有“自耕农或佃农比例法”,即测度自耕农或佃农家庭占全体农户的比重。这种方法同样存在问题。一是,自耕农、佃农和半自耕半佃农的认定也没有绝对的标准,因为有的农民既自耕也佃种,且自耕与佃种的土地数量比例不一。二是,在一田二主、公田较多的地区,佃农比例高,但不能认为他们都是无地农民,即不能以佃农多寡来判定地权分配之均否。三是,即使都是自耕农,其内部土地占有依然存在差异和不均,特别是在人少地多,荒地较多时。

可以说,近代地权分配研究中,基尼系数的应用依然不足,由于基尼系数具有以上优点,在研究地权分配时应值得重视和利用。

(二)地权分配基尼系数的计算

利用相同的材料,计算地权分配的基尼系数,不同的学者所得结果不尽相同,也引发分歧。胡英泽曾利用相同的资料和基尼系数的研究方法却得出与秦晖不同的结果,从而对秦晖的“关中模式”提出质疑。后来他继续受惑于这一问题:“赵冈曾根据国民政府内政部1932年公布的各省土地分配分组资料,计算过基尼系数,其中山西、河北、山东三省分别为0.350、0.330、0.292,虽然所用资料相同,但笔者计算的结果分别为0.515、0.519、0.499。而赵冈对河北、山东其他地权分配的研究结果显示,基尼系数却都较高。”赵冈的研究数据,同样受到丁骞的质疑。为什么利用相同的数据,计算结果却不同?

材料或数据相同而计算结果不同,除了计算本身出现错误,只能是因为计算方法不同而造成。首先,基尼系数的计算方法有多种,如几何法、平均差法、协方差法、矩阵法等。对于收入、财富以及土地分配,基尼系数的计算与洛伦兹曲线有关,以分配者的累计百分比为横轴(分配者以分配对象从少到多的次序累积),以分配对象的累计百分比为纵轴,在坐标中将对应的点相连接便可这样呈现一条向下凹的曲线,就是洛伦兹曲线,如图1所示。计算基尼系数,就是计算A与A+B的面积比。

再看基尼系数的计算方法对计算结果的影响。秦晖曾指出:“而就基本原理来讲则只有两种:或者洛伦兹曲线上有限的点连接成不连续的折线以近似地代表该曲线,或者用一条连续的拟合曲线来代表它。”不同方法的计算结果可能一致或接近,但不尽相同。理论上,相同分组用“折线法”计算的结果都应该相同,用“曲线法”计算的结果应该相近,但往往不尽相同,因为拟合洛伦兹曲线的函数有很多,不同的拟合方法,一般计算的结果也略有不同。理论上,用拟合曲线计算的基尼系数值要大于用折线计算的近似值,或者说前者一般要比后者精确(见图2),但不能以对错论之。除了是否拟合洛伦兹曲线,分组方法所包括的是否分组、如何分组、分多少组,也影响基尼系数的计算结果。由于分组多的折线更加接近于曲线,所以分组多比分组少计算的基尼系数更加精确(见图2)。

理论上,不分组也可以计算基尼系数,但是为计算方便,一般都要分组。另外,即使组数相同,由于分组标准不同,每组的数值不同,计算结果也不相同。虽然分组多计算更精确,但是为了便于比较,同一研究中分组的标准与组数应该尽量一致。

胡英泽对于关中地册的研究,地权分配基尼系数计算结果普遍要高于秦晖的计算结果,主要就是由于分组和计算方法不同所致。胡英泽称,秦晖与他计算赵渡镇《滩地事物公所民国17年东滩丈册》的地权分配(见表1)材料相同,所得基尼系数不同,分别为0.4763、0.5597。笔者对胡文中的数据,使用不拟合的折线法计算,得出基尼系数为0.5469,胡英泽的计算值略高于此数;而使用拟合洛伦兹曲线的方法计算结果为0.5561,更接近胡英泽的计算值。通过其他数据采用拟合和不拟合两种方法验证,说明胡英泽对关中地册的研究采取了曲线法即拟合洛伦兹曲线的方法。笔者以折线法计算《关中模式二》中的“武功县地权分配”,得出的结果相同,说明秦晖所用计算方法亦同,未拟合洛伦兹曲线。如果把表1相邻的组两两合并,变为6个组,计算结果为0.5148;同样方法将6个组变为3个组,计算结果为0.3970,由此可以推测秦晖的分组应在3—6组。

由于秦晖计算所依据的分组数据没有保留,无从得见其分组方法并验证结果。胡英泽在其《流动的土地:明清以来黄河小北干流区域社会研究》一书的“附录”中刊载了其所计算的关中地册的户数地亩统计表,可见其分组没有统一标准,多寡不一。所以,笔者认为,秦、胡二人计算结果不同,主要是由于计算方法与分组方法及组数不同所致,胡采取了拟合洛伦兹曲线的计算方法,而且分组多于秦,所以,计算的基尼系数普遍相对较高(详见表2)。同时也都可能有计算失误,胡的计算就存在少数计算数值略高的情况,例如赵渡镇嘉庆十年的数据(见表2),胡文的计算结果高于不拟合计算值9.48%,相对于其他数据略显偏高。

另外需要指出,近代地权分配的统计资料,一般分为两种统计模式或分组方法,一种是按阶级分组,一种是按家户拥有的土地面积分组,二者的计算结果往往相差不小,一般来说后者更为精确。不仅二者的组数可能不同,而且后者可能并非完全按照家户拥有的土地面积大小分组,导致二者的基尼系数计算值往往不同。以国民政府行政院农村复兴委员会1933年对浙江兰溪县新桥路、皂洞二村做的调查统计为例说明。二村地权分配的两种统计见表3、表4。

兰溪二村根据阶级分组按户计算所得基尼系数为0.547(以人口计算为0.442);根据土地面积分组计算结果为0.688,可见,后者要大于前者。这不仅因为后者的分组较前者多,还由于后者完全按土地面积由少到多分组,而前者并非全部如此,如无地户共有28户,但在以阶级分组中,占有土地最少的阶层“其他”仅有6户,说明有20多户无地户被统计到更高的阶层,可能造成这些家户组间的“重叠”,导致计算所得的基尼系数偏低。因此,按家庭土地面积分组的计算更为精确,更为可取。不过,按阶级阶层分组,只要土地数低一级组别土地最多的家户其土地面积低于上一级组别土地最少的家户,则不存在“重叠”的问题。

有鉴于此,笔者有以下几点建议:1.经笔者检验,史学界对地权分配研究多不拟合洛伦兹曲线,在分组不太少的情况下,使用不拟合的折线法计算地权分配基尼系数,确实简便易行;而使用哪种计算方法或是否拟合洛伦兹曲线,首先应该做到同一研究中方法一致。2.在利用基尼系数研究地权分配时,应直接或间接出示分组统计资料,一方面可供他人检查核对是否计算有误,另一方面,也方便他人进行比较与评价。3.分组统计时应尽量使得分组方法相同、分组组数相同;如果分组材料既定,则比较时应注意分组的不同。4.如果同一地区有按家户拥有的土地面积分组和按阶级分组两组资料,应优先使用前者计算基尼系数,而在使用后者计算时,应注意可能存在因分组较少与“重叠”问题导致所得基尼系数数值偏低。

(三)地权分配基尼系数的评价

计算出基尼系数之后,如何评价其反应的不平均程度?即多少意味着平均,多少意味着不平均?对于收入分配的基尼系数,其实并没有一个统一的评价标准,一般认为,基尼系数在0.2以下高度平均,0.2—0.3相对平均,0.3—0.4相对合理,0.4—0.6不平均,0.6以上非常不平均。胡英泽《近代华北地权分配再研究》照搬此评价体系,用来评价地权分配的不平均程度,可能同样也是基于这种认识,其《流动的土地与固化的地权》《再论“关中模式”》质疑秦晖的“关中模式”,认为关中的地权分配并没有那么平均。

针对《流动的土地与固化的地权》的质疑,秦晖回应道:“土地分配(相当于资本分配)的性质与收入分配不同,收入分配基尼系数达到0.5—0.6已经是分化很严重。但资本分配基尼系数为这个数值应当说还是很‘平均’的,因为与这种水平的资本分配对应的收入分配基尼系数通常只有0.2—0.3。”对此,胡英泽感到“令人费解”,《再论“关中模式”》中提到:“不能囿于基吉尼系数是计算收入分配、土地分配不是收入分配的认识,就生搬硬套,把土地分配视为资本分配,按照土地分配——资本分配——收入分配的转化逻辑,对正确反映土地分配的基吉尼系数再折算为对应的收入分配系数,这必然导致土地分配基尼系数降低和地权分散的推论,反致错误,也就违背了运用工具的初衷。”争论的关键,在于如何评价地权分配的基尼系数。

秦晖在《关中模式一》中指出,在租佃关系下,地主不能占有全部土地上的收入,佃农可以没有土地,但不可能没有土地上的收入,所以土地收入分配的不平均程度在逻辑上要小于土地分配的不平均程度。假设某农村区域全部土地上的农业收入分配的基尼系数不超过0.4,而该区域的土地分配的基尼系数可能会超过0.4,如果认为其收入分配平均,那么对应的土地分配基尼系数超过0.4,也应该认为平均。赵冈与秦晖的观点类似:“土地分配是财产分配,与所得分配不同。通常情形是,如果同一地区同一时点的所得分配资料与财产分配资料两均齐备,则财产分配之基尼系数要高出所得分配之基尼系数,因为财产可以孳生所得,而劳动力也可以提供所得。许多民户的财产可以是零,但所得为零之民户则绝少……在国际上的所得分配研究,公认基尼系数不超过0.4者都不能算是过分贫富不均。不幸我们没有国际财富分配之基尼系数可供比较。”简单说,秦晖认为土地分配与收入分配是两回事,用收入分配基尼系数的评价体系照搬来评价土地分配,并不适当;而胡英泽则认为应该用同一个评价标准。

首先,如果照搬或参考收入分配基尼系数的评价体系,需要了解收入分配基尼系数的计算方法。收入分配的基尼系数,由于计算方法不同,不同学者计算结果并不相同,也多有争论。经济学、社会学界一般都对洛伦兹曲线进行拟合;从分组来看,也并不相同,有采取五分法、十分法、二十分法等。计算基尼系数,可以按照户,也可以按照人来计算,但是由于家庭人口不同对家庭总收入的影响较大,按户计算,难以反映真实的收入水平,所以在计算收入的基尼系数时,普遍是以家庭(户)为对象,以家庭内人均收入进行统计计算。与收入类似,一个家庭地多,往往也人多,所以,以户为单位计算的地权分配基尼系数普遍比以人为单位计算的基尼系数要高。秦晖在《关中模式二》中曾计算过近代关中地区以户与以人计算的地权分配基尼系数的差别:“按人口分配的基尼系数一般为按户分配的基尼系数的60%—70%,以绝对值计,在中等分化(基尼系数<0.5)以下区间内按人口分配的基吉尼系数一般比按户分配的基尼系数要小0.13至0.16的幅度。”需要指出的是,各地家庭规模大小、人地比例等因素不同,以户与人计算地权分配基尼系数的差别幅度是不同的,并无固定标准。如果进行二者的换算,最好以相同研究区域内的统计计算差别幅度,再进行修正转换。所以,如果照搬或参考收入的基尼系数评价体系来评价地权分配时,应该是以人为单位,而不能以户为单位的计算结果进行直接评价。胡英泽在评价基尼系数所反映的地权分配时,所犯的错误是照搬了收入分配的评价标准,而其《近代华北地权分配再研究》《流动的土地与固化的地权》《再论“关中模式”》全部的数据都是按户计算的,并非是按人计算的。

《近代华北地权分配再研究》以户为单位计算晋、冀、鲁三省的地权分配基尼系数,分别为0.556、0.493、0.495,并照搬收入基尼系数的评价体系,认为“大致在0.5以上,地权分配很不平均”,这种评价是非常不恰当的。如果晋、冀、鲁三省的基尼系数以人为单位计算,那么数值将降低,大致上接近或低于0.4。以河北的地权分配为例,胡英泽《近代华北地权分配再研究》一文中以户计算的结果是0.493,从《近代华北地权分配再研究》取一个统计范围最广的数据,即董时进调查43县242村的统计数据,所得的基尼系数是0.562,高于《近代华北地权分配再研究》计算所得的结果。河北43县242村,按人计算地权分配基尼系数为0.403,其中无地户占10.03%,但是“无地户中,每户人口在3以内者居大半,但亦有15人以上者,此类大抵系从事其他种职业,非无业之贫农也”;据统计“专务农”和“务农兼他种职业”共计占户数的88.02%,其余为非务农户。无地户如果务农,除了当雇农则需租入土地经营,但是调查发现,“租地耕种者甚少,在2万余家种地户中,租入多少之土地者,仅1415户,约占6.5%耳。所租入面积合计为16529亩,不过占栽种面积2.8%”。董时进调查认为:“在此次调查所及区域内,土地之所有权,概分配于多数之小农,大地主极少。属于稍大地主之土地,仅占一小部分。”如果剔除非务农无地户的影响,则该调查以人计算所得基尼系数应该低于0.4。这从董时进指导的杨汝南对河北26县51村的调查,也可间接说明一二,26县51村的地权分配基尼系数按户计算为0.537(无地户占6.89%,《近代华北地权分配再研究》计算结果为0.530),无地户比例和地权分配基尼系数都略低于董时进的调查,而按人计算的基尼系数则为0.371。所以,河北的地权分配基尼系数以人计算大致不会高于0.4,而如果地权分配基尼系数不超过0.4,则不管从哪方面看都可视为分配平均。

其次,地权分配不同于收入分配,以收入分配的评价体系来衡量地权分配的不平均程度,并不合适。秦晖所述,不过是一个常识:一般社会的资产不平均程度大于收入的不平均程度。以研究经济不均而享誉全球的皮凯蒂(Thomas Piketty)及其著作为例说明。他对收入和资本不均程度的评价如下:收入分配基尼系数为0.36时,一般认为分配比较平均,在皮凯蒂的评价体系中对应的是“中度不均”,相对应的社会类型是2010年的欧洲。所以,即使不看2010年欧洲的资本分配基尼系数已达0.67,而同是“中度不均”的资本分配类型的20世纪70年代斯堪的纳维亚半岛(挪威和瑞典),其基尼系数也达0.58,高于其收入分配基尼系数0.26。土地相当于资本,地租相当于利息,在市场上,土地和资本可以相互交易,在皮凯蒂的研究中,土地与股票、债券等都属于资本,收入包括劳动收入和这些资本的收入。即使认为土地不等于资本,评价土地分配也不能照搬资本分配的评价体系,更不能照搬收入分配的评价体系,因为传统时代的农村(土地可能算是最重要的资本),土地分配不均的程度更近于资本分配而非收入分配。

如何评价地权分配的基尼系数,除了参照收入或资本分配基尼系数的评价体系外,也许与其他区域、国家进行横向比较是较好的方法。但是横向比较时应该注意:计算方法一致;分组相同或接近;统计口径一致,如果家庭人口结构差距明显,最好以人为单位。

二、地权分配的统计方法和比较原则

研究地权分配,基尼系数是一个非常有利的研究工具,不过,在利用基尼系数时,必须遵循科学合理的统计方法,方能得出令人信服的结果。而统计方法的使用,必须建立在统计资料扎实可靠的基础之上。

(一)地权分配的统计方法

1.考辨史料不可忽略

考辨史料的真伪及其内容的真实性、可靠性,是史学研究不可忽视和不可或缺的基础工作,近代地权分配研究亦然。即使研究利用的是调查统计资料,也不可不加以分辨拿来就用。因为过去的调查统计良莠不齐,不可不察。

例如,胡英泽《近代华北地权分配再研究》一文所利用的屯留县调查资料,乃1934年高苗到各村询问小学教员所得。从常识上判断,小学教员不可能完全清楚所在村庄每家每户有多少人有多少地,而且高苗所统计的土地面积都是以千亩计,因此,估计的程度很大,精确度与可靠性值得怀疑。民国期间的地权分配统计资料类似情况很多,未经实际调查,或由地方人士上报形成,统计质量低劣,有的不堪利用。

再如,赵冈曾利用的满铁对河北邯郸的调查资料,胡英泽《近代华北地权分配再研究》一文亦利用之,调查对象为580户,其中无地户占比21.86%,地权分配基尼系数为0.655。不过,此调查与邯郸县土改前的调查(见表6)相比相差不小,土改前邯郸县的土地分配较为平均(以人为单位计算基尼系数为0.385)。当然,可能满铁所调查的580户情况特殊,而赵、胡两位将其列入所能收集的各种数据之中,方法上诚不为过。但是,如果数据规模较小或者以此代表邯郸的一般情况,还是会造成结果有所偏差。不仅满铁调查中邯郸无地户比例高达22%,远高于邯郸县土改前无地户仅6%的比例,而且满铁调查冀东23村无地户比例平均达30.64%,也远超董时进调查河北43县242村无地户所占的比例(10.03%)。胡英泽《再论“关中模式”》未辨析其中的差异及其原因,而是直接引用之,甚至认定冀省无地户比例较高,不免有失轻率。冀东23村调查(满铁调查中称20“部落”)为满铁第一次冀东农村调查,满铁调查者认为此次调查最大的问题就是缺乏统一的调查方法,对是否能代表冀东地区尚持怀疑态度。因此,研究者在使用调查数据之前,应该先对调查者的调查方法和口径等问题进行考察。

因此,在利用调查统计资料时,不可略过考辨甄别这一步。还有,不少资料是在先有地权分配不均等观点之后,挑选出来为论证其观点的,并非抽样意义上的样本,亦须注意。

2.贯彻统计原则

近代地权分配研究,首先应该贯彻统计原则,利用统计资料和方法。近代特别是民国时期留有大量甚至是“全覆盖”的地权分配调查统计资料,所以近代的地权分配研究首先应该依靠统计资料,即研究应该以统计数据为准为主,以文字描述为辅,例证基本无效。因为如果仅仅是文字描述,而无调查统计数据,就是估计或推测,可能与事实相差较大。之所以例证基本无效,一是因为某一区域,举出一个或几个地权分配集中或分散的例子,都并非难事,特别是结论在先的情况下,毫无科学性可言;二是,研究一个区域的地权分配,所举的例子,如几户地主占地多少、几个村子或几个县地权如何集中或分散,往往占该区域的相应比例太小,难以说明总体的情况。例如,胡英泽《近代华北地权分配再研究》为了否定民国时期山西地权分配分散的说法,其中一个论据是:“山西北部的繁峙县山会村、李家庄等村的调查资料显示,两村佃户的比例分别为60.3%、69%,自耕农并不占多数。再如山西南部农村占地规模常被认为较小,山西永济南冯留村共96户,耕地3512亩,其中,占地百亩以上的农户10户,占11.5%,占地面积为1615亩,达46%。占地200亩以上的农户2户,共占地470亩,户均占地达235亩。武乡县有421户地主,占地76900亩,其中20%是民国以后特别是1926后集中的。赵家庄的大地主赵太和,占地多达5400亩。”由于所举的“样本容量”太小,从繁峙2村、永济1村,无法得知两县与晋北、晋南的地权分配状况,而在武乡的总户数、土地面积不知的情况下,也很难判断武乡的地权分配是否集中,因而此例证缺乏论证力。

使用统计资料的同时,还应该注意使用统计方法,不然只是罗列一些统计数据,也几近于举例,不能得出符合逻辑的结论。刘克祥对20世纪30年代土地分配的研究,可以说使用了不少统计数据,但是基本没有运用统计方法,而是举例论证,最后估算了全国各省的土地分配情况。且不说使用的统计资料是否可靠,如果方法与逻辑欠严谨,结论自然难以令人信服。以山东为例,刘强调“集中是20世纪30年代全国地权分配的一般形态”时,是以峄县和栖霞的文字描述、馆陶的统计数据来说明;又论及“若干地区地权分散状态的存在”时,是以莱阳、牟平、德平、招远、平度的文字描述和平阳等12县的统计数据及52县的部分统计数据来说明。如此论证,很难得出集中是一般形态的结论。

因此,研究近代特别是民国时期的地权分配问题,应尽量利用统计资料,而同时一定要注意统计方法的运用。

3.基本的统计方法

因为土地区位和产量不同,土地的价值也各不相同,例如,苏南一亩水田的产量和价值往往数倍于陕北一亩旱地,而同一地区一亩上地的产量和价值也往往数倍于一亩下地,所以研究地权分配,统计地价是比统计土地面积更为可取的方法,但是受限于资料,往往难以实现,现实的研究一般都是基于土地面积的统计。

关于某一地域地权分配的总体情况,过去的研究多是罗列此地域内各种统计数据,有的罗列之后再求基尼系数的简单平均值,其实,统计研究地域内部不同调查数据基尼系数按户或按人的加权平均值是比较恰当的方法。当然,如果无法做到或不适合加权平均,简单平均或求中位数亦可。不过,需要注意数据之间不可重复或覆盖,例如,胡英泽《近代华北地权分配再研究》一文在论证山西农村地权分配时,已经统计了山西省屯留县的数据,屯留县丰宜村等3村的数据则已包含在内,所以就应该除去,不能再统计此3村,否则就有重复计算之嫌;河北定县统计数据中包括高村等4村、李镇等2镇,还有定县8村1386农户,定县一到六区和城关、定县各区453村,也有重复计算之嫌。赵冈对定县的统计似亦存在此问题。

另外,研究时将不同数据合并加总甚至重新分组计算,往往并不可取。假设两个地区的地权分配绝对平均,基尼系数都是0,但是由于两个地区的每户或每人拥有的亩数不同,若将两地归并在一起分组计算,则基尼系数必定大于0,与两地的情况都不符。虽然,不少数据多是史料给定的一定区域范围(如县域)的加总统计,不免有此问题,但是研究者再次加总往往导致数据进一步失真。另外,由于近代农村各地亩制不一,加总统计难免失之舛误。所以,研究时一般不要使用将不同统计数据合并加总的方法,而应该在原统计资料的基础上直接计算平均数等值。胡英泽《近代华北地权分配再研究》所采取的方法就是合并加总再重新分组的方法:“笔者对山西省有关各农户地权分配调查数据加以调整、合并,采取相同的农户占地等级分类标准,从而计算出20世纪二三十年代山西省的农户地权分配基尼系数为0.556。”这一方法存在的纰漏,除了上述可能的问题外,还有就是:将31个村的统计数据与3个县的数据加总统计,由于前者数量之小、可能不足后者的5%,所以并不会改变3县所反映的土地分配状况,换言之,就是胡英泽《近代华北地权分配再研究》加总计算所得出的山西省地权分配的基尼系数,其实几近晋北的阳高县、晋东南的平顺县和屯留县的情况。《近代华北地权分配再研究》计算所得的3县的基尼系数,简单平均为0.549,非常接近胡计算得出的山西省的数据0.556。

有的同一县地理环境不同,如山地和水田差异很大,加总统计也会出现问题。胡英泽《近代华北地权分配再研究》计算浙江省龙游县的地权分配基尼系数为0.884,为浙江最高。龙游县“境内有群山分布,东南部尤多”,“山地面积约占全县总面积百分之五十”,部分山区农村山地面积较大。龙游8村中占地100亩以上的农户6户,占地3127亩,占全部土地的61.9%,但这6户全部在楼下、石亘二村,这二村的基尼系数分别为0.994、0.879,超过8村合计的值,而其余6村全部低于8村合计的值。可见,由于楼下、石亘二村人地结构相对特殊,将8村合并加总的统计方法,实际上使得8村数据所反映的情况更加接近于楼下、石亘二村;而8村以户计算的地权分配基尼系数,加权平均值为0.756,中位数为0.745。因此,研究者最好不要加总数据计算,而应在原统计数据的基础上计算平均数等值,一般作为初步计算的区域层级越低,计算结果越精确。

因此,研究较大地域范围内的土地分配,由于内部不同区域涉及地权分配的自然、社会环境差别可能较大,分区域调查统计,再计算平均数等值,较为可取。最基础的调查统计区域应该以涉及地权分配的自然、社会环境相近为原则,否则将差异太大的不同区域直接统计在一起,会导致地权统计严重失真。

(二)地权分配研究的比较原则

对于同一区域地权分配的研究,往往不同学者的统计和计算结果并不相同,甚至大相径庭,孰是孰非,涉及统计的比较原则。当研究一个区域的地权分配,统计数据或样本往往不止一个,甚至还包含有不同级别的区域单位,对于研究结果的比较,应该遵循“从总”或“从大”原则。

1.“从总”与“从大”的比较原则

所谓“从总”,就是研究某一区域地权分配,以该区域总体统计为最准确,也应该是尽量追求的目标。如果无法获得区域总体的统计,一般来说,范围较大的数据更接近总体的情况(还应该考虑分布状况),也最具有代表性,是为“从大”原则。

区域总体的地权分配,反映的是该区域总体或平均的情况,并非“全程判断”或“全称陈述”,即并非是该区域全部单位地权分配都平均或集中,即总体的统计,包括了各个不同的单位的地权分配,如果总体分配平均或集中,可能会有少部分单位分配集中或平均,但部分的特殊无法质疑总体水平。这本是基本的逻辑,但是胡英泽对“关中模式”的质疑全然罔顾这一原则。

《关中模式一》论证了土改前以及民国期间,关中地区地权分散。那么,上溯到清代,从逻辑上讲只有两种可能,一种是清代关中地权集中,但是趋于分散,到民国时,地权变得分散;另一种是清代关中地权同样分散(可能程度有所不同)。秦晖持后一种观点,即清代关中地权分配也分散,其《关中模式二》以地方史志和关中东部地册文书作了论证。胡英泽《流动的土地与固化的地权》重新计算地册文书中地权分配的基尼系数,得出了不同的结果(见上文),并指出“关中模式”所利用的关中东部地册仅为黄河滩地地册,这些村庄的耕地由滩地、塬地构成,滩、塬地权状况不同,而且“这些地册存在塬地面积缺失、滩地面积动态变化不准确、所录滩地田块不全面等问题,据此研究沿河村庄的地权会有很大的局限”,“会导致地权统计以偏概全”。胡英泽注重自然环境对地权的影响,在史料上下的功夫以及这方面的研究发现基本值得肯定。不过,且不说地方史志的记载,只是地册文书中其实可以比较的只有8村11个数据,即使不考虑前文提出的计算方法与分组不同等原因,胡在《流动的土地与固化的地权》一文中也认为雷村、下鲁坡、加里庄、张带村、寺南里五村二人的计算“稍有出入”“基本一致”,只是赵渡、广济村、东林村“相差甚大”。除了分组组数不一,还存在少数拟合计算数值偏高的问题,由于总体上分组较多,因此,胡英泽的计算结果应该更为精确。可是,《流动的土地与固化的地权》所有数据按户计算的基尼系数平均值为0.4604,相比秦晖计算所得的0.3514虽高,但是这一数值如果转化为按人计算的话,应该低于0.4。《流动的土地与固化的地权》也承认“这些地册确实反映了地权分散现象”,但是同时称,“清初至民国,关中东部既有特殊背景的地权平均,又有家户私有的地权不均,地权分散与集中现象并存,这和‘关中模式’地权分散的观点相矛盾”。可见,正是其以内部的差异质疑总体的平均水平,造成了这种错误的认识;而且利用相同资料质疑秦晖以偏概全的同时,又总结出自己的结论,并不适当。

《再论“关中模式”》则一方面提出地权研究的“资料的时间、空间匹配性”,提出若要论证清初至民国关中地权分配与土改前的“关中模式”一致,需要搜集和土改前“关中模式”在空间上相对应地权分配史料;另一方面进一步质疑土改前民国时期的“关中模式”,以黄河边1945年2保8个村庄的土地分配情况来否定民国期间包括土改前的“关中模式”或关中东部地区的“关中模式”。研究同一区域不同时段的地权分配,需收集相应时间和空间上规模相当的资料,自毋庸赘言,但是,历史研究以史料为基础,经年历久,历史记忆和史料不可再得,所以实际的研究往往是以局部的数据——相当于抽样调查样本——来推测所在区域总体的情况,这在研究中颇为寻常,诚如秦晖的回复,“这是历史研究本身常见的局限”。《关中模式一》说明关中地区民国时期地权分配状况,利用的是国民党政权农村复兴委员会与日伪时期满铁的调查、国民党政权编制的1941年合阳县河西乡“农会名册”和地政学者马玉麟关于武功县的调查,论证土改前的“关中模式”则利用了渭南和宝鸡地区20几个县的土改档案统计数据。《再论“关中模式”》中8个村庄所在的朝邑县地权分配的基尼系数为0.1570,应为朝邑县包括所有村的“总体”统计,而且朝邑县所在的渭南地区第一批与第二、三批土改的农村土地分配基尼系数分别为0.2218、0.1973。《再论“关中模式”》以8个村庄的数据来质疑民国时期的“关中模式”,认为“应该与民国时期的‘关中模式’同地、同条件”,如此偷梁换柱,时间、空间上又如何匹配呢?胡英泽也承认:“当然,我目前所接触的同地、同条件的资料还很有限,涉及村庄所涵盖的空间范围还较小,至于更大范围内的常态地权分配研究,尚有待于新资料的发现和运用。”胡英泽建议秦晖论证清代的关中模式需要收集与民国时期空间上匹配的大范围数据,而自己质疑民国时期包括土改前的“关中模式”却只利用8个村的数据,不免有“双重标准”之嫌,结论自然也难以令人信服。

2.再论近代华北的地权分配实态

关于华北的地权分配,《近代华北地权分配再研究》“对现有中外调查资料进一步计算,三省的农户地权分配基尼系数分别为0.556、0.493、0.495”,认为“20世纪二三十年代,晋、冀、鲁三省乡村农户地权分配的基尼系数大致在0.5左右”,“说明三省乡村农户地权分配很不平均”。以下,笔者将以更大规模的数据,来重新计算抗战前山西和山东的地权分配基尼系数。

《近代华北地权分配再研究》以平顺县、阳高县、屯留县3县以及14个县的31个村的调查统计资料(绝大部分为1935年《新农村》《农村建设》所刊),计算出山西省地权分配的基尼系数为0.556。赵牟云不同意胡英泽的观点和研究方法,利用比胡更多的数据,计算抗战前山西地权分配的基尼系数为0.343(按人计算)。不过,赵牟云的计算中亦有重复计算之嫌。笔者仅取一个大“样本”来论证中共根据地所调查的抗战前山西土地分配情况,见表7。

表7的调查资料与《近代华北地权分配再研究》的统计可谓是同一时期,而且户数远较大于3县加31村,还分布广泛,以户数计算基尼系数为0.428,以人口计算为0.333(皆除去“公有地”计算),较《近代华北地权分配再研究》计算的数字低不少,所显示的山西战前的土地分配应该算是相当平均。所以,根据“从大”原则,《近代华北地权分配再研究》的统计以及计算结果,不及表7的计算结果精准,或说更加接近山西总体的情况。况且,表7是建立农村根据地、强调土地分配不均的中共所调查得出,应该非常可靠。

《近代华北地权分配再研究》计算山东省的地权分配基尼系数为0.495,与河北省极为接近,所利用资料为邹平1434户农户的调查统计和民国东明县、馆陶县县志中的数据以及1932年国民政府内政部所编《内政年鉴》中山东省的土地分配数据。邹平县的统计数据乃乡村建设研究院调查部调查所得,应该非常精准,胡以户计算基尼系数为0.501,则以人计算应低于0.4。笔者举两则统计数据:“建国初期(1952年),中共山东分局组织暑期农村经济调查委员会,对19个县的8个典型乡和41个典型村进行调查的情况表明:抗战前山东地主占总户数的3.3%,占有土地19.3%;富农占总户数的3.8%,占有土地11.32%;中农占总户数的39.23%,占有土地46.45%;贫农占总户数的46.95%,占有土地21.72%;雇农占总户数的6.4%,占有土地1.1%;其它占总户数的0.31%,占有土地0.15%。另据山东省统计局1957年统计,1936年山东全省总耕地面积为12585.7万亩。其中,地主占人口的4.7%,占有土地19.3%;富农占人口的5.7%,占有土地11.3%;中农占人口的43.1%,占有土地46.4%;贫雇农占人口的46.1%,占有土地22.8%”。这两组数据应该比民国时期政府的统计数据更准确可靠,前一组数据,按户计算地权分配基尼系数为0.406;后一组数据是山东省的全统计,按人计算地权分配基尼系数为0.320。

可见,以更可靠和更大范围的数据重新计算晋鲁二省的地权分配基尼系数,结果数值都比较低。尽管上文重新计算晋鲁二省的地权分配统计资料为阶级分组,有略微偏低的可能,但参照上文河北的统计和计算结果,可以得出,抗战前华北山西、河北、山东三省农村地权分配以人计算的基尼系数应接近或不高于0.4,地权分配可谓相当平均。近代华北地权分配平均,不过,与“关中模式”的研究对比,华北应该不及关中平均。

结论

近代地权分配研究,不仅需要对前人留下的统计材料进行考证分析,而且需要使用科学合理的研究方法,唯此才能得出正确研究结论,接近历史真貌。

引入基尼系数研究地权分配,不仅可以清晰度量地权分配的不平均程度,可以比较不同地域之间与同一地域不同时段之间的地权分配状况,还可以在一定程度上避免阶级分组统计地亩的局限,优点颇为明显。对于同一资料,不同的计算和分组方法,所得出的基尼系数不尽相同,因此,在分组与计算时,应该注意方法的一致。通过基尼系数来评价地权分配的不平均程度,并无一定标准,直接照搬收入分配基尼系数的评价体系,并不适当。如果参照收入分配基尼系数的评价体系,地权分配基尼系数需使用按人而非户计算的数值。

研究近代地权分配,应尽量采用调查统计材料,使用统计方法,而以文字描述资料为辅,例证基本无效。由于自然和社会环境的差异,应采取区域研究的方法。对于原始的调查统计资料,应该直接计算基尼系数,再以适当的方法求取研究区域的平均数等值,而不应自行加总或重新分组计算。比较同一区域不同资料的研究结果,应该遵循从总、从大的原则,即总体的统计或数据规模更大的统计最能说明区域总体的一般情况。在此原则下重新计算证明,近代华北地权分配比较平均。因此,近代地权分配值得重新认识,而正确认识需要建立在科学合理的研究方法之上。

 
 
打赏
免责声明
• 
本文为会员发布,作者: 来自互联网。欢迎转载,转载请注明原文出处:http://www.zneh.com/znkb/show-367806.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们。