陈志武 | 为什么我们需要量化历史研究

由马光（搬运工）
22 4 月, 2018

历史研究领域的与时俱进

2013年，笔者与清华大学龙登高、伦敦经济学院马德斌、香港科技大学龚启圣等教授一起举办了第一届量化历史讲习班。之后，我们每年办一届。与四年前相比，报名人数越来越多，国内学界对量化历史研究的认知和兴趣也有了很大的变化。

按照经济史学者诺斯的追溯，用量化方法研究经济史问题大致起源于1957年，当时几位学者尝试研究美国黑奴历史的经济逻辑。随后，量化方法也用到了其它历史研究领域，包括诺斯对欧洲政治制度史、西波拉对西方教育史与宗教史的研究。到1960-70年代，量化史学变得流行，后来这股风潮又有所消退。但1990年代中期后，新一轮量化历史研究热潮再度崛起，引人注目。就以国际五大量化历史数据库为例(美国整合公共微观数据库IntegratedPublicMicro－dataSeries、加拿大巴尔扎克人口数据库BALSAPopulationDatabase、荷兰历史人口样本数据库HistoricalSampleoftheNetherlands、瑞典斯堪的纳维亚经济人口数据库Scandina－vian Economic DemographicDatabase和美国犹他人口数据库U－tah Population Database），2006—2010　年间，新发表的学术论文中运用这些数据库资料的就达2360余篇（梁晨、董浩、李中清：《量化数据库与历史研究》，《历史研究》，2015年第2期）。

催生新一轮量化历史研究的经典作品主要来自经济学领域。而且，在如何利用大数据论证历史假说方面，经济史学者做了许多方法论上的创新，改变了以往社会学家、人口学家只注重历史数据描述性分析、相关性分析的传统，将历史研究进一步往科学化的方向推进。

今天，计算机和互联网已相当普及，不仅许多历史资料的数据库化变得可能，而且使这些历史数据库的跨地区、跨国共享也成为可能。在互联网上，可以免费得到数不清的各国历史资料库，用起来方便，成本也低。这是以前的历史学者做梦也想不到的。

过去十几年，笔者与彭凯祥、袁为鹏、林展、何石军等团队，一直致力于建立中国民间借贷利率史数据库、婚姻与妻妾交易数据库、历代皇帝与反腐数据库、契约文书数据库。此外，也有不少同仁在建立历史数据库，包括“中国历代人物传记资料库”（CB－DB，由哈佛大学、台湾中研院、北京大学合作建设）、“中国地方历史文献数据库”（由上海交通大学建设）、“清代灾荒纪年暨信息集成数据库建设”（中国人民大学夏明方主持）、“清末民国社会调查数据库”（中国人民大学黄兴涛主持）、“数据历史黄河”（陕西师范大学建立的黄河流域各地的历史地理、气候、社会、灾荒等资料库），还有中国科学院地理所、复旦大学、北京师范大学等等分别或合作建立的历代或近代气候与灾荒历史地理数据库。

当然，众多量化历史数据库只是研究的基础，关键要看研究方法与分析框架是否跟得上。许多同仁提出，量化史学不是曾经时兴一段，但后来势头又下降了吗？这次为什么会不同呢？我们必须看到，1980年代之前电脑没有普及，更没有互联网，那时整理历史大数据很难，做统计回归分析并检验假说也很难。但是，现在没有这些问题了。

今天“大数据”是个时髦话题，可是，很多人没有看到历史资料是真正的大数据。比如，仅清代刑科题本档案就有近60万本，平均每本大约30页手稿，加在一起就是1800万页资料。更不用说其它明清及民国期间留下的奏折、公文、实录、文书、契约、方志等史料，加在一起至少有数亿页。

采用细读个案的传统历史方法，不仅会让我们偏重树木而忽视森林，而且，当历史资料规模超过一定水平时，这种方法很难行得通。海量历史资料带来两个现象：一是由于传统方法强调细读一手史料，近代史比远古史更难研究，因为明清资料太多而古代资料很少，只有靠引入新的研究方法才能改变这种奇怪局面；另一现象是由于传统方法强调个案细节、不强调大样本，但历史上的社会现象又错综复杂，研究者很多时候都能根据需要挑选到“合意”的历史案例。所以，在不同学者根据需要去找合意个案的习惯下，得出的结论当然各异，就有了“历史被任意化妆”的嫌疑。我们需要改变这些现象，就要靠大样本量化方法。

因此，量化史学不是热潮不热潮的问题，而是史学研究必须探求的新方法。否则，我们难以适应新技术带来的便利和挑战。中国历史资料丰富，这是中华文明的优势，但是，要发挥这种优势、增加我们自己乃至全人类对我们过去的认知，就必须改进研究方法。量化历史方法既受益于现代互联网技术，也受益于现代社会科学分析范式的进步，是历史研究领域的与时俱进。

接下来，本文将回答以下几个常见疑问：第一，量化历史方法跟传统历史方法是什么关系？第二，历史能够量化吗？第三，1990年代末期以来的量化历史研究方法跟之前的区别在哪里？最后，量化史学除了证明或证伪传统史学提出的假说外，能带给我们对历史的新认知吗？

对传统历史研究的补充

量化历史方法不是要取代传统历史研究方法，而是对后者的一种补充，是把科学研究方法的全过程带入历史领域。

量化史学和传统历史学研究，同样注重对历史文献的考证、确认。如果原始史料整理出了问题，不管采用什么研究方法，由此推出的结论都难言可信。两者的差别在于量化方法会强调在史料的基础上尽可能寻找其中的数据，或者即使没有明显的数据也可以努力去量化。

不管是自然科学还是社会科学领域，科学研究方法的基本流程是一样的：第一步是提出问题和假说；第二步是根据提出的研究问题和假说去找数据，或者通过设计实验产生数据；第三步是做统计分析、检验假说的真伪，包括选择合适的统计分析方法识别因果关系、做因果推断，避免把虚假的相关性看成因果关系；第四步是根据分析检验的结果做出解释，挖掘清楚“因”导致“果”的实际传导机制甚为重要。为给出令人信服的解释，既可通过统计方法认证逻辑传导机制，也可通过简单数学模型验证传导机制的逻辑一致性；第五步就是写报告或者文章，把科学过程研究出的结果报告出来。

传统的历史研究范式基本停留在上述科学方法的第一步和第二步，要么先提出问题或假说，觉得“历史应该是这样”，然后去找历史个案或少数几个案例，只要假说与这些个案相符，就认为假说对历史的解释是成立的；要么先通过对历史个案的透彻研究，得出关于历史现象中因果关系的假说或猜想，认为历史中就是这样由这个“因”导致那个“果”的，然后研究就到此结束。

史料整理是建立历史数据库的基础，在没有经过大样本检验之前，这些假说和猜想还仅仅是假说，不一定真的成立。量化研究是在传统研究方法的基础上，把科学方法中的第二步（收集大样本数据）做好、做完，并且把第三步、第四步也做完。只有这样得到的历史现象背后的“历史规律”，才能避免“以偏概全”。所以，量化历史方法是对传统方法的补充，而不是取代。数据是量化研究的基础，但只是其中一个环节，同样重要的是要根据历史大数据对我们感兴趣的猜想进行统计检验，看这个猜想是否能得到大样本的支持，而这一点是传统历史方法难以做到的。

过去，胡适先生也讲过“大胆假设，小心求证”，只不过当时他所讲的求证，还只是一般的寻求证据（主要是文献方面的），并不是统计学分析与大样本检验。比如说，到底是什么导致清朝灭亡？一种假说（仅仅为假说）是：因为晚清立宪改革所致，并据此得出结论说“不能进行宪政改革，因为宪政改革导致国家灭亡”。根据清朝的个案经历得出这样的结论，就好比“阿炳二胡拉得好，是因为他是瞎子，所以任何人要拉好二胡，必须先把眼睛搞瞎”，显然是以点带面。我们必须先收集中国与其他国家的宪政改革历史样本，进行系统统计检验，排除个案的特殊因素，让样本中的共同因素——宪政改革——突出出来，凸显“历史规律”的内涵，这样才能知道这个假说到底能否站住脚。

难以量化不等于不能量化

在历届量化历史讲习班及其它交流中，一个经常听到的问题是：历史能够量化吗？初看，问得有道理，因为许多历史现象和因素确实难以量化。但是，难以量化不等于不能量化，尤其不等于要放弃想象力和创新的努力。

以香港科技大学龚启圣和山东大学马驰骋最近的一份研究为例，他们的核心问题是如何测度儒家文化的影响并评估其实际贡献。我们都说儒家文化过去两千多年对中国社会贡献巨大，是中华文化的基础。但如何证明儒家文化的积极作用？其发挥作用的方式或者说机理到底是什么呢？

儒家文化的成本很高，尤以对个人自由与权利的压制为突出，其核心原则是以君与臣、父与子、夫与妻的“三纲”为基本出发点，把每个人从出生到死都固定在一个根据辈份、年龄、性别决定的名分等级秩序之中。基于儒家名分等级秩序所实现的资源分配结构、收入分配体系，要求个人特别是女性牺牲这么多、代价这么大，带来的贡献是什么？贡献有多少？学术领域鲜有对这些问题的量化答案，原因当然是文化很难量化。

龚启圣、马驰骋尝试用间接代理指标来量化“儒家文化影响的强弱”，亦即，用各县文庙或孔庙数量测度儒家文化的影响强弱：孔庙越多，儒家在当地的影响就越强。此外，自汉代开始，政府实施旌表节烈妇女的制度，但直到宋代以前，妇女守节、殉节的现象有但并不普遍，再嫁、改嫁行为也还经常发生。宋代理学家程颐、朱熹按照“存天理，灭人欲”、“饿死事极小，失节事极大”的思路，强调寡妇再嫁就是失节。朱元璋1368　年创立明朝后，即颁布诏书：“民间寡妇，三十以前夫亡守志，五十以后不改节者，旌表门闾，免除本家差役。”1723　年清廷规定：“节妇年逾四十而身故，计其守志已逾十五载以上，亦应酌量旌奖。”于是，清代的旌表标准缩短至守节十五年，其后又分别于1824　年和1871年进一步缩至十年和六年。正因为守节是儒家“养子防老”体系的价值延伸，一个县的烈女数量也大致能反映当地人对儒家文化看重、遵守的程度。就这样，他们找到了量化儒家文化的两个代理变量。

龚启圣、马驰骋研究的目标是清代1644-1910年间山东107个县的农民暴动情况，看儒家文化是否会显著降低各地遭遇灾荒冲击时农民暴动的冲动。通过检索《清实录》历史档案，他们发现，这期间山东南部各县农民暴动最频、次数最多，其次是青岛周边山东东北角的这些县；而孔庙数量的分布则倒过来：中部各县孔庙数量最多，南部和北部县最少。在排除各种其它因素的影响之后（包括每个县的收入水平、起初发达程度、教育水平、社会流动性等），受儒家文化影响越深的县（即孔庙数量或烈女数量越多），即使遭遇灾荒冲击（通过粮价高低测度灾荒严重度），其在清代农民暴动的频率也更低。

而之所以有这样显著的结果，机理在于：儒家文化影响深的地区，家族宗族网络越强，在面对灾荒冲击时宗族内部互通互助的程度就越高，亦即隐性互相保险的程度就越强。这就减少灾荒迫使农民走投无路、求助于暴力的必要性。在缺乏保险市场等金融产品的社会里，儒家文化就是这样促使社会稳定、减少暴力冲突的。

或许我们可以对他们的量化研究提出质疑或者提出改进建议，但是，他们的创意价值显而易见，不仅增加了我们对清朝历史的理解，而且给我们提供了研究儒家文化以及其它文化的新方法。

另一个用量化方法研究文化史的范例是针对韦伯《新教伦理与资本主义精神》中学说的研究。在1905年出版的这部经典著作中，韦伯基于个案定性论述了资本主义之所以发生在西方，是因为16世纪“新教改革”。但是，他的学说在当时没有得到量化检验，只是解释资本主义为什么发生在西方的众多学说之一。

如何检验韦伯的新教伦理命题呢？由于今天没有哪个国家是纯粹的新教国家，所以，只能大致上按新教徒是否占比最高把基督教社会分为“新教”和“天主教”两组，同时在量化研究中尽量以新教徒占人口之比为反映新教文化的代理变量。这样，英国及其前殖民地美国、加拿大，荷兰、丹麦、瑞典、挪威和新教改革发源地德国等，这些以新教为主的国家构成“新教”国家组，其中美国、英国、加拿大、澳大利亚、瑞士受加尔文宗影响尤深；相比之下，欧洲南部国家及地区，如意大利、西班牙、葡萄牙、法国南部，还有各拉美国家、菲律宾等西班牙与葡萄牙的前殖民地，都以天主教为主，这些国家构成“天主教”国家组（亦即拒绝16世纪新教改革的社会）。

到20世纪，这两组国家的差别显而易见：新教国家的人均收入最高、金融市场最发达、民主法治最完善。天主教国家虽然总体上也富有，但在许多方面落后于新教国家，尤其是西班牙，直到1975年才走出长达几世纪的混乱！佩雷菲特在《信任社会》中，从多个维度比较了16世纪以来新教国家与天主教国家的差异表现。在20世纪里，每百万人口得诺贝尔奖人数、20世纪人口密度与城市化、政府清廉指数以及综合竞争力这些指标上，新教国家都排在前面。

为什么20世纪新教国家超越天主教国家那么多呢？历史学者结合定性和定量分析对其做了深入阐释。16世纪新教改革前，天主教主导并规范欧洲社会的方方面面，连笑都受管制，追求利润的商业行为和金融就更受罗马教廷的规制了（佩雷菲特：《信任社会》，商务印书馆，2005年。其中，第5章专门介绍中世纪欧洲天主教的各项禁令，包括封斋期、四季大斋日、所有礼拜五的戒笑）。

在哲学层面，对人际间的互助与社会关系，天主教跟儒家的主张基本相同，就是以“义”而不是以货币化的市场交易规范人与人之间的互通互助，这就导致天主教对商业和金融的排斥。在《圣经》《申命记》第23章中，第20段说“借给你兄弟银钱、食物，或任何能生利之物，你不可取利。”如果教义不松动有关商业利润、出借获利的金科玉律，经济尤其金融市场是难以突飞猛进发展的。但是，到了16世纪，人们的现实生活已经离不开商业甚至金融，尽管这些活动只能在教会禁令的阴影下进行。这个背景加上罗马教堂的腐败为16世纪的新教改革奠定了基础。

历史学者看到新教伦理跟传统天主教的主要分岔在于两方面：一是新教允许甚至鼓励信徒发挥才华去经商，追求利润，包括从事金融放贷事业；二是鼓励信徒接受教育，让自己有能力读《圣经》并与上帝对话。根据这两点，量化历史学者得到的假说是：在16世纪之后，新教国家的识字率和一般教育水平开始超前于天主教国家，在人力资本方面取得优势，由此之后几个世纪里，在人均收入、社会综合发展等各方面超越天主教国家。

这样，研究的焦点就集中在比较新教与天主教国家之间人力资本，即识字率的差异上。但问题是识字率、教育普遍性这些历史数据如何获得呢？历史学者查到欧洲各社会婚书档案，看个体在婚书上是正式签名，还是只画了个“十”字或干脆声明“不会签字”，这跟中国人以前不读书识字的人画押签字一样。如果一个人能签名，就认为他能读书；否则，就认为他是文盲。根据佩雷菲特《信任社会》中图表的数据，可以看到，新教为主的瑞典、丹麦、荷兰、德国以及英国一些地方在1700年以前就达到半数男性脱盲，而英国北部、法国北部、比利时、奥地利则是18世纪完成半数男性脱盲，而意大利、西班牙、法国南部这些天主教社会半数男性脱盲则要等到19世纪甚至20世纪了！

另外，佩雷菲特《信任社会》中的数据还表明，到1850年为止，文盲人口占比跟新教徒占比之间是严格负相关的。由于新教教义反对教会的垄断，主张教徒自己读《圣经》，其对教育的重视就显得很自然。

针对分别受新教文化和天主教文化影响的两类国家做的量化对比研究，可以发现主要因为两个体系对教育的态度和政策决然不同而导致这些国家在16世纪后发展路径的大分流。也就是说，韦伯命题得到了教育历史数据的支持。

当然，我们可以列举更多文化史量化研究的著作，但基本结论是一样的：有许多表面看上去不能量化的研究课题，其实只要我们发挥想象力，还是可以找到代理变量，或者通过创造性研究设计把不容易量化的研究变得可以量化。

不仅仅是“用数据说话”

1950年代以及之后的几十年里，如果历史学者能用数据说话，那可能就算很前沿的量化历史研究了。诺斯、麦迪森、西波拉等历史学家，以及中国史学界的吴承明、何炳棣、赵冈、郭松义、李伯重等史学家，都是这方面的开拓者，包括估算GDP、收入、识字率、经济规模、耕地面积、城市化率、家庭数据等等。他们通过收集资料、量化各种指标，然后计算相关系数或者通过画图展示相关性，并把相关性看成因果关系，得出结论。相对于早期的定性研究而言，他们做的已经是非常量化的研究。当然，我们知道相关性不等于因果关系，他们做的主要是描述性的，完全的量化研究必须做更多，需要对因果关系进行统计检测。

也正因为以上原因，许多历史学者就说“量化史学只是把历史学家已经知道的结论用数据说一遍”！这是一个比较普遍的误解。统计检验的价值之一是让我们在针对同一历史现象的多种假说中排除一些假说、支持一个或几个其它假说，而如果没有量化检验的方法就很难做到这一点。

比如，关于传统中国社会的高利贷，解释就很多，既有剥削论，也有道义经济论、市场供需关系论等等。那么，到底哪一种假说更接近真实呢？以前，许多历史学者通过个案做了解释或佐证，但不管哪个朝代，借贷交易全国每天有那么多，交易关系和交易结局千差万别，佐证学者自己观点的例子应该都能找到。哪种假说最能反映其中的主要规律呢？

笔者与林展和彭凯翔利用清代1732-1895年间刑科题本中近5000命案记录（参见陈志武、林展、彭凯翔：《民间借贷中的暴力冲突：清代债务命案研究》，《经济研究》，2014年第9期。也参见林展、陈志武：《阶级身份、互联性交易、季节性与民间借贷》，《清华大学学报（哲学社会科学）》，2015年第5期），对民间借贷双方的关系进行了定量分析。研究发现，在借贷纠纷引发的命案中，一旦借贷利率高于零，被打死方为贷方的概率为60%，而且利率越高，被打死的是贷方的可能性也随之增加。这说明一旦发生债务违约，贷方面对包括生命风险在内的违约成本是不对称地更高。这一发现与传统“高利贷剥削”论和放贷者“超经济强制”论的推断相反。道义经济论可能最接近历史真实，因为在他们的借贷命案大样本中，如果借贷是无息，被打死的一方更可能是借方，借贷利率越高，被打死的一方越可能是贷方。而之所以是这样，一个重要原因还是在于哪一方有“道义制高点”、“哪一方理亏”。

这些基于量化研究的结论，一方面说明历史现象远比简单假说要复杂，另一方面说明高利贷的成因之一是民间借贷背后包含了不小的生命风险，这些高生命风险迫使借贷利率必须高，否则没有人愿意把钱放贷出去，这符合我们今天熟悉的市场逻辑。如果忽视契约执行时可能的暴力冲突所要求的风险溢价，人们可能难以完整解释民间借贷的高额利率。

再回到欧洲何以崛起的话题，Acemoglu、Johnson、Robinson于2005年发表了一篇经典著作《欧洲的崛起：大西洋贸易、制度变迁与经济增长》，在经济学界和史学界产生了轰动，也大大强化了笔者对经济史话题的兴趣。

关于欧洲的崛起或说西方的兴起，有许多不同学说，到底哪个学说更站得住脚呢？Acemoglu、Johnson、Robinson从大西洋贸易的角度提出新的假说并对其进行系统量化验证。首先，他们发现并不是所有欧洲国家和城市都在同时同步崛起，欧洲从1500年到1850年的兴起主要是因大西洋贸易国家（英国、荷兰、法国、葡萄牙、西班牙）而起，跟没有参与大西洋贸易的欧洲国家或地区关系不大。第二，同一时期，大西洋海港城市的增长远高于欧洲内陆城市的增长，而地中海海港城市的增长跟欧洲内陆城市并无明显区别。

当然，仅仅这些结果还不能完全告诉我们这种大分流背后的形成机制。尤其是他们注意到，O’Brien　等历史学者估算到来自大西洋贸易的利润实在太小，即使把黑奴以及从美洲运回的金银财宝包括其中，总的利润也太小，其本身远远不足以给欧洲带来大幅经济增长。鉴于这一点，Ace-moglu、Johnson、Robinson提出新的学说，认为大西洋贸易带来的直接利润只是一个方面，对长久发展更为重要的是这些利润培植了一批新富商人群体，这些新富会推动制约王权、保护私有产权的制度变革，使进一步的经济增长有了更好的制度保障。

那么，大西洋贸易模式以及16世纪之前各国的制度就很重要。这三位作者接着把英国、荷兰跟西班牙、葡萄牙、法国进行对比。西班牙、葡萄牙从15世纪末开始海洋贸易探险，就是完全由王室垄断，只有王室和利益相关者才能参与大西洋贸易，利润由他们独享，难以培植新的商人群体。相比之下，在16世纪之前，英国、荷兰的王权不是那么绝对，王权不能轻易侵犯私有产权或禁止私人参与大西洋贸易。这样，在英国、荷兰，大西洋贸易更能培植王室圈子之外的新富商人群体，由他们自发产生限制王权、保护私有产权的压力，促成体制变革。

为了验证这一假说，三位作者把各欧洲国家在 1500、1600、1700和1800年的制度进行量化打分，一国制度中每增加一项对王室权力的限制（比如，只有议会通过才能加税，大西洋贸易权由议会而不是国王控制）就加一分。结果，他们发现，一方面，参与大西洋贸易的国家在16世纪后对王权的限制显著增多，而且越往后增加越多；另一方面，在考虑到新教和天主教国家的差别后，大西洋贸易继续是非常显著的影响，也就是说，新教和大西洋贸易都对16世纪后的西欧产生显著影响，但彼此又不相同。

Acemoglu、Johnson、Robinson　进一步通过加入“16世纪之前对王权的限制指数”跟“大西洋贸易量”交互项的回归证明：欧洲崛起的主要驱动力是大西洋贸易和16世纪之前的制度条件。欧洲崛起的主力是那些16世纪初就不那么集权的、濒临大西洋并参与大西洋贸易的海洋国家。其中原因在于这些国家通过参与大西洋贸易培植了一大批新富商人，他们推动建立了有利于长期发展的产权保护制度，加强了对王权的制约。相比之下，新教改革发挥了一些作用（韦伯学说），但不如贸易与初始制度条件的交互作用那么显著。

因此，量化历史方法不仅仅是“用数据说话”，而是提供一个系统研究手段，让我们能同时把多个假说放在同一个统计回归分析里，看哪个解释变量、哪个假说最后能胜出。相比之下，如果只是基于定性讨论，这些不同假说可能听起来都有道理，无法否定哪一个，使历史认知难以进步。

带来新认知

有一个流行的说法，“量化历史研究只能对已有的假说做认证，但出不了新东西”，从前述Acemoglu、John-son、Robinson的研究中，我们已经看到这类质疑站不住脚。笔者用自己近几年的一些合作研究说明这一点。

在学界甚至社会中，对中华文明的悠久历史论著很多，也有大量中西文化对比的论著，但是这些论著基本停留在对中西文化经典的对比、定性讨论上，没有落实到具体的量化指标上。于是，就有了文化多元论的说法，“不同文化各有各的好”。但是，一个文化体系的优劣、一个社会文明还是不文明，最好是依据量化业绩指标来评估。而在这一方面，经济史文献做的比较多，从斯密到马克思、韦伯、诺斯、以及包括 Acemoglu、Johnson、Robinson在内的新一批经济史与社会史学者，都以经济表现尤其以生产率的量化指标对文化体系做了评估比较。

可是，除了物质收入之外，人类关注的还有“安全感”、“幸福感”这些未必跟物质收入100%相关的发展维度。而这些维度可以落实到文明化的具体数据指标上，比如每年每十万人口中有多少死于凶杀等暴力，一个“更文明”的社会应该是命案率更低的社会。关于暴力史的研究，目前基本都集中于欧洲社会，比如Gurr、Eis-ner、Elias等发现，自1200年以来，欧洲社会的命案率大约下降了60到100倍，文明化进程显而易见。

但是，关于中国的普通暴力史、命案率史，就我们所知，还是一个空白，没有系统的研究。基于此，笔者与彭凯翔和朱礼军做了尝试，利用清代命案要案档案中的黄册统计和题本数据等资料，建立并研究了1661-1898年间清代的命案率。研究发现，从康熙朝到嘉庆朝末年,中国命案率（不包括战争死亡）一直呈上升趋势，1820年后开始下降。可是，即使在普通人命案率达到高峰的1820年左右，每年十万人中只有1.6个死于一般暴力，而西欧同时期每年每十万人有4到8个死于一般暴力。也就是说，虽然欧洲自中世纪中期开始命案率一直在下降、文明化进程在进行，但是，到17至19世纪，其暴力死亡率还是远高于同期的中国，到19世纪末才接近中国。在这个意义上定义的“文明化”程度，西欧社会落后于中国。

虽然在比较中国和西欧普通人、普通社会的命案率时有以上发现，但是，在更高制度建设层面，结论又大为不同。笔者和林展对中国自秦朝以来658位皇帝是如何死的进行了系统研究(陈志武、林展：《真命天子易丧命？中国历代皇帝非正常死亡的量化分析与东西方比较》，耶鲁大学工作论文，2016年)，发现38%左右的皇帝死于非命，其中71%是死于亲戚或宫廷大臣之手。历代皇帝的平均统治时间为12.5年。在中国朝代历史中，每年皇帝死于非命的概率大约是十万之三千一百左右，比普通人死于非命的概率高1000多倍。按照剑桥大学对现代战场的定义，每年死亡概率超过十万分之五百的地方就是“战场”（battlefield），那么，中国历代皇宫里死于非命的概率是现代战场标准的六倍！

根据 Eisner对公元 600年至1800年间欧洲1513个国王的死亡经历研究，22%的欧洲国王死于非命，是中国皇帝死于非命比例的一半多一点；每年国王死于非命的概率大约为十万分之一千，是中国历朝皇帝面对的暴力死亡率的三分之一。比较积极的一面是，中国和欧洲的君主所面对的暴力死亡率，从一千多年前开始都在逐步下降，说明中西制度文明都在进步。

同样有意思的是，当笔者和林展把公元900至1500年间中国、伊斯兰国家和西欧国家的君主平均统治时间做比较（以一百年内的平均统治时间为准），那么会发现，西方国王的平均统治时间在900年时大约为15年，之后一直稳步上升，到1500年左右达到23年；而伊斯兰国家的君主平均统治时间，在此期间则从当初的18年一直下降，到1500年时降到11年左右；相对而言，中国皇帝平均统治时间从隋唐以来，一直在上下波动，没有达到一个稳定均衡状态。

按照Blaydes、Chaney所论述的，君主死于非命的概率、君主平均统治时间反映了一个国家的上层制度建设的状态。权力制衡、权力交接的制度架构越完善，君主权力越小，那么，君主死于非命的概率会越低（因为在那种情况下，杀死皇帝带来的好处越少，而代价可能越高），其执政时间也会越长，政局越稳定。在这个意义上，我们的研究表明，在上层制度建设方面，西方很早走上改良的发展轨道，而中国皇权体制却一直在摇摆中停止不前。

这些量化研究结果表明，或许由于在儒家文化之下，祭拜祖先带来的好处是普通乡村里“谁是权威”完全由三纲五常名分等级秩序决定，没有含糊性，使得乡村社会秩序很是稳定，暴力、命案率就不会太高，并且可能很早就低于同期欧洲的普通暴力水平，这是中华文明好的一面。但是，在国家治理层面，儒家建立的“真命天子”的权威并非不可以挑战，使君主的权威性很模糊、充满不确定性，所以，君主的生命安全和统治时间远不如同期的西欧。

从这些量化研究看，西方和中国的文明化历程很不同。儒家文化早于欧洲解决了社会底层的治理秩序问题，但儒家没有解决好国家治理问题，在君主传承等制度文化建设方面，欧洲更早地发展起来，使权力的分享与交接秩序更早地文明化，致使西欧君主的暴力死亡率很早就远低于中国皇帝。由此，我们看到，量化历史研究不只是帮助证明、证伪历史学者过去提出的假说，也会带来对历史的全新认识，引出新的研究话题与视角。

结束语

未来十年、二十年会是国内量化历史研究的黄金期。原因在于两方面，一是对量化方法的了解、接受和应用会越来越多，特别是许多年轻学者会加入这个行列。二是中国史料很多，但绝大多数史料以前没有被数据库化。随着更多历史数据库的建立并且可以低成本地获得，许多相对容易做的量化史学研究一下子就变得可行。所以，从这个意义讲，越早进入这个领域，越容易出一些很有新意的成果。

公认、统一的历史数据库对量化历史研究来说非常关键，是基础建设工作。就以金融经济学为例，1960年由芝加哥大学建立的“CRSP证券价格数据库”（Center　for　Research　in　Security　Prices）对之后世界金融学术研究起到了革命性的贡献，1960年代是金融学研究正式开始从经济学剥离出来的起点。原因在于，有了公认、统一并且学者都很熟悉的数据库之后，各路学者就不用花时间去争论数据来源是否可靠了，而是把精力和争论都集中在所研究的问题上。

金融学的经历对量化史学有很高的借鉴价值。所以，过去十几年我们团队一直致力于建立基础数据库，希望更多同仁也能共同努力，挖掘出更多历史数据库资源。这也需要各家历史档案馆、博物馆、文物馆给予帮助，如果他们把更多史料开放并电子化，那会是对历史研究、对中国社会功德无量的事情。

量化历史研究的发展也需要各家学报的支持，需要他们开放更多空间让这类论文发表，激励更多学者热情加入。同时，这也对历史系教学课程提出新的要求，历史学生都应该学习数理统计课。

最后，我们也应该看到，虽然量化史学强调使用现代社会科学尤其经济学的分析范式、重视大样本与统计方法，但是，量化历史研究不只是找到一组历史数据并对其进行回归分析，然后就完成研究了，而是也要认真考究史料、摸清史料的历史背景与社会制度环境。只有这样，才能更贴切把握所研究的因果关系链条和传导机制，增加研究成果的价值。

（本文标题为编者所加，发表时有删节。作者系耶鲁大学金融经济学教授、香港大学冯氏基金讲席教授、北京大学经济学院特聘教授zhiwu.chen@yale.edu）

标签:量化历史陈志武

陈志武 | 为什么我们需要量化历史研究

发表回复 取消回复

发表回复取消回复