歷史學研究中進行所謂「大數據」研究的條件尚未完全具備,但歷史數據卻擁有進行可視化(Visualization)研究的巨大潛力。1在 任何一個歷史研究分支中,一項研究如果占有、挖掘或產生了大量歷史數據,但卻未能以最適宜、最直觀和最具表現力的方式表達出來,將一定程度上影響其結論的 表達,導致結論被其他學者的曲解甚至損害其學術價值及學術價值的傳播——這無疑是一種巨大的浪費。合理審慎的數據可視化也許能在一定程度上幫助更深刻結論 的達成和學術成果的跨領域交流。
數據可視化由來已久,1987年美國國家科學基金委(NSF)在一份關於優先支持科學計算可視化的報告中,將可視化定義為「是一種將抽象符號轉化為幾何圖形的計算方法,以便研究者能夠觀察其模擬和計算的過程和結果」。2眾 所周知,地圖的歷史要比數據可視化長的多,而且應用更為廣泛。但是,現在有一種看法,認為可以將地圖視為數據可視化的一種。比如,2011 年,O’REILLY Media, Inc.的《數據可視化之美——通過專家的眼光洞察數據(Beautiful Visualization)》在國內出版。3系統介紹了數據可視化在數據挖掘過程中的重要作用。「一圖勝千言」,顯示了良好的數據展示和表達對於決策者的分析以及科學研究的重要性。在此書的第五章「信息映射:重新設計紐約地鐵圖」,作者認為:
地圖是已有的最基本的數據可視化的一種,我們已經有幾千年的地圖製作歷史。然而,我們並沒有把地圖作為理解複雜系統的一種工具並加以完善。4
歷史數據可視化的工作方興未艾。5但是具體到中國歷史過程或者歷史數據的可視化,目前主要是其他學科的學者來進行,比如地理學者,這無疑不是一種遺憾。6
而 如果被可視化對象是空間數據,這種可視化某種意義上可以視為地圖學(Cartography),換言之,在一定意義上,地理空間數據可視化可以被看作是數 字時代的地圖學。更進一步,如果可視化的對象是歷史時期的空間數據,則可稱之為某種方式的歷史地圖製作。在某些方面,地理信息系統(GIS)可以較為容易 的完成此種特殊類型——歷史空間數據的可視化。地理信息系統作為一種工具「侵入」或者「被吸納進」社會科學的趨勢已經是非常明顯,在流行病學、新聞傳播研 究、人類學以及宗教研究等領域發揮了非常大的作用,得到了很多以前的常規手段難以獲得的結果。盡管中國GIS的產業規模、GIS本身的研究水平都已經進入 世界最發達的國家行列,但在國內歷史學界GIS手段使用尚在積極探索的過程中。
在 歷史學分支中,經濟史是最為適合GIS使用,原因無它——二者都以數據為基礎。經濟史是最傾向於定量研究的歷史學分支,近代經濟史又是經濟史中數據最為豐 富的組成部分。但由於學科分類層面更近的血緣,歷史地理學比經濟史更早接觸GIS。如今,歷史地理學界大規模的使用GIS已經有十餘年的歷史。潘威等人在 回顧GIS進入歷史地理學研究10年中文章指出,歷史地理學使用GIS的深度和廣度尚很欠缺,這一現象已經為歷史地理學界內所認識。但最近10年來,歷史 地理學已經開始了具有自己特色的信息化和數字化之路。在歷史地理學界,滿志敏在歷史氣候和歷史地貌方面的研究是開端。此後,經多位學者不斷深入,現今已經 遍地開花結果。7中國歷史時期人口統計資料較為豐富,留有長時段人口數據,侯楊方和路偉東的中國人口歷史地理信息系統(CPGIS),是國內目前最成熟的人口GIS系統,擁有近代以及現代的多個時間截面的數據。8
除此之外,也有學者進行區域性的研究。如王均、陳向東、宇文仲基於GIS數據處理技術,對清時期陜西省內的縣級政區境界做出數字化建庫, 並鏈接歷史文獻中的縣級人口、耕地等專題數據, 進行了人口分布與人口密度、耕地分布與墾殖密度等方面的數據分析和制圖。9這 樣小區域的人口研究基礎——底圖以及人口數據都是較易獲得的。與之類似的,河南大學的史磊等人,以梁方仲《中國歷代戶口、田地、田賦統計》為基礎,以歷史 行政區域為基本單元,在GIS軟體中設計歷史數據庫,做到對歷史地理文獻數據的計算機管理和可視化制圖並進行歷史數據的空間分析,以輔助相關歷史地理研 究。此文首先使用Access建立常規數據庫,從書中的200多份數據表格中提取歷朝歷代各個年份的不同行政區域的人口、田地、賦役信息建立1個主表,其 餘相關信息通過建立相關副表來存儲和管理,以達到最大限度地挖掘利用歷史資料的科學研究價值的目標。後來,將Access的常規數據庫與ArcGIS數據 庫「連接」,可以做到以省為單位的數據管理查詢、地圖空間制圖和分析等功能。
中國測繪科學研究院的王均等人,以清代陜西歷史數據庫的建立為例提出了編制底圖及數據庫設計的原則和方法,並建立了以政區境界為主要內容的縣級數據庫。與之類似的還有王均等人、初建朋等人以及陳剛的研究。10城 市史在GIS使用方面的切入點較多。中研院史語所范毅軍研究員,自其《傳統市鎮與區域發展——明清太湖以東地區為例,1551-1861》(台北:中央研 究院,聯經出版公司,2005)的城鎮研究開始,就非常注重以精美的地圖展示商路和市鎮分布(蘇州、松江以及太倉二府一州地區出現的928個市鎮),其在 這方面是本領域的先行者。後來,其開始系統的建立台灣有關的歷史地理信息系統(或地理資訊系統)11,並有大量的理論性論述公開發表。12
經 濟史學界使用GIS的時間不長,但是經濟史學界卻早已經夯實可視化研究的基礎工作,對於計算機技術的關注也是遠早於歷史學界同仁的。最遲在1991年《經 濟史評論》(The Economic History Review)就已經開始對每年最新的信息技術進展對經濟學和社會科學的貢獻進行回顧。此時,編輯人員已經敏銳地認識到新的技術手段對研究方式的巨大改 變。但是,當時的技術條件還是很薄弱的。1986年,Association for History and Computing (AHC)成立,這個機構成為歐洲最為重要的進行歷史統計或曰歷史計算(尚不能稱之為歷史計量)交流平台。回顧1991年研究的文章將主要的篇幅放在數據 庫管理系統(DBMS)方面。DBMS在當時剛剛從軍用轉到民用,因此學界對其熱情很高。文章也介紹了dBASE和Open Access III等昂貴軟體,並分析了其在處理數據方面的異同點和各自的優劣。13此 後若干年,一直到1996年,都有類似的綜述性文章出現。1996年的一篇綜述第一次提到了萬維網(WWW)以及地理信息系統(GIS),但是並未進行深 入的介紹。畢竟當時二者均屬於初創階段,本身的發展尚未成熟,對其他學科的幫助也有限。此時的IT技術,對歷史學和經濟史學的幫助,停留在「紙和筆」的階 段。也就是說,IT技術,此時僅僅是異化了的紙筆,僅僅作為一種記錄載體存在,其計算功能還非常弱更遑論分析了。14
目前,經濟史研究領域,如下兩種方式利用GIS系統是最為常見的:
第一種類型,以GIS軟體或系統輸出佐證性或示意性圖鑒,作為背景介紹或開篇明義或延伸討論。比如,對1350年歐洲北部糧食運銷的研究。15又 如著名城市史學家安克強(Christian Henriot)一篇文章,研究的是上海市區內工業分布如何受到中日戰爭影響。戰前的租界是美租界黃浦江以北的楊浦區,英法租界在黃浦江以西蘇州河以南, 而大的工廠,基本都分布在河流兩岸而不是租界內部。1937年開戰後,蘇州河以北的閘北區域被密集轟炸,1938年之後得到快速恢復(fairly quickly)。文章力圖分析空間因素(以及背後的歐美-日-中不同管理者)在這種超速恢復中的作用(見圖1)。而在戰爭期間關門的企業,亦有其特殊的 分布區域。這篇文章是非常具有代表性的:GIS在大部分情況下,是作為一種「作圖工具」出現在經濟史研究領域。這樣的示意圖或者地圖,是眾多描述性史料的 可視化,具有較大的表現力和直觀性,也被稱之為「可視化敘述(Visual Narratives)」。
▲圖1 安克強文中所示關閉工廠的空間分布(原文圖4a)
類似的研究還有比利時魯汶大學建築系Greet De Block以及美國新罕布什大學歷史系的Janet Polasky兩位學者對比利時19世紀晚期輕軌和城鄉交通聯繫的研究。16比利時的基礎建設(鐵路和輕軌)對比利時的工業發展尤為重要,他將從鄉村和工廠便捷的聯繫起來,使得鄉村的農民可以快捷的進入工廠工作(見下圖2)。
▲圖2 19世紀比利時鐵路(黑色)和輕軌(紅色)空間分布(原文11圖)
本人亦有類似論文探討了近代郵政網點的空間分布狀況(見下圖3),分析了郵政網點在空間上的集聚狀況。17
▲圖3 1936年70178個郵政網點的空間分布(上圖)及熱力圖(heat map)
第 二種類型,文章的最主要結論由GIS軟體或者系統空間分析獲得。但是,從頭至尾完全利用GIS分析手段並得到結果的經濟史研究論文極為少見。經濟學者中龔 啟聖和顏色等對歷史和空間有濃厚的興趣,但是,在其研究論文中,還是計量模型發揮主要作用,GIS仍舊承擔更多的是「顏值擔當」的角色。這就是經濟史學界 GIS技術的利用現狀。經濟史研究領域,新方法和新的技術手段的運用層出不窮,是一個較為活躍的學術增長點。18因為GIS手段的特殊性,學者較多採用建立網站的方式進行WEB發布,較之以往的研究成果以學術期刊、學術專著的方式有所不同。
總 結來看,GIS的使用當然可以在較大程度上增加經濟史研究的空間維度,但是這需要特殊類型的經濟史數據——具有空間屬性的那一類經濟數據。這樣的數據,即 使是在當代經濟研究中亦屬不常見,在歷史研究中就更少之又少。因此,目前阻礙GIS更多地在經濟史中使用的最大困難就是數據。最近若干年,史學界有越來越 多的學者認識到建設數據庫的重要性,大量的數據庫比如:海關出版物數據庫、清代糧價數據庫、地方歷史文獻數據庫、人口數據庫慢慢地完善,這些數據庫的建設 才是GIS在經濟史研究中使用的關鍵步驟。
1 歷史研究中通常所使用的數據,幾乎無法符合「大數據」嚴格定義的任何一條,在數據量、數據的實時性和數據速度方面均無法稱之為「大數據」,本文主旨不在於此不再贅述。
2 B.H. McCormick, T.A. DeFanti, M.D Brown,eds., 「Visualization in Scientific Computing,」 Computer Graphics, Vol. 21, No .6(1987), p3.
3 〔美〕J. 斯蒂爾,N.伊利斯基編,祝洪凱、李妹芳譯:《數據可視化之美(通過專家的眼光洞察數據)》,機械工業出版社2011年版。
4 前引,第101頁。
5 牟振宇:《數字歷史的興起:西方史學中的書寫新趨勢》,《史學理論研究》2015年第3期。
6 謝麗:《民國時期和田河流域洛浦墾區墾荒、撂荒地的空間分布格局——基於歷史資料的信息可視化重建》,《地理學報》2013年第2期。王加勝、李滿春和劉永學等:《南沙群島歷史事件時空演化的可視化表達》,《地理科學》2015年第5期。王占剛、莊大方、王勇:《歷史事件時空過程描述及其可視化研究》,《計算機工程》2014年第11期。
潘7 潘威、孫濤、滿志敏:《GIS進入歷史地理學10年回顧》,《中國歷史地理論叢》2012年第27卷第1輯。
8 8 http://cpgis.fudan.edu.cn/cpgis/default.asp
9 9王均、陳向東、宇文仲:《歷史地理數據的GIS 應用處理—以清時期的陜西為例》,《地球信息科學》2003年第1期。
110 王均:《陜西省資源環境本底數據庫建設及GIS 在歷史地理研究中的應用設想》,《中國歷史地理論叢》2002年第9期;初建朋、侯甬堅:《基於GIS技術建立明清時期山西省人口耕地資料數據庫》,《唐山師范學院學報》2004年第3期;陳剛:《超媒體地理信息技術在六朝建康歷史地理研究中的應用芻議》,《南京曉莊學院學報》2004年第7期。
111 如台灣歷史文化地圖http://thcts.ascc.net/
112 范毅軍:《試論地理信息系統在歷史研究上的應用》,《古今論衡》1999年第2期;范毅軍、白碧玲、嚴漢偉:《空間信息技術應用於漢學研究的價值與作用》,《漢學研究通訊》2001年第78期。
113 Jean Colson, Roger Middleton and Peter Wardley. 「Annual Review of Information Technology Developments for Economic and Social Historians」, The Economic History Review, Vol. 48, No. 2 (1995), pp. 370-395.
114 James E. Everett. 「Annual Review of Information Technology Developments for Economic and Social Historians」, The Economic History Review, Vol. 50, No. 3 (1997), pp. 543-555.
115 Nils Hybel . 「The Grain Trade in Northern Europe before 1350 The Grain Trade in Northern Europe before 1350」,The Economic History Review, Vol. 55, No. 2 (2002), pp. 219-247.
116 Greet De Block, Janet Polasky.」 Light Railways and the Rural-Urban Continuum: Technology, Space and Society in Late Nineteenth-Century Belgium」, Journal of Historical Geography .Vol. 37, No.7 (2011), pp. 312-328.
17 本人工作論文,未發表,請勿引用。
118 王玉茹、張瑋:《國際經濟史學研究的新趨向—從第十五屆世界經濟史大會談起》,《山東大學學報(哲學社會科學版)》2010年第2期。
★再次對王哲和潘威兩位老師對「明清史研究資訊」的支持表示感謝!
作者簡介:王哲,南開大學歷史學院。
郵箱:humboldth@163.com。
顧問·約稿:@panwei 文字編排:@齊東野
来源:明清史研究資訊