首页 > 会议-讲座-招聘 > 回归传统:浅谈数字化时代的史料处理与运用
2016
04-10

回归传统:浅谈数字化时代的史料处理与运用

文|陈爽

作者为中国社会科学院历史研究所副研究员;

原文载《史学月刊》2015年第1期,注释从略。


过去30年,注定会被未来的史学史所浓墨重彩地大书特书的,不仅仅是思想解放带来的学术繁荣,还包括电脑和网络技术广泛应用所引发的研究手段的更新。30年间,古代历史典籍的载体大多已经由纸质书本转换为电脑可识别的文字符号,新一代学者对电脑写作和网络查询早已驾轻就熟,数字化检索已成为史学研究必不可少的辅助手段,史家对于史料的获取方式经历了亘古未有的革命。数字媒介的引入,促成了阅读方式和写作方式的改变,也使知识发现途径与处理手段都发生了变革。甚至有学者十分乐观地断言“一个有机会孕育‘e-考据学派’的时代或已出现”。

30年前,我进入大学历史系学习;20年前,我开始尝试使用电脑完成博士论文;15年前,我创办了史学专业网站象牙塔;10年前,我和几位同好开办以史学讨论为特色的往复论坛。3年前,我因时间和精力有限停止了网站的更新。我们这一辈人,追随着计算机技术在人文学科应用和普及的大潮蹒跚而行,体验了惊喜,经历了暄嚣,也见证了历史。驻足回眸,令人略感失望的是,当我们以数字化的方式在一定范围内(比如我所从事的汉唐历史研究)“穷尽史料”之后,我们所期待的“史料大发现”的时代却并没有到来,我们依旧要在那几部最基本史著的字里行间寻求突破;技术手段的更新,也并没有带来终极意义上的学术思维革命,前辈学者经典学说的理论框架短期内尚难以全面突破,我们所做的只是在修正、完善和细化。数字化时代的史学论著呈几何级增长,令人目不暇接,学者或成为局促在某一领域自说自话的“专家”或沦为批量生成“个案研究”的工匠。而那些立意格局令人耳目一新、闪烁着智慧之光的研究成果,却寥若晨星。

唐代史学家刘知几曾经提出过著名“史才三长”论,讲到“史才须有三长,世无其人,故史才少也。三长:谓才也,学也,识也。夫有学而无才,亦犹有良田百顷,黄金满籯,而使愚者营生,终不能致于货殖者矣”。身处“e-时代”的我们,不时会产生这种坐拥良田黄金却不能致于货殖的慨叹。我等以中人之资混迹史坛,就像武侠小说中那些内力平平的小人物,却因缘际会得到了无坚不催的屠龙宝刀,无尽情施展之本领,却有被祸伤身之隐忧。

数字化时代史学研究所面临的主要困惑之一,是史料的处理和运用。借助先进的电脑网络手段,我们可以快速、便捷地检索到大量史料,而受到知识结构、学术积累和理论修为的局限,我们却无法确保自己能够准确分析鉴别和合理地运用史料。要解决数字化时代史料处理中的问题,功夫在史料之外,考校的是史家的内在功力——才识和素养。数字化检索所引发的种种学术弊端,责任也不在新技术本身,而实质是史料与史学的关系问题在新的学术环境下的体现。中国史学有着悠久的历史传统和深厚的学术底蕴,电脑网络技术的出现,给古史研究提供了丰富的学术宝藏,入宝山而不取固然可惜,但不经提纯地过度开采,不仅浪费资源,而且破坏学术环境。要利用好这一宝藏,除了掌握好先进的电脑网络知识外,还必须具备扎实的学术功底,只有博闻强记,才能融会贯通。有鉴于此,在数字化时代,我们有必要提出回归传统,重温那些貌似过时的治史门径之谈,以前贤的经验与智慧应对数字化时代史学研究所遇到的挑战与问题。在此,仅围绕数字化时代史料的处理与运用等问题,谈几点个人感悟。

其一曰“读书得间”。王国维对于史学研究要旨的理解是“宜由细心苦读以发现问题,不宜悬问题以觅材料”。谢乃和先生曾经一针见血地指出数字检索史料的局限性:“e考据虽不能与新汉学派在史料学上有完备的理论体系相提并论,但治学路径则颇有殊途同归之处,即在专题研究的起点多有一个逻辑的‘预设’和清晰的问题意识,准此预设按序索引,材料一索即得。”通过搜索获得的信息是支离破碎的。无论哪个领域的历史研究,都需要对时代特征和历史脉络有总体的把握。数字检索不能替代读书,是学界的共识。老一辈学者总提倡“读书得间”,这里的“间”,是间隙之意,指除文字本身外,字里行间所包含的意思,以形容读书能对文字所描述的真正含义心领神会,在看似不相干的史料间建立起有机的关联,达到融会贯通。电脑网络所能够检索到的,只能是研究者预设了关键字词标签的“显性史料”,而那些出乎研究者预设范围之外、不包含所谓关键字词的“隐性史料”,往往深藏于史籍的字里行间,深藏在我们熟视无睹的史事中。最基本的史学素养,必须通过对最基础的原始史料的阅读来获得。网络时代的阅读方式是多样的,我们不一定非像前人那样抱着纸本掩卷长思,电脑浏览、手机阅读都是有效的阅读手段,时下“前四史”、《资治通鉴》,甚至是《昭明文选》,都已经出现全文朗读的数字音频版,改读书为听书,亦不失为一种引人入胜的阅读方式。

其二是要有意识地探究史源。史料的引用要讲究,并非多多益善。通过数字检索,我们所获得的史料不仅数量众多,而且内容庞杂。古人著书,有很多材料都是互相辗转抄录,一定要覆核原始出处,只有将相关史料都尽可能收集齐,通过排比、分析,才有可能得知“源”在哪里。知道了哪一个是“源”,就能帮助我们判断哪些史料的价值高,哪些史料的价值低。而这个源头才是真正有史料价值的东西,这就是陈垣先生所倡导的“史源学”。我曾对一位同人论文的初稿提出过意见,文中引了《魏书》、《北史》、《通志》、明修《山西通志》中四条几乎相同的记载,考证北魏时期某一郡名的存在。这四种史籍,《北史》多袭《魏书》,《通志》撮录正史,方志亦是如此,这几条材料基本是同源的,全部列举反而会弱化自己的论点。

其三要重视异说,消化反证。要对电脑检索搜集到的庞杂资料做细致的遴选、筛滤工作,并在此基础上展开进一步的逻辑推理和论证。不利自己论点的史料,不能忽视或忽略。田余庆先生曾经说过:“要注意排除反证,没有反证的问题是简单问题,复杂问题往往有反证。反证必需在我们的考虑之中。”只有把这些材料放到一个变化的过程中,作通盘理解,对那些反面的史料也能作出恰当的解释,我们对史实的认识才更有可能是准确的。另一种值得警惕的是概述性或概括性的史料,碰到这类史料,我们一般都会很兴奋,因为它一下子就能证明自己的说法,我们不用再一条一条地找具体的实例来说明了。殊不知,这类材料最有欺骗性,它的代表性最应该被质疑。遇到这样的史料,在兴奋之余,一定要追究它究竟有多大的代表性。唯其如此,才能使学术论断建立在更为坚实和可靠的基础上。

其四是慎用数理统计。长期以来,文史研究缺乏量化分析手段,计算机数据库的应用可以协助解决许多比较复杂并且人手难以完成的课题,如李中清等学者对清代人口的统计研究,即是在掌握了数以万计的的清代特定人群的户口册的基础上建立数据库分析系统。毛汉光先生的专著《中国中古社会史论》中,也曾经尝试用数理统计的方法研究魏晋隋唐社会的变迁及其对政治的影响,力图使该时代社会政治史更具有确定性,避免轻易定性分析而造成以论代史。韩昇先生对此提出诸多质疑,中肯地指出:“数理统计有其优点,但是,要很好地运用于人文学科,并不容易,绝非加减乘除或者更加复杂的数理运算就能够进行。人的社会存在诸多不确定性;而且,表面看起来确定的东西,却必须进行定性的分类,才能够成为统计的材料。所以,定性和定量是交织在一起的,不可能简单地通过定量进行定性。这个过程,存在着许多歧义,需要历史的判断,这些因素都决定了人文科学一旦运用数理方法,就不是简单容易的事。”数理统计方法在史学中的应用受到很多客观条件的限制,既有基础史料数据量的局限,又受到数据库设计理念的影响。否则,根据错误理念所建立的数据库系统,虽看似科学谨严,实则南辕北辙。

其五是要强化文献学的知识训练。这里所说的文献学,既包括以版本校勘为主要内容的古典文献学,也包含新媒介所衍生的数字文献学。传统史学对于史料版本的要求很高,校勘目录乃专门之学。时下学者对数字古籍的质量要求远不及印刷文本,将检索而来的史料覆按原书,是论文付梓前一道必不可少的工序。数字古籍产生问题的原因众多,数字文献选择底本的不善,某些开发商因规避版权等原因,录入文本与宣称版本往往名实不符。数字文献制作中因字形差异,校核不精等所产生错字、缺字众多,甚至错行错页、脱行脱页之例也屡见不鲜。而由于人们对电脑和网络的盲目信任和依赖,数字古籍传播中出现的错误可能更难以察觉和校正。台湾汉籍资料库文本录入的准确性在海内外久负盛誉,但也不无瑕疵,比如把《太平御览》等古籍中所有“盐”字、“剑”字的异体字都当作生僻字以图形的方式造出,看似忠实原书,实则无法检索,这对于古代经济史料和军事史料的搜集将是灾难性的。对于近年来商业竞争造成众多海内众多古籍数据库质量良莠不齐,更应保持高度的警惕。有鉴于此,我们除了需要恶补古籍版本目录知识之外,还需要更多地了解数字文献的特质,尽量选择文本精良、校核准确的古籍数据库,“择善而用”。大陆古籍数据库的开发刚刚起步,需要经历一个从贪大贪全到求精求准的发展过程,而作为数据的使用者,我们心中应当有“数字善本”的概念。

其六是要讲究“辞章”,重视文法。为文之道,在传统文史之学中有诸多古训可寻,讲求考据、义理、辞章的完美结合。数字化时代写作方式的转变,使很多论文失去原有的清新与明快。谢泳先生曾著文痛陈“西式论文”成为学术评价的主流标准所带来的弊端,我想这其中“检索史学”也负有一定责任。辛苦检索而来的大量史料的不忍割爱,就只能堆砌牵合,文章越写越长,灵感越来越少。不加分析地大段征引史料,看似敷衍成篇,实则阻滞文气,影响了读者的阅读和理解,以其昏昏,使人昭昭,就是刘勰所说的文章“瘠义肥辞,繁杂失统”的“无骨之征”。古人云“文章千古事”,不可不慎。对与论文的评价标准,见人见智,但作者需要有字斟句酌、精益求精的文字锤炼过程,果断删除那些庞杂无用的鸡肋。

傅斯年先生曾提出“史料即史学”的著名论断,界定了史料在史学研究中的核心地位。当我们借助现代化的电脑网络技术用在一定范围内“穷尽”史料之后,史学研究所面临的主要问题,就不再是辛苦爬梳寻找资料,“动手动脚找东西”,而是对史料进行科学鉴别筛选和分析排比,在这个过程中,学者个人的史学修为和学术功力显得尤为重要,这需要通识,更需要见识。从占有史料,到驾驭史料,我们还有很长的路要走。(完)

最后编辑:
作者:马光
勿忘初心!

留下一个回复

你的email不会被公开。