跳至正文

旧方志中人物传记资料的整理和数字化现状

​​一

人物传记是历史的镜子。历史人物的传记可以生动、形象地反映传主所处历史与时代的面貌,再现人类社会生活的丰富多彩。人物研究是社会科学研究中最基本、最重要的环节,是历史研究乃至整个社会科学研究的基础和关节点。钱穆先生认为:“中国一向以人物为历史中心”。章学诚在《文史通义校注》中认为:“传状志述,一人之史也;家乘谱牒,一家之史也;部府县志,一国之史也;统记一朝,天下之史也。”核心思想即人物传记与构成中华历史大厦的三大支柱——家谱、方志、正史一脉相承,甚至这三者正是以人物之史为联系的关节点。因此,人物研究不仅本身具有重要性,对社科领域中其他研究亦有着基础而广泛的关联性。了解历史人物传记,对于人们认识历史、认识家史、认识自身,进而认识当下,有着不可忽视的现实意义。

据统计,二十四史和清史稿中的人物,约有2.3万人,这个数量,和漫长的中国历史进程出现的人物相比,只占据非常少的一部分,大量的历史人物资料则需要在方志和家谱中寻找。在地方志中,“人物志”都放在了重要位置上,不仅占据了大量的篇幅,而且人物的分类也特别详细。方志人物门类大致包括:各类人物传记,一般分名宦、乡型、乡宦、仕进、孝友、节烈、耆旧、寿民、方伎、流寓、列女等;各种表志,如职官表、选举表等;另有金石、艺文类中的墓志、碑铭、传诔、去思录等。方志人物传记的基本特点,是所收人物大大超过了正史的范围,多为一些名不见经传的地方名贤,且对人物的叙述没有限制,内容比较详尽,记载十分丰富,有着正史人物传记所不能比拟的优势。在上述浩如烟海的典籍中,如何将这些人物史料一一整合,编织出一幅人物的立体图像,历来是学术研究和文献整理方面的难点所在。历史上对于人物传记资料的整理,一直以来都在延续。特别是近代,研究者利用编制人物传记索引、人名词典、编辑丛书等方法,梳理了大量历史人物资料,为相关研究带来了极大的方便。进入现代,计算机技术的发展,又使这些文献整理的成果扩大化,为学术研究和文献整理加工带来更为快捷方便的应用。

对这一部分文献的专题整理,首推国家图书馆出版社(原北京图书馆出版社)从2001年开始出版的“历代地方志人物传记资料丛刊”系列影印图书。该丛书历时16年,近期终于按全国7个行政区划出齐,分别是西北卷、东北卷、华北卷、华东卷(分上下编)、西南卷、华南卷和中南卷。丛刊上述门类中的人物传记资料,时限上远及上古,下迄民国;在范围上,无论帝王将相,三教九流,无所不包;其中还穿插着不少当时的编纂者(多为历史文化名人)所做的按语。《丛刊》共计586册,收录方志3000多种,参考的方志多达6000多种,涉及人物估计在60万以上,卷帙浩大。然为检索方便,丛刊每卷均编有总目,每一册编有细目。为保证编目质量,还组织专家为每卷编制《人物姓名拼音索引》和《人物姓名笔划索引》(绝大多数只有姓氏的“列女”除外),与每册细目相互补充,以目录统类、以索引统人,构成相对完整、极其方便的人物传记资料检索系统(后三卷因出版较晚,索引编制尚未完成)。

除此之外,该社还根据朱士嘉先生的《宋元方志传记索引》,从现存宋元方志中辑录出有关人物传记资料汇编为一书,为《宋元方志人物传记资料丛刊》(全10册)。该书收录三十三种宋元方志的人物3949人,是发挥图书馆优势,“按图索骥”搜集原文而成。原始资源与索引相得益彰,极大地增加了使用者的便利。

对方志人物的整理,编制索引是一个传统而有效的方法。方志人物索引的编制大体分为四类,如1939年江苏省立图书馆曹允源编制的《吴县列传人名索引》,可能是我国最早的方志人物传记索引,收录5000余人,是单种志的人物索引。还有的方式人物索引是区域性的,如《山西通志人物传记索引》、《东北方志人物传记资料索引》、《北京天津地方志人物传记索引》、《广西方志传记人名索引》等。另外,台湾地区编制了《中日现藏三百种明代地方志传记索引》,与《宋元方志传记索引》一样,是以方志年代为限的,与此类似的还有《天一阁明代方志选刊》所编的“人物资料人名索引”。而《中国地方志宋代人物资料索引》则又是一种新的类型,从历代方志中择取某一朝代人物。收录了《宋元方志丛书》、《天一阁藏明代方志选刊》、《天一阁藏明代方志选刊续编》、《日本藏中国罕见地方志丛刊》四套地方志中320种地方志的宋代人物资料信息100044条。另外,日本也编制有一些中国地方志人物索引,还有一些方志人物索引为60、70年代内部刊物,现在较难见到。

索引的编制对于人们查找方志中的人物起到了积极作用,同时也存在着一些问题。首先,索引的编制都是与一定范围的原始文献配合使用的。如果使用者想查找某个人物的具体信息,必须翻查原始文献。然而上述索引只提供线索,还需要使用者自行搜寻原始文献,不够便捷。其次,因为人工索引的工作量巨大,工作程序复杂,印刷型方志人物传记资料索引,检索点主要是人物姓名,少数有籍贯、字、号,只有个别的有生卒年和类目,检索途径较为单一。这样就十分不便于使用者分门别类或多字段地查找。第三,近年来方志全文数字化的不断推进,也从客观上减弱了方志索引的功能,这使得方志人物索引的编制工作越来越少出现新作。

另一方面,由于地方志卷帙浩繁,数字化成本非常高昂,全文化程度并不高。近年来大规模的方志数字化主要有:国家图书馆将馆藏方志中的6000种进行了数字化,但仅可从局域网访问,外网阅览有页数限制。籍古轩数字公司制作的商业数据库《中国数字方志库》,据介绍收录12000种不同版本方志(含山水志),并完成了其中几千种方志的全文化。但该库售价高昂,也未能普惠学林。其实,即便将现存方志全部实现全文化,也无法解决人物搜索的知识服务问题。因为古代人物称谓极其复杂,一个人除了姓名外,还有以字、号、谥号、诨号、室名、官名、排行等称谓的,还有简称、敬称,加之人物关系等对称谓的干扰等,从全文化的历史资料中查找方志人物的全部信息也将有很多疏漏。因此将要全面整理方志人物,或者检索某一个人物在方志中记载的全面情况,还需要专门的方志人物传记知识库产品的出现。

“中国历史人物传记资源库”是国家图书馆出版社自有产品,历经3年完成。资源库的文献来源以国家图书馆的馆藏为主,以其他图书馆的馆藏为补充,库中文献标引基础主要是国家图书馆出版社几十年来对历史人物传记资源的持续整理形成的核心数据,同时吸收近现代以来历史人物传记资料的索引整理和数字化成果,如哈佛燕京引得编纂处的人物传记引得、北京大学数据分析中心人物传记知识服务系统等。“中国历史人物传记资源库”是目前世界范围内涵盖中国古代人物数量最多的数据库,达到50万人以上。收集历代人物资料近万种,扫描图300多万张,资源容量达到2.5t以上。资源内容涵盖中国历史上人物传记的完整脉络,从正史、别史到地方志,从总传、别传到文集中的传记篇章,从年谱、家谱到日记、手札,从纪传体例到表册名录,从书册到金石碑传,举凡人物传记资料,都予收录,使传主资料呈现立体化、全面化。

笔者作为该库的主要建设参与者,希望能分享一下该库中方志人物数字化的情况。该库对方志人物的数字化有如下几点值得注意:

1、方志人物是资源库主体。

资源库50多万人中,约有40多万人来自于方志中人物。国图社出版的《宋元方志传记资料丛刊》及《地方志人物传记资料丛刊》系列中的“华北卷”“东北卷”“西北卷”“华东卷”已入库;“西南卷”“中南卷”“华南卷”人物资料尚未入库,入库后预计方志人物将达到60-70万人。此外,出版社还计划将近年出版的“著名图书馆藏稀见方志系列”丛书中的方志人物传记进行整理,届时,库中方志人物将得到更为全面的补充。可以说,从该库目前所收的“史、志、传”文献看(库中2000多种家谱人物信息尚未细化到人,仅到姓氏籍贯),方志人物在库中占到四分之三强的数量,十分可观。

资源库分类数据:

正史类(二十四史、清史稿)

3765卷  23394人

编年类(《资治通鉴》)

294卷  35096人

別史类

29699人

年谱类

1578种  1178人

家谱类

2394种

方志类

1432种  440597人

总传类

108371人

别传类

2063人

杂传类

2164人

表册类

12323人

金石(碑传)类

5647人

目录类

30975人

文学类

32739人

2、资源库以人物为坐标,通过对人物信息深度标引,可以整合人物所有传记原始文献。

该库以历史人物为坐标,不仅可查找某人在何地方志中有记载,还能延伸阅读此人在其他文献中的传记资料。其中重要历史人物均有小传及人物关系、作品篇目等,每种传记资料都可看到原始文献。通过这样的整合,某一人物的各种传记资料可以得到全方位呈现,使研究者的资料占有更为详实,便捷,大大节省查找资料的时间。

3、支持同一人物的异称归集,可在姓氏、时间和地域上进行关联性检索。

资源库同姓名人物的标引区分,将某人异称统一于小传文献,在检索中支持体现。同时支持历史与地域的对应,以现代省市县三级区划对应不同历史时期地理称谓。可将人物检索与籍贯(地域)、时代一一对应,具有一定知识服务功能。可单独抽取某一地区、某一时代、某一姓氏人物。同一个人很可能出现在不同方志的不同类目中;同一地区不同时期对某一个人记载的不同,也可以体现出方志纂修过程中的因循承递关系与人物评价的异同。

4、界面友好,功能全面;不断更新,后续可期

除人物检索等核心功能外,资源库还辅以时代转换、诗文反查、康熙字典等工具,支持超大字符集和简繁通检,支持生僻字的显示,古今地名对照和个人数据管理等其他功能。针对一些方志页面人物姓名众多,为便于使用者查找,还对检索人物进行了高亮坐标设置。

出版社承诺将以一年不少于5万人或2000种文献的速度递增资源;目前入库方志只有不到2000种,还有近四分之三的志书人物传记没有入库。之前一些地区方志人物索引的成果也并未进入资源库,这主要是源于索引没有资源匹配的问题,相信这些问题都可以通过方志数字化的进程不断加快得到解决。这都是我们未来建设内容的重要目标。我们还将对人物信息进行进一步标引,除年代、籍贯外,设置身份、类别等人物标签,以便于检索利用。部分重要文献将逐步开通全文检索功能。

综上,随着科学技术的发展,今天,我们终于可以站在历史的制高点上以一种前所未有的方法重构古代历史人物,为人们获取知识提供新的途径。人物历史文献和地理文献、名物文献、事件文献等知识库,结合汉语语料和语义网的建设将构成庞大的国家历史文献资源平台,这是古籍数字化整理的发展方向,同时也是从国家层面对本国文化遗产进行数字化再生性保护的方向。旧方志中的人物传记资源和其他人物传记资源一样,是中华传统文化的宝贵财富。人物历史资料中含有丰富的历史人物事迹以及民族、家族、姓氏源流,人们可以通过这些史料追寻祖先遗迹,探寻中华民族形成与发展的历史轨迹,对于凝聚民族精神和发扬优秀传统文化将产生积极的作用。

原文

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注