其他

科技类古籍数据库建设的创新思考与实践——以《中国经典水利史料数据库》为例

2016-12-07 陈奕骁 马爱梅 科技与出版

本文刊载于《科技与出版》2016年第11期

P89-92。如果您喜欢,欢迎订购我刊。

邮发代号:82-655

摘  要

文章以《中国经典水利史料数据库》为例,探讨了科技古籍数据库建设的选题设计思路、核心模块设定、特色资源优化、数据标引细节、建库实践模式和资源扩展构想等内容,以对其他学科的科技古籍数据库建设提供借鉴。

关键词

科技古籍;数字化;古籍数据库;数据标引


我国科技古籍体系庞大、卷帙浩繁,在科技史上占有重要地位。由于年代久远,不少珍贵的科技史料已遗失或毁损严重,严重影响了它们的历史传承价值和科学文献价值。为了防患于未然,抢救现存珍贵科技文献,目前可以采取的最快速、最经济的保护手段就是古籍数字化。为了让科技古籍文献更长久地保存下来,更好地服务于现代国民经济建设,经过深入调研文献资源状况,广泛走访科技史、文献学、数字出版、古籍整理等方面的专家,中国水利水电出版社将中国经典水利史料进行专业系统梳理后建设《中国经典水利史料数据库》,以创新、开放、共享的发展理念,提高资源利用效率,更好地传承中华优秀科技文明成果。


1

确定建库目标,规划资源体系


经过周全细致的调研和选题设计后,我们将《中国经典水利史料数据库》(以下简称“史料库”)的建库目标确定为:用数字化的手段将中国古代经典水文化与现代专家学者的智慧成果进行整合挖掘,实现资源共享、信息增值,为用户提供翔实、可靠的史料参考和历史数据,并通过数字出版技术对相关文献资源进行深度挖掘和技术关联。


我国现存的水利古籍不计其数,为更好地体现建库目标,综合各方面专家的建议,将“史料库”的资源体系初步规划为三大基础资源和多项功能索引,三大基础资源为文献、图片和奏章谕旨;功能索引为书名、作者、朝代、事件、职官等。文献资源由水利专业知识背景和古籍整理工作经验兼备的水利史专家点校、审核,然后繁体录入并排版形成电子化文本,将电子化文本按照数据库需求方案碎片化并技术标引;图片资源需要历史、地理、水利等方面专家反复论证,对经典古代水利图片进行收录、整理、专题性细分后形成一套完备的分类体系经数字化处理后形成翔实的水利历史图片库;奏章谕旨资源是由相关专家从经典水利古籍中单独析出并标明朝代、事件、职官等索引项的二次文献,在文献全文数字化的基础上生成新的资源体系。


2 

分析资源状况,构建基本方案


我国现存的水利典籍,仅专著就有上千种,舆图、碑刻、拓片、札子更是不计其数,为此中国水利水电出版社策划了“十一五”“十二五”“十三五”国家重点图书出版规划项目、“十一五”“十三五”国家重大工程出版项目《中国水利史典》,该项目编纂规模为50 个分册、5 000 万字,由《综合卷》《长江卷》《黄河卷》《淮河卷》等10 卷组成,分为一期工程和二期工程。基于出版社水利文献资源的状况,我们将“史料库”构建的基本方案确定为:以《中国水利史典》纸质出版物的文字资源作为“史料库”建设的文献主体资源,在此基础上再扩充部分有价值的志书和特色水利文献;在选录《中国水利史典》中专业图片资源基础上,广泛搜集选录历史文献、国内外馆藏资料、地方志中的经典水利图片;在“史料库”文献资源的基础上请专家以不同的标引体系专业标引析出的奏章谕旨资源和图片资源。


3 

明确核心模块,设定内容特色


根据选题设定的建库目标、现有资源状况和基本建设方案,经过进一步研究论证后,我们决定将数据库的核心模块定义为水利历史文献、水利历史图片、谕旨奏章3 部分,同时设计多媒体资料、影印资料、档案资料、碑拓等预扩展资源空间。


为更好地运用数字化出版新理念和新技术,实现“史料库”建设过程中专业细分、技术积累和文化增值等目的,数据库构建时将突出体现以下内容特色。


3.1 充分体现文献资源的基础档案作用


“史料库”要精心选录我国历史上与水有关的经典文献,尤其是那些记录各流域水系水文水情历史状况的文献,客观呈现各流域水系历史演变情况的文献,以及汇集防洪抢险、农田水利灌溉等方面经验教训的文献。因为这些文献可以为现代水利工程建设、水文水资源历史情况研究、生态文明建设提供基础档案。如河流的水势走向、水道变化记录,河流历史水位高低的数据记录,水利工程的长宽高大小记录以及历史淹没范围、水情变化等数据对当今防洪减灾工作很有价值,也能为城市规划建设提供权威的数据基础。


3.2 充分体现文献资源的史料价值


我国历史上的水利典籍内容包括流域自然地理、灌溉、水运、河器、防洪、抗旱、赈济、风俗等诸多方面,以会要、方志、则例、谕旨、奏疏、专著、日记、图考、图谱、年表、辞源、诗集等各种题材呈现。这些文献多是历朝历代官修典籍,或是名人名家以及河道官员的专修之作,体现了当时国家兴修水利史料记载的最高水准,具有珍贵的史料文献价值。如全面记载漕运制度的官修文献《漕运全书》,内容稀缺,版本存世数量稀少,是研究清代经济、政治制度和漕运历史的珍贵史料;几近绝版的《中国河工辞源》是研究中国水利史和了解河工水利名词源流不可或缺的重要工具书。还有大量几近散轶的珍贵水利文献,如《天津海河工程局问题》《顺直河道治本计划》等。


3.3 充分体现图片资源的水利专业价值


水利历史图片要着重收录水利经典古籍、历代治河奏折呈表、海内外各藏书机构中的珍稀图片,并按主题特色进行多维度专题分类,包括流域、朝代、出处、绘制技法、专题类别、版本特点、形式构成等多个维度;从水利专业视角、历史视角、地理视角、绘制技术视角、文物视角、美术视角对这些珍稀地图进行深层解析。如明代潘季驯的《河防一览图》,采用古代传统的绘图方法,将东西流向的黄河与南北流向的运河并置在一个画卷上,使观图者能一目了然地了解两河河防的全部情况,是现存篇幅最大的古代治黄工程图,具有很强的历史代表性。又如清光绪《水经注图》之《渭水局部图》,以胡林翼《大清一统舆地图》为底图,水系径流与城邑地名采用古今对照、古墨今朱的表现形式,在当时可以说是一个创举。


3.4 充分体现图片资源的历史文化价值


中国古代地图的产生、发展历史源远流长。作为一种图形和符号语言,中国古代地图是后人追寻古代历史原貌的重要史料和线索。按照专题内容,中国古代地图可细分为疆域政区图、天文图、城市图、行宫图、河渠图、军事图、航海图、自然灾害图等多种专题地图。为更好地体现“史料库”的建库特色,对所收历史图片要进行深度阐释,以图说史,从地图文化史的角度,对图片的历史背景、历史事件、描绘特点、时代意义等进行深入论证。


3.5 充分体现析出资源的专业特色


在分析资源状况时,我们对可能收录的文献资源内容与结构进行了横向分析和比较,结果发现大量文献中存在奏章和谕旨,而围绕每个水利事件,都会有很多以时间为序列串联起来的奏章和谕旨,如果将奏章和谕旨单独提取出来,对文献中的每一个奏章和谕旨进行标注,除提取完整内容,还需要标注出每一份奏章的时间、所涉及的重要水利人物和重大事件,可以更好地体现历朝历代兴水利除水害的重大举措。


4 

突出专业标引、聚合类型数据


在水利出版领域内,“史料库”首次成体系地对水利经典史料进行点校整理、分门别类、数字化加工处理,充分利用现代科技手段,使大量水利史料以简便、快捷、灵活的方式存储、使用和传播。“史料库”的开展,有利于以统一的标准对整个水利古文献知识体系进行梳理和整合,进而为国家行业知识资源总库的建设与应用做出有益的尝试和铺垫。为实现内容资源维度多维化、数据使用便捷化和技术成果优质化,“史料库”建设时的思路和方法突出了专业标引、细化了数据功能,形成水利历史文献、水利历史图片和奏章谕旨模块三大模块。


4.1 标引文献资源形成水利历史文献模块


将“史料库”已收录的数据资源按所涉及流域进行专业分类,分为综合、长江、黄河、淮河、运河、海河、太湖及东南、西部、松辽、珠江等10 部分,包括谕旨奏章、政府公文、私人论著、路程纪行、散文、诗歌、翻译著作等多种类型。内容涉及历代治水经验总结、政府水政方针、官员和水利专家治水主张及构想、水利地形和水利工程描绘等。


4.2 搜集特色古地图资源形成水利历史图片模块


中国古代水利图片内涵丰富,蕴含着深厚的水利文化背景和鲜明的时代治水特色。不同时代,治水方略不同,水政方针不同,绘制技法不同,表现内容不同,绘图背景不同。本模块对所选录的古代水利图片进行了多维度分类,按所涉及流域范围,分为综合、长江、黄河等10 部分;按古代测绘技术和绘图技法,分为了符号法、山水画法、计里画方法、投影经纬法、实用网格法等;按版本特点,分为了官刻本、私刻本、坊刻本、墨绘本、彩绘本、抄本、拓片、碑刻等。除此之外,还按照出处、形式构成、识读方式特点深入标注图片类别。同时,本模块对历史代表性强、史料价值较高的水利古地图和河渠图进行深入浅出的论证阐述,对因古籍开本限制而分幅展示、年代久远而残损的珍稀水利古地图进行数字化加工和修复,尽可能完善地展示古地图原貌。通过专家审读地图信息去粗取精,筛选出有较高传承价值、史料价值、文献价值的图片整理入库。


4.3 标引奏章谕旨资源形成奏章谕旨模块


将“史料库”已收录的历史文献资源进行横向分析和深入挖掘,安排专家将文献中散存的谕旨奏章提取出来,按时间序列将围绕每个重大水利事件的谕旨奏章分类标引,然后串联起来,以时间轴的形式体现历朝历代兴水利除水害的重大决策和技术成果,同时体现了当时的社会、人文、经济等状况。


5

挖掘特色数据,优化资源结构


5.1 水利历史文献模块的数据特色及资源优化


收录经典全面,覆盖全国各流域文献

根据项目初期的摸底和版本调研,本模块在建设初期确定收录的172 种文献2 000 万字。随着建库工作的不断推进,又陆续补充了《畿辅通志》《钱塘江水利史料整编》和《洞庭湖志》3 种文献约300 万字,既增加了文字数量,也极大地扩展了内容的覆盖面。

设定多层级定向检索路径,充分体现资源价值

根据既定目标,对所收录文献的书名、人名和朝代进行了定向索引标注;将资源细分为流域、热词推荐、全文本搜索、大事件标引等多层次的定向检索路径;设计了多媒体资料、影印资料、档案资料、碑拓等预扩展资源空间。


5.2 水利历史图片模块的数据特色及资源优化


水利历史图片模块的选录

①从已有历史文献资源中选录图片。在文献点校整理的过程中,聘请古地图相关专业的人员,将已有历史文献资源中的2 679 幅图片进行了分类整理,并提取相关信息,做了详细标引。


②委托专家针对长江、黄河、运河等流域的图片进行筛选、整理,最终入库1 099 幅。


③充分利用各类资源,从公开的古地图收藏机构和个人获取图片,经专家介绍和把关,获得了某国外知名图书馆及相关专家的图片1 157 幅。


④从古文献中搜集古图片段,经过多次调研、专家把关和数字化加工,最终拼接并数字化图片211 幅。

水利历史图片模块的特色优化

①拼接和修复。水利历史图片模块中收录的许多古代地图由于书籍幅面尺寸限制、年代久远、战乱兵祸、保存不善等原因,导致地图画面出现模糊、残缺、断面等现象。为最大程度展现古地图原貌,我们委托在古地图修复方面经验丰富的专业单位,对这些地图进行修复和拼接,既将不再适宜进行纸质保存的地图进行了数字化修复,又将无法向人们展示全貌的珍稀地图进行了完整拼接,增加了这些古地图存史传世的价值。


②深度研究并阐述。在请专家对图片进行筛选、分类的同时,又挑选了一些价值相对较高的古地图进行了考证与研究,撰写了详细说明,内容涉及这些古地图产生的历史背景、描绘特点、时代意义等,从水利专业视角、历史视角、地理视角、绘制技术视角、文物视角、美术视角对这些珍稀地图进行了深度阐述,提高了这些地图珍品的文化价值和学术价值。


③专题分类。在图片资源的建设和整理之初把地图的详细鉴别与分类工作作为核心与基础,通过调研多家单位及相关数据库特色,咨询专家以及研究讨论,确定了本模块图片的专题分类及标引重点与细节。所收录的6 000 余幅图片均按地图主题内容进行了专题分类。水利历史地图主要分为堤工图、水道图、河源图、流域图等30 多个类别;与水利相关的历史地图,细分为全国政区总图、地方政区地图、路程图、景观图、港口图、经济分布图、宫殿图、军事交通图等。这些分类特点既体现了多层面的学术内涵,又使图片资源的专题特色更加鲜明,实用性更强。


“史料库”将搜集到的文献资料经专业的筛选、分类、标注后通过现代信息技术进行提取、加工、整合、组织与设计,形成了便于存储和传播的水利数字内容产品。这些容量巨大、专业性强、检索便捷的数字内容产品将会更好地服务于水利建设、水文化研究和中华优秀文化传播。“史料库”的建成,对于中华文化传承、中华文化走出去以及提升中华文化软实力必将产生重要的影响。


作者简介

陈奕骁1   马爱梅2

1) FSH工作室,100048,北京;

2)中国水利水电出版社,100038,北京

往期好文传送门

中国与“一带一路”沿线国家间的出版贸易格局——方英   刘静忆


从新闻出版五年规划管窥我国出版业的发展——兼谈“十三五”出版业发展路径——王彦祥


数字出版发展模式梳理与展望——以传统出版机构转型升级为视角——张颖  陆自荣  张新新




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存