面向文化遗产整理与人文研究的数字人文时间基础设施:学理基础、应用构想与实施路径

朱本军 / 北京大学图书馆


摘要中华文化遗产中的汉语时间表达极为复杂。对于中华文化遗产及文化遗产内容知识单元的数字化整理和智慧化关联而言,实现中国古代不同政权之间纪时的古—古转换、中国历法与西方儒略历或格里高利历的中西历转换,是一项带有关键性、全局性和基础性的工作。该项工作甚至可以为全世界的文化遗产数字化整合带来变化。文章对数字人文时间基础设施“汉语统一时间标尺平台”的学理基础、应用构想与实施路径进行了系统性论述。

关键词:数字人文 时间基础设施 汉语统一时间标尺平台


准确简明的历史年表,不仅是从事研究、教学、历史、地理、考古和其他学科的必要工具书,也是文物工作者、图书馆工作者、文化馆工作者、编辑工作者等所不能缺少的工具书。[1]2023年3月由笔者主导研发的数字人文时间基础设施——“汉语统一时间标尺平台(Sinitic Meta Time Scale Platform, www.histchina.cn)”[2]正式上线。该平台较为完整地实现了中国古代政权之间的古—古历谱映射、中国古今纪时与西方儒略历和格里高利历之间的中西历历谱映射,在提供时间查询、时间转换、汉语时间著录规范等功能的同时,还将中—中、中—西历谱映射扩大到了日本、朝鲜、韩国、越南四国。自正式上线以来,平台历谱数据的权威可靠性,及能在哪些方面发挥支撑图书馆、文博馆、档案馆、美术馆文化遗产(包括古遗址、古墓葬、古建筑、石窟寺、石刻、壁画、近代现代重要史迹及代表性建筑等不可移动文物,历史上各时代的重要实物、艺术品、文献、手稿、图书资料等可移动文物,以及在建筑式样、分布均匀或与环境景色结合方面具有突出普遍价值的历史文化名城等[3])整理和学者人文研究的基础作用,成为学者和使用者关注的焦点,也成为衡量平台健壮性和生命力的核心指标。兹将该平台的学理基础、应用构想与当下的实现程度进行申论,以期与学界进行充分交流。

一、对当下中西历转换平台与系统的研究综述

在“汉语统一时间标尺平台”项目启动之前,全球范围内已经出现了数种中西历历谱转换工具与平台,影响较大的如中国台湾“中研院”的“两千年中西历转换”[4]、中国台湾法鼓文理学院的“时间规范检索”[5]、许剑伟研制的“寿星天文历”[6]、廖育栋的中西历系统[7]等。在已有诸多成果的情况下,仍启动本项目,源于观察到了这些工具尚有些许不足。

一是中历历谱数据的准确性欠佳。以秦与汉初的历谱数据为例,近四十年来,考古界发掘的秦墓、汉墓中出现了大量带有历点的简牍,例如龙山里耶秦简[8]、岳麓秦简《质日》[9]、云梦睡虎地秦简《语书》《日书》《编年记》[10]、荆州周家台30号秦墓《历谱》[11]、天水放马滩秦简[12]、云梦龙岗秦简[13]、居延汉简[14]、张家山247号墓汉简《历谱》《奏谳书》[15]、江陵高台18号汉墓木牍[16]、长沙马王堆3号墓木牍[17]、江陵凤凰山汉墓竹简[18]、银雀山汉墓竹简《元光元年历谱》[19]、荆州胡家草场汉简[20]、敦煌悬泉汉简[21]等,用出土文献中的历点去校验前述中西历转换平台及陈垣《二十史朔闰表》[22]、王双怀《中华通历》[23]中的古历朔望及历日,中历的历谱数据均不能与出土文献所载历谱完全吻合。

二是精确到日的历谱数据延展性不够。横向延展性上,较为显著的是,只有主流政权(例如“周”)的历谱数据,没有同时期地方政权或非主流政权(例如与“周”政权并行的秦、楚、燕、赵、韩、魏、齐等地方政权)的历谱数据;纵向延展性上,一般只有秦统一六国后的历谱数据,而秦之前的历谱数据缺乏。

三是时间标尺的选取有可再讨论的空间。较为集中的,如中西历转换中的“西历停闰问题”和“历谱参照系问题”。“西历停闰问题”方面,陈垣《廿史朔闰表》和台湾“中研院”的“两千年中西历转换”平台采用了所谓的古罗马历法,将公元4年停闰,以致公元1年至3年的日期与现行各国历表都相差一日。“历谱参照系问题”方面,台湾法鼓文理学院的“时间规范检索”数据库用“公元(common era,简称C.E.)”作为标尺,可是将西汉哀帝元寿元年表述为C.E.+0000公元0年。公元0年只存在于天文纪年、佛历中,文史领域所使用的儒略历、格里高利历里,并不使用公元0年而直接从公元1年过渡到公元前1年,这意味着利用法鼓文理学院“时间规范检索”数据库时换算“公元前”的年月日时间,需要在“年”上减去1年。

四是工具性不够。前述中西历转换平台,以中历、西历互查的“查询”功能为主,且查询功能仅以干支纪时(干支年-干支月-干支日)、王公年号谥号庙号纪时、西历纪时为主,并未能兼容诸如太岁纪年、岁星纪年、楚历纪月、四季纪月、月相纪日等纪时方式。当前的文化遗产整理工作,除了大粒度的文化遗产编目层面,在深入到文化遗产内容层次知识单元提取与标引,而文化遗产内容层面的年、月、日纪时表达非常多元,仅提供“查询”及有少数主流政权纪时要素的平台或系统并不能满足图书馆、博物馆、档案馆、美术馆的文化遗产整理需求及人文研究需要。

二、“汉语统一时间标尺平台”时间本体的学理基础

鉴于以上问题与不足,以及精确到“日”的历谱编排的严密性,短时间内上述诸平台系统性更新算法和历谱数据的可能性极小。为在当前认知范围内对不同时期政权纪时的古—古历谱映射、中国古今纪时与西方儒略历和格里高利历之间的中西历历谱映射做一些新的推进,本研究对中华文化遗产中与“时间”相关的汉语时间表达、中国历代历法、中西历历算标尺与映射、面向文化遗产整理与人文研究的特殊考量等进行了学理上的深入探索。

(一)中华文化遗产中的时间表达要素研究

中华文化遗产中所体现的时间表达较为复杂,大体可分为大粒度时间、中粒度时间和微粒度时间三个体系。

大粒度时间体系有世、章、统、蔀、纪、运、会、元等概念,主要用于历法步推。例如:《后汉书·律历下·历法》以十九年为一“章”,四章为一“蔀”,二十蔀为一“纪”,三纪为一“元”;[24]刘歆《三统历》以十九年为一“章”,八十一章为一“统”,三统为一“元”;[25]邵雍的“元会运世论”以三十年为一“世”,十二世为一“运”,三十运为一“会”,十二会为一“元”。[26]中粒度时间体系有岁、年、季、月、日等概念,主要用于记事与指导农事,一般以二十八至三十一日为一“月”(其中以月亮运行为周期的朔望月有二十九日或三十日,以太阳运行为周期的月有二十八日至三十一日不等),三个月为一“季”,十二个朔望月或四季为一“年”,一个太阳回归年为一“岁”。其中:“岁”,先后有岁星纪岁、太岁纪岁、干支纪岁、西历公历纪岁等;“年”,先后有王公谥号纪年、王公庙号纪年、王公年号纪年、国号纪年等;“季”,有春、夏、秋、冬四季;“月”,先后有农历数序纪月、地支月建纪月、楚历纪月、武曌纪月、四季月名纪月、西历数序纪月等;“日”,先后有农历数序纪日、干支纪日、月相纪日、廿四节气纪日、节日纪日、平水韵目纪日、西历数序纪日等。微粒度时间体系,有时辰、时、分、秒、刹那、一念、一瞬、弹指、罗预、须臾、生灭等概念,例如《僧祗律》所载的一“刹那”者为一“念”,二十念为一“瞬”,二十瞬为一“弹指”,二十弹指为一“罗预”,二十罗预为一“须臾”,一日一夜有三十须臾,[27]以及《仁王经》所载的一弹指有六十五“刹那”,一刹那有九百“生灭”。[28]

值得注意的是,大、中、小三套纪时体系既可相互转换,也相互独立。但从中华历史文化遗产中“时间”记载的角度,大粒度时间和微粒度时间并不多见,即便有记载,更多体现出一种虚指,即虽然表达了时间,但不能具象到历史时间线上的某一个时刻或时段。这意味着,中粒度体系下的岁、年、季、月、日,以及部分年值、月值、日值重复再现,是构成汉语纪时表达的主要元素。“汉语统一时间标尺平台”的主要研究对象是中粒度体系下的年、季、月、日等时间表达和取值。

(二)中华文化遗产中的纪时表达规则研究

综观中华文化遗产对年、季、月、日的表达规则,就“纪年”而言,大体有五种:一是“政权名称+王公谥号+年值”,此规则主要见诸先秦史料,例如周赧王三年、鲁隐公元年、秦孝公八年等。二是“政权名称+庙号+年值”,此规则主要见诸汉初,例如汉高祖五年、汉文帝三年。三是“政权名称+王公庙号+王公年号+年值”,此规则主要见诸汉武帝至清宣统,其中政权名称、王公庙号有时可以简略不写,例如,可称“汉武帝元朔元年”,亦可省称“元朔元年”。四是“政权名称+年值”,此规则主要见诸中华民国时期,例如中华民国元年、中华民国十五年。五是直接写“年值”,此规则见诸中华人民共和国成立以降,既不使用国号纪年,亦不使用年号纪年,而直接用西历年,例如一九六二年、二〇二三年。

值得注意的是,由于中国历史悠久,不同政权在政权名称、王公谥号、王公庙号、王公年号、年值上多有重复,如果用上述五种纪年规则中的任意一种来囊括整个中华文化遗产中的纪时,在某些情况下会出现多值和歧解。比如,按“政权名称+王公谥号+年值”或“政权名称+王公庙号+年值”规则进行的时间表达并不唯一,需要额外的辅助信息才能加以区别,典型的例子,如周时期的“燕”政权,同一个政权先后出现了两个“文公”:一个是燕武公之后的燕文公(《史记·燕召公世家》“武公十九年卒,文公立”),一个是燕桓公之后的燕文公(《史记·燕召公世家》“桓公十一年卒,文公立”),按照“政权名称+王公谥号+年值”规则,当出现“燕文公元年”时,计算机和人都无法区别是哪个政权。再例如,蒙古族建立的“元”政权,先后出现过两个“至正”年号,一个是元世祖忽必烈的“至元”年号(共行用31年),另一个是元惠宗使用的“至元”年号(共行用6年),如果将时间著录为“元至正元年”,人和计算机都不知道是哪个王公的年号。消除歧义的方式大抵有两种:一种是在“政权名称+王公年号+年值”规则中加入“王公姓名”以辅助区别,例如“元忽必烈至元元年”“元妥欢帖睦尔至元元年”;另一种是在“政权名称+王公年号+年值”规则中加入“王公庙号/谥号”可以辅助区别,例如“元世祖至元元年”“元惠宗至元元年”。也即,在“纪年”的规则上,采用“政权名称+王公庙号/谥号+王公姓名+王公年号+年值”的纪年规则,可以覆盖汉语中几乎所有的纪年表达且不会出现歧解。

如果将纪季、纪月、纪日加入到“纪年”的规则中,可以形成一个完整的、可以覆盖几乎所有中华文化遗产的汉语纪时表达规则,即“政权名称+王公庙号/谥号+王公姓名+王公年号+年值+季值+月值+日值”纪时规则(其中的纪时要素都是非必备项)。

(三)关于中华文化遗产中中历历算标尺与历谱编排的研究

《汉书·艺文志》云:“历谱者,序四时之位,正分至之节,会日月五星之辰,以考寒暑杀生之实。”[29]中国古代的历法是古人通过长期观察天候(日月星辰等天体运行的周期)、气候(风霜雨雪等出现的周期)与物候(动植物的活动规律),所形成的一套在彼时看来较为严密的推导法则。这个法则,早期只是事后的观测记录,经久积累后,不仅找到了规律,而且形成了严密的数学算法。这个数学算法可以步推还未出现的四时之位、分至之节,形成相对准确的朔闰历谱颁发给各级地方政府,以指导农时或纪事。值得注意的是,虽然不同时期的历法数学算法会因为精度不高造成失朔或失闰的情况,但是天官或司历会在适当时机调整朔余或气余,以与日食、月食、星辰位次等天象无限密合。通过对《史记·历书·历术甲子篇》及《汉书·律历志》的算法及参数进行深入研究和推排,本研究发现中国古代政权的历谱数据,实际是建立在一套“客观的”天文纪时参照系统之上的“主观”编排。

所谓的“客观纪时参照系统”,就是根据日月星辰的运动来纪时,无论何国、何时期的任何人,只要使用的测量标尺(例如对天穹宫格方位的划定、星座的认识)是一定的,那么在同一天的同一时不同地域司历所观察的天象也会是一致的,所记的时刻也将是相同的。这种统一的天文观测约定,相当于是建立了一个统一且客观的纪时参照体系。就今天所掌握的材料,司历所遵循的客观的纪时参照体系大抵有如下一些规则:一是时间的起点,上古的司历把“冬至日”作为一岁的开始,把太阳、地球、月球在一条直线上交会的“朔日”作为一月的开始,把夜半“子时”0分0秒作为一日的开始。[30]二是干支日的编排与轮替。为方便日后计算,颁布者选定(或步推假定)了一个极为特殊的时间开始实行历法,即选定某个冬至日和朔日都在夜半子时0分0秒时开始计时(有的历法假定这个起点为“甲子年甲子月甲子日朔旦”,有的历法假定这个起点为“己酉年子月甲子日朔旦”),每过一日,干支日就按按10天干和12地支组配的60个干支顺序轮替一下,如此往复,虽千年万年却一丝未乱。三是月的编排与轮替。天官或司历通过长时间观察北斗七星的斗柄指向,发现其斗柄指向有一定的规律可循:如果将天穹划分为12等分的宫格(按子、丑、寅、卯、辰、巳、午、未、申、酉、戌、亥的顺序命名),每个朔望月结束,北斗斗柄就恰好指向下一个宫格,十二个月后又指向原来起始的第一个宫格。为方便纪月,司历将北斗七星的斗柄起名为“月建”,并规定以冬至日所在的月为“子月”。如此规定后,任何一个天官只要仰观北斗斗柄的指向以及固定宫格名称和位置,就能纪事于同一个月而不致淆乱。四是岁的编排与轮替。古代的天官或司历以“冬至日”(汉武帝太初改历后以“立春日”)作为一岁的开始、下一个冬至日的起点作为一岁的结束。一岁正好一个太阳回归年,约为365.25日。先秦的干支纪年、岁星纪年、太岁纪年,都是以“冬至日”作为上一年与下一年的“界点”。冬至日及气余确定后,那么廿四节气中的十二节、十二气就可以确定(“四分历”中采用平气方式,节与气之间的日长为15又7/32日),如果按照“无中气置闰”的方式,就可以确定“十九年闰七”的规律,达到调配日、月运行,序四时之位、正分至之节的目的。五是合朔与交食。根据日、月、地运行的规律,日食只可能发生在朔日(初一),月食只可能发生在望日(十五日),天官或司历通过观察日相与月相,来校验和纠正历日谱,不使失序。

上述五点,是古代天官或司历掌握的恒定不变的历法规则。由于肉眼观察精度失算而导致频繁出现“日食在晦”,或强调“受命于天”,帝王可能会在前述客观纪时参照系统上按照自己的想法进行排历。根据对秦与汉初历法的研究,不同政权的天官改历或排历的基本规则大致为以下几个方面中的一种或几种:一是自行确定本政权的年首,即以北斗斗柄指向哪个宫格为“正月”。古人对“年”和“岁”的界定是不同的:“岁”以冬至日为界点的太阳回归为基准,是客观的;“年”是政权自行定义的,一般以12个朔望月的周期为基准。至于年的起点月,各政权可以根据“天命”的需要,随意规定北斗斗柄指向某个宫格为“正月”即可。比如,战国时期的秦国,以北斗斗柄指向“亥”宫格作为一年的起点月,而齐以北斗斗柄指向“子”宫格作为一年的起点月,韩、赵、魏以北斗斗柄指向“寅”宫格作为一年的起点月。[31]二是自行确定本政权月的称谓。月建北斗斗柄指向的宫格是固定的参照系,但建正之后如何命名“正月”及后续的月名,各政权可以自主决定。比如楚国,并没有按照“正月”“二月”“三月”……“十二月”的顺序命名,而是将正月命名为“冬夕”、二月命名为“屈夕”、三月命名为“䓕夕”、四月命名为“刑夷”、五月命名为“夏杘”、六月命名为“亯月”、七月命名为“夏栾”、十一月命名为“炱月”、十二月命名为“献马”;唐代武周武则天改历后将十一月命名为“正月”、十二月命名为“腊月”、十二月后面的月依次命名为“一月”“二月”“三月”……“十月”。三是自行确定本政权一年中闰月的位置。月建的置闰是以无中气置闰,但是政权可以自己规定闰月的位置和名称。例如,战国末期至秦时期的秦国并未采用无中气置闰,而是将所有的闰月都放在年尾,并将闰月称之为“后九月”。四是出于某种目的,地方政权的天官或司历脱离统一的历法体系而自行改变历谱的算法,或保持算法不变的情况下修正参数,使之精度更高。

在掌握上述“客观的”纪时参照系统之上如何“主观”编排方法后,就可以根据不同时期史料中“律历志”所载的算法和参数,推知某一政权所使用的完整朔闰历谱,也可以在算法不变的情况下通过出土文献中的历点反推其改历的时间及改历参数。譬如,本研究运用《史记·历术甲子篇》“四分历”算法和参数,通过部分秦与汉初出土文献历点数据,步推得出了秦与汉高祖改历的时间和完整的朔闰历谱数据,这些历谱数据与当下已知的出土文献历点全部吻合。又由于干支纪日自历元点至今绵延无中断,可以以当前所在“干支日”为起点,使用“律历志”所在的算法和参数,向前或向后步推出任意年月日的中历各政权的朔闰历谱。

(四)关于西历历算标尺及与中历映射的研究

前述研究,只是如实将汉语文献中的中历历谱数据进行了还原,但要实现中历与西历的转换,还须对西历算法进行研究。

值得注意的是,西历儒略历与格里高利历历谱的编排比中历要简单得多。西方天文学界在儒略日[32]、日月交食[33]、月相与廿四节气[34]、儒略历、格里高利历[35],都有成熟的算法和公式。以当前所在的“日”为起点,可以回推编排出公元前4713年1月1日至今、从今以后任意年份的西历历谱,而且可以回推日、月、地、木星等天体在具体儒略历日和格里高利历日中所处的位置,以便于校验天象。

如此,中历和西历,虽然各自运用自己的算法,却形成了两条平行的时间轴线,每一天都可以一一对应起来。

(五)面向中华文化遗产整理与人文研究的特殊情况考察

上述研究,已经完整地解决了中历与西历的映射问题。但要对中华文化遗产整理与人文研究产生实质性帮助,还需要做一些额外的考量:

一是中历中引入“历史分期”的概念。“历史分期”概念的引入,源于两个因素:其一,是文博领域的需要。在器物陈列展览的铭牌中,当器物没有确切时间记录时,通常只列其大致历史分期,诸如“西周时期”“东汉末年”“清晚期”等跨时段的时间概念,这些时间概念需要具象到西历的时间段。其二,是政权索引的需要。自西周至今,仅中国历史上即先后出现了300多个大小不一的政权,在进行中历到西历的转换查询时,如果不对这些政权进行精炼索引,每次都要从300多个政权中寻找一个政权,会耗费相当多的时间。引入“历史分期”的概念,主要是解决上述两类问题。

二是规范历谱要素与要素的取值。西周至今的300多个政权,不仅存在政权名称、王公谥号、王公庙号、王公年号等重复的问题,而且在历史的进程中存在部分政权名称丢失、王公谥号/庙号/年号称谓音同字不同(例如唐文宗“太和”年号又作“大和”)、意同形不同(例如新莽时期的隗嚣的年号,有的史料称“汉复”,有的史料称“复汉”)等问题,要实现人与计算机的识别,对数据进行规范化极为必要。例如,中国历史上的不同时期,政权的名称存在大量同名现象,有刘邦建立的“汉”、刘秀托名汉室建立的“汉”、刘玄、隗嚣为推翻新莽分别托名建立“汉”、刘备托名汉室后裔建立的“汉”……在此种情况下,如果都写成“汉”,不仅计算机会混淆,人也会混淆,那么,就需要建立一些规则以示区分,例如:文史学界已有约定俗称的,按照约定俗称,如称刘邦建立“汉”为“西汉”、刘玄为推翻新莽建立的“汉”为“玄汉”、刘秀托名汉室建立的“汉”为“东汉”,刘备托名汉室后裔建立的“汉”为“蜀汉”;对于没有约定俗称的,按照“[创立者姓名]政权名称”的格式称呼政权名称(例如,新莽时期隗嚣托名建立推翻新莽政权的“汉”,称之为“[隗嚣]汉”);对于政权名称亡佚的,用“[创立者姓名]”代称(例如,晚清的“东明农民起义军”,按现有的史料,不知是建立过政权名称但亡佚了,还是根本就没有来得及建立政权名号就被镇压消亡,在称呼这个政权时,采用“[东明农民起义军]”)。

三是历谱数据的上延与下展。在年中改历或改年号时,原始史料通常会用一个年号指代全年。例如,汉武帝太初改历的时间在元封七年五月朔日,也即从五月初一日开始使用“太初”年号,此前采用“元封”年号,[36]但原始史料记载时,却将改历前的“元封七年”十月至四月称为“太初元年”十月至四月。[37]由于本平台的历谱数据的应用场景之一是支持文化遗产的整理,故而需要将真实历史中并不存在的太初元年十月至四月的历谱也要以“推算”的形式向前延展补充,以便按原始史料标引的中历时间能换算成西历时间。

基于以上之研究与考察,可以确定面向文化遗产整理与人文研究的时间本体。该本体包括以西历为时间标尺的儒略日、儒略历或格里高利历年值、儒略历或格里高利历月值、儒略历或格里高利历日值、韵目日、日食/月食,以中历为时间标尺的历史分期、年(含干支年、岁星年、太岁年、政权名称-王公谥号/庙号-王公姓名-王公年号/国号年)、年值、季值、月(含干支纪月、四季纪月、政权纪月[含楚历纪月、武曌纪月]、累月纪时、月建纪月)、月值、日(含政权纪日、月相纪日、干支纪日、韵目纪日、廿四节气纪日)、日值及备注。

三、汉语统一时间标尺平台应用功能的学理基础

为进一步提升系统对中华文化遗产整理与人文学者文史研究的基础支撑作用,我们通过文献法,对图书馆、博物馆、档案馆、美术馆文化遗产整理与文史领域研究人员处理“时间”相关史料的行为进行了分析,并通过分析,拓展平台的“工具性”应用功能。主要的学理研究及相应的功能,体现在如下几方面:

一是基于对器物考古断代的行为需求,增加“组配检索”功能。在考古文博领域,当新出土带有历点的吉金、彝鼎、石刻、简牍等器物时,考古工作者需要根据零星的历点进行考古断代或断限。典型的,如对西周铜器“在二月既望乙亥……四月既生霸庚午”“隹三年五月既死霸甲戌”等铭文进行断代[38]、对楼兰简牍“丙申朔七日壬寅大将军右长史关”“四月三日庚戌白”等进行断代[39]等。值得注意的是,在铭文中,类似“十年七月辛卯朔”“十一年八月甲申朔”等同时显示确切日期与定点月相的历点信息,或类似“□□四年四月十六日壬子”等同时显示确切日期与干支日期的历点信息,是考古断代的重要材料。这需要历谱的“查询”功能做一些改进,即在单一“年”“月”“日”查询的基础上增加额外的“年”“月”“日”条件以方便运用逻辑运算“and”进行组配检索。基于考古断代的组配检索需求,系统做了改进,改进后的检索界面支持文史研究人员去探索模糊或缺失的时间。以出土文献“元氏县界封刻石”为例,该石刻的碑文残缺,仅有“□□□□□在己亥,三月□□朔,廿五日庚子,司徒前……”记载,[40]记载中最为关键的年号缺失而仅存干支年,虽有“三月”但月的合朔时间缺失而仅存“廿五日庚子”。传统的方法,要在中国数千年的历史长河中国确定此石刻的勒石时间,需要耗费极长时间。提供“增加条件”的组配检索功能后,将条件限定为“干支年=己亥”-“政权月序=三月”-“政权日序=二十五日”and“干支年=己亥”-“政权月序=三月”-“干支日序=庚子”,很快就能定位到唯一的结果“339年-4月-20日-己亥年-后赵-太祖-石虎-建武-五年-三月-二十五日-庚子”,以及将缺失的“三月□□朔”补齐为“三月丙子朔”。

二是基于在混沌中辅助探索和定位确切信息的行为需求,增加“拼写提示”功能。与知晓某一政权的确切“年”“月”“日”,去查同时期其他政权“年”“月”“日”或西历“年”“月”“日”相逆的,是在只言片语的混沌中寻找确切“年”“月”或“日”。例如,前西北科学考察团在甘肃额济纳河畔出土西汉武帝、昭帝年间木简,有十余简所书纪年为“延和”,[41]那么“延和”是哪位皇帝的年号?为方便考古文博领域的文史研究者在混沌中探求确切的结论,系统增加了“拼写提示”功能。对于前西北科学考察团的例子而言,只需在“王公+年次/年号/国号”标签的文本框中输入“延和”二字,可以看到提示北魏太武帝拓跋焘有年号“延和”、高昌国麴伯雅有“延和”年号、唐睿宗李旦有“延和”年号、汉武帝刘彻“征和”年号又称“延和”。根据提示,结合史料内容,可以很快定位这些木简实际是汉武帝“征和”年号的形误。

三是基于规模化历谱数据的比对、中西历规模化转换等行为需求,增加“导出成EXCEL”“EXCEL年表批转换”和“API接口”功能。李忠林为探求秦与汉初的历法,将秦与汉初出土文献历点、传世文献历点与完整的历谱数据进行核验比较,通过核验中的异同来探究秦与汉初的改历时间与改历规则,[42]罗今见将楼兰简牍与陈垣《二十史朔闰表》进行系统对照,以释读或纠正出土简牍中的历点时间,[43]都很好地阐释了要求系统平台能批量输出有一定时间跨度的历谱数据到本地进行处理的需求。此外,图书馆、博物馆、档案馆和美术馆或项目团队在做“时间线”(timeline)可视化项目时,有将已有的中历“年”“月”“日”数据批量转换为西历“年”“月”“日”的需求。为此,系统平台增加了“导出成EXCEL”“EXCEL年表批转换”和“API接口”功能。

四是基于文化遗产编目或内容标引著录“时间项”时输入中历“年”“月”“日”即能得到对应西历“年”“月”“日”的行为需求,提供文化遗产时间著录与标引规范及配套的时间著录规范源程序。如前所述,历谱的“政权名称-王公谥号/庙号-王公姓名-王公年号”“年值”“季值”“月值”“日值”等要素与要素的取值是规范化的,只有标准化的输入,才会产生正确的值。为方便图书馆、博物馆、档案馆和美术馆或项目团队从数据著录阶段就能形成规范的时间数据,以方便不同系统之间的数据互操作,本系统平台提供汉语文献时间著录与标引规范,及与规范完全配套的时间规范著录源程序,方便机构或学术团队本地化适配。

结 语

图1 汉语统一时间标尺平台界面

通过前述对当下中西历转换平台与系统的不足、汉语文化遗产中时间本体构建的学理基础、对汉语文化遗产中与“时间”相关的学术行为需求分析,构建了包括“查询”“导出历谱成EXCEL”“EXCEL年表转换”“API接口”,提供“汉语时间著录与标引规范”和配套源程序代码,以及鉴于“大中华圈”内的日本、朝鲜、韩国、越南在近代以前也较多用汉语记史纪事,系统在中国本土汉语时间古—古转换、中—西转换的基础上,增加了日本、朝鲜、韩国、越南历谱数据与西历的转换,最终形成了能同时处理中、日、韩、朝、越五国历谱信息与西方儒略历和格里高利历历谱信息的“汉语统一时间标尺平台”(如图1所示)。

由于“时间”是衡量万物的尺度,随着数字技术与人工智能运用到中华文化遗产整理与人文研究,作为数字人文的关键基础设施之一,“汉语统一时间标尺平台”的基础性学术价值和学术贡献将会逐步显示出来:一是为海内外中华文化遗产、中华文化遗产内容中知识单元(例如地名、人物、职官、印章、斋堂馆舍等)基于时序的著录、标引、关联与智慧化,以及中古史研究、古代历法研究、考古断代、中华文明探源与辐射研究等提供基于“时间”的基础性支撑,极大地方便学术界编年、沿革和年代学等相关领域的研究;二是对人文研究的方法和范式产生积极和正面影响,不仅修正王国维首倡的“二重证据法”为“三重证据法”(即传世文献、地下出土文献,以及朔、望、晦、日月食、分至、节气等天文天象三者相互印证),而且使得“三重证据法”中的“天象印证”更加容易而正确地得到实现。

Digital Humanities Time Cyberinfrastructure for Digital Revival of Cultural Heritage and Humanities Research: Theoretical Basis, Demand-based Conceptions, and Implementation Paths

Zhu Benjun

Abstract: Sinitic Time expression in Chinese cultural heritage is extremely complex. In order to promote the digital organization and intelligent association of cultural heritage and knowledge units in cultural heritage, the realization of converting calendars among different ancient Chinese political entities and between Sinitic calendars and Western Julian or Gregorian calendars, is a crucial, global, and fundamental work, which could even bring changes to the digital integration of cultural heritage worldwide (and not only in China). Taking Sinitic Meta Time Scale Platform as a research case, this paper systematically discusses theoretical basis, demand-based conceptions, and implementation paths for the digital humanities time cyberinfrastructure.

Keywords: Digital Humanities; Time Cyberinfrastructure; Sinitic Meta Time Scale Platform

(编辑:赵薇)

本研究为国家社科基金项目“面向人文研究的国家数字人文网络基础设施研究”(a20BTQ013)的阶段性成果之一。

注释:

[1]万国鼎编,万斯年、陈梦家补订:《中国历史纪年表》,上海:商务印书馆,1956年,第5页。

[2]汉语统一时间标尺平台,http://www.Histchina.cn,2023年4月7日。

[3]张岚编:《浙江海岛文化十六讲》,北京:海洋出版社,2019年,第219页。

[4]中国台湾“中研院”数位文化中心:两千年中西历转换(公元元年2月11日至2101年1月29日),https://sinocal.Sinica.edu.tw,2023年4月7日。

[5]法鼓文理学院:时间规范检索,https://authority.dila.edu.tw/time,2023年4月7日。

[6]许剑伟:寿星天文万年历,https://www.zdic.net/ts/fulu/wnl/wnl.htm,2023年4月7日。

[7]廖育栋:中西历对照(公元前722年—公元2200年),https://ytliu0.github.io/ChineseCalendar/sunMoon_simp.html,2023年4月7日。

[8]张春龙编著:《湖南里耶秦简》,重庆:重庆出版社,2010年。

[9]朱汉民、陈松长编:《岳麓书院藏秦简(贰)》,上海:上海辞书出版社,2011年。

[10]睡虎地秦墓竹简整理小组编著:《睡虎地秦墓竹简》,北京:文物出版社,1978年。

[11]湖北省荆州市周梁玉桥遗址博物馆编:《关沮秦汉墓简牍》,北京:中华书局,2001年。

[12]甘肃省文物考古研究所编:《天水放马滩秦简》,北京:中华书局,2009年。

[13]刘信芳、梁柱编著:《云梦龙岗秦简》,北京:科学出版社,1997年。

[14]胡之主编:《内蒙古居延汉简》,重庆:重庆出版社,2008年。

[15]张家山二四七号汉墓竹简整理小组编著:《张家山汉墓竹简二四七号墓释文(修订本)》,北京:文物出版社,2006年。

[16]湖北省荆州博物馆编著:《荆州高台秦汉墓》,北京:科学出版社,2000年。

[17]国家文物局古代文献研究室编:《马王堆汉墓帛书》,北京:文物出版社,1980年。

[18]李均明、何双全编:《秦汉魏晋出土文献散见简牍合辑》,北京:文物出版社,1990年,第66—82页。

[19]银雀山汉墓竹简整理小组编:《银雀山汉墓竹简(壹)》,北京:文物出版社,1985年。

[20]荆州博物馆、武汉大学简帛研究中心编著,李志芳、李天虹主编:《荆州胡家草场西汉简牍选粹》,北京:文物出版社,2021年。

[21]甘肃简牍博物馆等编:《悬泉汉简》,上海:中西书局,2017年。

[22]陈垣:《二十史朔闰表》,北京:中华书局,1978年。

[23]王双怀:《中华通历秦汉》,西安:陕西师范大学出版总社,2018年。

[24](南朝宋)范晔撰,(唐)李贤等注,中华书局编辑部点校:《后汉书·律历下·历法》,北京:中华书局,1965年,第3058页。

[25](汉)班固撰,(唐)颜师古注,中华书局编辑部点校:《汉书·律历志第一下》,北京:中华书局,1962年,第1007页。

[26](明)王夫之著,杨坚总修订:《船山全书·杂录》,长沙:岳麓书社,2011年,第1072页。

[27](宋)从义撰,白光整理:《天台三大部补注》卷4,北京:中华书局,2020年,第185页。

[28](明)弘赞注,李海龙整理:《半月诵菩萨戒仪式注·半月诵菩萨戒仪式注》,北京:中华书局,2022年,第8页。

[29](汉)班固撰,(唐)颜师古注,中华书局编辑部点校:《汉书·艺文志第十》,第1767页。

[30]张汝舟:《二毋室古代天文历法论丛》,贵阳:贵州大学出版社,2016年,第574页。

[31]张汝舟:《二毋室古代天文历法论丛》,第614页。

[32]Wikipedia:JulianDay,https://en.wikipedia.org/wiki/Julian_day#Julian_or_Gregorian_calendar_from_Julian_day_number,accessed April 8,2023.

[33]许剑伟等:天文算法,https://www.qx121.com/weather/uploadRes/u/cms/www/201506/18220518bdl6.pdf,2023年4月7日。

[34]廖育栋:月相和二十四节气的计算,https://ytliu0.github.io/ChineseCalendar/docs/sunMoon_simp.pdf,2023年4月7日。

[35]施能锋:《万年多元中西历速算》,福州:福建科学技术出版社,1997年。

[36]夏五月,正历以正月为岁首。(汉)班固撰,(唐)颜师古注,中华书局编辑部点校:《汉书·武帝纪第六》,第199页。

[37](汉)班固撰,(唐)颜师古注,中华书局编辑部点校:《汉书·武帝纪第六》,第199页。

[38]张闻玉:《西周铜器断代研究三题》,《贵州教育学院学报(社会科学版)》1990年第2期。

[39]罗见今:《楼兰简牍年代补释》,《内蒙古师范大学学报(自然科学汉文版)》2007年第6期。

[40]刘恒:《新出土石刻拓本题跋二则》,《书法丛刊》2000年第3期。可参见:中华石刻数据库·汉魏六朝碑刻,《元氏县界封刻石》,http://inscription.ancientbooks.cn/docShike/shikeRead.jspx?id=1467018&libId=4,2022年12月1日。

[41]傅振伦:《汉武年号延和说》,《考古社刊》1939年第6期。

[42]李忠林:《秦至汉初(前246至前104)历法研究——以出土历简为中心》,《中国史研究》2012年第2期。

[43]罗见今:《楼兰简牍年代补释》,《内蒙古师范大学学报(自然科学汉文版)》2007年第6期。   

en_GBEnglish