佛教建筑数据研究与平台建设——buddhist.wiki数据平台的设计与应用

佛教建筑时空地图(buddhist.wiki)是一个面向科研系统、文物系统、宗教系统和大众信徒的信息共享平台。平台侧重于对佛教建筑(包括佛寺、佛塔、石窟、造像、遗址等)图文信息的搜集分析,并从时间和空间两个维度组织佛教建筑及文化的图文资料。

王伟侨/同济大学建筑与城市规划学院博士后(源工作室主持建筑师)

李克泉/微软亚太科技有限公司高级软件工程师

摘 要:佛教建筑时空地图(buddhist.wiki)是一个面向科研系统、文物系统、宗教系统和大众信徒的信息共享平台。平台侧重于对佛教建筑(包括佛寺、佛塔、石窟、造像、遗址等)图文信息的搜集分析,并从时间和空间两个维度组织佛教建筑及文化的图文资料。平台为每一个佛教建筑建立完整档案,包括概况、建筑、历史、艺术和人物这五方面图文信息,并以中英文双语呈现。用户可通过地图检索和时间轴来获得某一时段下佛教建筑的地理空间信息,也可通过文字检索获得具体时间空间下某类建筑的图文资料。通过提取数据的时间和空间属性,作为设计维度,对图形信息的描述和分类进行格式化,为数据平台的采集、展示、检索和研究提供系统性便利。这可视为大数据时代下研究型数据平台的初步尝试。

关键词:buddhist.wiki 数据平台 佛教建筑 时空地图 数据研究

一、数据平台缘起与宗旨

佛教建筑是历史建筑中的重要瑰宝,中国现有的大量佛教建筑是社会公共生活和历史集体记忆的载体。历史上与佛教建筑相关的史籍内容丰富,种类繁多,是宝贵的基础资料。在大数据时代下,这些基础资料和佛教建筑的实物遗存一同构成佛教建筑研究的立体网格。

关于中国佛教相关基础资料的数字化与数据整理,佛光山、法鼓山、哈佛大学、亚利桑那大学等有许多宝贵经验和相关项目开展。

在世界佛教资源的数字化、出版和传播方面,佛光山做了大量工作。佛光百科[1]是一个在线门户网站,允许弘法者和佛教徒在协作环境中开发和共享世界佛教资源,包括佛经、佛教仪式、佛教音乐、佛教讲座和佛教故事等。佛光山于2013年3月出版的《世界佛教美术图说大辞典》[2]是第一部佛教美术综合汇编,包括建筑、石窟石刻、雕塑、绘画、书法、篆刻、器物和装饰艺术、人物八类20卷具有历史和艺术意义的著作。《佛光大辞典》[3]是第一部以白话文撰写的佛典,内容涵盖佛教术语、人物、寺院、宗派、器物、仪轨、古则公案、文学、艺术等多门学科,来自印度、中国、韩国、日本、斯里兰卡、缅甸等亚洲国家以及欧美等地与佛教研究或活动有关的历史、谚语。此外,主要的现代佛教人物、事件、发展和学术也包括在其中。这个项目主要是在1978年到1998年期间完成的。值得注意的是,以上三项内容均已数字化,可简单检索其词条。

法鼓山也有许多实质贡献。中华电子佛典协会(CBETA)[4]成立于1998年,由菩提文教基金会、西莲教育基金会主办,中华佛学研究所、法鼓佛教学院协办。其宗旨是收集所有的汉文佛典建立电子佛典集成。同时,该协会还致力于研发佛典电子化技术以提升佛典交流与应用。值得赞赏的是,所有收集的佛典资料都有严谨而细致的呈现方式,并免费提供阅读、检索和下载。CBETA已成为研究佛教相关领域和佛教界人士学术研究生活中必不可少的佛典数据平台。“台湾佛寺時空平台”是法鼓佛教学院基于GIS,整合“台湾佛教史料库”[5]与“中华佛学研究所”[6]等网站资料所完成的另一重要数据平台。所用文献形成于17世纪至21世纪期间,由此追踪中国台湾佛教在百年来的传播发展与地域分布。它不仅面向学者,同时也面向佛教团体和民众,并最终希望建构佛教旅游信息平台。

除了佛光山和法鼓山,关于中国佛教建筑相关的数据平台建设,哈佛大学和亚利桑那大学也有许多重要成果。2018年,笔者在哈佛大学文理学院做访问学者时,结识了“中国历代人物传记资料库”(CBDB, China Biographical Database)项目经理Merrick Lex Berman研究员。他向我们展示了ChinaMap数据库[7]并介绍MySQL数据库处理佛寺地图数据的方法和思路。当时他已经根据《大清一统志》整理好Buddhist Sites(1820),并引用亚利桑那大学吴疆教授整理的中国佛寺地图“2006 Chinese Buddhist Temple Locations”[8]。该数据来源为2006年中国佛教协会编纂的《中国佛教寺院名录》。值得一提的是,该书所含信息截至2005年9月,内容仅准确到县市。对Merrick Lex Berman分享的BGIS数据进行分析,发现BGIS记录的佛教寺院总数为18,938座,但只有6,172个不同的地理坐标,其中3,123个坐标没有重复。这意味着83.51%的寺院位置不准确(图1)。在其余的16.49%(3,123个坐标)中,随机选择20座寺院对其地理位置进行人工验证。这些地理位置与20座寺院并不完全相关。实际上,20个地理位置中只有8个在其附近有寺院。以福建省龙岩市圆通禅寺为例,其具体位置与Excel中显示的地理位置相距约10公里(图2)。

图1 BGIS数据列表中经纬度重复问题示意图

图2 2006 Chinese Buddhist Temple Locations (BGIS)佛寺位置点不准确图示

为了进一步获得中国佛寺数量和分布地图的准确数据,2019年笔者从国家宗教事务局获得宗教活动场所基本信息列表,内容包括现有佛教活动场所的派别、场所名称、地址和负责人姓名(图3)。根据《宗教事务条例》[9]第七条规定,宗教团体的成立、变更和注销,应当依照国家社会团体管理的有关规定办理登记。因此,我们有理由认为国家宗教事务局公布的完整的宗教活动场所基本信息列表可以涵盖我国现有合法的佛教活动场所,共34,098处。关于这部分的数据如何提取,并进一步获得佛教场所的位置点将在下文第三部分的数据处理部分具体展开。

图3 国家宗教事务局公布的佛教活动场所基本信息列表

需要说明的是,我国现有的佛教建筑数量超过国家宗教事务局公布的佛教活动场所数量。诸如宁波保国寺等已没有宗教活动而却有文物遗产价值的佛教建筑,目前归属于文物部门管理。中国的世界文化遗产中的六分之一、全国重点文物保护单位中的四分之一与佛教建筑相关。此外,历史上大量的佛寺留下的塔、殿、遗址等既没有宗教活动,又未能成为文物的,其数量目前仍有待进一步核查。通过以上初步研究,笔者意识到数据来源的准确性和数据处理方法对数据平台的重要性,同时佛教建筑相关图文资料存量浩大,如何使用和呈现,也是值得思考的问题,这一点与当下人们对佛教建筑的认知和研究需求息息相关。因此,有必要分析数据平台的需求背景。

二、需求背景

中国是世界上佛教建筑数量最多和信仰佛教人口最多的国家。佛教传入中国的时间目前还未有定论,比较可信的是两汉之间。佛教传入中国的路线主要有两条:一条是由丝绸之路经敦煌传入内地,到达洛阳;另一条是经印度洋,再走太平洋,经南洋诸岛,最后到达广州,然后北上到内地。佛教建筑分布于全球五大洲,主要集中分布在亚洲地区。类别包括佛寺、佛塔、石窟、造像、遗址等;涉及内容包括建筑、历史、艺术和人物等;对象特点是时间长、分布广、内容多、受众杂。佛教建筑因其存在的大量实物和史料,与科研系统、宗教系统、文物系统和大众信徒的实际工作和日常生活紧密相关。

首先,佛教建筑对于科研系统而言是一个重要的研究对象。国内外高校设立的多个专业如建筑学、艺术学、历史学、考古学、人类学、哲学、宗教学等在其研究课题中时常与佛教建筑打交道。国内外佛教研究中心如中国社会科学院佛教研究中心、佛光山人间佛教研究院、国际佛教研究协会等在其研究过程中也多有涉及佛教建筑的内容。

其次,佛教建筑中具有宗教活动的部分受到宗教系统的监管。宗教系统包括管理系统和宗教活动场所。管理系统包含国家宗教事务局、省民族宗教事务委员会、市民族宗教事务局和区民族宗教事务局;宗教活动场所包括佛寺、寺院组织(如中国佛教协会及各省市区佛教协会)、宗教院校(如中国佛学院、栖霞山佛学院)等。根据国家宗教事务局发布的佛教寺院名录,我国佛教作为中国五大宗教(包括道教、伊斯兰教、天主教和基督教)之一,目前具有最多的道场,有34,098座佛教寺院,其中汉语系28,558座、藏语系3,857座、巴利语系1,075座。

第三,佛教建筑中具有文物级别的部分受到文物系统的管理与保护。我国文物管理系统分为国家文物局、省文物局和区文物管理委员会。佛教建筑是不可移动文物中的重要种类。在联合国教科文组织评选的世界文化遗产中,中国共有55处,其中约六分之一是佛教建筑;国家文物局自1961年至今已公布八批共5,058项(处)国家重点文物保护单位,其中约四分之一是佛教建筑;此外,各省市县分别设立文物保护单位。文物部门主要通过“四有”档案对文物进行文档记录。“四有”是指有保护范围、有保护标志、有记录档案和有保管机构。记录档案一般由10个主卷(文字卷、图纸卷、照片卷、拓片及摹本卷、保护规划及保护工程方案卷、文物调查及考古发掘资料卷、文物保护工程及防治检测卷、文物展示卷、电子文件卷和续补卷)、3个副卷(行政管理文件卷、法律文书卷和大事记卷)和3个备考卷(参考资料卷、论文卷和图书卷)组成。

第四,与佛教建筑紧密相关的还有大众信徒,包括相关从业者如建筑师、工匠等,他们直接参与佛教建筑的保护、修复或新建工作,佛教信徒为宗教活动场所提供重要的经济支持。全球的佛教信徒约有4.88亿,中国是佛教徒最多的国家,大约有2.44亿名佛教徒,占中国总人口的18.2%。[10]此外,对于普通大众而言,佛教建筑是重要的参观景点、精神空间和社会活动空间。

如图所示(图4),研究系统、宗教系统、文物系统和大众信徒之间的关系紧密相连。研究学者在对具有宗教活动的佛教建筑进行田野调研时,需向宗教活动场所的主体寺院、民宗局等申请调研许可,对具有文物级别的佛教建筑进行研究时,需向文物部门申请与研究相关的资料,主要是“四有”档案资料。宗教部门在进行宗教活动场所评估论证时,常常需要专家学者参与提供意见和建议。同样的,文物部门在涉及文物保护事宜时一般需依据专家学者的研究成果或邀请专家学者来做指导。同时,在面对具有宗教活动和文物性质的佛教建筑时,宗教部门和文物部门需联手进行合作交流。此外,文物部门一方面需负责对文物建设的审批管理,需管理佛教建筑相关从业者的工作内容,监督他们的工程质量。另一方面有责任面向大众进行文物展示、宣传和教育活动。大众信徒也会对研究学者的研究成果有学习了解的需求。研究系统、宗教系统、文物系统和大众信徒之间面对佛教建筑的相互需求关系,促使我们进一步思考创造一个共享信息平台的重要性和实用性。且考虑到研究系统、宗教系统和文物系统在展开各自工作时具有重合的部分,尤其是佛教建筑相关内容如建筑、历史、艺术和人物这几方面,为避免他们各自的重复劳动,并补全完善每个系统对佛教建筑的认知维度,平台为每个佛教建筑建立完整档案,并以中英文形式呈现(图5)。其中,建筑方面包含地理环境(航拍图、地形图、环境简介)、空间布局(测绘图纸、三维模型、布局简介)、单体建筑(历史照片、现状照片、单体模型、单体图纸、建筑简介)。历史方面包括建造历史和宗教活动大事记。艺术方面包括诗词、书法、绘画、工艺和音乐。人物方面包括僧人、居士、艺术家等和佛教建筑相关的人物。

图4 佛教建筑与研究系统、宗教系统、文物系统和大众信徒的紧密关系

图5 佛教建筑时空地图(buddhist.wiki)数据平台中的佛寺档案示例

三、数据研究

对数据平台而言,最重要的是数据。其中,数据类型、数据处理和数据呈现是数据平台的考虑要点。

1.数据类型

构成佛教建筑时空地图数据平台的主要内容是(佛教建筑)时空地图和佛教建筑(档案)。其中时空地图是带有时间维度的空间分布,主要涉及以下几种情况:历史上的寺院、现存寺院、新增寺院。历史上各个朝代(时期)分别有多少寺院?建造规模如何?分布如何?寺院与城市的关系如何?今天的中国有多少前代留存的佛教建筑?有多少新增的寺院?它们与周围环境的关系如何演变?佛教建筑带有空间维度的时间积累,包含与佛教建筑相关的概况、建筑、历史、艺术和人物等方面。它们都是与这个佛教建筑有关的从古至今的图文资料。

时空地图的构建需梳理历代佛教建筑数量及分布情况,一方面需要从地理志书中整理佛教建筑情况,另一方面需基于地理志书中对其方位的描述,结合信息检索,尽可能确定它们的经纬度。这方面的地理志书包括:官修地理总志、地方志、寺志等。

历代官修地理总志多包含对主要寺观的简要记录和描述,通常涉及寺院的简要历史、旧名、大致方位描述和存亡情况。目前主要留存的官修地理总志包括唐代《元和郡县图志》,宋代《太平寰宇记》《元丰九域志》,元代《大元大一统志》(又称《元一统志》),明代《大明一统志》和清代《大清一统志》。其中,唐代《元和郡县图志》是中国最早、记录较完整的地理总志。南宋以后图已佚,文字也有残缺。目前以近代贺次君注解的为最佳版本。其中,共记录具体佛寺名称10个。《太平寰宇记》仿李吉甫《元和郡县图志》的体裁,是北宋初期的一部地理总志,共提及佛寺30个。《舆地纪胜》是一部私撰南宋地理总志。《大元大一统志》所记录各路、州、县内容多来自唐代《元和郡县图志》。作为中国元代官修地理总志,该志书至清中叶已散佚不全。通过统计《玄览堂丛书续集》《辽海丛书》《元一统志》三书,共发现记录佛寺377个。在沿袭摹仿《大元大一统志》体例基础上,明清两代分别完成各自的官修地理总志。《大明一统志》成书于明代天顺五年(1461),全书共90卷,在各卷寺观中共记录佛寺1,462个。《大清一统志》是中国官修地理总志中内容最丰富最完善的一部,从清康熙二十五年(1686)至道光二十二年(1842)共编辑过3部:康熙《大清一统志》、乾隆《大清一统志》、《嘉庆重修一统志》。其中,以《嘉庆重修一统志》内容最为详实,全书共560卷。值得一提的是,该志仅反映到清嘉庆二十五年(1820)为止。与前面几本的统计方法相同,数据平台仍然(目前的技术条件也只能)通过人工的方式,将《嘉庆重修一统志》中的佛寺及相关介绍一一摘出。该志书共记录佛寺2,893个。这些简要的信息可以帮助构建各朝代主要寺院的分布地图。目前,数据平台正在处理该项工作,一方面通过人工查找核对获得各个佛寺的经纬度,以及各朝代佛寺分布地图;另一方面,由于每个佛寺在平台有唯一的ID,对应唯一的经纬度,可以由此查看佛寺在历代的存亡情况。以《嘉庆重修一统志》浙江省部分为例,共有175个佛寺,能找到精确经纬度的134个,找到大概经纬度的26个,未能找到经纬度的15个。其中延续至今仍为寺院的有125个,成为废墟或仅剩局部殿塔的有35个。《大明一统志》中记录的位于浙江布政司辖域内的佛寺共有151个,与《嘉庆重修一统志》记录浙江省寺院相比,位置重合的有42个,我国现存的佛寺建筑也多是明清时代留下来的,可以据此分析主要佛寺由明清至今的演变情况。以2019年国家宗教事务局公布的宗教场所数据来看,浙江省范围内现有佛寺4,062座。值得注意的是,今天与过去相比,由于获得信息的渠道和技术能力不同,我们所看到佛寺的数据量是明清时期记录的几十甚至几百倍。有两个问题不能忽视:1.明代和清代的浙江省范围与今天的浙江省行政区域范围是有偏差的,这一点需进一步厘清;2.官修地理总志仅记录当时的部分重要寺院,要了解明代或清代的完整寺院情况,需从大量的地方志、山志等史志资料中获得补充信息。

中国地方志,作为重要而珍贵的学术资源,涵盖地理人文历史等各方面的综合性资料,其中多包含各地方佛寺资料。中国台湾“中研院”所做“中国大陆各省地方志书目查询系统”是较为完整的收录版本。“有关中国各代地方志书目之收集,中国科学院北京天文台曾于1985年编纂出版《中国地方志联合目录》,收录1949年以前出版之历代方志共八千二百余种。‘中国各省地方志书目查询系统’以《中国地方志联合目录》为基础,参照2000年新出版之《中国地方志总目提要》等,增补1949年以后各地新编如省、县、市志、自治州志、乡志、街志等二千余种。此外,针对各地原有孤本地方志新刊行者,亦加以著录。简言之,本系统所收录的地方志条目堪称是当今世上最完整者。基本涵盖宋元明清各时期,而当代新编地方志,特别是1949年以后的地方志,亦详加著录。未来亦将持续更新,随时补充,以方便使用者。”[11]中国台湾“中研院”基于GIS,“以中国为空间范围,并以原始社会迄今的中国历史为时间纵深,以中国文明为内涵的整合性资讯应用环境”,建构了“中华文明之时空基础架构”计划。[12]其中,“基本空间图资以谭其骧先生主编之《中国历史地图集》为主要的基础,提供上古至清代,上下逾二千年的中国历代基本底图,并辅之以持续整理搜集之各类历史地图、遥测影像等基础图资”。这为我们了解中国历代行政区域疆界变化,研究各类各时期地理志书所涵盖的空间范围提供重要参考。

“方志是地方史书,内容非常丰富。在方志中包含着大量有用的佛教资料,如寺院的建设与沿革演变、佛教人物、与佛教有关的风物人情和名胜古迹等都可以被方志所记载。”[13]叶宪允(2013)以乾隆朝《番禺县志》为例,具体展示了佛教研究中方志资料的重要性。那么如何利用方志中记录的佛教资料,尤其是如何确定佛寺位置?香港中文大学历史系苏基朗教授作为“晚明至清中叶大松江地区棉纺织业研究”项目主持人,建立了“晚明至清中叶大松江地区棉纺织业研究项目地理讯息系统数据库”,其中,依据《崇祯松江府志》建构“明代松江府的寺庙”[14],包括松江府华亭、上海及青浦三县总数达500多座寺庙。在为寺庙定点时,主要分镇市和郊区两大类,“城区内的寺庙定点时,便采取更精细的定点办法,将底图的地理情况与方志内各个城区地图作比较,按照城区图内的寺庙、官署和学校等相对的位置,以决定寺庙定点的所在”,“相对于府县城或个别镇市的方向和距离、同时亦具如河道等天然地标”来确定郊区寺庙位置点。这种基于相对空间关系的定点方式可以建构相对位置大致准确的明代松江府寺庙地图,但很难精准建立寺院位置与清代甚至与今天的具体空间关系。因此,本数据平台以佛寺经纬度作为唯一的位置,对应唯一的佛寺ID,以确保佛寺位置数据能在空间分布层面及时间纵深层面与各个寺院及相应的佛教资料进行准确的关联。

爱如生数字化技术研究中心所作“中国方志库”,“地方志类著作,包括全国地理总志(如方舆志、一统志等),各地方志(如省通志、府州志、县志等),各类专志(如山川志、边防志、都城志、宫殿志、村镇志、里巷志、园林志、寺观志、书院志等),各种杂志(如乡土志、物产志、风俗志、考古志、游历志等),以及外志(如环球志、一国志、多国志等)。所记大至一国一省一州一府,小至一村一镇一城一关,举凡历史沿革、地理形势、行政建置、财赋收入、物产资源、人文景观、灾异祸乱、乡土风俗、靡不详尽。‘中国方志库’所收地方志类著作,上起汉魏,下迄民国,共计1万种。每种皆据善本制成保留原书所有资讯的数码全文,另附原版影像,总计全文超过20亿字,影像超过1千万页,资料总量约350G。”[15]华中师范大学中国农村研究院于2019年完成的“中国地方志数据库”收录地方志量达31,483册,计82,735卷。[16]以上数据资料和数字化内容将是本数据平台佛寺档案内容的重要来源。

虽然寺志是地方志中的一种,因以记录佛教寺院的建置沿革、历代住持、檀施法护、山场田地、寺规戒律、瑞应灵异、法缘文字等专门事类的内容为主,与佛寺关系更加密切,是本数据平台佛寺档案数据构建的重要组成部分。“近代对于佛寺志主要的汇集作品,主要为两部于20世纪所完成的木刻版编辑丛书。第一部为:1980年至1985年由杜洁祥主编之《中国佛寺史志汇刊》[18],此部丛书共有110册,前后共分三辑,分别由台北明文书局(前两辑)与丹青图书(第三辑)发行。而另一部是:2005年由张智主编,扬州广陵书社出版的《中国佛寺志丛刊》[19],内容共130册。110册的《中国佛寺史志汇刊》,内容共包含100部寺志,而《中国佛寺志丛刊》的130册内容中,收录197部寺志。两丛书所收录的所有寺志当中,共有60部寺志是完全相同或仅有小部分差异。因此扣除重复的部分之后,我们可认为内容共有237部具参考价值的寺志。”[20]2007年至2018年期间,法鼓文理学院进行“中国佛教寺庙志数位典藏”项目,完成了237部寺志内容的影像扫描和全文数字化,并采用TEI(Text Encoding Initiative)标准的XML(Extensible Markup Language)语言,针对文章进行标记,以表达文字之外的其他重要信息。其中,所识别的人物、时间与地点资料对于本数据平台来说,是补充佛寺档案的重要数据来源。需要提及的是,法鼓文理学院无私奉献和严谨治学的精神着实令人敬佩。

涉及佛教建筑所需的相关图文资料可以从正史、地理志、僧传、寺志、地方志及文人游记等史料和绘画、老照片等图片中获得。

我们常说的正史一般是以清朝时乾隆皇帝诏定的二十四史为正史,“作为正史中的佛教文献资料,由于淹没在浩翰的正史之中,利用起来非常困难”[21],兰州大学敦煌学研究所杜斗城教授组织汇编《正史佛教资料类编》[22],共分十卷:通论、人物、塔寺、议论、事迹、敬佛、教令、经籍、出尼、毁佛。其中第二卷人物和第三卷塔寺与本数据平台的内容紧密相关,可作为补充了解历史上与佛教相关的人物和塔寺记录,待进一步纳入数据平台内容中。值得一提的是,CBETA汉文大藏经网站已将该书电子化[23]并公开,更是为资料的进一步分析利用提供了便利。

除此之外,佛教史所载《高僧传》《续高僧传》《宋高僧传》《大明高僧传》等记录大量佛教僧人事迹,同时也包含与此相关的佛寺情况,这部分内容亦需要进一步研究理清。

图文资料还包括历朝历代的游记、诗词、碑记等,历代描绘佛教建筑山水画、地方舆图、山图、老地图,寺院相关的近现代著作及近代已发表的测绘图纸,19世纪末至20世纪初来华的外国人行旅中国时留下的大量游记、老照片和相关研究著作等,这些都是构成佛教建筑档案的主要内容。然而图文数据存量浩大且类型繁多,需逐步考究理清。

2.数据处理

在初步获得图文数据后,如何整理和呈现也是数据平台的一大重要工作。对于时空地图的构建主要是通过计算机程序批量处理数据和人工逐一处理数据这两种办法来实现。比如国家宗教事务局的数据规范性比较强,当下地图平台提供了易于使用的API,使得我们能批量获得这些寺院的经纬度坐标。而像《大清一统志》,则需要对寺院进行逐一人工核验、查找和处理。对于佛教建筑档案图文资料的收集,有规律且已经数字化的图文内容可通过计算机程序批量导入,没有的则需人工逐一导入。

关于数据处理的相关技术细节,本文以2019年国家宗教事务局所公布的34,098座佛教寺院名录为例,简要介绍寺院列表及其经纬度坐标等地址信息的获取方法和处理过程。笔者从国家宗教事务局网站上爬取两份数据集:宗教活动场所列表,包括宗教、派别、场所名称、地址、负责人姓名五个字段,共计34,098座佛教寺院;三级行政区划(省、市、区)列表。对这些数据依次进行如下处理:(1)删除其中包含的空格。(2)大部分数据的地址以“xx省xx市xx区”开头,但仍有一定数量的地址格式并非如此。对于前者,我们利用行政区划列表,将其中的省、市、区信息提取出来。对于后者,我们用百度地图Geocoding API,通过地址信息获取经纬度坐标;然后再用百度地图的Reverse geocoding API通过经纬度坐标获取省、市、区和详细地址。经过这一番处理,我们获得了所有寺院的省、市、区信息,并将其保存在数据库表格的不同字段里。(3)再次使用百度地图Geocoding API,通过场所名称和市,获取经纬度坐标。在API返回的结果中,有一个comprehension字段,表示结果的准确程度。这些百度地图API的返回结果遵循当前的行政区划,而当前有些县、县级市(区级行政单位)是省直属的(比如湖北省仙桃市、海南省安定县)。因此这些地方的宗教场所,其市这一级是空缺的,我们手动以区来填充市。(4)至此,我们获得了所有寺院的经纬度坐标和地址详情。然而,其中有很多数据并不准确。我们将以下三种情形的数据筛除掉:(1)原始数据的省、市、区信息与Reverse geocoding API返回的省、市、区信息不一致;(2)重复坐标:百度地图Geocoding API有时候会返回地点所在的市/区的中心点的经纬度坐标,因而导致坐标点的重复;(3)comprehension值小于50。通过以上处理,我们获得了一份包含准确经纬度信息的寺院列表,共计12,647座佛教寺院。对于其余的21,451座佛教寺院,则需通过人工核对,逐步进行验证和录入。

3.数据呈现

准确的数据来源还需要易检索的数据形式。数据的呈现体现了数据平台的设计理念:简单、统一、可持续。面对浩翰的图文数据,通过提取数据的时间和空间两个属性,对佛教建筑相关信息进行收集、整理、聚合、检索和呈现,目的是方便研究系统、文物系统、宗教系统和大众信徒之间关于佛教建筑的信息共享。

平台为PC端网页,前后端分离。前端分为数据呈现部分和后台管理系统,前者采用Vue2.0和MapBox,用Leaflet和supercluster聚合地图坐标,后者基于vue-element-admin二次开发。后端采用NodeJS和Express框架实现RESTful API,用Passport实现登录鉴权。数据存储于MySQL数据库,用nodebatis访问。图片资源存储在七牛云,从浏览器直接上传和访问。用Azure Application Insights记录前后端日志。

在使用体验上,也寻求更加友好、便捷和直观的效果。在首页时空地图,使用者可以通过拉动下方的时间轴看到地图上佛教建筑点的变化,由此可以看到不同时期的佛教建筑分布情况和演变情况。在佛教建筑档案的建筑页面,使用者可以通过点击建筑图纸上的建筑空间(图6),获得与该建筑相关的老照片和文字介绍。同时也可以拉动时间轴,看到不同时期同一建筑的演变情况。在历史、艺术和人物方面,也可以通过拉动时间轴迅速获得某一时间段与该佛教建筑相关的图文信息。

图6 数据平台佛教建筑档案的建筑页面

4.已收录数据

地图部分:目前收录的佛教建筑所在地涵盖了中国、日本、韩国等地,包括国家宗教事务局于2019年公布的34,098座佛教寺院名录;中国境内,笔者从百度地图获取的12,647座寺院的准确经纬度等地址信息;日本文化厅官网公布的862座佛教建筑信息;韩国文化财产厅官网公布的391座佛教建筑信息;除去中日韩三国数据,Wikipedia公布的全球525座佛教建筑信息;联合国教科文组织官网公布的世界文化遗产名录中的32座佛教建筑信息等数据。

佛寺档案:100余座寺院田野调研一手资料,其中包含浙江省20座寺院(包括普陀山5座寺院)、山西五台山约60座寺院、四川峨嵋山10座寺院、安徽九华山10座寺院、江苏省5座寺院的CAD测绘图纸、航拍图、老照片、寺藏文物资料等。

四、应用前景与展望

本数据平台的创新亮点是将佛教建筑相关的图文信息通过时间和空间维度进行录入、筛选和获取,是面向研究系统、文物系统、宗教系统和大众信徒的信息共享平台。首先,对研究系统而言,它是获取图文资料和帮助分析的研究工具;其次,本数据平台是文物保护及相关档案自下而上的高效存储宣传系统;再者,对宗教系统而言,本数据平台是宗教活动场所进行有效管理的信息资源库;对大众信徒而言,它是了解和认知历史、文物和宗教建筑的学习平台。

Data Research and Platform Construction of Buddhist Monuments: Design and Application of buddhist.wiki Data Platform

Wang Weiqiao, Li Kequan

Abstract: The Data Platform of Buddhist Monuments in Time and Space (buddhist.wiki) is an information sharing platform for research system, cultural relics system, religious system, and pilgrims and ordinary people. The platform focuses on the collection and analysis of graphic and textual information on Buddhist monuments (including Buddhist monasteries, pagodas, grottoes, statues, ruins, etc.), and organizes the information on Buddhist architecture and culture from two dimensions of time and space. The platform establishes a complete archive for each Buddhist monument, including five aspects of graphic and textual information-overview, architecture, history, art, and personage, and presents it bilingually in both Chinese and English. Users can obtain geospatial information of Buddhist architecture in a certain period of time through map search and timeline; they can obtain graphic and textual data of certain architecture types in a specific time and space through text search. By extracting the time and space attributes of the data and using them as the design dimensions, the description and classification of graphic information can be formatted, which provides systematic convenience for the collection, presentation, search, and research for the Data Platform. It can be regarded as a preliminary attempt of a research-oriented data platform in the era of big data.

Keywords: Buddhist.wiki; Data Platform; Buddhist Monuments; Time-space Map; Data Research

编辑 | 肖爽

致谢

我们衷心感谢哈佛大学前网络服务经理和GIS专家Merrick Lex Berman研究员、华东理工大学闫爱宾教授、建筑师王若凡和软件工程师林宏锐提供的慷慨帮助和宝贵建议。佛教建筑时空地图数据平台(buddhist.wiki)荣获2020年第五届上海图书馆开放数据大赛二等奖和第六届上海开放数据创新应用大赛三等奖,特别感谢上海图书馆刘炜副馆长对数据平台给予大力支持。

注释

[1]FoGuangPedia, https://foguangpedia.org/.

[2]http://arts.fgs.org.tw/fgs_arts/.

[3]FGDB, https://www.fgs.org.tw/fgs_book/fgs_drser.aspx.

[4]https://www.cbeta.org.

[5]http://buddhistinformatics.dila.edu.tw/taiwanbuddhism/tb/.

[6]http://www.chibs.edu.tw/index_tw.php.

[7]该数据库原访问地址为worldmap.harvard.edu/chinampa/,如今已不能访问,数据内容搬至网站https://worldmap.maps.arcgis.com/home/index.html。

[8]BGIS, https://cbs.arizona.edu/buddhist-geographical-information-system-bgis.

[9]2004年11月30日中华人民共和国国务院令第426号公布,2017年6月14日国务院第176次常务会议修订通过,http://www.gov.cn/zhengce/content/2017-09/07/content_5223282.htm,2022年5月2日。

[10]引自维基百科:https://zh.m.wikipedia.org/zh-hans/%E5%90%84%E5%9C%8B%E4%BD%9B%E6%95%99#:~:text=%E6%A0%B9%E6%8D%AE2010%E5%B9%B4%E5%90%8E%E7%9A%84,9%EF%BC%85%E8%87%B310%EF%BC%85%E3%80%82。

[11]中国大陆各省地方志书目录查询系统,https://www.jiansuoke.com/db/webgis-sinica-place。

[12]“中华文明之时空基础架构”计划简介:http://ccts.sinica.edu.tw/intro.html。

[13]叶宪允:《方志在佛学研究中的文献功能与作用——以〈番禺县志〉为例》,《科技情报开发与经济》2013年第11期。

[14]http://www.iseis.cuhk.edu.hk/songjiang/temple_1.htm.

[15]爱如生数字化技术研究中心,“中国方志库(爱如生数据库)”,2010年,https://hollis.harvard.edu/primoexplore/fulldisplay?docid=01HVD_ALMA612271824640003941&context=L&vid=HVD2[16]lang=en_US&search_scope=everything&adaptor=Local%20Search%20Engine&tab=everything&query=any,contains,爱如生数字化技术研究中心&offset=0。

[17]中国地方志数据库,http://lcd.ccnu.edu.cn/。

[18]杜洁祥主编:《中国佛寺史志汇刊》,台北:明文书局、丹青图书公司,1980—1985年,http://buddhistinformatics.dila.edu.tw/fosizhi/fosizhilist_g.pdf。

[19]白化文、张智主编:《中国佛寺志丛刊》,扬州:广陵书社,2006年,http://buddhistinformatics.dila.edu.tw/fosizhi/fosizhilist_y.pdf。

[20]洪振洲:《中国佛教寺庙志数位典藏系统之建置》,《法鼓佛学学报》2013年第12期,https://doi.org/10.6889/DDJBS.201306_(12).0004。

[21]郑炳林:《〈正史佛教资料类编〉缘起》,2005年11月8日,http://www.cbeta.org/cbreader/help/other/H01/H01a.htm,2021年12月20日。

[22]杜斗城:《正史佛教资料类编》,兰州:甘肃文化出版社,2006年。 [23]杜斗城:《正史佛教资料类编》第一册,2006年,http://tripitaka.cbeta.org/H01n0001.

en_GBEnglish