邦妮·麦 / 美国伊利诺伊大学香槟分校信息科学学院
戚 悦(译) / 清华大学人文学院
摘 要:考古学研究方法可用于探索数字化资源的形成、传播和接受。这一讨论以著名的数据库“早期英文图书在线”(Early English Books Online,简称 EEBO)为例,尝试厘清数字化信息与底本之间的关系,阐明数字化信息在哪些方面见证了当前对过去的认识,并被运用到相应的学术研究之中。希望以对EEBO及其数字化信息的批判性分析为基础,在更加广泛的层面上研究数字化资源给思想观念传播和文化遗产的形成所带来的影响。
关键词:数字化 数据库 考古学研究方法 文化遗产 早期英文图书在线

面向大众和学者的数字化资源不断涌现,促使人们对这些新资料与其所代表的文件、图书以及人工制品之间的关系产生了广泛的兴趣。虽然数码复制的研究已经强调了“再媒体化”(remediation)的概念,但尚有一些问题并未得到详细探讨,如数字化信息与底本之间的本体性分歧、这种分歧造成的后果,以及如何对数字化资源进行有效的批判性分析。[1]关于图书馆和档案馆应该如何对待数字化资料,学界尚无定论[2],不过我们可以探索这些资料在知识生产中的作用,从而加深对它们的理解。为此,本研究决定借鉴考古学原理,挖掘并思考数字化信息形成、传播和接受过程中的各类实践。米歇尔·福柯(Michel Foucault)曾将这个特殊的考古学概念作为批判性分析的一种手段加以推广[3],事实证明它有利于展现本研究的调查范围和方法。1976年,L. M. J. 德雷塞(L. M. J. Delaissé)也提倡对中世纪手抄本进行考古学研究,并称之为“所有手抄本研究的第一步”,随后他又做出解释,认为这种方法能够“保证我们充分掌握有关图书历史及内容的重要事实”[4]。正如德雷塞希望他的考古学研究可以为中世纪图书建立强大而全面的历史一样,笔者也希望运用考古学研究方法,为数字化信息的未来历史奠定基础。因此,本文将挖掘一个特定的数字化项目,介绍该项目的形成过程,研究数字化信息的传播条件,探讨如何对类似的项目进行批判性分析。
目录学家D. F. 麦肯齐(D. F. McKenzie)[5]、古典学家詹姆斯·J. 奥唐纳 (James J. O’Donnell)[6]和历史学家罗杰·夏蒂埃(Roger Chartier)[7]曾经把数字化媒体放在阅读和写作技术的广阔范围内进行思考,我们下面的探索便以此为基础,将数字化信息置于手抄本研究、图书史和更加普遍的思想传播领域之中。近年来,对于目录索引和文学批评等工具的理解不断深入,促使许多学者开始研究数字化图书和文本的物质性,其中包括艾伦·加莱(Alan Galey)[8]、 约翰娜·德鲁克(Johanna Drucker)[9]、马修·G. 基尔什鲍姆(Matthew G. Kirschenbaum)[10]、艾伦·刘(Alan Liu)[11]和 N. 凯瑟琳·海尔斯(N. Katherine Hayles)[12]。本研究也同样采用了较为成熟的人文方法,来探索数字化人工制品在思想传播中的作用,尤其是古文字学、手抄本学、目录学和艺术史的方法,从而区别于传播史和传播学的研究[13],后者关注的是更加广泛的交流结构[14]。在这里, 数字化信息的主要特征不是技术性,至少它不会比中世纪泥金手抄本或报纸具备 更多或更少的技术性,我们将把数字化图书当成实际存在的目录学对象进行分析。作为人类劳动的产物,数字化信息在其实体化的过程中能够提供许多线索,帮助我们认识其制造和传播的环境。这些线索涉及了副文本(paratextual)和近文本(peritextual)、形式和内容。如果把它们放在一起加以审视,我们将对该数字化信息及其策略有更加细致入微的理解,因为意义就是在这种基础结构中形成的[15]。 正如探索古代和中世纪社会需要研究其文字记录的各个方面,包括句子的标点[16]、字词的间距[17]和字体的形状[18],本文也采取了一种相似的方式,试图解码数字化文本或图像的物质实体化过程,从而考察当代知识建构(knowledge-making)的历史与政治。

一份中世纪手抄本的数字化也就意味着一个21世纪观点的物质化,而这个观点围绕的对象便是那份至少已经历了500年演变的手抄本。这样一件人工制品 (如大英图书馆所藏8世纪的《林迪斯法恩福音书》[Lindisfarne Gospels]或瑞典皇家图书馆所藏13世纪的《魔鬼圣经》[Codex Gigas])的数字化发生在当代特殊的社会、文化、经济和政治环境中,相应地为当代受众提供了一种回忆和纪念某段历史的特殊途径。在单独考察一项数字化信息时,我们会发现它与其所代表的物体本身紧密相连,并且体现了有关该物体的各种情况,尽管这种体现可能是不够连贯的:也许是12世纪的手写文字与插图,或是15世纪的印刷工标志,加上18世纪的旁注、19世纪的叙录,以及近期被珍本收藏家所装订的痕迹。此外,这样一项数字化信息还伴随着当代的元数据(metadata)和其他副文本,在特定的叙述条件下凸显该数字化信息及其底本或原始人工制品的重要性。如今,上述的所有历史都可以同时呈现出来。数字化信息既与底本密不可分,又体现出自身的特点,既传递着过去,又表达着现在,它构成了一个独特的空间,我们可以在这里清楚地看到许多传统互相交叉,同时,对于正在进行的意义建构过程,它也提供了颇具启发性的线索[19]。
以下研究将考察“早期英文图书在线” (Early English Books Online,简称 EEBO),这是一个网络资源,提供早期英文印刷图书的各种数字化信息,即印刷文本和图像的数字化版本。作为历史资料的代表,这些数字化信息来自传统技术与新兴技术的特殊结合。新与旧的重叠会使数字化信息变得更加有趣,不过正是由于这种混杂的特征,使得学术分析很难对数字化信息进行定位。为了研究EEBO中互相交叉的时间性,本文采用了“重写本”(palimpsest)的概念。所谓重写本,就是一个书写载体,上面原有的文本或图像被抹去并换成了另一种文本或图像。对于莎草纸和中世纪的羊皮纸而言,这种循环利用的方式很常见,因为它们都是结实坚韧的材料,即使经过清洗或刮擦,也仍然能够提供可用的书写载体[20]。顾名思义,重写本是并未完全抹除的证据,留有过往的痕迹——虽然有些部分消失了,但是那段岁月依然触手可及。正是因为这种新旧重叠留下了丰富的线索[21], 所以我们可以说数字化信息本身便是充满活力的历史性资源,能够为有关知识生产和传播的长久讨论提供不同的切入点。
“早期英文图书在线”作为早期英文印刷资料的数据库,在人文领域——尤其是文学、历史和图书史领域的学者中颇受欢迎,为本次的考古挖掘准备了令人熟悉的场地。EEBO提供了上溯到1700年的早期英文印刷图书的全文转录和数字化图像,支持用户检索,其采用的转录形式既有文本版,也有扫描版[22]。这个数据库包含了超过 125,000种图书,对于文学学者和研究近代早期英格兰及其殖民地的历史学者来说,它已经成了一种标志性的参考工具。EEBO由多种要素组成,但与其联系最为明显的是《1475—1640年间英格兰、苏格兰和爱尔兰印刷图书以及海外英文印刷图书简明目录》(Short-title catalogue of books printed in England, Scotland, and Ireland, and of English books printed abroad, 1475–1640)。为了补充数据库里的条目,EEBO会不断地从“英文简明目录”(English Short- Title Catalogue,简称ESTC)中获取文献记录,对特定图书的缩微胶片进行数字扫描,标记扫描后得到的转录文本,最终发布转录文本的“打印预览”版[23]。我们把数据库及其数字化的文本和图像视为重写本,进而分析它们之间的关系以及它们与历史先例的关系,并且从日渐增加的学术资源出发,找到它们的定位。我们的考古挖掘将从上述“简明目录”(Short-Title catalogue,简称STC)开始,因为那是EEBO的灵感来源。
STC是A. W. 波拉德(A. W. Pollard)和G. R. 雷德格雷夫(G. R. Redgrave) 于20世纪初进行的一项尝试,目的是生成一份简明参考目录,为追溯1641年以前英国及其殖民地内英文印刷图书的现存版本之关系奠定基础。第一版目录的编纂花费了大约8年时间,用主编的话来说,参与编纂的人员都是“70岁以上的老人”[24]。在STC的前言中,波拉德提醒说:“这份目录里出现的都是编纂者能够找到的图书,而不是已知或据说曾有过的图书。”而且,由于资料的来源非常复杂,两位主编表示,没有查证信息就直接使用STC的做法是“很危险”的。实际上,波拉德和雷德格雷夫承认:“如果这项工作从一开始就能按照更加系统的计划进行,尤其是,如果我们当初可以获得更多美国图书馆和藏书者的帮助,那么这份目录会具备更高的完整性、统一性和准确性。”[25]STC 的修订和更新于1949年正式开始,当时的主编是W. A. 杰克逊(W. A. Jackson)和F. S. 弗格森(F. S. Ferguson)。这项工作历经30年才得以完成,而《简明目录》的最后一位主编凯瑟琳·潘茨尔(Katherine Pantzer)承认,修订版同样暴露了“执行层面的不平衡问题”,包括前后描述的不一致以及版式命名的不规范。由于各位主编是在数十年时间里跟不同专业的研究者共事,出现这样的情况也是在所难免。此外,潘茨尔还坦言,为了在截稿日期前完工,最终的版本还删掉了一些条目。她用“复杂”和“曲折”来形容这次修订的过程,并表示尽管有些图书在第二次世界大战期间被烧毁了,但她还是决定把它们的条目收入STC,并在前言中予以特别说明[26]。

因此,按照最初的构想,STC只是一个目录初稿,此后还会有一个关于英文印刷图书及其版本的“正式”目录。在第二版中,有关其可靠性、广泛性和完整性的警告又得到明确重申,因为第一版的提醒“依然存在被忽视的风险”[27]。STC及其修订版的缺点,尤其是综合性和一致性的欠缺,在目录的前言中得到了主编们的公开承认,并引起了学界的讨论,将近一个世纪后,这样的讨论仍在《美国目录学协会论文》(Papers of the Bibliographical Society of America)《图书馆学》(The Library)《图书馆学季刊》(Library Quarterly)等学术期刊上不时见到[28]。 G. 托马斯·坦瑟雷(G. Thomas Tanselle)从目录学研究史的角度考察STC,指出它的目的是“区分不同的版本;而且它的历史与伦敦目录学协会(Bibliographical Society)的历史紧密相连,该协会的兴趣在于图书的历史, 而非目录的编纂”[29]。D. F. 麦肯齐更进一步指出,该协会在20世纪初的首要任务是“建立一个系统的记录,统计出版时间截止到1640年底的现存印刷图书,并准确判断英国在这一时期最重要的文学文本是如何从手抄本传递到印刷本的”[30]。 即是说,目录学协会的使命塑造了STC,它被用来满足一种特殊的愿望,那就是追溯英文图书的版本流变。
数字化信息有助于强化一些固有的成说,因此可以用来代表一个特定群体的文学或民族认同。马茨·达尔斯特鲁姆(Mats Dahlströ m)、约阿西姆·汉森(Joacim Hansson)和乌尔利卡·杰尔曼(Ulrika Kjellman)曾做过相关讨论,研究了瑞典皇家图书馆所藏《魔鬼圣经》和《古今瑞典》(Suecia Antiqua et Hodierna)的数字化,以及隆德大学的《圣劳伦迪乌斯数字档案》(St. Laurentius Digital Archive)[32]。类似的项目重新记录了关于文化遗产的特定描述,并进一步明确了这些描述的优势地位。例如,大英图书馆将数字化的《林迪斯法恩福音书》称为“盎格鲁—萨克逊艺术的巅峰”,可能会在无意中让人们忽略一些尚未解决的争议,比如这份手抄本是否来自林迪斯法恩,以及它在多大程度上代表了所谓的盎格鲁—萨克逊风格[33]。正如斯图亚特·霍尔(Stuart Hall)所言,遗产“总是被那些掌控过去者的力量和权威所左右,他们对历史的看法至关重要。这些观点和影响被视为自然的存在,意味着既定、永恒、真实而必然”[34]。因此,当数字化信息融入已经确立的文化遗产中,变成一个不可或缺的部分时,它就能免遭质疑。EEBO与STC以及英语文学遗产的结合,可以防止数据库受到批评。从这个角度来看,如果批评文化遗产的数字化信息,可能会让人理解成是在质疑一项已经被公认为“既定、永恒、真实而必然”的文化遗产。
考察EEBO中的数字扫描件,可以发现有关其制作和传播过程的许多重要线索。实际上,EEBO数据库里的图像采用缩微胶片作为直接底本,而这些“数字复制页面”(digital page facsimiles)通过胶卷号、不规则的曝光和其他类似的标记清晰地展现了它们的历史[35]。考古学研究不会把这些制造过程的物质痕迹当成操作失误或意外干扰,而是将其视为人工、机器和时间留下的线索。在数字化的社会历史中,这些标记构成了宝贵的证据,可以帮助我们建立对数字扫描件的批判性理解,从而在更加广泛的层面上探索思想观念的传播。
1930年代,大学缩微制品公司(University Microfilms International,简称 UMI)的创始人尤金·鲍尔(Eugene Power)开始把STC中列举的图书做成缩微胶片[36]。这项工程名叫“早期英文图书”(Early English Books),它的历史也非常“曲折”:复制图书最初是鲍尔创业计划的一部分,他想提供一种按需出版的服务,利用全新的缩微技术拍摄图书的负片,并出售洗成正片的胶卷。鲍尔认为对于他的实验来说,STC图书是一个宝贵的资源,因为“相应的市场需求肯定很大,美国各地的图书馆刚建立不久,普遍缺乏STC条目”[37]。在制作完第一批货物以后,鲍尔意识到他并未充分发挥胶片的优势,因为每卷缩微胶片只有一本书。他改变方式,让后续的胶片(长度约100英尺)每卷都能传递20到30本书,而不仅仅是一本书。由于许多毫不相干的图书被整合到同一卷胶片上,物质层面的重新配置改变了资料的识别和分类。按照最初的计划,图书的胶片要按照年份和作者姓名的字母顺序排列,实际上第一批货物也正是这样做的。后来的胶片是根据一种内部编号进行简单排列,而这种编号又对应着STC的条目顺序。不过即便如此,鲍尔还是承认,因为少数图书难以获取,而且部分图书会提前被送去拍照,所以出现例外也是在所难免[38]。制作、整理和传播资料的实验史都体现在胶片中,而这些胶片又影响了EEBO的知识结构。

到了1930年代末,鲍尔担心战争会切断他从英国图书馆获取STC图书的途径,进而阻碍刚刚兴起的缩微胶片事业——此时已有16家机构成了他的订阅客户。学术界也开始担心欧洲图书馆能否在日益动荡的环境下守护图书和手抄本,包括鲍尔在内的评论者“一致认为必须采取措施,至少把英格兰地区的珍本保存下来”[39]。1940年6月,美国国会图书馆和美国学术团体协会(American Council of Learned Societies,简称ACLS)联合举办了一次会议,得出的结论是,鉴于国外局势的不断恶化,“学术中心将转移到美国,应该制定一项计划,把世界各地原始资料的缩微胶片副本集中到美国”[40]。为此,历史学家赫伯特·A. 凯勒(Herbert A. Kellar)和露西尔·奥康纳·凯勒(Lucile O’Connor Kellar)编定了一份“美国学者所需历史资料清单”[41]。7个月后,洛克菲勒(Rockefeller)基金会投入30,000美元支持这项最终被交予鲍尔负责的缩微工作,并于1941年9月再次拨款。于是,凭借ACLS缴纳的费用和洛克菲勒基金会提供的赞助,鲍尔得以在战争期间继续开展国外的文献复制活动。尽管ACLS的秘书声称该项目的明确宗旨是“保存而非营利,所有资金都将用于这一目的”[42],但是可以想见,当鲍尔用洛克菲勒基金会的拨款来复制600万页的STC图书时,他肯定是把缩微胶片的经济效益放在了首位。最终清单上重申了该项目的紧要任务是保存美国学者感兴趣的资料,在这份文件的开头,鲍尔指出:“我们所列出的目录并不完整,只有美国学者特别关注的部分被制成了缩微胶片。”[43]
通过美国国会图书馆的关系,鲍尔还开始为美国情报协调局(Office of the Coordinator of Information,简称COI)局长威廉·多诺万将军(General William Donovan)组织各类情报的缩微胶片制作,COI便是美国中央情报局和美国新闻署的前身[44]。英国情报机构获得的科学期刊、地下报纸以及其他资料被鲍尔的员工进行复制,每天以外交邮袋的形式寄往华盛顿。女性在这些缩微胶片的制作计划中发挥了关键作用,她们不仅是摄影师和技术员,还是协调者和管理者。例如,在鲍尔出国期间,玛格丽特·哈威克(Margaret Harwick)继续从位于安娜堡的 UMI 办事处向外发送《早期英文图书》及其他缩微胶片;与此同时,在伦敦,露西娅·莫霍利(Lucia Moholy)带领一群“女性工作人员”在维多利亚与阿尔伯特博物馆(Victoria and Albert Museum)提供的房间里开展COI项目。1942 年,鲍尔聘请芝加哥大学的古文字学家阿黛尔·基布瑞(Adele Kibre)帮助美国战略情报局(Office of Strategic Services,简称OSS)把一袋袋被截获的德国邮件制成缩微胶片;她在斯德哥尔摩监督这项工作,并一直在那里待到战争结束[45]。其他地方的员工为美国司法部复制轮船的旅客名单,还为美国空军复制了50,000张图纸,用于P-51战斗机的设计与制造。
跟美国联邦政府合作使鲍尔得以购买并拥有最先进的设备,否则严格的战争优先政策将禁止他接触这类设备[46]。它们帮助UMI提高了制作和复制胶片的效率,其中自然也包括STC图书的胶片。实际上,在诺曼底登陆之后,曾经用于OSS项目的相机被重新分配给了研究型图书馆来完成“学术任务”;如此一来,《早期英文图书》缩微胶片的历史便与战争技术的历史紧密相连了[47]。当然,我们也可以反过来理解二者的关系:早期 STC订阅服务的成功让鲍尔获得了特殊的地位,他的公司能够快速复制大量资料,这符合美国联邦政府机构在战时的要求。因此,UMI有资格跟更大的团队竞争,包括柯达的子公司瑞柯达克(Recordak),甚至在军事合同方面超过了这些团队。几十年过去了,复制工作仍在进行,如今是由 ProQuest提供支持,而且它还负责把缩微胶片变成数字图像,后者在EEBO中也可获取[48]。
最初,UMI缩微胶片传递的图像经过人工操作被转化成双色调(黑白)的数字扫描件[49]。从2012年开始,缩微胶片的数字化处理得到了调整,新的扫描工作都以灰度模式执行。根据 EEBO网站的解释,做出这种改变是“为了更加细致和逼真地呈现原始印刷资料”[50]。EEBO暗示灰度图像可以更好地体现“原始印刷资料”,这种说法忽略了充当关键媒介的缩微胶片。即是说,按照EEBO的声明,数字扫描件更加准确地体现了印刷图书的页面,而非作为直接底本的缩微胶片图像。因此,读者很可能会轻视扫描件的资料史,而扫描件本身又是数字化信息的组成部分。这种误差不仅会掩盖文献传播的历史,给考古学方面的研究带来困难,而且还赋予了扫描件多个参照物:EEBO的“数字复制页面图像”可以指向缩微胶片、亨廷顿图书馆内带有特殊排架号的印刷图书、特定文献的某一版本或者那份文献的抽象概念。尽管一个物体同时拥有几个参照物的情况似乎违背了公认的逻辑,但是EEBO 的数字化信息正是建立在这种重写本特有的歧义之上。
例如,在数字化环境下,视觉模仿已经被当成一种关键的呈现方式。数字化信息的评价依据通常是图像分辨率,而非其他包括气味或纹理在内的特征[53]。有关数字复制品的描述暗示视觉模仿足以成为判断呈现水平的标准,或者至少能传递原始人工制品的“重要特征”[54],从而普及了一种奇怪的逻辑,那就是便于数字化传递的特征较之其他特征更为重要。尤其是,从剖析知识建构基础的角度而言,菲奥娜·卡梅伦(Fiona Cameron)指出,数字复制品“宣扬了一套为现实而打造的社会关系”[55]。即是说,除了强调特定的文化叙述之外(正如前文所讨论),数字复制品还可以重新确立人们对视觉的偏好,使他们认为视觉与真相的呈现之间存在着自然的联系[56]。而且,在意义建构与权威之间,有一种重要的动态关系发挥着作用,正如马丁·肯普(Martin Kemp)所言:“我们自动为数字化图像增添了合理性,而这种合理性又引导我们去相信它。”[57]鉴于学者和学生们越来越依赖数字化图像,甚至将其作为历史研究的原始资料[58],因此对这些数字化信息进行考古学挖掘,可以让人们思考或至少意识到许多接触方式(包括触觉、味觉和嗅觉等)的缺乏以及对它们的刻意忽略。因此,从考古学角度来看,数字化信息不仅是历史物体及其现代呈现的重写本,而且是锻炼和培养价值判断的空间,这种价值判断关乎文化资源的产生、整理、交流和接受,并影响未来的知识建构。

在EEBO数据库里,接触资料的另一种方式是通过全文转录,这项工作由大批的“外包供应商”负责,他们以标准通用标记语言(SGML)输入并标记了超过 40,000份早期英语文本。在一个不同于EEBO的非营利性组织“文本创建伙伴”(Text Creation Partnership,简称TCP)的监督下,复制员持续转录数字扫描件的文本,并添加计算机可读的编码,以便后续根据标题、作者和关键词进行检索[59]。如果仔细考察源代码和TCP的操作记录,我们会发现每页文本在处理过程中都经过了多人检查。TCP表示,在根据早期印刷图书的扫描件或低质量的扫描件转录文本时,虽然可以借助计算机软件把字符转化成机器编码文本,也就是进行光学字符识别(optical character recognition,简称OCR),但实际上人工转录更为可靠[60]。跟有关自动化和计算机精度的普遍观点相比,TCP对人力优点的明确认可非常出乎意料。不过,在一份内部培训文件中,TCP警告牛津大学伯德雷恩图书馆(the Bodleian Libraries)的工作人员,称那些转录文本“出自非专业人士之手,所以不应该被当作权威版本”[61]。可见TCP承认,尽管人工转录的结果比OCR更好,但有时候依然存在问题,是不能完全信赖的。
TCP的文件中还提到了为转录和标记工作选择文本的主要依据。如果某些作者的名字在《新剑桥英语文学目录》(New Cambridge Bibliography of English Literature)中出现了,那么TCP就会转录他们的作品。另外,TCP的投资伙伴要求的文本也会得到特别关注,并且“排在制作列表的顶端”;这些投资伙伴主要是美国的公立大学和私立大学,也包括加拿大、澳大利亚和英国的少数机构[62]。因此,TCP的选择标准体现出一些重要的信息,即英语文学资料在21世纪是被哪些人以及如何理解、整理和呈现的。霍尔指出,类似的过程“使某种选择体系具有了权威性和物质及制度上的真实性,从而很难得到改变或修正。负责使这种选择体系发挥作用的机构尤其强调自身的真实性”[63]。这种特殊的知识秩序融入EEBO,又给该数据库增添了一段实践方面的历史。TCP的优先项和STC以及UMI缩微胶片的关注点叠加在EEBO中,共同构成了早期英文资料的战略性组合,为今天的学者构建了过去。由于它们在某种程度上对学科知识进行了整理,因此还可能影响未来的研究。
TCP打算陆续发布其制作的全文数字化信息,第一批约25,000份文本已于2015年公开[64]。TCP的转录文本不太容易与相应的底本进行比较,因为数字扫描件会被挡在 EEBO的付费墙后面,这种安排使产品脱离了支撑它的劳动和过程。在传播时,由于很少提及其自身的形成历史和有关权威性的警告,全文版本及其标记很可能会被当成原始资料,用来建构其他叙述。实际上,“元数据提供新知识”(Metadata Offer New Knowledge,简称MONK)和“手抄本在线”(Manuscripts Online)等数字人文项目已经对编码的转录文本展开了进一步的计算机处理[65]。正如布鲁诺·拉图尔(Bruno Latour)和史蒂夫·伍尔加(Steve Woolgar)所言,在科学知识的建构中,有一个让假设变成权威的节点,那就是“当该假设失去所有时间上的限制条件并融入一个为他人所接受的庞大知识体系之时”[66]。追溯TCP的转录文本和标记融入其他资源的方式,有助于我们理解临时性的试验是如何在知识产生的过程中被视为权威的。
彼得·W. M. 布雷尼(Peter W. M. Blayney)在对于STC及其后来发展的研究中已经注意到了使观点获得权威地位的方式[67]。然而,在ProQuest保护下的EEBO里,就 STC、经过编码的转录文本和图像扫描件而言,它们的目录、摄影、抄写以及编辑等特征都呈现出了另一种面貌。正如拉图尔和伍尔加所发现,创造事实的行为“需要使用特定的工具,使生产过程中的所有痕迹都变得难以察觉”[68]。而数据库或许就是这样一种工具,随着目录、图像和转录文本被EEBO汇集到一起,它们各自的历史也从视野中消失了。忽略生产过程中无法避免的意外事件会造成一种错觉,那就是数字化信息不仅没有受到编辑层面的干扰,而且可以在生产的传统基础之外发挥作用[69]。EEBO中的所有观点(包括有 关数据库本身的观点)都变得非常稳固,人们越来越难以对它提出问题,诸如某些条目是否应该收录,其他条目是否应该排除,或者一份图像或转录文本在多大程度上以及在哪些方面准确地呈现了底本。因此,读者可能会发现,他们很难从20世纪早期的缩微胶片和 21 世纪复制员、扫描员和编码员转录的文本中分辨出16或17世纪的手写批改[70]。忽略建立数字化信息的社会过程,不仅会掩盖EEBO最终产品的策略,而且会消除从历史角度来理解这个项目的可能性。于是,过去、现在以及二者之间所有事物的叠加就可以被视为一种带来现实影响的动态关系,EEBO的表现也就变成了知识的表现。
因此,考古学研究面临的挑战不只是要辨别被忽略的本质并恢复数字化信息中被掩盖的东西,还要在积极抵触这种研究的环境中迎难而上。雪莉·特克 (Sherry Turkle)曾如是描述数字化信息的环境:“计算机精度被错误地等同于完美度。人们不自觉地产生了一种幻想,把计算机当成了保障。”[71]这种幻想隐含着一个假设,那就是有价值的信息都在网上了,这些信息显然已经过计算机处理,一定是完整的、全面的、准确的。虽然近期艾德·弗尔萨姆(Ed Folsom)称数据库“渴望完整性”[72],但更加确切地说,数据库是一个表现空间(performative space),读者在此表达对其完整性的渴望,这样的渴望又得到了谨慎而巧妙的助长。例如,EEBO所属的ProQuest公司声称要提供“经过审查的可靠信息……图书馆等机构的使命是传递完整可靠的信息,对它们来说,ProQuest发挥着必不可少的作用”[73]。罗莎琳德·克劳斯(Rosalind Krauss)在广告方面的讨论有助于剖析ProQuest的表述,因为她发现以类似方式使用的图像“是广告公司投射的现实,旨在替特定的产品向潜在消费者灌输某种欲望和需求”[74]。而且克劳斯认为,这种宣传方式没有留下选择的余地。如果把她的理论应用到当前的案例上,可以说ProQuest激发并培养了消费者对完整、可靠的信息的需求,同时提出用包括 EEBO在内的一系列产品来满足那些需求。在这样的情况下,消费者很难想象有另一种选择,因为其他知识体系似乎都没有这样宣传自己。实际上,自称属于“EEBO一代”的克洛瑟(Crowther)、乔丹(Jordan)、维尼蒙特(Wernimont)和纳恩(Nunn)描述了克洛瑟对数据库的依赖是如何导致她形成了一种理论,而一旦考虑到那些没有被EEBO转录的文献,这个理论就是“无稽之谈”[75]。“早期英文图书在线”相当于一个空间,读者可以在此表达对数据库完整性的渴望。从这个角度来说,数据库是一个重要的表现场所,EEBO催生的价值判断影响了资源利用和科研布局。于是,数据库和这种价值判断便成了知识建构实践的一部分。

尽管围绕着数字化产物的“信息光环”阻碍了它的历史化[77],但是仔细考察数字化资料,可以获得关于其产生过程的重要见解。这些见解有助于对数字化资源行批判性分析,从而揭示21世纪知识建构的部分基础,因为涉及过去的学术研究已经越来越依赖数字化资源。正如休伯特·达米施(Hubert Damisch)在提到摄影图像时所说:“它不属于自然界。它是人类劳动的产物,是文物,它的存在……不能脱离它的历史意义和那个可以追溯年代的源头。”[78]对一个数字化信息的考古学研究,应该把这个数字化实体理解成文物,它产生于人类劳动,受到历史环境的塑造,又体现了相应的历史环境。从这个角度来看,数字化信息就是物质性的人工制品,是考察过去与现在的理想材料。前述的考古学研究发现,人类劳动和战时焦虑留下的痕迹会在EEBO的数字扫描件中体现出来。数字化图像承载着一段历史,并提出了许多问题:关于英语性和英语文化遗产的形成;美国学者对英语资料的研究方向;公共遗产的管理和占有;20世纪中叶美国国会图书馆、联邦机构和民族认同的关系;以及学术界与战争科技的关联[79]。数字扫描件还可以进一步引导我们探索女性在知识生产中所扮演的角色。在 20 世纪早期STC目录的编纂工作和二战期间缩微胶片的制作中,女性发挥了关键的作用;如今,这些成果已经被认为是人文学术和数字化资源的重要基础[80]。此外,EEBO中的图像还提供了关于复制技术的复杂描述,因为这些图像记录了印刷、缩微胶片、数字扫描和数字处理的历史时刻,并且体现了涉及人类劳动的多种实践。实际上,EEBO 的扫描件就相当于一个个重写本,见证了15世纪的印刷工,20世纪以女性为主的图书管理员、摄影师和缩微胶片技术员,还有21世纪的扫描仪、网络设计师和私营信息服务。就连最近的一些变化,诸如把扫描件从黑白改成灰度,并以图像形式存储在数据库中,也显示了信息传递的实验性与丰富的社会、政治以及技术特征,从而启发我们深入研究信息传递的实践和基础结构。从这个角度来看,数字化信息就像一个激动人心的平台,可以探索意义建构的历史和未来。
Archaeology of a Digitization
Bonnie Mak
Abstract: This study proposes an archaeology as a means of exploring the practices by which digitally encoded resources are generated, circulated, and received. The discussion grapples with the ambiguous relationship between digitizations and their exemplars in the well- known database, Early English Books Online (EEBO), and suggests ways in which digitizations might be analyzed as witnesses of current perceptions about the past and used accordingly in scholarly research. The article therefore offers a critical reading of EEBO and its digitizations as part of a broader effort to investigate the role of digitally encoded resources in the transmission of ideas and the production of cultural heritage.
Keywords: Digitization; Database; Archaeology; Cultural Heritage; EEBO
编 辑 | 姜文涛
