作为社会铭刻的数字记忆

吴静 / 南京师范大学哲学系


摘 要: 按照记忆媒介形式和记忆内容的不同,人类记忆的迭代大致可以分为五个阶段:前记录时代、非文字记录时代、文字记忆时代、影像记忆时代、数字记忆时代。对于数字记忆的讨论,必须超越中性工具论的层面,进入到批判性的视野。数字记忆将复杂的人类社会匀质化为单一的数据系统,赋有意义的数字记忆都是被特定算法结构捕获和抓取的,或者是通过对数据库进行关键词搜索而获得的碎片。数字记忆的局限性与数据的永久存续性之间形成不对称关系。作为社会铭刻的记忆书写的关键性问题,不仅仅在于数据表达与记忆真实之间的连接是否有效,还在于数字化的门槛到底将哪些内容排斥在外。数字技术正在塑造一种全新的言说现实的方式,“数字”与“人文”的最大差异首先表现为两种差异思维模式间的碰撞。建立具有批判性的数字人文,不是摒弃数字,而是强调多种工具与方法的合理性,重视事物的多种属性,开发其多元价值。

关键词: 数字人文 数字记忆 记忆迭代 社会铭刻 算法


莫涅莫绪涅在希腊神话中的身份极为独特,她不仅是记忆女神和时间女神,也是九位缪斯女神(艺术女神)的母亲,同时还是吟游诗人的守护神。这种有趣的多重定位刻画出了古希腊文化对于社会性记忆在人类社会发展中所承担功能的理解:它既是文化生成的根源,又是文化的时间维度——它是一切艺术形式的母体:它就是历史。这样的推论并不离奇。从根本上而言,人类的历史本身就是社会记忆的不断书写,它是记录与遗忘、连续性与不连续性、共时性与历时性、个体记忆与集体记忆一系列彼此对立范畴的交织。它们相互之间构成彼此的边界和外部,使社会历史的书写本身布满了无法统一的间奏:它既作为认知的基础,又作为认知的对象。但是数字时代的记忆却以其超量溢出的丰富性和永存性改变了这种间奏,却又把一些新的问题提到了台前。尽管从很多方面看来,数字记忆作为社会记录方式的积极效果正在不断显现,但它显然也成为记忆建构论的有力支撑。法国哲学家斯蒂格勒就将数字化记忆所实现的第三持存的永久化认定为人类纪熵增过程的一种途径,因为这种记忆持存被数字化架构的外在化历史不但不会促进知识的增长,反而会造成知识的丧失。以工具理性中的计算理性为基础的算法模型和数据挖掘支撑的理解方式会使人类陷入“系统性愚昧”的境地。[1]正是在这个意义上,斯蒂格勒将这种对单一效率机理的追求定义为“文化之熵”,认为它是对生活本身的摧毁。因为这种对记忆自然形成之节奏的把控,正是前数字社会书写过去与未来关系的质料,它决定了社会成员对共同体的想象空间。这种从人文主义立场对数字理性凌驾于社会现实的趋势所持的批判立场,与技术乐观主义的欢呼以及新兴的跨学科领域“数字人文(digital humanity)”的方兴未艾形成了数字记忆讨论中的对照立场。一个值得深思的问题是,当记忆女神莫涅莫绪涅在数字时代化身为永不消失的数字持存的时候,看见(记忆)与不被看见(不进入记忆)、永存的数据与有选择的记录、自主性与权威性、历史时间与有可能被不断被重构的情境、过去和未来之间到底会呈现出怎样的关系呢?这些关系的重构与否,到底是会导致传统历史书写方式从单边主义走向多边主义,还是呼唤一种新的阅读方式以面对社会记录愈加密集的趋势呢?

一、记忆媒介迭代与社会影响

人类的历史是记忆不断被书写、也遭遇删除的过程。传媒理论当中一个基本的共识是,随着历史的发展,生产力和技术水平逐渐增长,记忆记录的媒介以及由其所决定的传播内容和范围自然也有所不同。麦克卢汉并不满足于这种自然性增长理论的翻版,他深入地分析了媒介形式的转换对信息传递内容的积极作用过程,得出了“媒介即信息”的结论,认为这种形式上的变更在长期效果之下会对社会和个体都发生影响。这种和当时流行的经验主义研究范式不同的理论一经出现,立刻引起学界一片哗然,认为这是对媒介形式本身功能的过分夸大。但从传播学后来发展的历史来看,这个结论尽管在麦克卢汉本人那里带有了某种技术决定论的意味,但媒介形式在技术变革下的每一次更迭,确实对人感知自我和他人的方式、内容以及社会关系的建构都发生了深刻的影响,同时媒介和其使用者之间的关系也在不断变化。因为不同的媒介形式决定了信息传播的方式和速度,如果“信息运动速度缺乏同质性,就会产生组织模式的多样化。所以,任何传送信息的媒介,都会改变权力结构”。[2]互联网和数字化技术的发展验证了麦克卢汉的理论。“信息茧房”、“过滤气泡”、数字条件下记忆增强与遗忘权的讨论都使得新的数字媒介(包括存储和传播)在信息传播、知识构成甚至人的社会性存在方面都带来了前所未有的变化。沿着福柯“知识即权力”的脉络,对数字技术自然性的“祛魅”研究理应审视其所构成的权力谱系及当代展开。这也就意味着,数字记忆本身不再是一个纯粹的技术问题,而是社会问题。对于记忆数字化问题的讨论不仅要从数字记忆所能实现的内容密集度和时间持续度进行考量,更要打开它的内部,从它的运作机理和实现方式去考量其社会效果及其与社会的距离。

如果按照记忆媒介形式和记忆内容的不同,人类记忆的迭代大致可以分为五个阶段(这些阶段的划分并非完全按照时间更替,而是以记忆载体的类型为依据):

第一个阶段是前记录时代。由于缺乏记录工具,记忆的流传主要靠口口相传。这并不单纯只是个体之间的经验或记忆的传递,很多原始的部族中也会存在诗人和歌手擅长创作和吟咏英雄及其业绩的诗歌,他们提供的是对于公众人物或公共事件的口述记忆。公元1世纪,作家卢卡努斯在《内战纪》中就曾把吟游诗人称为高卢,或不列颠的民族诗人或歌手。他们被流传下来的作品保留了前记录时代中具有公共性的那部分。不过由于这种记忆属于自发性和个人性的创造,记忆质料的准确性并不是最被在意的部分,夸张、想象、神化的因素都在不同程度上存在,甚至成了传说和神话。这种形式的口述记忆也是最早的文学形式。在这个时期,口头语言的表达是记忆的唯一方式,专有的表达成为特定的权利。它提供的很多很多素材成为后世文学创作丰富的宝库。当然,这种记忆的稳定性相对较弱,它在流传的过程中会一直被再创造,并且再创造的痕迹难以被准确追踪。

第二个阶段是非文字记录时代。无论是更早的“结绳记事”还是如法国拉斯科洞窟中的动物壁画,它们都以或抽象或具象的方式保留了对具体事件或场景的记忆或记忆的再加工。“结绳记事”由于缺乏描述性,其记录的能力其实非常有限,所以不必讨论。但如拉斯科壁画所描绘的部分场面也一度引起研究者的争议,因为画面中出现的非现实性因素(如双手各长着四个指头的鸟人),就很难被确定为是对现实的还原(如伪装的猎人或举行仪式的巫师),还是某种观念性的表达。这种记忆的遗迹在世界很多地区都有发现,无论从艺术、还是人类学或民族学角度对于研究地区历史都非常有意义。因为遗迹在构图原则、绘画工具和技法、描绘内容、颜料成分甚至自然环境等各方面所显示的丰富内容都是极其珍贵的历史资料。更为重要的是,像拉斯科这样大型壁画的出现,体现出这种具象记忆和之前的口述时代的极大不同:它不再是个人的即兴创作,而是集体性和社会性的记忆积累,同时也反映了经验和工具在社会协作层面的传递和共享。但这种记忆在传播层面上所能形成的流动性有限,因而记忆本身的社会性功能也相对较弱。

第三个阶段是文字记忆时代。文字的出现使得记忆的书写和记录在专门化的要求下成为特定的职业和权利(这种专业化的趋势后来逐渐促成了历史文献和典籍的分类)。一方面,文字记载使得对记忆的确定性记录成为可能,记忆的稳定性和精准性加强,使得其无论在历史书写、经验传递、情感交流和知识积累方面都具有了划时代的革命性意义,极大地促进了文化的社会性传播,人类也由此开始进入信史时代。记忆的内容也兼具了个体记忆、集体记忆以及社会交往记忆。并且,记忆也逐渐开始不局限于具体事件或人物的纯记录。借助文字在表达上的特点,人们能够形成概括、总结和抽象性的表达,为后来理论的形成、发展和丰富开辟了道路。比起之前的记忆形式,文字记忆的信息密度大,物理存续性好(当然也取决于介质),传播中形成的损耗相对较少,信实性加强。另一方面,由于获得文字书写的能力和表达的权利在社会范围内不是匀质的,文字的出现促进了不对称的社会分工和阶层分化。在原先的社会协作的基础上,脑力劳动和体力劳动的分工开始确立,由社会功能性的差异逐渐转向社会地位的差异,形成阶级对立。与此同时,文字记忆的社会性功能在更大的意义上被发挥:它们承担了一个阶级(脑力劳动者)对另一个阶级(体力劳动者)的统治和规训的意识形态功能并力图将后者固定在这种社会关系之中。记忆权的所属造成了发展主动权的不同。阿尔都塞沿着马克思在《资本论》中关于劳动的社会分工的讨论确认了这一点:“一些人在事实上垄断了知识以及本领的某些内容和形式,而另一些人却被圈定在另一些形式和内容当中……所以通过前者对于后者的权威,生产关系的社会分工的所有威力,在被宣布为纯技术的‘劳动分工’的关系中得到了维护。”[3]

第四个阶段是影像记忆时代。事实上,记忆在这个时期已经进入综合记录的时代,影像技术(图像和胶片电影)是这个时期最显著和耀眼的媒介形式,但却并非唯一的形式,传统的文本书写并没有丧失自己的领地。相反,随着教育的普及和文化工业的发达,文字书写不再是特权之一,而成为普遍的技能。文字记忆的类型更为广泛。因此,影像记忆不仅没有能够取代文字记忆,反而和文字记忆方式相映成辉,成为并行不悖的方式。由于影像记录侧重于对现实场景的记录,但又受到物理形式的限制(图片数量、影片长度),所以其内容通常是经过压缩的。就信息量密集度而言,它在丰富性方面和文字记忆相比是两个不同的类型:相对于文字记忆的凝练和概括力,影像记忆的优点在于更直观、更有利于传达更多整体性细节,胶片电影更是史无前例地提供了对动态过程的记忆。

然而,认为影像比文字更接近于真实的想法却带有了某种简单乐观主义的色彩。影像从来就不是简单的现实还原。就图像而言,图片形成的方式(角度、元素、场景构造等)、展现的方式(背景、色彩、冲印效果等)以及不同图片之间的连接可以创造性地在视觉可见与知觉理解之间建立联系。它表面上看是将叙事的理解和想象空间交付给了主体,但实际上其连接方式本身就是叙事张力展开的构架,也是对可见物与可说物之间关系的一种话语制造。电影技术的蒙太奇手法更是如此。它可以整合各种元素(声音、画面、文字)通过剪辑、转场、空场、声画分离或重构改写任意叙事结构。“这种重构并不必然地和真实之间产生因果联系,而是作为用可见形式书写出来的新的意义叙事凌驾于现实之上,甚至取代现实。这也正是为什么国际情境主义的代表人物居伊·德波在他著名的《景观社会》一书中发出感慨,认为影像 /景观对现实的统治已经成为一切统治形式之最。这实际上是对关于影像的直观经验主义的判断的一个有力反击:影像未必言说现实,相反它在可见与可想之间建立的固定的关系秩序重构着人们对现实的理解。”[4]可见,虚构的影像并不比虚构的文字更容易鉴别。相反,它以其直观的表达方式和与经验之间更短的距离越发能够让人产生真实的感觉。误导比以往任何时候都更易发生。

第五个阶段即是数字记忆时代。和影像的经验直观不同,数字记忆本身在概念上是一个复杂的综合体。它既指以数字介质形式存储的其他记忆内容(文字、图片、影像、语言等),也指通过数据采集设备形成的记忆素材数据库。前者介质的改变带来的影响主要是物理性的,如占用空间的压缩、保存时间的延长以及交流的便捷性。而后者的出现则造成了认识范式和研究范式上的变革。计算机的高算力和大数据的数据库资源同时将“数字人文”研究变成了这个时代的显学。但因为数据库资源本身是非叙事性的,它无法像之前的记忆媒介一样和人的感官建立直接联系(听、看、阅读),其意义呈现必须依赖特定的模型结构。这些数据和算法基础则使得其表达过程以一个符号学的独立系统被提到台前。作为一种符号语言,数据和自然语言都依赖于符码能指和所指之间的关联性。但这种关联性本身却是人为确定的,和其他社会性建构一样是构成性的,受理论、经验、条件的影响,并不能为客观准确性提供保证。但数字记忆形式的持久性和易于传播的特点又使得对于数据来源和采集中问题的勘误和更新难以即时同步地覆盖应用全域,其结果就是数字记忆形成了“社会刺青”一般无法消除的痕迹。“通过数字记忆,圆形监狱能够随时随地地监视我们。”[5]不仅是在现在,甚至是在将来。数字记忆的建构性特点与其永生之间形成了不对称的关系,它重新拷问着个体以及社会前进的能力。

当然,上述的梳理只是社会发展历史一个微小的侧面。但从中反映出记忆媒介的转换在社会层面造成的影响。每一次记忆媒介的更迭,都会造成表达功能上的差异(但不一定是线性进步的,也会体现在表达侧重点不同上),从而对个体和集体记忆的塑造都产生深远的意义以及认知模式上的变化。从这个意义上说,对于数字记忆的讨论,必须超越中性工具论的层面,进入到批判性的视野。这不但不是对数字技术和“数字人文”的证否,反而是帮助它们审视自身内在秩序的一个必要途径。

二、数字记忆:总体化表面下的非总体性

彼德·斯洛特戴克将作为全球化基础的“世界历史”描述成一个排他性的、自我建构的宏大叙事,“它的逻辑就是把所有的物体预先按照均质的空间、均质的时间以及均质的价值不加区分地予以理解;而它的操作模式则是密集化;它的经济后果是建立起世界体系;……它在人类学上的挑战就是要批量地创造‘最终的人’”。[6]事实上,数字化也正在以同构的过程在进行一种匀质化。计算理性和数字表征系统正趋向于将本身具有复杂性的个体和社会建构成可通约衡量的对象。数据主义的终极目标正是将复杂的人类社会建构成这样单一的数据处理系统。并且,社会范围内数字技术应用权重的不断增长会使非数字方式处于边缘甚至被遮蔽的地位。

和数字记忆时代之前的记忆媒介相比,记忆的数据化表达是反叙事性的。这一特点是匀质化得以进行的前提,它同时也使得数字记忆在机制上的特殊性造成了它比所有其他的技术形式距离经验现实更遥远、更疏离。雷吉斯·德布雷延续了麦克卢汉的观点,认为记忆媒介的不同形式所决定的社会关系的距离差异造成了社会成员对其所负载的记忆内容的认同不同。“人类社会的联系机理并非始终如一,而是取决于社会的‘异常事件’和‘值得记忆事件’是托付给集体记忆、某种罕见或丰富的植物载体、托付给磁带或电子芯片而有所不同。”[7]从这个意义上说,技术对于数字记忆并不仅仅提供了物质载体,它甚至参与了内容的决定。那么,决定数字记忆形成的技术参数到底在多大意义上影响了数字记忆的生成,可以从下面的这个例子入手。

某知名网站最近在爆出大幅裁员新闻的同时,还被揭露以“行为感知系统”监控员工通过公司网络所进行的所有网络活动,以查知员工是否有离职倾向或其他不利于公司的行为。其实,这样的隐私权话题在数字技术遍地开花的时代已经算不上什么新闻,但是它却从一孔窥见了个体的数字记忆被非法使用的乱象。

开发这款系统的网络公司称,公司认为海量的上网日志中蕴含着对用户有用的业务价值。他们使用上网行为管理系统负责收集数据,进而通过行为感知系统负责汇总和分析数据。显然,这种分析默认将员工所有的网络日志按照预先设定目的连接进行分类,每一次浏览都被置于这种过滤模型进行审视,哪怕是鼠标的一次滑动失误。在与预设目的关联性判断下,员工的行为倾向被加以定性甚至处理。但事实上,这当中的逻辑关联并不是自然的。首先,它预设了员工所有的网络行为都是有着目的利益的强导向性,不存在随机行为或无目的行为。其次,它的目的设置和分类是排他性的。譬如,员工浏览求职网站只是为自己离职做准备,而非替他人帮忙或了解其他信息。再次,系统还预设了只要具有一定的离职意向,就会很快发生离职行为或做出对公司不利的事情。显然,这三个预设都不存在站得住脚的因果联系,经验现实的多样性远在这些可能之外。但这个“行为感知系统”却利用这种非自然的关联将每一个员工的每一次网络行为紧紧地绑缚在评价机器之上,力图将原本具有多动机性和丰富性的人类行为解读成匀质单一的线性逻辑。“它是一种从数字化存储的有限信息中,重构出的人造过去,一种缺乏时间线索、完全扭曲的拼图,而且可能会同时被它所包含和不包含的东西所篡改。”[8]

从这里可以看出,数字记忆并不单纯是对一切痕迹的纯粹记录,而是对经过选择的数据的使用和分析。因为尽管大数据技术有高容量存储能力,但对于特定算法而言,未被结构化的数据实际上是以数据冗余的状态存在,不但不能自然产生意义,反而占用了物理资源。所以实际上所谓有意义的数字记忆都是被特定算法结构捕获和抓取的,或者是通过对数据库进行关键词搜索而获得的碎片。表面上和预设目的无直接相关性的因素、或者是那些不能被数字化的因素都会被排除在数字记忆之外。这些数据在被结构重组之后形成了和算法结构相符的叙事,从而形成一种拼贴画(cliché)形式的数字记忆。“这种数字化拼贴和主体的记忆重构不同,它是去主体性的,甚至是无机性的,是对某些权重因素的过滤。这种永存的过去反而妨碍了对未来的真实判断。而且,在这种判断中,负面性的记录比正面记录受到的选择性关注会更强。”[9]

当然,这种建构性并不旨在于说明数字记忆的不可靠,而是希望通过对其生成机理的分析展示数字记忆的视域和边界,以便于以更加积极和客观的方式来对待它。事实上,不仅是数字记忆,即使是个体的自然记忆本身也是生成性的。主体的记忆形成原本就是一个过滤机制,它是个体经验在经过复杂重组后存在于人脑的海马体结构和其他部分的身体性盈余。很多情况下,个人在遭受重大创伤、刺激或惊恐之后,会出现部分失忆的情况。这并非大脑出现了损伤,而恰恰是有机体的自我保护机制之一。“这些构成记忆的痕迹在被激活的过程中开启了记忆的强化过程,以及自我的确认与承认的过程,即自我构建在其中展开。”[10]可见,个体记忆被留存的过程是个复杂性系统,很难以确定的目的或因素来考量。但数字记忆在目的确定上具有很强的人为性,这也就意味着它内在性地受历史、环境、利益等目的制约。但这种局限性与数据的永久存续性之间形成不对称的表达关系。因为当数据以技术性第三持存的方式成为超越性的时间客体时,它已经在一定的意义上成为自然性和普遍性的代表。

由于对大数据覆盖能力的信任,数字记忆往往被形容和相信成具有极高的丰富性甚至是无缝的全面性的总体记忆。世界各国在建设自己的数字记忆工程(如国家图书馆的“中国记忆”项目)也确实试图做到这一点。例如欧洲的“时光机”项目,就希望通过时空大数据构建跨越数千年的欧洲城市历史地图,建立与过去信息的可达性,改变人类感知世界、历史和文化的方式。它是使用“历史大数据”进行研究的项目中规模最宏大的一个。为此,项目组不仅耗时耗力地对欧洲数百万的历史文献、画作和古籍进行数字化,并且对一些著名的历史文化名城进行数字化和模拟,通过数据分析形成信息网络,通过三维建模还原真实的历史场景,以数字多媒体形式呈现其历史风貌。该项目计划作为免费的社会历史文化教育资源使用,被形容为“不仅是欧洲文化遗产的进步,更加是世界文化遗产的进步”。[11]

但即使是这样一个看起来包罗万象、巨细靡遗的项目依然不能说是对欧洲历史的无缝覆盖。这不完全由数字化的技术门槛决定,也由记忆自身的生成性决定。作为社会铭刻的记忆书写的关键性问题,不仅仅在于数据表达与记忆真实之间的连接是否有效,还在于数字化的门槛到底将哪些内容排斥在外。在提到的时光机项目中,研究人员自身的视域,所使用的搜索工具都会对内容产生影响。虽然项目组在此方面做了巨大努力来尽力减少由于视差造成的空白,但不可否认的是,那些关注度较少的少数族裔、未留下文字或其他典籍的社群不被数据“看见”的可能性指数显然会增大,也在更大范围内将非数字化世界置于盲区。于是,这种数字记忆对历史的呈现方式在一些时候很可能为某种价值所左右,但因为其所具有的“科学、全面、客观”的外表,这种扁平化或单一化的问题很容易被忽视。

作为纯形式化的抽象存在,数据被使用的模型决定了它所展现的世界图景。数据主义的未来对技术进行了绝对赋权,谁掌握数据、谁选择数据、谁使用数据,谁就掌握了话语的建构,当然也就决定了集体记忆的输出样式和传播内容。数字化在某种意义上使权威更具有传播性。经验现实的多样性和文化的多元性会被同温层价值滤镜和意识形态过滤后的网络记忆所取代。一旦这种被绝对化的记忆成为文化认同的基调时,共同体就成为了一个反乌托邦的隐喻。

三、建立数字人文的批判性视野

“数字化”作为一种技术性工具,借助于数据采集和数据标注的基础性工作,再通过算法的数据挖掘和数据分析,既丰富了研究资料范围,又扩展了传统人文研究方法,使得海量文献的搜集与浏览不再成为人文研究前进的限制性因素。其中之一就是与传统的“细读”(close reading)相对照的“远读”(distant reading)。这种全新的、备受争议的文献阅读方式一反传统阅读的主体理解模式,注重数据的广度规模和处理速度,推崇数据中心论。从这里可以同时透露出数字人文(digital humanity)在今天一方面广受推崇、另一方面却褒贬不一的原因。它以前所未有的技术性支撑和速度达到了对浩如烟海的文献典籍的处理,使研究者不再受“皓首穷经”之苦;但同时,它的去主体化的处理方式架空了深层理解、价值领悟的情境式阅读,改变了读者与文本的关系。数字技术正在塑造一种全新的言说现实的方式,它的功能与角色不再仅限于一种中立的辅助性工具。其所依赖的算法建构正在通过改变人与人、人与对象以及人与世界的连接方式而彻底重构着世界。因此,理解算法对人文研究的影响,也不再仅是人文研究资料的数据化处理、词频图表等技术语言的应用,而要深入数字技术对传统的人文思考视角、提问方式、价值立场等的改写,从而厘清数字技术何以重构人文研究。

“数字”与“人文”的最大差异首先表现为两种差异思维模式间的碰撞。丹尼尔·贝尔曾借用美国数学家、“机器翻译之父”沃伦·韦弗(Warren Weaver)“复杂的简单问题”“无条理的复杂性问题”和“条理化的复杂性问题”三个概念,区分了从工业时代到后工业时代技术变迁所带来的人类社会问题类型的转变。[12]在大工业生产模式之下,人类的思维方式倾向于借助二元对立的成对概念(或变量)对关系进行构型。但随着智能技术的发展,社会结构完成了复杂化重组,系统论、博弈论、概率论等成为了认识论领域的新内容。“条理化的复杂性问题”成为人类在智能技术之下正在面对这的新问题。“智能技术就是用规则系统来代替直观判断。”[13]人类的思维方式也从因果关系拓展到相关性之间的推演。这一转变的积极意义在于拓宽了关系连接的生成方式,但前提则是不能以相关性思考完全取代因果关系思考。然而,在今天的很多数据建模中,这样的谬误并不少见。

人文学科最重要的思维方式是“批判性思维”或曰“反思性思维”。约翰·杜威认为,“反思性思维”是一种重要的接近知识本身的思维方式,即:能动、持续和细致地思考任何信念或被假定的知识形式,洞悉支持它的理由以及它所进一步指向的结论。这一思维模式与形式逻辑的不同之处在于关注的核心是思维的内容,而不仅是形式。思维的内容指向的是思维面向的真实问题本身。这在分析哲学与批判哲学的区别中,表现为分析哲学所关注的语言逻辑和批判哲学所关注的真实现实之间的差别。它要求我们能突破单一数字化阐释的弱点,真实地面对和分析人的生存条件,以及条件之间的复杂关系本身,并透过这些关系寻找它的内在机理,这也正是哲学的批判反思所希望完成的目的和意义。

以数字记忆问题来看,这种技术与人文之间的内在张力就格外值得关注。舍恩伯格提出,要通过回复社会对数字记忆的删除功能,而使其像过去的历史系统一样,回复自我更新和不断前进的能力。不能让强大的数字权力和技术逻辑将历史凝固,并将未来封冻在标准化的过去当中。但事实上,这种理想主义的论调并不会让事情变得更好。因为遗忘和记忆一样,同样是建构性的。在数字时代,决定着遗忘的内容和方式的,也依然是数字技术。希腊神话里俄耳普斯为了救回爱妻勇闯冥界,却因为忘记了“不能回头”的警告失去了妻子。《圣经》里罗得的妻子在逃离索多玛城的毁灭的途中,也因为回头变成了一根盐柱。各国流传的故事里关于“不能回头”的文化隐喻在数字时代真真切切地被改写成了“无法回头”。当社会性的遗忘必须靠人为地执行删除功能来完成时,它所遭遇的问题并不会比记忆建构少。即使不考虑一切技术上的细节,它们的核心问题也都要去追问以下三个问题:“谁要记忆/遗忘?”“记忆/遗忘什么?”以及“如何记忆 /遗忘?”一个甚有反讽意味的有趣例子是,历史研究者艾比·史密斯·朗西(Abby Smith Rumsey)的新作《当我们逝去:电子记忆如何形成我们的未来》(When We Are No More: How Digital Memory Is Shaping Our Future?)被评论家批评在谈论媒体和媒介发展的历史时,秉持了“西方中心论”的立场,完全忽略了伊斯兰世界、中国以及印度。[14]可以想象,如果由持这样偏颇立场的数字记忆研究者来选择数字记忆的素材的话,就会同时造成普遍化和遮蔽两种后果。

乐观的研究者倾向于将数字人文当做一种新的研究范式,认为它根源于数字时代整体认知范式的改变。爱尔兰国立大学梅努斯学院社会科学研究院的罗伯·基钦在他的研究中列举了大量与此相关的言论。尽管他批评了其中一些过激性的观点(如“数据可以直接表达现实”),但他却也肯定大数据技术促使一种本质上不同的认识论正在形成。这种新的数据密集型的科学范式,挑战了既定的科学演绎方法。因为数据驱动的科学将会重建与经验的关系,从而改变原来由知识驱动的科学方法,成为数据驱动。他甚至提出,“为了配合这种转变,数据驱动的科学哲学基础(认识论的信条、原则和方法),需要通过努力和辩论为新范式提供一个强大的理论框架。”[15]但这样一种观点实际上所强调的是事物属性当中可以被作为数据捕捉的量化维度,也即它的确定性维度。当一切事物都被简化成可计算的变量组的时候,实际上恰恰强调了线性逻辑和量化标准对世界的架构。技术话语获得了超然的神目观地位。这种简单替换正是今天的大数据时代的统治逻辑。它进行得越彻底,线性逻辑思维就越深入人心,对于非线性变化的敏感度就随之被削弱。正如过度依赖定量分析其结果会侵蚀人们对微妙属性进行捕捉的思维方式和习惯,使他们逐渐失去通过对事物进行定性分析而获取信息的能力。如文学书写中的言外之意就无法通过词频抓取的“远距离阅读”方式获得,而文本的核心意义也并不必然地与词频之间形成关系。

从另一方面来看,数据驱动的本质实际上是模型驱动。因为正是算法所赖以建立的数学模型,决定了输出结果和它所试图代表的现实之间关系,它是现实与计算机之间的桥梁,通过计算机可以识别的数学语言和符号来对现实问题进行描述。它在根本上是模型建造者对世界的经验性理解的投射。建模首先需要通过建立假设来确定条件描述(描述的精度至关重要,这也是定量化的过程),其次根据这种描述建立变量与其他变量之间的核心关系,它决定了各数据之间的相关性。但这里有两个逻辑上可被追问的地方。第一是确定条件描述,第二是建立变量之间的关系。它们既是建模过程的关键,也是模型是否经得起验证的关键。

将复杂性系统的变量之间的相互作用量化本身就是一个极具挑战性的任务,因为其关系不但不是线性的,彼此之间的权重值甚至难以被量化,很多时候必须被有意识地进行降维处理。在此我将以LDA(Latent Dirichlet Allocation)模型为例进行讨论。 LDA是现在文献分析中使用率很高也有公认效果的一种概率性主题模型,它以统计学上的贝叶斯模型为基础,其基本算法原理可以概括为:先验分布+数据(似然) =后验分布。后验分布其实就是研究者希望得到的对实际问题的分析结果,它可以通过先验分布概率和数据一起综合得到。先说先验分布概率,贝叶斯派所使用的很多模型比如正态分布, beta分布等,常常被频率学派攻击没有科学依据,难以从严密的数学逻辑里推导出来。因为先验分布概率的“先验”是相对意义上的,实际上来源于数据所在领域的历史经验,但是这个经验常常难以量化或者模型化。贝叶斯学派所提出的模型在很大程度上是根据部分经验得出的小数据样本,既难以得到数学逻辑支撑,也在更多的时候存在标准偏差。它们只适用于一定的经验领域。其次,在数据问题上也并非无懈可击。以基于LDA模型所进行的汉语古籍语义资料的研究为例,其最基本也最关键的一步是自建语料库。而自建语料库的工作是由手动输入的,取决于采集者对古代汉语文献语义的经验性理解。这和作为AI基础的数据标注的工作有相似之处。它是在用大量的人类经验的积累去对算法进行训练,以提高其识别精度。并且,古代汉语的很多单字具有意义,如“天”“子”,但同时也可与其他词组成另外的意义如“夫子”。那么,就必须将这些单义字的所有组合词可能都输入语料库,才能对其进行抓取和分析。而这项工作无法通过人工智能来完成。并且, LDA是一种典型的词袋模型,它将一个文本视作由一组语料元素组成的集合,元素与元素之间为同一语料。

列举这些问题并非要否定“数字人文”作为一种新型研究范式的效用性。而且,在实际工作中,研究者也正努力用各种方法提高数字技术的精度和准确率。然而,从技术形成的机理及社会影响角度的透视依然有助于我们厘清技术本身的边界以及“人”的价值。海量数据带来的不是对真实和真理的贴近,而是以非此即彼的二元对立式思维将技术塑造为神话。数字技术不是理解世界的唯一方式,纷繁复杂的社会结构中有溢出算法边界的属人的柔性属性、创造性、偶然性、意外性。克里斯蒂安·马兹比尔格创造性地在大数据基础上提出了“厚数据”(thick data)概念。“厚数据不仅可以捕捉事实,还可以捕捉这些事实的背景。……如果薄数据旨在根据我们的行为来理解我们,那么厚数据就是根据与所生活的世界的联系来理解我们。”[16]打破数字神话的真实方法不是摒弃数字,而是强调多种工具与方法的合理性,重视事物的多种属性,开发其多元价值。数字技术为今天的人们提供了认识更大范围世界的可能性和手段,但人类经验的丰富性远在有限的数学模型和认知理论之外。当“人”的生存本身被平面化,如何恢复“人文”的深度与厚度,不仅是技术的问题,也是人文的问题,更是数字人文在今天要面临的真正挑战。数字人文研究的真正意义正在于在数据技术之上重新恢复人文的向度,这不是对算法的摈弃,而是对算法的正向优化。建立具有批判性的数字人文,以人文的反思性关注技术的发展,才是一条更具有建设性的研究之路。


Digital Memory as Social Inscription

Wu Jing

Abstract: According to the different forms and contents of memory media, the iterations of human memory can be roughly divided into five stages: pre-recorded era, pre-text memory era, text memory era, image memory era and digital memory era. Digital memory has to be discussed in critical thinking. Digital memory homogenizes the complex human society into a single data system. The relationship between the everlasting digital memory and the limitation of memory are asymmetric. Digital technology is shaping a new way of discourse, which excludes what cannot be digitalized. To establish a critical digital humanity is not to abandon digital methods, but to emphasize the rationality of a variety of tools and methods, which call for a variety of attributes of things and their multiple values.

Keyword: Digital Humanity; Digital Memory; Memory Iteration; Social Inscription; Algorithm


(编辑:赵薇)

注释:

[1](法)贝尔纳·斯蒂格勒:《南京课程:在人类纪时代阅读马克思和恩格斯——在人类纪时代阅读马克思和恩格斯》,张福公译,南京:南京大学出版社,2019年,第35—37页。

[2](加)马歇尔·麦克卢汉:《理解媒介——论人的延伸》,何道宽译,南京:译林出版社,2019年,第Ⅲ页。

[3](法)路易·阿尔都塞:《论再生产》,吴子枫译,西安:西北大学出版社,2019年,第107—108页。

[4]吴静:《从影像到数字:社会性别建构的“拟像”之困》,《探索与争鸣》2021年第12期。

[5](英)维克托·迈尔-舍恩伯格:《删除:大数据的取舍之道》,袁杰译,杭州:浙江人民出版社,2013年,第13页

[6](德)彼德·斯洛特戴克:《资本的内部:全球化的哲学理论》,常晅译,北京:社会科学文献出版社,2014年,第20页。

[7](法)雷吉斯·德布雷:《图像的生与死:西方观图史》,黄迅余、黄建华译,上海:华东师范大学出版社,2014年,第30页。

[8](英)维克托·迈尔-舍恩伯格:《删除:大数据的取舍之道》,第184页。

[9]吴静:《第三持存和遗忘的可能:数字时代的莫涅莫绪涅困境》,《江海学刊》2021年第5期。

[10]闫宏秀:《数字时代的记忆构成》,《自然辩证法研究》2018年第4期。

[11]该项目官方网站:https://timemachine.eu/,中文简介见:https://mp.weixin.qq.com/s/jZSaK2fFlyndDD_DMNK3gw?。

[12]对这三个概念的相关具体论述参见:(美)丹尼尔·贝尔:《后工业社会的来临——对社会预测的一项探索》,高铦、王宏周、魏章玲译,北京:新华出版社,1997年,第30—33页。

[13](美)丹尼尔·贝尔:《后工业社会的来临——对社会预测的一项探索》,第32页。

[14]Abby Smith Rumsey, When We Are No More: How Digital Memory Is Shaping Our Future, New York:Bloomsbury Press, 2016.

[15]Rob Kitchin,“Big Data, New Epistemologies and Paradigm Shifts,” Big Data & Society, 2014, vol. 1, no. 1,p. 10.

[16]Christian Madsbjerg, Sensemaking: The Power of the Humanities in the Age of the Algorithm, London: Hachette Books, 2017, pp. 22-23.

zh_CNChinese