从隐喻到模型 ——作为研究和批评路径的网络分析

陈 松 / 美国巴克内尔大学东亚研究系

赵 薇 / 中国社会科学院文学研究所

网络分析的众多概念和工具都源自对社会现象的研究。20世纪上半叶,在心理学、社会人类学和社会学三个学科的合力下,社会网络分析(Social Network Analysis)应运而生。1933年,美国社会心理学家莫雷诺(Jacob L. Moreno)和詹宁斯(Helen Hall Jennings)率先使用社会关系图(sociogram)分析小群体的内部结构(譬如同班同学间的相互吸引或排斥关系),提出了星型网络、结构孤点等分析概念。他还创办了一份名为《社会测量学》(Sociometry)的学术期刊,将定量分析方法用于研究群体的内部结构、群体成员间的互动模式以及个人在群体中的地位。随着群体规模的扩大,群体成员间关系的复杂程度也会成几何级数上升,使社会关系图经纬纵横、难以判读。为了摆脱这一困境,在随后的二十年中,社会科学家对莫雷诺的分析方法做了改进,用矩阵代替社会关系图,作为社会关系的表示形式,从而将矩阵运算和图论引入研究工作中,相继提出了中心度、结构平衡等分析概念。1967年美国社会心理学家米尔格拉姆(Stanley Milgram)开展了著名的连锁信实验,以此为基础提出了“小世界理论”。与此同时,英国社会人类学家拉德克利夫- 布朗(Alfred Radcliffe-Brown)也开始强调对社会关系进行量化研究的重要性。拉德克利夫-布朗的思想带有浓厚的结构—功能主义色彩。在他看来,特定的社会结构是为实现特定社会功能而发展出来的,而社会结构的本质就是一个由社会关系构成的复杂网络。当时的社会学和人类学研究多围绕文化与内化价值展开,在拉德克利夫-布朗的影响下,美国以及英国伦敦、曼彻斯特等地的社会人类学家开始对这种研究路径提出质疑,逐渐将重心从文化观念转向社会关系,相继发展出图密度、多维标度 (multidimensional scaling)等分析概念,开拓了连锁董事会研究(interlocking directorates)等影响深远的课题。特别值得一提的是美国人类学家华纳(W. Lloyd Warner)及其合作者于20世纪三、四十年代使用社会关系图和矩阵,对人群中的小团体(cliques)现象展开的一系列研究。在心理学家梅耶(Elton Mayo)主持的著名的霍桑实验中,华纳与梅耶合作使用社会关系图,揭示了美国芝加哥近郊霍桑工厂中工人的非正式群体现象。在华纳的主持下,戴维斯(Allison Davis)等人还开展了著名的研究,通过搜集美国南部黑人男性与白人女性的社交活动数据来分析种族因素对社会分层的影响,从而开创了双模网络研究的先河。[1]

在社会学领域,有关人际关系和社会结构的讨论历史悠久,可以上溯到孔德(Auguste Comte)、齐美尔(Georg Simmel)等19世纪欧洲思想家。但是以量化方法对社会关系进行实证研究,则晚至20世纪中叶才发轫于哈佛校园。尽管起步稍晚,社会学家的参与迅速拓展了社会网络分析的概念和方法。社会学家相继发展出传递性、三元组普查(triad census)等众多概念和方法,并将社会网络分析应用于对信息扩散模式、社会资本、脱域式社区等一系列课题的研究。美国社会学家怀特(Harrison White)和威尔曼(Barry Wellman)尤其功不可没。1950年代,怀特及其学生格兰诺维特(Mark Granovetter)、伯内希赫(Philip Bonacich)先后发展出结构等价、块模型、弱关系理论、特征向量中心度等一系列影响深远的概念和方法,从而将社会网络分析的数学模型与对社会角色的思考紧密结合起来。同样出自怀特门下的威尔曼不仅对社会支持、脱域社区等课题展开了卓越研究,他还组织了“国际社会网络分析学会”(INSNA),并利用学术会议等形式增进了不同学科之间的交流,极大地推动了社会网络分析领域的整合。[2]

无论从哪个源头看,人际关系显然都是社会网络分析的重要内容。事实上,在19世纪末,数学家麦克法伦(Alexander Macfarlane)、人类学家摩尔根(Lewis Henry Morgan)等人开展的一系列堪称社会网络分析先声的研究项目,正是围绕人际关系——尤其是亲属关系——展开的。除了对亲属关系数据进行系统性的搜集和分析外,他们还尝试使用拉丁字符代替自然语言对亲属关系进行描述,并绘制出亲属关系图。通过使用拉丁字符来表示最基本的亲属关系(如p表示父母、c表示子女),麦克法伦开创性地使用字符串联法对复杂的亲属关系做出了比自然语言更为精准的描述(如cc 表示孙辈)。[3]

社会网络分析在中国研究领域的应用同样离不开对人际关系的关注。1990年代开始,社会学家、人类学家、政治学家就已将社会网络分析用于研究中国社会中的非正式关系,课题涵盖了劳动力市场的信息流动、非正式关系与科层制的互动、城市居民拜年数据中体现出来的阶层结构、农村居民的社会支持网、企业的横纵向联系及市民社区等众多方面。[4]近年来,社会网络分析也日益应用到人文研究中,研究对象相应地扩展到历史人群。在中国历史和文学研究领域,社会网络分析为群体传记学(prosopography)开辟了新天地。群体传记学将历史学家的关注点从制度史、事件史和思想观念史转向历史人群。早年的群体传记学是“通过对一群历史人物的生平进行综合研究,进而发掘出他们共同的背景特征”[5],而在社会网络分析的影响下,新一代群体传记学研究则更加注重探讨一个历史人群内部各成员之间的相互关系和交往模式。[6] 中国历代人物传记资料库(CBDB)为这类研究提供了必不可少的数据集。通过从史料中批量提取传记数据并对其进行规范化处理,CBDB将散见于历史文献的亲属关系和社会交往数据汇整起来,为从宏观视角研究历史人群提供了海量的结构化数据。截至2022年8月,CBDB共收录了52万名古代人物的传记数据,其中包括近53万笔亲属关系数据以及逾18万笔社会交往数据,内容涉及书信往来、诗文赠答、师友交游、政治推荐、攻讦弹劾等方方面面。由于CBDB数据量庞大、数据结构复杂,项目团队还使用循环检索、亲属关系字符串联等办法开发出强大的亲属关系和社会交往关系检索功能,并提供多种检索结果输出格式,为后续的可视化处理、空间分析和社会网络分析带来了便利。CBDB执行委员会委员傅君劢(Michael A. Fuller)和高级项目经理王宏苏以专文《中国历代人物传记资料库(CBDB)对历史网络的结构化处理、记录与分析》在本期专刊中对CBDB的数据结构和检索功能做了详尽的介绍。[7]在文本挖掘、数据库建设、可视化与量化分析等计算机技术的加持下,历史学家和文学史家使用中国历代人物传记资料库和各种自建数据库为东晋门阀士族的交往情况[8]、唐宋政治精英的联姻模式[9]、宋元地方家族的学术往来[10]、佛教僧侣的师承与交游[11]、唐末诗人的赠答与唱和[12]等一系列研究课题开辟了新天地。

尽管如此,社会网络分析绝不应简单地等同于对人际关系进行分析。社会网络分析是一条特色鲜明的研究路径,界定它的不是其研究对象,而是其分析概念和分析方法。这条研究路径具有浓厚的结构主义色彩,它认定行为人之间的社会关系和相互交往会造就特定的社会结构,既为身处其中的行为人提供稀缺的社会资源,也同时制约着他们的行动。作为社会关系和社会交往总和的社会结构即为社会网络分析中所说的“网络”。不同的网络具有不同的结构特征,而不同行为人在网络中的地位和功能也各不相同。社会网络分析的目标正是要揭示一个网络的结构特征及其与个体行为人之间的关系——中心度、模块度、凝聚子群等一系列分析方法和统计指标都是为此发展出来的。在本期专刊中,李惠以专文《按图能否索骥——关于社会网络分析的一点思考》对最基本、最常用的社会网络分析指标提供了深入浅出的说明。简言之,网络由关系构成,但是关系并不天然是网络,从关系到网络,需要研究者有一个“概念上的飞跃”。只有当研究者把一条条关系汇总起来并将其视为一个具有可描述的结构性特征的整体时,关系才成了网络。也就是说,网络是一个分析概念,是研究者的思维建构,它是在20世纪科学主义的认知大潮中出现的。网络为研究人际关系和社会结构提供了一个模型,将人与人、物与物、实体与实体之间的关系抽象为节点(人、事、实体)和边(关系),进而将其绘制成图并分析其拓扑结构。[13]

人类社会原本就不可能脱离关系而存在。有人类便有性关系,便有父母与子女的关系。随着人类文明的发展,又衍生出婚姻、朋友、师生、分工协作、竞争对抗、贸易、统治与被统治等种种人际关系。很久以来,人们便已意识到这些人际关系纵横交错,但是在20世纪之前,没有人将这些社会关系视为具有结构性特征的整体。历史文献中随处可见的是“盘根错节”之类的隐喻,这些隐喻把参差交错的种种社会关系比作植物的根系,意味着这些关系错综复杂、难以剖析。进入20世纪以后,“网络”“关系网”等词汇开始出现于社会科学的专业文献中,[14]但是这些新的措辞通常仍是一种模糊的隐喻,只不过“网”取代了植物的“根”成为新的喻体。事实上,尽管中国社会中的非正式关系一直是各路学者关注的核心课题,但直至1990年代,相关研究仍然很少采用网络分析的观察视角和分析方法。[15]

我们一旦将社会网络分析中的“网络”视为一个由节点和边组成的、具有特定拓扑结构的模型,那么其抽象的对象就不会仅囿于人际关系或社会交往。任何事物只要可以抽象为节点和边,就可以成为网络分析的研究对象。网络分析的技术可以上溯到著名的柯尼斯堡七桥问题(Seven Bridges of Königsberg)。当时东普鲁士的柯尼斯堡市区被普列戈利亚河分为两个部分,河中心有两个小岛,小岛与柯尼斯堡市区的两个部分通过七座桥连接起来。数学家欧拉(Leonhard Euler)在1735年提出一个问题,即在所有桥都只能走一遍的前提下,如何才能把这个地方所有的桥都走遍呢?欧拉在解决这个问题时对它进行了抽象,实际上将其转化成了网络分析问题。在这个网络中,每座桥都可以视为一条边,而桥所连接的地区则可抽象为节点。欧拉解决这一问题的方式为数学开创出了图论和拓扑学两个领域,为后来的网络分析奠定了数学基础。由此延伸开去,我们会发现网络分析的适用对象可谓无处不在:机场与航线组成航空运输网;变电站(或发电站)和电线组成电力输送网;电子计算机和光纤电缆之类的传输介质组成互联网等。所有这些现象都可以抽象为由节点和边组成的网络,而研究人员也发现这些网络虽然千差万别,却常常具有相似的结构特征(例如小世界属性)。这些网络现象引起了各领域学者的广泛关注。1990年代以来,从公共卫生、管理咨询、国家安全等领域的专家到物理学家、生物学家等自然科学家纷纷投身到各种网络现象的研究中,[16]物理学出身的华兹(Duncan W. Watts)与应用数学家斯托加茨(Steven Strogatz)一起深入探究了小世界现象的数学基础,[17]而物理学家巴拉巴西(Albert-László Barabási)和阿尔伯特(Réka Albert)则进一步指出很多看似千差万别的复杂网络现象(如互联网、电影演员合作网络等)都具有无标度这一共同特征。[18]多学科的参与为网络分析注入了空前的活力,从随机图出发使用数学模型进行动态模拟,为理解网络形态及其演化逻辑提供了崭新的视角,而为某一特定网络现象设计出来的分析指标和算法(如互联网中的HITS和PageRank)也常常被应用于其他网络现象的研究中。无标度网络结构和幂率模型的普适性,更提示了人类社会诸种结构化现象中不平衡分布的广泛存在,因而触动了人文学者敏感的神经,在语言学、艺术史,甚至文学理论研究中,都可以看到随之而来的启示。

从网络视角出发重新诠释研究对象,在社会科学领域已经行之有年。考古学家常常以考古遗址为节点、以是否曾发掘出同类器物为据构建出不同地域之间的物质交换与文化交流网;[19]经济学家以国家为节点、以不同国家间是否存在投资或贸易往来为据构建出国际经济关系网;[20]政治学家以官职为节点、以不同职位间是否存在迁转关系为据将官僚体制也抽象为网络分析的研究对象;[21]社会学家和文化人类学家以文化范畴、救济措施为节点,以不同范畴之间、不同救济措施之间的从属关系为据建立两个网络,进而分析文化范畴与救济实践之间的结构性对应关系;[22]语言学家则根据对语料所做的语法、语义依存的标注结果,构建动态句法语义依存关系网络,进而研究其复杂性和普遍性特征。[23]如此种种,不一而足。

近年来网络分析进一步深入人文领域,作为一种探索事物结构性特征的抽象模型,其基本思想和建模手段,被创造性地用于计算批评(computational criticism)的推理和论证,成为数字时代人文学者阐明观点,介入文化、历史和意识形态批评的有效途径。这些研究已不再拘泥于分析社会、经济和政治现实,而是恢复了表征实践的悠久传统,巧妙地借助建模操作,找到了思想观点的“客观对应物”,完成了从传统观念到新阐释的再度飞跃。[24]这种飞跃为文化史研究带来了问题的重新凝结再造,也是计算批评的关键。2014年,艺术史学者 马克西米利安·希奇(Maximilian Schich)与网络科学大家巴拉巴西(Albert-László Barabási)团队合作在《科学》杂志发表研究,用过去两千年间欧洲和北美十五万文化名人的生卒地作节点,以迁移网络的形式再现了西方文化中心的全球流动和盛衰演变。[25] 这一建模方式名噪一时,极大地影响了后来者,在德国史研究、空间人文和小说研究中均出现了用迁徙数据做文章的佳作。[26]2020年,武汉大学地理信息团队就与中南民族大学文学与新闻传播学院合作,在11万条文人足迹数据的基础上构建了唐宋文人的大规模迁徙网络。[27]和 Schich的指标一样,他们也把统计网页点击率的 PageRank算法,用于对不同时期城市节点的“吸引力”建模,从空间人文的角度重估了先前研究中关于“文化中心说”的大量论断:如唐代文化以两都为中心,环太湖流域文人群体初现;北宋时开封和环太湖、长江流域文人聚集性崛起;南宋时江苏南部、江西、浙江城市群和福建、成都文人群体发展壮大等。而Schich研究广为传播的一个重要结论,其实正来自于对迁移路径(边关系)的网络分布形态的测量,即“从生到死”之路径的分布不仅遵循了齐夫定律,而且从19世纪开始,生、卒地的累积概率之斜率开始发生惊人的差异,这种幂率差异表明不平衡的出现,较大的文化中心在近世吸引了更多的知名人士,像巴黎、伦敦这样一些城市成为名人归宿地。

在人文研究中,系统地搜集关系数据是网络分析必须面对的一大难题,当研究对象是历史问题时,这一困境则更加明显。近年来,人文学者开始借助于霍布森、戴维斯等人开创的双模网络分析来处理这类问题。这类研究中的网络通常不再是真实的社会关系的映射,而成为一种形式化的表征。比如,历史学家林如莲(Marilyn Levine)在仅仅掌握群体传记属性资料(如性别、年龄、籍贯、留学背景等)的情况下,便另辟蹊径,构建人物—属性双模网络,再通过双模向单模网络的转化算法,建立起历史人物的关系网络,进一步揭示政治群体的内部派系和核心领导人所担任的不同角色。[28]显然,这种网络所呈现的已不再是社会交往关系,而成为以相似性度量为基础的一种新的表征方式,在用于党派和政治活动的研究时,正体现了所谓“物以类聚,人以群分”的思想,让人文数据在人文学者手里得以更灵活地“为我所用”。这种以节点相似度为基础的网络建模方法在本刊收录的数篇文章中亦可见到(详见后文对马昭仪等、康森杰等的讨论)。在文学和文化研究中,仅仅依靠期刊出版和作者元数据建立起的双模网络,可以用于考察思潮流派和创作行为的美学占位,为批评性观点的发挥提供佐证,为论证添彩。[29]在这方面,网络建模的手段如果与其他文本分析方法密切结合,还可以获得更加精细化的论证。如以宋代地方官学碑记的作者及官学所在地域为节点建立双模网络,再辅以内容上的主题聚类,便可以从网络形态、地理分布和文本语义三个角度,经过三重询证,还原理学思想在南宋地方官学中与日俱增的影响力,使这一原本不易察觉的观念传播过程得到“迹化”。[30]在这样的思路中,原命题被不断转化,分解为新的假设;相应的,说理和验证也由此展现出一种层层深入、抽丝剥茧的效果,这正是计算批评的魅力所在。

由隐喻而模型,由模型而批评,这个学术趋势在本期专刊中得到了充分的体现。本刊集中展示了网络分析方法在中国古代史、近现代史、中国文学、文献学、民族古文字学等人文领域中的研究和批评成果,同时介绍了关系型数据库、图数据库、网络数据可视化平台等与网络分析相关的基础设施建设。本刊所收的研究论文将网络分析与主题模型、文学制图、语义技术等灵活结合,应用于宗教史、文化记忆、性别书写、崇高美学、唐传奇中的空间表征等多种研究课题。

本刊中有三篇论文集中于文本网络(textual networks)的分析。在这类网络建模中研究者通常会从文本中抽取可量化、且有研究价值的关系来建立网络,至于其意义该如何解释、得出的各项结构指标又有何种意涵,则由具体的研究问题和节点间连线的标准(亦即编码方式)来决定。诸如人物的互动频率、对话强度、实体共现次数、地点之间的迁移路径等,皆可作为关系数据,用于网络建模。

就文学文本中的网络分析而言,常见的 一类做法是对人物关系予以抽取和建模,通过分析网络的各种统计指标和结构特征,探讨叙事组织背后的深层意图。其中一种建模方法把注意力放在人物的提及与被提及关系上,其思路与引文网络研究(citation network)颇为类似。陈威(Jack W. Chen)等人较早研究了《世说新语》中人物的提及关系,并投射到地图上,从中观察到这部轶事集中的人物按时代聚集的趋势,而不同的时代聚类又分别反映了各个时代所关心的不同主题 。作者对提及他人和被他人提及两种不同情况做出了区分,由此构建出有向网络,并结合出入度、中介中心度等指标,发现了一些值得深究的现象。[31]和提及关系不同,在文学叙事的人物话语和人物功能研究中,另一种建模方法是以角色为节点、以不同角色间各异的对话情境为边来构建角色互动网络。[32]和《世说新语》类似,北宋初年王谠编纂的《唐语林》也是轶闻小说集,且其分类系统也建立在《世说新语》的基础之上。不过,秦颖《〈唐语林〉中对话网络的可视化和统计分析初探》中则采用了和陈威颇为不同的建模方法和分析指标。尽管她所构建的也是有向网络,但是既不涉及对话的内容(如一段对话中提及了哪些人物),也不涉及对话之外其他形式的互动关系。她将关注的重点完全放在对话方向和对话次数上,通过分析对话关系网的结构特征,对《唐语林》中“语”的性质展开了细致探讨,关注的是北宋初年对唐代的历史记忆问题。在这个对话网络中,秦颖对发话方和受话方做了明确的区分,并将点击度算法(HITS)应用到这项研究中。点击度原本是康奈尔大学计算机科学教授克莱因伯格(Jon Kleinberg)为更好地对网页进行排名而设计的,它使用权威度(Authority)和枢纽度(Hub)两个相互关联的指标分别衡量一个网页自身的受欢迎程度和它的引流能力,但是在本项研究中秦颖为这两个指标赋予了全新的意涵。和陈威使用的出入度不同,权威度和枢纽度都是利用迭代算法得出的全局性指标。一个节点的权威度和枢纽度是综合一个网络的整体特征得出的,而非仅仅取决于与它存在直接联系的节点数目。这种计算方法使秦颖得以从全局层面对节点的重要性加以观察。她指出玄宗是《唐语林》对话网中的主导人物,但其形象在《唐语林》前后两部分中截然不同。在前半部分,玄宗是一个积极的发话者(高枢纽度),与他交流的对象多为直言规谏的朝臣,而在后半部分,他则被描绘成一个被动的受话方(高权威度),常常处于僧侣、宦官和倡优的影响之下。作者认为,传统研究强调细读,把注意力放在每则轶事的细节上,因此难以发现潜藏在一千多条轶事材料中的“玄宗因素”,更难揭示它在文本后半部分的“反转”。网络分析具有整体关照的优势,可以帮助研究者将这些全局性特征提炼出来,下一步便可结合对具体轶事的细读做更加深入的探讨,引导研究者进一步思考这一特征所反映的到底是中晚唐轶事材料对玄宗时期的关注,还是北宋时期的笔记编撰者在反思唐帝国兴衰的基础上对材料所做的取舍。换言之,网络分析为研究者提供了一个具有全局视角的抽象模型,为后续更大尺度的同类研究提供了通用的、可检验的度量指标,体现了计算批评中“模型检验”的基本思想,或者说反思意识。

马昭仪、何捷和刘帅帅《从唐小说中的空间交互看都城长安的社会感知变迁》的研究对象(唐传奇)和秦颖非常接近,但是他们关注的不是人物塑造,也并非文学叙事问题,而是文学作品对城市空间的文化表征。因此,他们的分析方法也和秦颖截然不同。从计算批评的角度看,其精彩之处正在于,紧紧抓住了两个核心问题来建模。其一是“基于坊里可见度的时间相关性网络”,即通过模块度计算,探测出社区,寻找那些分散着的、但又属于同一群组的坊里之间的相似之处,探究是什么让它们在各时期可见度变化都相趋同。这个指标,体现了社会权力结构更迭的空间性特征。而第二类指标,虽然也再现了深层的空间叙事意图,却是由人物的出行数据得出的,也就是说,是从文本塑造的故事世界中一个个活生生的人物命运走向中抽绎出来的,但显然,这部分通往文学虚构之核心的问题却并非作者旨趣所在。他们以唐长安城的坊里为节点、以故事人物在不同坊里间的移动轨迹为边,构建出坊里空间交互网络,将中心度、模块化的计算和当代人文地理学的分析手段(如文学制图、空间插值)结合起来,对各个坊里的重要性及其彼此之间的相互联系进行探索。他们的研究表明初唐、盛唐、中唐故事通常围绕以太极宫、兴庆宫、大明宫为中心的政治空间展开,而中唐以降迄于晚唐,宗教色彩较浓、与文士社群关系密切的晋昌坊、曲江等中南部区域在唐传奇中的可见度则与日俱增,逐渐成为故事情节展开的主要场所。此外,盛唐以来随着兴庆宫的兴起,长安城内东西向的联系也在唐传奇中逐渐凸显出来,与长久以来以北部权力空间向南投射为特点的南北向礼仪性空间关系形成掣肘之势。这两项设计分别以节点属性相似度和节点互动关系为基础构建网络模型,显示了网络分析为空间人文研究开辟的颇具吸引力的前景,也激起了人们对“小说证史”这一类更根本的阐释问题的反思。

马杰(Maciej Patryk Kurzynski)《论中国现代文学叙事中的崇高技术》的研究对象是现当代文学。他开宗明义地将网络分析作为计算批评的一大利器,用于分析20世纪的革命和后革命小说中的崇高修辞。借助于量化手段,他极富见地地指出《第二个太阳》和《灵山》两部作品虽然主题内容天壤悬隔,其修辞机制却如出一辙。从古典修辞学和康德美学出发,他认为这两部作品都在叙述中将表达崇高意象的辞藻序列别有意味地融入了情节发展中。随着情节的推进和壮美之辞的叠加累进,崇高辞藻不仅在量的方面超越极限,给读者的阅读体验带来了质的转变,而且其所携带着自然伟力的情感记忆,与蕴含着抽象价值的那些推动情节发展的主题话语形成了“跨越边界”的协同共振,最终成就了崇高的瞬间。为了从语言形式的层面论证这一观点,他将网络分析方法与自然语言处理技术结合,先用词嵌入法构建出一张表达崇高意象的词表(sublime vocabulary),再对每部小说进行主题建模,并以此为基础创建出一张在词频分布上与崇高词表高度相关的情节词表(plot vocabulary或topical vocabulary)。然后以这两类词语作为节点、以它们是否在同一句子或相邻句子中同时出现为依据建立词共现网络,最后利用特征向量中心度和共现次数评估每个词语的重要性,呈现两类词表在叙事过程中的交织使用模式。可以说,这种计算批评不仅利用语义技术和网络分析设计出一套测度崇高的计算批评模型,也为人们从一个非西方的语境中重新认识革命浪漫主义在1980年代的嬗变,提供了不同于以往的视角。

社会网络分析不仅给文学研究带来了新视角、新方法,也为中国近现代史研究注入了新的活力。德国学者Henrike Rudolph(卢娴立)的《赋权结构:20 世纪中国妇女活动家集体传记的网络研究》将社会网络分析用于二十世纪中国妇女活动家集体传记的研究,尝试揭示这类传记的叙事规则及其蕴藏的性别意识和权力关系。[33]卢娴立关注的不是历史书写中的遣词造句,而是历史叙事对材料的取舍。因此,在她所构建的叙事网络中,节点不是词汇,而是历史人物、事件和机构,而网络中的边则将每条传记的主人翁与该传记中提到的事件、机构及其他历史人物连接在一起,再利用入度、接近中心度等指标,进行跨时期比对。她找出了在不同时期的叙事网络中占据重要位置的节点,力图触及变化发生的原因。这些节点所代表的历史人物、事件、机构通常具有高度象征意义,在妇女活动家传记中被反复提及。卢娴立指出,通过将它们融入妇女活动家的生平叙事中,这些传记将她们的人生故事绑定到了主流历史论述上,这套机制被作者称为“赋权结构”。可以看到,同样是研究叙事问题,史学出身的卢娴立和文学出身的马杰有着不尽相同的视角,但他们的落脚点同样是作为一套社会实践的观念领域,换言之,是在不断文本化的过程中文化与权力的胶着关系,因而也毋宁视之为一种历史文化批评。

在宗教史、民族古文字学和文献学方面,网络分析也为研究人员从宏观角度理解历史材料提供了新工具和新方法。张光伟《西夏文字典〈文海〉的网络分析》将网络分析方法用于对西夏字典《文海》的研究。他以《文海》中所收的西夏字为节点、以解释关系为边,将整部字典转化为有向网络,然后通过重复删除出度为零的节点找出西夏文基本字集,并根据节点之间的路径长度及其闭环特征全面排查了《文海》中的循环解释现象,重建了西夏字的解释层次结构,为后续西夏文研究夯实了根基。

芝加哥大学康森杰(Jeffrey Tharsen) 和克洛维斯· 格莱斯顿(Clovis Gladstone)《TextPAIR查看器(TPV):用于探索文本对齐和文本复用网络的交互式可视化工具包》则将网络分析方法用于探索中国历史文献中的文本复用(text reuse)现象。近年来,数字人文学者开发了多种计算机程序,帮助研究人员从文献中检测相似段落,其中首推芝加哥大学的TextPAIR工具。[34]这些工具的问世为研究古籍中的互文关系提供了极大的便利,但是随之产生的海量数据也给研究工作带来了巨大挑战。为解决这一问题,康森杰和克洛维斯·格莱斯顿将网络分析和文本复用研究结合起来,合作开发了TextPAIR Viewer (TPV)平台,以文本为节点、以不同文本的相似度为边,利用网络关系图呈现文本复用数据。[35]这种呈现方式带来了研究视角的切换,它把研究人员的注意力从《班马异同》式的考证工作中解脱出来,将他们的视距拉远(zoom out),使他们不再把精力耗费于巨细靡遗地胪列每对文本之间的异同,而是鼓励他们对一大批文本彼此之间的复用情况进行全景式、鸟瞰式的观察。借助网络分析中的凝聚子群算法和中心度指标,研究人员还可尝试以文本复用关系为基础来甄别不同的文化社群,并发现那些跨越不同文化社群、在其间扮演着桥梁纽带作用的文献,拓展互文性研究的手段和边界。

对波士顿大学的马飞立(Alex Mayfi eld)艾德恩(Daryl Ireland)梅欧金(Eugenio Menegon)而言,网络不仅是数据的呈现方式,也是最为直观高效的数据编排和存储形式。在本期的跨越数字鸿沟:中国基督教历史资料库的发展与用户体验》中可以看到,他们正在着手开发中国基督教历史资料库(CHCD),这个资料库将记录明代中叶至民国时期(1550—1950)中国每一所基督教教堂、学校、医院、孤儿院、印书馆等场所的地理方位,以及与这些场所有过交集的各种中外人士。CHCD以Neo4j图数据库管理系统为底层技术平台, 图数据库利用自然语言中主谓宾结构与网络图中“节点—边—节点”结构(即语义三元组,semantic triples)之间的对应关系,以语义三元组作为最基本的数据存储单元,数据结构具有灵活高效的特点。在此基础上,CHCD又使用React、Leafl et、D3等Java代码库为终端用户搭建简洁易用的空间数据和网络数据可视化人机交互界面,供中高等院校的师生及全世界的普罗大众使用,帮助人文学者跨越数字技术的鸿沟。[36]

和2021年出版于欧洲的Journal of Historical Network Research 特刊“Beyond Guanxi: Chinese Historical Networks”类似,这部专刊同样可视为在中文数字人文领域集结的第一部网络分析论文集,我们希望这两朵并生花特刊能够对网络分析在人文学术中的应用起到实质性的推动作用。本刊组稿从起念至今,已近三载。在编者与作者、作者与审稿人,以及编者彼此间长达两年的反复切磋、讨论和返修过程中,我们见证了很多作品的诞生、定型和落成,也经历了最真实的数字人文学术的发生。感谢所有撰稿人,以及梁晨、陈刚、许超、Paul Vierthaler(李友仁)、Anatoly Detwyler(戴安德)、Marilyn Levine(林如莲)、HenrikeRudolph(卢娴立)等学界同仁的鼎力支持,而其中特别应致以谢忱和歉意的是我们的前辈学者,在他们的耐心配合下,有的稿件往复修改达十三稿之多,惜乎最终未能刊出,他们自始至终谦谨的付出令人铭感不已,也是催促我们不断前进的动力。

注释:

[1] Allison Davis, Burleigh B. Gardner, and Mary R. Gardner, Deep South: A Social Anthropological Study of Caste and Class, Chicago: University of Chicago Press, 1941. 双模网络数据的搜集和可视化探索还可往前追溯到19世纪经济学家霍布森(John Atkinson Hobson)对连锁董事会的开创性研究,参见Christina Prell, Social Network AnalysisHistory, Theory & Methodology, Thousand Oaks, CA: SAGE Publications, 2012, pp. 19, 24。

[2]Christina Prell, Social Network Analysis: History, Theory & Methodology, pp. 19-58.

[3]Linton C. Freeman, The Development of Social Network Analysis: A Study in the Sociology of Science,Vancouver, BC: Empirical Press, 2004, pp. 16-25.

[4]张文宏:《中国社会网络与社会资本研究30年》,《江海学刊》2011年第2期、第3期。

[5]Lawrence Stone“, Prosopography,” Daedalus, vol. 100, no. 1, 1971, p. 46.

[6]Dion Smythe, “Prosopography,” The Oxford Handbook of Byzantine Studies, eds. Elizabeth Jeffreys,John Haldon, and Robin Cormack, New York: Oxford University Press, 2008, pp. 177-178.

[7]另见包弼德、王宏苏、傅君劢、陈松、柳舟、朱厚权:《中国历代人物传记资料库(CBDB)的历史、方法与未来》,《数字人文研究》2021年第1期。Song Chen, Hongsu Wang“, China Biographical Database (CBDB):A Relational Database for Prosopographical Research of Pre-Modern China,” Journal of Open Humanities Data,vol. 8, no. 1, 2022, pp. 1-6. 另见CBDB项目官网的介绍(https://projects.iq.harvard.edu/chinesecbdb),2022

年9月10日。

[8]Wenyi Shang, Zizhou Sang, “Solidity in a Turbulent Flow: The Social Network of Aristocratic Families in the Eastern Jin Dynasty (317-420 C.E.),” Journal of Historical Network Research,vol. 5, no. 1, 2021, pp. 1-32.

[9]Nicolas Tackett, The Destruction of the Medieval Chinese Aristocracy, Cambridge, MA: Harvard University Asia Center, 2014, pp. 107-145; Song Chen, “Governing a Multicentered Empire: Prefects and TheirNetworks in the 1040s and 1210s,” State Power in China, 900-1325, eds. Patricia Buckley Ebrey and PaulJakov Smith, Seattle: University of Washington Press, 2016, pp. 101-152.

[10]Peter K. Bol“, From Kinship to Collegiality: Changing Literati Networks, 1100-1400,” Journal of Historical Network Research, vol. 5, no. 1, 2021, pp. 87-113.

[11]Marcus Bingenheimer“, On the Use of Historical Social Network Analysis in the Study of Chinese Buddhism: The Case of Dao’an, Huiyuan, and Kumāraīj va,” Journal of the Japanese Association for Digital Humanities, vol. 5, no. 2, 2020, pp. 84-131.

[12]Thomas J. Mazanec, “Networks of Exchange Poetry in Late Medieval China: Notes Toward a Dynamic History of Tang Literature,” Journal of Chinese Literature and Culture, vol. 5, no. 2, 2018, pp. 322-359.

[13]Song Chen, Henrike Rudolph,“ Beyond Relationships and Guanxi: An Introduction to the Research of Chinese Historical Networks,” Journal of Historical Network Research, vol. 5, no. 1, 2021, pp. iii-xxxii.

[14]王同惠:《广西省象县东南乡花篮猺社会组织》,上海:上海商务印书馆,1936年,第44页。

[15]纪莺莺:《文化、制度与结构:中国社会关系研究》,《社会学研究》2012年第2期。

[16]Stephen P. Borgatti et al.,“ Network Analysis in the Social Sciences,” Science, vol. 323, no. 5916, 2019,pp. 892-895.

[17]Duncan J. Watts, Stephen H. Strogatz, “Collective Dynamics of ‘Small-World’ Networks,” Nature, vol.393, no. 6684, 1998, pp. 440-442.

[18]Albert-László Barabasi, Réka Albert“, Emergence of Scaling in Random Networks,” Science, vol. 286, no.5439, 1999, pp. 509-512.

[19]Søren Michael Sindbæk,“ The Small World of the Vikings: Networks in Early Medieval Communication and Exchange,” Norwegian Archaeological Review, vol. 40, no. 1, 2007, pp. 59-74.

[20]David A. Smith, Douglas R White“. Structure and Dynamics of the Global Economy: Network Analysis of International Trade 1965-1980,” Social Forces, vol. 70, no. 4, 1992, pp. 857-893.

[21]Franziska Barbara Keller,“ Analyses of Elite Networks,” The Palgrave Handbook of Political Elites, eds. Heinrich Best and John Higley, London: Palgrave Macmillan, 2018, pp. 142-143; Abdurrahman Atçıl, Gürzat Kami, “Studying Professional Careers as Hierarchical Networks: A Case Study on the Careers of Chief Judges in the Ottoman Empire (1516-1622),” Journal of Historical Network Research, vol. 7, no. 1, 2022, pp. 1-32. 关于中国史研究方面的实例,参见:Xiong Huei-Lan, “Path toward the Top Leadership:A Network Analysis of the Civil Service System in the Early Southern Song (1131- 1164),” Journal ofHistorical Network Research, vol. 5, no. 1, 2021, pp. 33-86。

[22]John W. Mohr, Vincent Duquenne, “The Duality of Culture and Practice: Poverty Relief in New York City, 1888-1917,” Theory and Society, vol. 26, no. 2-3, 1997, pp. 305-356. 近年来,也有研究思想史的学者以词语为节点、以不同词语是否在同一部著述中出现为依据将一位思想家(或政治人物)在特定历史时期内的著述抽象为词语共现网络,借以探讨在该人物在不同历史时期的思想特征,如Anne S. Chao et al.,

“Network of Words: A Co-Occurrence Analysis of Nation-Building Terms in the Writings of Liang Qichaoand Chen Duxiu,” Journal of Historical Network Research, vol. 5, no. 1, 2021, pp. 154-186。

[23]刘海涛:《依存关系与语言网络》,北京:科学出版社,2022年,第224—301页。

[24]此处计算批评的具体意涵,参见赵薇:《作为计算批评的数字人文》,《中国文学批评》2022年第2期。

[25]M aximilian Schich et al.“, A Network Framework of Cultural History,” Science, vol. 345, no. 6196, 2014, pp. 558-562.

[26]王涛:《数字人文框架下〈德意志人物志〉的群像描绘与类型分析》,《历史研究》2018年第5期。

[27]应申等:《基于唐宋文人足迹集聚性分析的中心文化城市变迁》,《地球信息科学学报》2020年第5期。

[28]林如莲(Marilyn Levine):《淬炼于欧——中国共产党领导人与旅欧中国共产主义组织》,《数位典藏与数位人文》待刊。

[29]Hoyt Long,“ Fog and Steel: Mapping Communities of Literary Translation in an Information Age,” Journal of Japanese Studies, vol. 41, no. 2, 2015, pp. 281-316.

[30]陈松:《为学作记——从网络分析和文本分析视角看宋代地方官学碑记的作者和主题》,《数字人文》2020年第4期。

[31]Jack W. Chen et al.“, The Shishuo Xinyu as Data Visualization,” Early Medieval China, vol. 20, 2014, pp. 23-59.

[32]廖儁凡:《中国古典白话小说中的社会网路关系:以〈儒林外史〉为例》,硕士学位论文,台湾大学,2010年;Franco Moretti, Distant Reading, London: Verso, 2013, pp. 211-240; 赵薇:《社会网络分析与“〈大波〉三部曲”的人物功能》,《山东社会科学》2018年第9期;赵薇:《网络分析与人物理论》,《文艺理论与批评》2020年第2期。

[33]需说明的是,由于种种原因,该文最终未能在本期刊出,我们也在此向作者再次致以歉意。

[34]关于TextPAIR工具,可参考该项目官网(https://artfl-project.uchicago.edu/text-pair)。TextPAIR的源代码已于GitHub上公开(https://github.com/ARTFL-Project/text-pair)。此外,德龙(Donald Sturgeon)也开发了相似段落资料库(https://ctext.org/tools/parallel-passages/zh),将其作为中国哲学电子书计划的一部分,并允许用户利用高级搜索功能从指定文献中寻找相似段落。

[35]关于以相似度为基础构建文本网络的,可参考:Matthew Lee Jockers, Macroanalysis: Digital Methods and Literary History, Urbana: University of Illinois Press, 2013, pp. 154-168。关于网络分析方法在研究文本复用方面的应用,见Donald Sturgeon, “Unsupervised Identification of Text Reuse in Early Chinese Literature,” Digital Scholarship in the Humanities, vol. 33, no. 3, 2018, pp. 670-684。此外还有关于18世纪文献挖掘的项目“CommonPlace Cultures”及相关成果(https://commonplacecultures.org/?page_id=259)。

[36]另见CHCD项目官网(https://chcdatabase.com/zh/),2022年9月10日。

原刊《数字人文》2022年第1期,转载请联系授权。

en_GBEnglish