比较视野中的数字人文对话与争议 ——南京大学“比较视野中的数字人文反思”学术研讨会综述

近年来数字人文在中国发展迅速,引起人文社会科学领域的关注,并开始形成……

作者:谢丽萍;转自:公众号 DH数字人文

DH资讯

谢丽萍 / 南京大学政府管理学院

————————————

摘要:近年来数字人文在中国发展迅速,引起人文社会科学领域的关注,并开始形成跨学科的学者社群。与西方成熟的发展土壤不同,在中国刚刚扎根的数字人文面临着新的问题和挑战。来自多学科的中西方学者,在“比较视野中的数字人文反思”学术研讨会上围绕数字人文的定义与核心、数字文化遗产与艺术、人文研究与技术合作、数字的元问题、数字知识生产跨境旅行、在中国如何认识数字人文等六个主题进行了跨学科对话。中西方语境均面临着传统人文学科的质疑、计算机技术学习以及跨学科合作信息不对称等问题;而不同文化语境中历史、文字、教育模式等差异,则成为中西方数字人文学者亟待沟通与融合的重要议题。

关键词:数字人文 中国语境 比较视野 跨学科合作 最小计算

————————————

数字人文(DH, Digital Humanities)作为数字时代知识生产转型的新兴模式,在中西方语境中皆有发生。然而,作为一个新兴领域的“数字人文”却在中西方语境中呈现出不同的发展路径、形态模式和特点。英美的“数字人文”溯源于“人文计算”与“文献学”,历经60多年发展历程,已在研究范式、方法创新、工具开发、人才培养和学术出版方面取得令人瞩目的成就。而中国的“数字人文”与西方不同,始于20世纪末、21世纪初,近几年来发展迅速,势头渐猛,开始引起人文社会科学各个领域的关注,新的跨学科数字人文社群也逐渐形成。可以说,数字人文所体现的是在全球信息技术与基础设施发展语境中的新型学术知识的生产、传播和保存形态。从比较视野来看,中西方语境中“数字人文”除共性之外,也体现出很多差异,比如中文文本数据的特殊性为组织和分析数字文献的方法、路径和工具提出了挑战。

南京大学数字人文创研中心是南京大学人文社会科学高级研究院下属的跨学科国际研究平台。该中心以“聚焦数字时代焦点问题研究”为导向,提倡以“数字人文”为跨学科研究驱动,汇聚南京大学校内多学科资源,促进校内跨学科合作,面向国内外科研及文化机构,搭建国际化交流与合作平台,推动数字时代的人文社会科学知识生产与传播转型。

2019年4月28日,南大高研院数字人文创研中心召开“比较视野中的数字人文反思”学术研讨会,旨在面对数字人文在中西方语境中不同的路径时,对数字人文全球化和本地化系列议题开展一系列反思讨论。来自国内外英语文学、图书馆学、艺术学、比较文学、历史学、新闻传播学、博物馆学、计算机科学、地理信息科学等学科的20多位嘉宾,在研讨会上展开了充分的讨论和交流,议题覆盖数字人文的核心理论及方法论等理论化问题,也包括用于学术研究的工具、方法和工作流程等方法性问题,还包括数字人文项目的研究资金、可持续性和课程建设等相关体制及资源问题,并在讨论中形成了一系列非常有趣而深入的对话。01对话一:数字人文的定义与核心是什么?

数字人文领域近几十年蓬勃发展,不断涌现出新的研究成果,学术共同体也逐渐形成,那么处于十字路口的数字人文应当如何继续前行?反思以往的发展路径,数字人文究竟意味着何种研究?是否有属于自己独特的研究范式?数据驱动的研究方式是否会导向理论虚无主义?数字人文的本质是否意味着高成本、耗人力的大型项目?中文语境的数字人文的定义与发展存在什么问题?基于上述困惑,上海图书馆副馆长刘炜教授、美国塞勒姆州立大学助理教授Roopika Risam、南京大学王涛教授围绕着“数字人文的定义与核心”问题展开了对话。

刘炜:呼吁数字人文学科/理论建设

“数字人文”存在三个状况:定义的危机、理论的模糊性、学科贡献的结构性问题。首先,数字人文的定义范围没有边界。刘炜教授介绍了美国弗吉尼亚联邦大学David Golumbia副教授的观点,解释了“数字人文”广义和狭义的两种定义:虽然“数字人文是计算机技术和人文学科的结合”的广义定义得到了大家的普遍认可,但是根据美国关于数字人文的招聘启事和项目资助可以发现,在实际操作中只认可“技术工具和资源开发”的狭义定义。因此David更倾向于广义定义,希望学术共同体能够在广义数字人文下各取所需,而不要陷入“是否属于数字人文领域”相互质疑攻讦的困境之中。[1]

承认广义的定义固然有利于为数字人文的初期发展提供更好的生长土壤,但是一旦到了数字技术高度发展,并成为人类进行学术研究的普遍技术时,如果没有理论支撑的话,那么这种没有范围边界的广义定义就会让“数字人文”在发展中迷失方向。数字人文应该往何处去?事实上,当前数字人文的主要特点是数据驱动的研究范式,这种范式在方法论层面影响了人文学科的传统研究范式,并在应用、方法、理论方面出现了跨学科的特性。数字人文的发展逐步形成了数据驱动的方法论共同体,开始普及相关的数据理念(实物数据、文本或图形、概念数据)及其配套的方法(技术或模型)。这使得数字人文在当下所处的发展初期更加强调实践意义上的探索,主要体现为国外大多数技术人员和研究专家在谈论数字人文教育时,都是提倡“just do it”,优先做好相关的技能培养就可以了。而将这种理论的无政府主义推至极致的就是《数字人文宣言2.0版》[2],这份宣言确实提及了数字人文应该如何发展的问题,而其基本观点就是:所有理论都会阻碍数字人文的发展,所以反对一切理论作为其发展准则。

但是,仅仅依靠数字(Just doing it without thinking it)真的能振兴人文吗?近日加州大学几名学者的著作[3]被译为中文出版,其中指出技术很容易成为数字人文项目的中心,人文学者容易被技术所迷惑,导致数字人文研究仅仅停留在工具层的贡献上,这也形成了数字人文工作者的理论焦虑。针对数字人文理论的模糊性,数字人文学者更应该进行数字人文学科/理论建设,拓展研究的深度和广度。

最后,数字人文研究领域中,各个学科的贡献出现了不平衡的情况。纵观从数字图书馆到数字人文发展历史,资料的数字化首先是以建立数字图书馆为出发点,进行数字化之后,为了向纵深发展,图书馆从上个世纪末才开始资助人文的数字研究。因此,学科贡献不均的结构性问题是其发展历史造成的,最开始进入的是语言学家、文学家,然后是历史学家。国外学者从数字意识出发做了结构图表,但是数字人文在展现其跨学科的特性时,应当有学科平等的意识。

Roopika Risam:数字人文项目必须是大型的吗

数字人文实践只能借助大规模的财政资源、数据和人力才能运转吗?数字人文项目应当是大规模的刻板印象,往往会阻碍数字人文社群的发展。事实上,数字人文社群有很多种类型,从学术层次上来说,可以包括学生、图书馆员、教师等;从机构性质上来说,可以分公立、私立、地区性等;甚至从全球的角度上来说,还可以分南部与北部。在多数情况下,很多学者并没有充裕的经费支持,也没有直接使用大型数据库的权限,可能团队里面还有尚未入门的本科生。这是否意味着多数人就无法进入数字人文的研究领域呢?美国塞勒姆州立大学提供了一个“微型”的答案。

Roopika Risam

微型数字人文项目(Micro DH)可以跨越学术层级将教师、图书管理员和学生聚集起来进行学术合作。塞勒姆州立大学的生源主要来自当地工人家庭,35%的学生是有色人种、40%是家庭里第一代大学生。[4]为了给学生提供数字人文学术训练的机会,Roopika团队利用学校所提供的一小笔资助开发了“数字学者项目”(Digital Scholars Program),学生经过筛选后将进行为期一个学期的小规模数字人文培训。微型数字人文的好处在于学生可以全程参与数字人文项目的每个环节,包括查阅档案、自主选择研究课题、组织材料、制定研究计划、选择平台工具、计算研究结果。本着微型数字人文的精神,该项目不使用费用高昂的专有技术和软件,只使用可免费获得的资源和开源软件。这个项目帮助学生进行了一系列数字人文实践,包括数字化文本、三维建模、数量文本分析、数据可视化等,在这个过程中学生可以得到专业的数字人文学者的指导。微型数字人文项目让学生从数字媒体和技术消费者的角色转变为生产者的角色,在这个视角下,该团队为学生们的小项目开发了“数字塞勒姆(Digital Salem)”[5],将学生的每个小项目收编起来成为塞勒姆州立大学独具特色的学术数据库。

微型数字人文能够促进教师、图书馆员和学生的协同合作,既适用于教学密集型大学的学术培训,也为不同学术机构提供了一种运行数字人文项目的思路。更重要的是,“微型”意味着不需要加入大型机构中心、购买昂贵的技术、处理大量的资料,打破了资源匮乏的初学者进入数字人文领域的障碍,这对于包容的数字人文社群的发展至关重要。

王涛:“数字人文”称谓在于其意涵“无所不包”

“大数据视域下的数字人文研究”入选2018年度“十大”学术热点,已经充分证明了数字人文的“热度”。但数字人文并非是近些年才出现的新方法。如果从概念来看,“数字人文”应该是在该研究领域的多个命名竞争中获胜的结果。如果这个研究领域的厘定不受制于“数字人文”这个狭义概念的话,那么该领域的讨论时间,相较于南京大学陈静副教授所提的2009年[6],在国内可以再往前追溯到2002年“数字化与21世纪人文精神”研讨会[7]议题,甚至可以追溯到1922年梁启超于东南大学演讲所倡导的“历史统计学”(Historical Statistics)。纵观社会网络分析、文本挖掘、地理信息系统、可视化功能的研究技术发展过程,可以看到,经历了多个命名竞争之后,“数字人文”这个概念最终之所以保留下来,正是因为其含义“无所不包”。

当前数字人文需要注意三个问题:第一,学者间进行学习与合作交流存在技术壁垒,根据2019年2月发布的长达149页的《数字人文文献目录》[8]可见,数字人文研究议题范围很广,但论文中所涉及的各种数据库类型以及数字技术,成为了其他学者学习和交流的障碍;第二,数字方法压倒学科议题,数字人文会议的与会学者来自不同的专业背景,因为论文宣讲后的讨论环节中学者间只能就数字人文的方法进行互动,却无法就文章本身的学科专业性议题提出自己的见解;第三,不同语言环境的数字人文发展进度不一,比如《数字人文文献目录》中,中国数字人文研究的缺席有可能是因为书写语言没有采用英语而不受关注。中文语境的数字人文研究存在参照西方研究、理论讨论多于实践案例研究的情况,数字人文在中国虽然尚未成熟,但发展可期。02对话二:人文文化遗产与艺术如何在数字人文时代得到新的发展机遇?

传统的人文文化遗产与艺术的呈现方式是什么,又面临着怎么样的困境?数字人文理念的冲击,在协作团体、展出形式、功能效果等方面,给予人文文化遗产与艺术什么样的启发和挑战?上海图书馆夏翠娟研究员以文化记忆为主题,介绍了数字人文介入中西方文化记忆实践的成果,提出工程师、图书馆员、学者共同进行数字协作的理念,以及讨论借助“存储”来抗争“遗忘”等议题。上海博物馆的刘健副主任讲解了上海博物馆董其昌数字人文展示项目,通过介绍其五大模块和多项功能,呈现数字人文在博物馆数字展示方面的应用以及对知识传播效果的影响。

夏翠娟:文化记忆与数字协作

文化记忆是同一群人分享、传承和建构的事和物,具备社会性和情感性。根据阿斯曼的文化记忆理论,文化记忆可以被解释为用符号系统(文字、图像、仪式、建筑等)固定下来的可以被传承的大范围分享的记忆。[9]不同于历史,记忆是富有情感性的,联结着现实,可以被重新建构、更新和覆盖。记忆总是与遗忘同时存在。有些东西被选择作为记忆,就意味着有些东西被遗忘。为了记录文化的痕迹,国内外的档案馆、图书馆、博物馆等机构创建了各样的文化记忆项目,比如1992年联合国教科文组织的“世界记忆名录”[10]、1994年美国图档博机构合作的“美国记忆”[11]、2006年上海图书馆的“上海年华”[12]、2011年国家图书馆的“中国记忆”[13]。可以发现,国外文化记忆项目相比于国内模式,具有图档博一体化的特点,即图书馆、档案馆、博物馆一起合作。而国内的记忆项目则主要由档案馆主导,但国内档案界习惯“重藏轻用”,对于收集的历史材料一般采取出版、办展览、数字化三种方式,较少在网站上公开;虽然建立了大量的专题库,但是数据库各自独立互不连通。“威尼斯时光机”[14]项目在数据库关联方面做得比较好,值得借鉴与学习。

数字人文能给“文化记忆”带来什么改变?数字人文不仅改变了人文研究的范式,而且还改变了学术交流的模式、学术出版的模式[15]。传统的文化记忆等各种学术项目,一般都是由图书馆员提供材料,再由学者进行研究和知识创造。在数字人文框架下,工程师、学者、图书馆员可以一起进行知识创造,共同成为学术研究的贡献者。学术成果不只局限于论文,还可以是数据库、基础平台等,而学者也可以参与到建库环节,为工程师和图书馆员提供关于数据自身必要的学术价值信息,参与数据库信息的校订与修改。基于数字人文的背景,上海图书馆开始进行专题库关联的尝试以及系统设计,添加访问用户参与贡献“文化记忆”内容的权限等。

“文化记忆”项目的建设目标就是达到用数据模拟现实的效果。只要数据量足够大、资料足够微观、历史跨度足够长,加之结合智慧数据技术模拟现实,便可以利用数字人文在“文化记忆”项目中做很多学术贡献,与“遗忘”做斗争。虽然当前数字人文领域的讨论多是与量化、计算、数据相关的议题,但数字人文的落脚点还是要回到人文,因为利用人文视角所发现的语境情境、价值观、世界观,才能更好地解释技术手段所得出的模型和图表背后所反映的本质问题。

刘健:博物馆数字展示与知识传播

数字人文时代的到来,对博物馆传统的工作形态和思维方式带来了冲击,为此上海博物馆转变理念提倡“跨界合作”,将应对挑战的切入点放在了“数字展示”上。当前博物馆数字展示类型主要有两种:一是辅助类数字展示,通过数字技术和视觉设计阐释展品,帮助观众理解,比如克利夫兰博物馆Gallery One、上海博物馆移动导览系统Mobile Guide;二是专题类数字展示,即在展厅采用数字技术形成的专题性展览,比如梵高·星光灿烂的夜晚Van Gogh Alive、北京故宫博物院端门数字展和“发现养心殿”沉浸展Immersive Exhibition at Palace Museum。总体而言,博物馆数字展示主要是辅助展示功能,数字展馆量小种类少,以沉浸式为主,讲求外在效果。

上海博物馆一直在思考博物馆专题数字展如何实现知识传播的问题,由此尝试引进数字人文的理念和方法,并于2018年推出了董其昌数字人文展示项目[16],该数字展示项目既能到博物馆观赏,也能在网站上互动。该数字展示项目围绕董其昌设计了五大模块:一是大事年表,在列出董其昌生平的时间轴基础上,对应地列出明朝大事记和欧洲大事记的时间轴,并附上事件介绍,可以直观地呈现明朝的国内外环境对董其昌创作的影响;二是作品精看,上海博物馆现场有六块64寸拼接屏展示董其昌书画的高清图像;三是社会网络关系,用不同的颜色来展示董其昌的家族关系、艺术同好关系、官场关系与科举相关的关系网络,着重提取出陈继儒与董其昌二人生平的大事件表进行比对,提供他们于何时何地一同参与什么活动的信息;四是书画船卷,董其昌很多活动都是在船上进行,因而以山河地理地图为底图,通过动画形式呈现其出游路线,附上其在每个城市地点所做的事情资料信息,帮助观众理解相应书画作品产生的背景;五是书画辨伪,围绕“董其昌画作双胞胎案”的案例,将本馆藏品与台湾故宫的藏品做对比,采用深度模型卷积网络技术,对明清文人画元素进行深度学习,识别书画作品中的植物等要素,从人工标识发展到机器标注。

在数字人文发展的潮流下,上海博物馆应对时代挑战开发各种数字展示形式,以传播知识和全方位提供信息为目的,进行充分的数据挖掘和美观设计。在基本成熟的董其昌数字人文项目的经验基础上,上海博物馆将围绕宋徽宗推进新的数字人文项目,为学者的研究提供更为丰富和直观的资料。03对话三:技术与人文研究如何实现合作?

在数字人文的发展进程中,人文学者与技术工程师的沟通往往是关键性环节。为了实现技术与人文研究的合作,数字技术进入人文社会科学领域中,是应当尽可能简化还是高度结构化?在技术研发方面,哥伦比亚大学Alex Gil研究员讨论了设计学术软件时所遵循的极简原则:最小计算(Minimal Computing),即对于用户来说,界面需要简洁且软件格式普遍适用,对于程序员来说,需要实现计算的精简和优化;并介绍了团队所开发的两款经济适用的学术软件(Ed和Wax),在与研究者互动交流的过程中,以最优方式实现学术软件的知识更新、传播和保存学术记录的功能。南京大学陈刚副教授介绍了团队所建设的六朝建康城市历史信息化项目,通过历史地理信息系统的建设,讨论空间人文研究的可能性,并且探讨了实践操作中可能存在的数字浪费以及数据库废弃等问题,提出多源数据整合的必要性。

Alex Gil:最小计算运动与人文学者的自主研究

Alex团队发起最小计算运动(Minimal Computing Movement)的缘由主要有两个。一是挑战数字世界中的数字权威,例如在数字文化遗产CH(Cultural Heritage)领域,这类大型项目的运营者在数字环境处理以往年代信息的时候,便享有数据收集、数据转写、录入、标签以及呈现方式的选择特权,可以自主设定数据库的通用标准(Universal Standard)来解释数据库的各项规则。这时率先用于制定文本数据化工作的通用标准,将成为世界上的主导标准,所涉及的软件也会在全世界广泛传播,用户无论是来自非洲、亚洲、拉丁美洲还是北美都必须遵守这样的标准才能使用。二是不同地区的社会结构和技术水平存在差距。我们正处于高速运算的世界,社会机构、高校等都需要依赖网络来学习课程并且获得文化信息。但是不同大洲的网络环境与运算速度存在差距,即便是在同一个国家,城市和乡村的网速也存在差距。从数据的获取途径来说,用户的网速取决于该地区的经济水平。那么就有理由认为,同样是研究大西洋文化,由于网速的差距,使得高校内的大西洋研究与高校外的大西洋研究也存在区别。

为此Alex团队转变设计软件的思路,不再以高校的高网速为设计基准,而是兼顾到其他网速慢的地区,在设计的每个环节都进行了运算的简化。在“最小计算”的思路下,Alex团队主推了两款软件:Ed和Wax。Ed[17]是一款面向文本编辑的Jekyll[18]主题软件,具有可读性、持久性、易用性和灵活性的特点。该款软件可对学术作品等文本进行渲染,界面简洁美观,操作简单易懂,十分适用于教学。Wax[19]则侧重于文化艺术图像,包括手稿、绘画、照片、雕塑等,工作原理与Ed相似。不同于其他数据库复杂的通用标准(universal standard),Ed和Wax用纯文档的方式处理数据,用户可以自由添加批注和标签,无需学习和遵守特殊的标签规则。此外,Ed和Wax中的数据不限于线上存储,还可以保存在电脑硬盘,甚至可以拷入U盘进行数据流通,这样可以实现离线工作的效果。创建数据者(the producer)可以不需要在网络环境中编辑项目,也无需借助别人的电脑工作,可以在自己的电脑工作。最后,最小计算的最大优势是用户不需要追求性能好的昂贵电脑来处理项目,也不需学习大量的计算知识才能够使用,因而通用性极强。对于文学、艺术、历史等人文学者来说,他们并不需要成为计算机专家。因此,最小计算的软件设计主旨就是:人文学者只需要学习基本的计算规则,就能够进入数字人文领域,掌握软件的使用方法,从而可以把更多的时间放在大量的文本分析工作上。

无论我们在地球的哪处角落,小至城市比如南京,大至大洲比如非洲,我们借助数字人文,通过学习少量的计算知识,就可以创建项目去研究自己所关注的具体问题。因而设计最小计算的软件,不是为了服务计算机工程师,而是旨在向人文学者们表示,可以不用再依赖于他人所建立的大型数据库,而是可以设计服务于自己的数据库,做更多有价值的事情。

陈刚:时空GIS平台框架与空间人文

“六朝建康城市历史信息化”采用GIS的方法来表现南京城市空间,包括编绘南京历史地图、建设南京古都地图数据库等,目的是构建南京的历史地理信息系统。在发挥数据库功能的基础上,进一步呈现两千年来南京时空的变迁,完成南京历史地图编绘的学术目标,推进相关的学术研究。

近年数字人文的发展推动了HGIS(Historical Geographic Information System,历史地理信息系统)在中国历史地理研究中的运用,“空间转向”研究趋势在人文社会科学领域兴起。2009年起至今,两岸三地每年举办“空间综合人文学与社会科学”国际会议。关于“空间人文”,台湾“中央研究院”范毅军研究员认为,空间人文是数字人文与地理信息系统的结合,在数字人文的范畴中,“空间人文”更加重视“空间研究”。当前现有的多数HGIS,在数据库建设方面主要存在以下几个问题:第一,因为每个HGIS团队都是围绕自己具体的项目建设的系统,因而缺乏统一的规划,规模不一,无法共享数据,存在重复建设的弊端;第二,由于每个团队采用的是各自的数据结构,所以缺乏统一的时空数据架构设计;第三,缺乏长远规划而临时设计的数据结构过于简单或冗余,数据中存在许多错误,难以更新和维护;第四,忽视数据规范,难以实现数据交换和共享,形成“信息孤岛”;第五,随着软件和硬件环境的变化,大多数数据库很难升级和维护;第六,一些数据库生命周期短,开放性不够,利用率不高,特别是随着项目任务的结束,缺乏后期维护和升级,成为无人关心的死库。

基于上述问题,从技术角度看,“空间人文”的核心是新一代历史GIS,需要整合多源时空数据,构建STGI(Spatial-temporal GIS Infrastructure,时空地理信息系统基础设施)。该平台的基本设计理念就是既能辅助学者开展历史地理研究,又具备各种各样的专题数据库以及历史地图编绘,为更多学术问题的探索与挖掘提供资源,最后还支持数据共享、数据交换的功能。目前SinicaView[20]和WorldMap[21]属于初具上述理念的信息平台。总之,STGI平台应当主要包括四个元素:关于历史地理的数据库、数据共享机制、信息服务、技术标准和业务支持体系,才能以此来实现时空数据内容、数据模型、数据分类和编码、元数据和交换标准、网络服务、用户界面、工具集等七个方面的统一性。项目浩大,任重道远,但只有实现资源统合才能更有效地发挥数字资源的学术价值。04对话四:我们究竟面对的是怎样的“数字”?

从数字的元问题出发,南京大学新闻传播学院王成军副教授从数据到计算方法全方面反思计算思维(Computational Thinking)对于解释人类社会的有效性,并针对计算社会科学的数据垄断、知识性质、黑箱系统等问题,提出需要在重识人类行为的基础上,建立用以理解全球知识的计算中心。

王成军副教授首先介绍“计算”(Computation)与“社会科学”的结合与二者所共同面临的挑战。物理学家理查德·费曼曾经批评社会科学是一种伪科学,模仿着科学研究的形式,却并不能从中发现任何规律。研究人类社会是否能采用自然科学的方法,这个问题虽然一直存在争议,但是2009年,David Lazar、 Alex Pentlend等15位著名学者联名发表题为Computational Social Sciences的文章[22],已经将“计算社会科学”这个更带有自然科学意味的概念引进人类社会的研究中。“计算社会科学”结合网络科学理论,旨在通过数据基础和计算方法来揭示个人和群体行为。数据的基础来源主要是数字媒体,比如电子邮件等,而计算方法主要包括自动内容分类、语义建模、自然语言处理、模拟和统计模型等。

王成军副教授还指出,当下计算社会科学主要面临三个问题:第一,由数据垄断所引发的数字领域的资本主义现象。研究者主要通过联系数字媒体公司获取数据,而微信、推特等新媒体版本迭代速度飞快,加之计算机专家发展了很多相关技术,因此数据有限的开放度与技术壁垒形成了数据垄断的现象。第二,“知识是全球共有的(Knowledge is Global)”的意识尚未普及。人类活动范围有限,因而很难意识到本地的信息可以关联到全球共有的知识,那么知识本身所具有的全球共享性便遭到限制。第三,研究者习惯通过数据模型去分析、预测人类行为,但是往往忽略了对数据模型的内在机制进行反思,如果人类在电子网络上的行为可以反映为输入端与输出端的话,那么负责计算的数据模型实质上就是不可知的黑箱,而人类行为的解释权将不是由人类自身,而是由机器计算来掌握。当黑箱有可能是潘朵拉之盒的时候,我们或许需要新的解释方式。毕竟自然科学存在普遍适用的定律,但是人类是活在自己生成的世界里,而不在一个外在的既定世界里(We are in the world of being not in the world of living in)。05对话五:数字知识生产跨境旅行如何成为可能?

数字人文作为一种新型的知识生产方式,数字知识生产在跨境旅行中会遭遇到什么样的语境问题和机遇?这回避不了关于数字知识的全球性与本土性的讨论。伦敦大学学院Simon Mahony教授考虑到了全球语境的问题,认为基于当前数字化内容以英语语言载体为主导的现状,数字人文发展的关键应当是补足语言的多样性,注意到其他语言的作品与贡献。山东大学邱伟云副研究员则关注本土语境的问题,语言转向(Linguistic Turn)虽然共为全球人文研究范式转向的背景,但在思想史研究领域中,不同于西方仅仅研究基本概念的取径,近代中国语境的思想观念研究应当将所有语汇都视为关键词,这给数字人文的进入提供了机会,而数字转向(Digital Turn)也因此成为其所在团队的中国本土思想史研究的特点。

Simon Mahony:数字人文的语言多样性问题

数字人文作为数字技术与人文学科交叉的领域,在发展初期只是关注技术工具的研发对服务人文研究的作用。随着数字人文的发展,人文学者与技术人员如今成为平等的合作伙伴,彼此促进各自专业领域的发展,并且人文研究对象也从纯文本开始拓展到文化遗产等领域。但是,数字人文依旧缺乏应有的开放性和包容性,从某种程度上来说,这种开放性和包容性的缺乏源于语言多样性意识的缺乏。

Simon Mahony

例如,学术出版物的语言代表性偏差。有学者指出,全球以Scopus和Web of Science为代表的引文数据库,其算法规则始终以英语为通用语,这使得美国和英国人文学科书籍相比于其他语言的书籍天然有更为乐观的计算结果。如果忽略语言的多样性,那么这种知识生产领域中“地缘政治”的失衡误读,会愈演愈烈[23]。而数字人文的诞生环境,正是以英语为通用语的因特网和万维网,而计算机ASCII码的标准也是用于显示英语。UCLDH(伦敦大学学院数字人文中心)一直在和ICANN合作,试图解决互联网域名的语言限制问题,特别是中文、日文和韩文字符。这项语言倡议在英国尤其受欢迎,因为我们在学习语言方面比较糟糕,而且由于英语已经成为一种国际语言,通常没有这样做的动机[24]。事实上数字人文组织的专家小组也正在从国家和全球层面上处理这个问题,比如参加本次会议的Alex Gil团队的“Around DH in 80 Days”[25]项目、美国国家人文基金会支持的“CenterNet”[26]项目等。

近年来中文语境的数字人文发展情况非常值得关注,从关于中文与英文出版物的比较研究[27]来看,英语语境的数字人文研究论文在技术和理论方面的讨论起步更早,基于多种语言的计算语言学议题更多,学术议题更加多样。而中文语境的数字人文研究论文的主题比较单一,更多地强调工具、图书馆和教学的发展。最后,基于数字人文所存在的语言多样性问题,数字人文学者应当注意到不同语境下研究主题的差异、不同语境研究接触的可能性、文化差异、语言障碍、出版物差异、资金模式差异等情况。

邱伟云:数字人文在中国语境中思想史研究的本土应用

如何用数字人文进行中国语境中的思想研究呢?金观涛创建的“历史与思想数位人文实验室”国际团队一直致力于运用最新的数字人文技术,研究近代中国思想的变迁。相较于英美的观念史路径,该团队的研究更加接近于德国概念史的做法,即对概念词给予必要的关注,由此开展以关键词为导向的近代中国思想研究。以关键词为导向的研究主要具备三种优势:可被观察和量化,可成为验证某观点的证据,具有可重复性、可复制性。

中国研究一直关注“近代中国的多元现代性是如何形成的”议题,不同领域的学者从各自专业角度给出对现代性的形成和发展轨迹的解释,人文学者如史华慈、柯文、张灏也有许多重要的研究成果。近代中国的知识分子运用了一套以进化论为依托的“新”话语,来推动社会接受西方的新思想、新制度、新事物,完成现代化进程,由此推测“新”可等同于现代化,尤其是在进化论语境中象征着“文明”内涵,那么“新”话语可以理解为中国从传统社会走向现代社会的重要表现,因而把“新”字概念群视为理解“现代性”的线索。

然而,以往的相关研究提出了两个研究难点,一是“新”的含义在民国时期发生了变化,内涵不容易捕捉;二是知识分子往往使用“新”字词来重塑传统观念,不容易区分出传统用法与新用法。由此可见,“新”话语具有多重、复杂的特征,传统的研究方法无法全面勾勒出“新”话语在近代中国的轨迹和含义。因此,采用数字人文技术,基于中国近现代思想史全文检索数据库(1830-1930)[28],可以全面观察并处理海量的历史数据,包括借助统计语言的N-Gram模型过滤关键词、采用CUSUM方法(cumulative Sun Control Chart)绘制关键词的历时变化图、聚类分析法描述等,把握近代中国“新”话语的数据结构和演变轨迹。

从数字人文的角度看,语言转向(Linguistic Turn)和数字转向(Tigital Turn)是中国本土思想史研究的路径和特征。语言学转向使得语言不再是传统研究的工具,而是成为人文研究的起点和基础。在此背景下,英美的政治思想史研究开始关注政治关键词,德国也以基本概念为关键词进行概念史研究,中国近代思想史也出现了语言学转向,但与西方国家不同的是,近代中国的关键词不会只限制于基本概念,比如“辫子”不属于基本政治概念,但是却有着保守主义的内涵,因而也是值得注意的关键词,但这样的词则不会在西方观念史研究中出现。因此,是否可以将近代中国所有语汇都视为关键词,用以探索其中所折射的思想内涵?同时,也正因中国语境的特殊性,在受到语言转向思潮影响的同时,中国的传统思想史理论能够与统计学、计算机科学结合起来,赋予数字转向(Digital Turn)的研究特色,这就是思想史研究方法中不同于西方的中国模式。06对话六:如何在中国认识数字人文?

面对方兴未艾的数字人文研究,我们是否能尝试通过暂时建立中西二元对立框架的方式,来比较和反思数字人文在“中国/中文”与“西方/英语”不同的话语空间中的发展情况,以此将“数字人文”视为全球范围内知识生产系统中出现的新机制呢?在中国语境中如何认识数字人文,南京大学陈静副教授和浙江大学姜文涛老师对此提供了思路和实践。

姜文涛:在国内传统学界引进数字人文的尝试

《山东社会科学》的“数字人文:观其大较”学术专栏从2016年到2018年,共计出版四期,2019年追加6月刊与8月刊两期,逐步向国内传统学界引入数字人文研究方法。由于国内一开始尚未形成数字人文的研究氛围,姜文涛与戴安德(Anatoly Detwyler)作为专栏主持,与期刊编辑陆晓芳一起组织专栏,从刊发海外优秀的数字人文作品中译文、知名数字人文学者专访,到如今开始收录中文学者原创的研究成果。

2016年11月刊第一期专栏从文学文类的问题出发,介绍海外文学领域的学者斯坦福大学弗兰克·莫雷蒂(Franco Moretti)、加州大学艾伦·刘(Alan Liu)、芝加哥大学苏真(Richard Jean So)和霍伊特·朗(Hoyt Long)的数字人文研究成果,由此吸引传统学界的关注,引发国内对“数字人文”与文学研究、历史研究、艺术史研究等具体学科相结合的思考与讨论。2017年9月刊第二期专栏延续文学研究主题,从文学分析方法论出发,讨论被誉为数字人文初始点的“远读”构想与“细读”法、历史主义之间的联系与区别。2018年7月刊第三期专栏开始关注中国数字人文研究领域,包括欧美关于中国研究的数字人文作品、国内的数字人文学术活动、运用数字人文工具研究中国文化的实践。2018年9月刊第四期专栏聚焦社会多样性议题,探索文化分析、数字人文能够在多大程度上,与社会多样性议题研究形成互相促进的关系,从数字方法和人文学科的结合契机中反思人文研究背后的认识论与伦理责任问题。

数字人文的引进仍然面临着许多问题和挑战,学术专栏试图以中国文学研究领域为突破口,探讨人文研究的前沿问题是什么,数字人文的方法是否能处理这些问题;借此将国内不大重视的阅读分析方法论、社会多样性等议题呈现在学者面前。此外,专栏也秉持着如何在长时段中定位数字人文的问题意识,关注由此所涉及的人文学科的危机、人文教育基础设施建设等议题,让数字人文能和传统研究在推进人文研究发展上相得益彰。

陈静:差异何在,差异何为

尽管西方数字人文兴起较早,对中国数字人文的发展有着很大的影响,但我们依然无法以一种西方模式来定义或者描述中国数字人文的发展历程和学术形态。这种差异一方面是因为人文与科技的互动以及跨学科研究自身在中西方语境中存在着历时性的差异,另一方面是因为科学技术在具体人文学科中的应用需要根据人文学科自身的资源、问题和学科特点进行具体化、定制化和特殊化。中西方数字人文学界已经开始意识到了这种差异,但还需要进一步就具体议题展开讨论,比如中西方历史语境中的人文学科对科学技术的态度不同导致的“争论”所揭示出的历史性差异、中西方数字人文在跨学科及学科多样性上的差别、学科化在跨学科研究及教学开展方面的难度差异、数字基础设施建设与数据分享方面的差异、数字鸿沟所带来的推广及普及差异、数字人文在学术殖民方面所具有的危险性等。此外,还有更多具体议题值得持续关注,比如作为非字母文字的中文所具有的文本差异造成的方法论差异、英语在算法分析中的主导地位对其在非欧美语言中应用的影响、欧美学术界在全球学术组织格局中的主导性地位在“数字人文”领域中的平移、数字人文的科研投入与科技研发成本之间的平衡问题、图博档等公共知识服务机构与学术研究之间的关系问题等。这些议题中,有些是宏观的历史或者机制造成的,实际上存在已久,也并非数字人文这个新兴学科所独有;有些则确实是数字人文领域或者其发展中所独有的;有些议题或许是中西方学术界共同面对的,但在不同语境中却呈现出不同的面貌和特点;而有些则是中国数字人文因为体制或者别的先天性条件所具有的母胎症状,后天很难克服。

我们还必须要意识到以学科化、专业化为特征的现存学术及教育系统使得强调跨学科协作的数字人文在中国现有的学科结构中难以找到合适的位置。在数字人文项目运作及机构设置方面,国外高校中的数字人文机构多数是以中心的方式存在,有少数是以研究生教育项目或者院系出现。这种中心往往会跨越专业和学科的限定,强调跨学科性合作及多学科的参与,且往往学校本身会提供一定的技术人员,尤其是图书馆的图书馆员及相关的技术专家参与其中。跨学科合作之于数字人文研究的核心作用,西方学者已经讨论了很多,虽然在这个问题上,西方数字人文界也存在一定的困难,但就跨学科研究在中国发展的历史经验而言,中国数字人文想要突破学科边界,难度更大。一方面是因为院系本身是以学科为主,所有的考核和成果都强调学科导向,跨学科成果的认定存在困难;另一方面则是因为资源的分配和各类扶持政策多以专业或者院系为主,而跨学科研究项目比较难获得资助。

与此同时,数字资源的建设者和使用者往往又非是同样人群。只有按照人文研究的需求来生成并占有一定的数据,人文学者才有可能开展有一定深度的学术研究。中西方的一些人文学者对于这个问题有着较为清晰的认识,比如弗吉尼亚大学的杰米·麦甘恩(Jerome McGann)牵头建设的罗塞蒂项目(The Rossetti Archive)和19世纪电子学术网络基础设施项目(Networked Infrastructure for Nineteenth-century Electronic Scholarship)就是从数据资源建设开始,以人文学术研究的方法和规范标准对人文文献进行了收集、数字化、清理和分享,大大减少了获取数据的成本,也因此促使了以学者为主的数字人文研究的普及和推广。中国学者对此长期以来也有相应的讨论,比如北京大学的史睿也曾撰写过系列文章,对古籍数字资源存在的问题以及文史学者面临的困难进行了说明,提出古籍数字化建设需要人文学术研究者的积极参与。

数字人文学者也要时刻保持警惕。人文文本向数据转化,不仅要求有机构、团队和资源的支持,同时还需要人文学者在这个过程中能够提出正确的问题。无论是在中国还是在西方,我们普遍能听到的一个论调就是数字人文是一种泡沫,因其不能超越传统研究,没有作出什么有价值的贡献,仅仅是绚丽的方法和呈现方式,但没有什么令人惊艳的结论,甚至难以被评价。尤其是关于数字人文使用像统计、自然语言处理和人工智能识别等基于计算的方法来回答人文学科问题方面,很多学者都提出了质疑。积极回应这种质疑,对传统问题做出回应,并提出新的问题,更应当成为数字人文研究者的自觉。

结语

“比较视野中的数字人文反思”学术研讨会,既有中西语境的比较,也有本质核心的反思,所涉议题甚广:在“数字人文的定义与核心”议题中讨论学科建设、项目组织、发展前景;在“数字人文时代下的文化遗产与艺术”议题中介绍文化记忆、馆藏再现项目;在“技术与人文合作”议题中讨论极简主义、空间人文;在“数字元问题”中讨论数据设施;在“数字知识生产跨境旅行”议题讨论数字知识的全球性、本土性与跨境交流。最后,刘炜教授从中国(中文)语境出发,对比较视野下的中国数字人文进行反思与提问,试图引发进一步思考:数字人文对于以高等教育为代表的学术生产系统和以博物馆、档案馆和图书馆为代表的文化机构究竟产生了什么样的影响,以及这种影响是否能在全球数字人文的大格局中建立数字人文发展的另一种可能,并对本次会议的报告议题提出数字人文十二问,让会议主题更进一层:

  • 1.数字人文的理论虚无主义是有利的吗?单靠数字(Just make it without thinking)真的能振兴人文吗?
  • 2.数字人文的定义一定是排他的吗?大帐篷下不能有小桌子吗?
  • 3.Digital Humanities真的已经胜出了吗?前景一定是乐观的吗?当人文研究完全数字化之后数字人文还意味着什么?
  • 4.人类记忆依靠技术平台是能够长期可持续和经济的吗?
  • 5.观念史的数字转向如何保证模型的可靠和有效?
  • 6.技术进步是如此之快,如何选择合适的技术?如何让望远镜和显微镜不仅看到原本就有的事实,还能看到新的事实?
  • 7.数字呈现在DH中与收集、建模、保存、利用是怎样的关系?花多少钱比较合适?
  • 8.大家都需要的GIS平台何时能实现?每个人可以如何贡献?
  • 9.DH专业教育如何振兴?特别是国内,如何体制化?
  • 10.数字学术交流如何更学术、更创新?
  • 11.如何建设通用DH的计算设施平台服务?大家来自不同的行业,有各自擅长与困难之处,数字人文应当进行怎样的理论讨论才能平衡各个领域让大家找到自己的角色?
  • 12.东西方数字人文的差异是一种中国特色吗?应该强调还是应该淡化?

数字人文反思其实刚刚开始,远道而来的Simon、Roopika、Alex,使本次会议的比较主题具有了现实性,数字人文的学术交流在国外更加数字化,比如社交网络、博客都可以成为学术交流的阵营。事实上数字人文研究并没有很明显的国家性或民族性,西方语境所面临的许多问题与我们十分相似,而会议上几位海外学者所提供的不同的思考和解决方案也给我们带来了新鲜感和启发。期待有下一次研讨会,更期待研究者能形成一定的共识并开展一定的合作。只有一起努力,DH的未来才会是真正乐观的。

—————————————————————————————————————————————————————–

Digital Humanities Dialogue and Controversy Through the Comparative Insight: A Seminar Review of “Rethinking Digital Humanities Through the Comparative Insight” in Nanjing University

Xie Liping

Abstract: Digital humanities has developed rapidly in China in recent years, attracting the attention of the humanities and social sciences, and starting to form an interdisciplinary community. Differing from the full development in the west, the digital humanity arising in China has just put forward new problems and challenges. Chinese and western scholars from multiple disciplines conducted interdisciplinary dialogues on six topics: the definition and core of digital humanities, digital cultural heritage and art, humanistic and technical cooperation, the meta-problems of digits, trans-lingual travel and knowledge production in digital humanities, and how to understand digital humanities in China. Digital humanities in both China and the west are faced with the oppositions from traditional humanities, obstacles in computing learning and information asymmetry in interdisciplinary cooperation. However, the differences in history, language and educational modes in diverse culture have become the essential issues, which are in urgent need of communication and integration between Chinese and western digital humanists.

Keywords: Digital Humanities; Chinese Context; Comparative Insight; Interdisciplinary Cooperation; Minimal Computing

—————————————————————————————————————————————————————–

编 辑  | 王波

注释:

[1]David Golumbia, “ Digital Humanities ”: Two Definitions, https://www.uncomputing.org/?p=203, accessed June 2, 2019.

[2]Jeffrey Schnapp et al., The Digital Humanities Manifesto 2.0, http://www.humanitiesblast.com/manifesto/ Manifesto_V2.pdf, June 5, 2019.

[3]参见大卫·M贝里、安德斯·费格约德:《数字人文:数字时代的知识与批判》,王晓光等译,大连:东北财经大学出版社,2019年。

[4]Roopika Risam, Susan Edwards, Micro DH: Digital Humanities at the Small Scale, https://dh2017.adho.org/ abstracts/196/196.pdf, June 9, 2019.

[5]项目网址:http://di.salemstate.edu/digitalsalem/。

[6]陈静:《当下中国“数字人文”研究状况及意义》,《山东社会科学》2018年第7期。

[7]李振、奚建武:《信息化进程的前沿探索——“数字化与21世纪人文精神”研讨会综述》,《探索与争鸣》2003年第2期。

[8]John Taormina, A Digital Humanities Bibliography, https://s3-us-west-2.amazonaws.com/dukewired/wp- content/uploads/2019/02/11171028/DH-bibliography-2.19.pdf, June 12, 2019.

[9]参见扬·阿斯曼:《文化记忆:早期高级文化中的文字、回忆和政治身份》,金寿福、黄晓晨译,北京:北京大学出版社,2015年。

[10]“世界记忆名录”项目网址:https://en.unesco.org/programme/mow。

[11]“美国记忆”项目网址:http://memory.loc.gov/ammem/browse/updatedList.html。

[12]“上海年华”项目网址:http://memory.library.sh.cn/。

[13]“中国记忆”项目网址:http://www.nlc.cn/cmptest/。

[14]Alison Abbott“, The ‘time machine’ reconstructing ancient Venice’s social networks,” Nature,2017, pp. 341-344.“威尼斯时光机”项目理念介绍:http://open.163.com/movie/2014/3/L/Q/M9KC8BCV4_ M9KH408LQ.html。

[15]参见安妮·伯迪克等:《数字人文:改变知识创新与分享的游戏规则》,马林青、韩若画译,北京:中国人民大学出版社,2018年。

[16]https://www.shanghaimuseum.net/museum/dongqichang/index.html.

[17]软件网址:https://minicomp.github.io/ed/。

[18]Jekyll是简单博客形态的静态站点生产器。它有一个模版目录,其中包含原始文本格式的文档,通过转换器和渲染器转化成一个完整的可发布的静态网站,也可以在GitHub Page上运行。

[19]软件网址:https://minicomp.github.io/wax/。

[20]HGIS平台是由台湾“中研院”研发的集社会服务和跨学科学术研究应用为一体的四维时空GIS平台,平台网址:http://3dgis.rchss.sinica.edu.tw/。

[21]该数字合作研究平台由哈佛大学的地理分析中心所研发,学者可以自由访问进行历史地理信息查询和在线地图绘制,平台网址:https://www.mapsofworld.com/。

[22]David Lazar et al., Computational Social Sciences, https://gking.harvard.edu/files/LazPenAda09.pdf, June 25, 2009.

[23]Domenico Fiormonte, Towards monoculture (digital) humanities?,https://infolet.it/2015/07/12/ monocultural-humanities, June 28, 2019.

[24]Simon Mahony“, Cultural Diversity and the Digital Humanities,” Fudan Journal of the Humanities, 2018,pp. 371-388.

[25]http://arounddh.org/.

[26]http://dhcenternet.org/.

[27]Jin Gao et al., What do we write about in the Digital Humanities? A comparative study of Chinese and English publications, http://discovery.ucl.ac.uk/10052735/,July3,2019.

[28]“中国近现代思想史全文检索数据库(1830-1930)”,https://www.cuhk.edu.hk/ics/rcccc/database_main.html;“中国近现代思想及文学史专业数据库(1830-1930)”,http://digibase.ssic.nccu.edu.tw/。

原刊《数字人文》2020年第3期,转载请联系授权。

zh_CNChinese