中国数字人文发展报告(第一辑)
上QQ阅读APP看书,第一时间看更新

序言

见证、相遇与发现

在草长莺飞的季节,第一部《中国数字人文发展报告》从47位作者手中脱稿了,为数字人文的这个春天平添几分烂漫。数字人文的生长力令人惊叹,1999年末的一次国际研讨会上,一群人文计算学者感觉距离可称为“数字人文”的领域似乎还有千年之遥,然而年历轻翻几页,数字人文在世界范围已成气候。2004年《数字人文指南》的出版是“数字人文”凝聚概念共识并广为传播的标志性事件,20年后的今天,全球数字人文的风光让人目不暇接,学术共同体、科学研究成果、教育和实践项目花开遍地,精彩纷呈。

撰写《中国数字人文发展报告》的初衷是见证中国数字人文起步阶段的不凡旅程。确定本书意图时已是2023下半年,倡议一出,作者们即刻热情呼应,放下手头繁杂的工作迅速落笔,大约都带有一种回望来路、展望前程的心情。这些作者中不少是中国第一代数字人文学者,怀揣数字时代的学术理想,蹚过人迹罕至的路,艰难而执着地破土耕种。数字人文在中国不过十几年光景,真正落地有影响还不到十年,眼见它从无到有,从窄而阔,从浅至深,这片园地逐渐草木繁茂,竹笋拔节,果坠枝头,身在其中的人多有欣喜、感怀和体悟,希望把这一段过程记录下来,留给数字人文的未来和同路人。

见证以真实性或存在性为证。这部报告的作者们花费很大精力梳理我国数字人文各领域现状,用大量事实和数据描绘数字人文发展的真实图景。全书分为四部十八章,第一部分鸟瞰我国数字人文整体样貌,包括发展环境、理论脉络和方法体系、实践探索、研究机构、教育以及学术成果与学术交流;第二部分是相关学科和业界发展分梳,选择了语言文字学、文学、史学、历史地理学、艺术学等人文学科,以及图书馆、档案馆、博物馆、数字记忆与数字重建、技术与产业界发展等专题;第三部分概要介绍国外数字人文发展前沿,为中国同仁打开眺望世界之窗;第四部分是年度专题,本辑选择了AI技术应用。读者从这本报告中可以获知很多精心采集、整理、辨析的现状信息,例如关于数字人文的技术和政策环境,作者阅读了近3年发表的745篇相关论文,确定57个政策文本作为分析样本,得出了有依据有说服力的认识和结论;关于数字人文研究机构,作者做了大口径调查,94个机构进入统计范围;关于学术论文,作者以2,720篇文献作为分析对象,以3年为1个时间单位切片形成11个聚类,各专门领域也对研究成果做了统计分析或综述;关于海外概况,作者爬梳了10家联盟式研究机构,100家高校研究机构,19种学术期刊,以及遍及五大洲数十个国家140多所大学的教育项目。各部分陈述的发展历程,列举的典型案例,分析的特色与问题等,为我们看清目前中国数字人文概貌与情势提供了宏观轮廓和细微事实,称得上是对这段数字人文发展历史的回顾式见证。

撰写《中国数字人文发展报告》和数字人文发展历程一样有许多美好而特殊的相遇。相逢何必曾相识,来自18个单位不同学科的47位作者在本报告中相遇,使当下中国数字人文“大帐篷”中的丰富图景得以宽幅立体呈现。在传统的职业分工和学科分野中,这些作者中的多数可能终身都不产生交集,而数字人文将一大批不同学科、不同背景、不同专长的探索者汇聚于此,因相同的理念和追求投入这一火热的领域中。本报告对我国数字人文研究机构人员构成状况的初步统计表明,其至少来自12个学科门类的58个专业,远超一般意义的跨学科,此外,还有多类型技术服务公司、文化遗产保护机构、文化创意产业、出版社等加入进来,相互之间的多元连接融合很难用简单的交叉线描绘清楚。

很多章节的研究显示,多路主体的相遇与不同学科知识和技术方法的介入应用相生相伴。在数字人文的“大帐篷”下,不同分支领域支起了一顶顶“小帐篷”,汇拢了多学科知识和方法,比如,语言文字学遇见了计算机科学、信息科学、社会学、心理学、新闻传播等学科的知识方法,文学遇见了文化计算,艺术学遇见了定量分析和生成艺术,历史地理触发的人文社会科学空间转向遇见并应用于历史学、哲学、文学、社会学、人类学、建筑学等诸多领域,图档博学科的数字人文研究与实践、数字人文教育等都是多学科知识、多学科力量的相遇汇合。这些遇见、交叉与碰撞不仅发生在不同学科、不同领域之间,还发生在研究者个体知识结构上,很多从事数字人文研究和实践的人自觉出圈,补充吸收多学科知识和方法,在数字人文中遇见新的自己和新的可能。

撰写《中国数字人文发展报告》的过程是一段发现之旅,揭示了许多隐藏在现象深处的问题和规律。几乎每一章都从归纳出发,把纷繁的事实条理化并形成从特殊到一般的推断,让读者从时间线或结构面上看清基本情况和内在逻辑。比如将目前数字人文政策的核心指向归纳为文化传承与弘扬、基础设施建设以及公共服务三个方面,将数字人文常用技术归纳为由6大类组成的结构化应用体系框架表;从8个学科视角讨论数字人文概念子集的内涵及演变,提炼了数字人文方法论的特点和原则;将数字人文实践成果划分为基础设施、中间成果和工具成果三大类等。各分支学科也对本领域情况做了清晰化描述;如语言文字学篇归纳了数字人文视阈下的六个主要领域,文学篇拎出一条从早期的文献数字化、数据库检索、文献计量和文体测量,到现如今文学计算批评的发展脉络等,给读者提供了一条条便于理解和思考的线索。

数字与人文结缘的本质追求是收获前数字时代难以形成的视角,难以发现的问题和难以生成的知识及表达。本报告作者用数字人文理念和方法做数字人文报告,以开放包容和批判思维,广泛应用文本分析、时空分析、社会网络分析、数据可视化等方法,加上各自的专业背景,对我国数字人文各领域现状、问题和前景的分析很有见地和意味,不少显性和潜在议题颇有几分穿透力,引人深思深究。比如数字人文如何超越“工具角色”,使“人”的维度在数字时代更具主导性和支撑力?数字与人文双向奔赴的价值有哪些?从数字人文政策文本和研究成果中提取的高频词缘何多有不同?数字人文产学研结合的内生动力和有效机制是什么?强势迭代的AI技术对数字人文产生哪些影响?等等。在分支学科亦有学术发现,如数字人文引发中国史学研究共时性的多维复杂化与历时性的长时段化,可否在数字手段下回归新的“宏大叙事”?数字人文中“空间”概念的扩展是否成为空间综合人文社会科学的新推力?很多问题都在书中有所提及,可能引发读者更多闪光的思想火花和深层的理论发现。

作为一本数字人文读物,我们尝试对报告涉猎领域和资料线索做了粗线条可视化表达,形成5张阅读导图(见书末《附录》部分),其中总图示意本报告叙述的我国数字人文发展“主干道”,包括发展环境、理论技术,相关人文学科和图档博领域的四个“主题站点”,每个站点延伸出多条“支路”,由相应章标题和序号表示。分图1—分图4示意四个主题站点中每条支路的内容脉络和资料图表,用层次化、类别化关联代替了很多书常用的图表索引,希望为读者通观全书结构和内容布局有所指引和帮助。受纸版书幅面限制,不便对全书丰富的数据做可视化呈现,读者可以按图索骥,在书中35张表、33幅图以及文字分析中获取细节信息。

我们深知,这个报告不足以呈现中国数字人文的全貌与全部内涵,作者的分析难以避免个人认知色彩,不同章节对于某些数据的统计口径和结果有些差异,各种粗浅错漏在所难免。我们只是希望这些破土时代的见证、相遇和发现能给中国数字人文留下一些历史的回响。

数字人文值得想象,值得憧憬,值得坚持,值得不断地破坏性创新。1949年,数字人文前身人文计算的奠基人罗伯特·布萨找到IBM(国际商业机器公司)创始人托马斯·沃森,希望借助计算机编制意大利哲学家、神学家托马斯·阿奎纳的著作索引,老沃森严肃劝告布萨:即便你的余生可以浪费也不能干这种事。幸好布萨用想象、憧憬和坚持最终说服了老沃森,成就了“电子学术编辑”这一人文计算的开端之作,开辟了后来成为数字人文的大千世界。如今,中国数字人文的“大帐篷”已经支起,它的内涵与建树还在扩充生长,它的神奇魔力远远没有施展,它的未来将是我们现在构想不出的异彩缤纷,无比壮观。

2024年4月