胡伊伊  >>  正文
数字人文视域下典籍外译目录的集成和可视化路径初探
胡伊伊
2023年04月03日

2022年,我国颁布《关于推进实施国家文化数字化战略的意见》,提出到“十四五”时期末要基本建成文化数字化基础设施和服务平台;到2035年要建成国家文化大数据体系,展示中华文化全景,让中华文化数字化成果全民共享。2023年2月27日,最新发布的《数字中国建设整体布局规划》则进一步强调要夯实数字基础设施和数据资源体系“两大基础”,推进数字技术与经济、政治、文化、社会、生态文明建设“五位一体”深度融合,强化数字技术创新体系和数字安全屏障“两大能力”,优化数字化发展国内国际“两个环境”。

其中,国学传统典籍作为承载着优秀文化精华的重要文化遗产,其电子化及智能化已引起国内外的广泛关注,但相比之下,已被众多国内外译者以节译、选译、摘译、改写、全译等多种方式介绍、传播到世界各地的典籍外译本,其电子化及智能化建设却相对薄弱,需要在数字人文视域下进一步得到应有的重视和实际的研发,尤其是对典籍外译书目进行整理和可视化研究,使从业者、教师、学生、专业研究者、典籍外译爱好者等有纲可依、彰往察来。应当指出的是,与传统的文献数据库不同,当前建设的目标应该是能被电脑直接分析的量化数据库,应该致力于实现从“文字的阅读”到“数据化的分析”的跨越,以更好地应对数字时代的挑战和机遇。

一、如何集成——典籍外译版本目录集成路径

典籍外译版本目录的整理、汇总和标准化处理至关重要,这是构建典籍外译目录数据资源库、实现典籍外译版本目录集成与可视化的关键。该资源库应包含典籍名称、作者、译者、外译版本、外译目录、翻译者、出版、社出版时间、典籍类型等详细信息,以方便学者进行检索、查询、开展相关学术研究。

首先可基于已有的汉语典籍外译的文献目录研究专著,如《汉学书目》(考狄,1878~1921)、《西文汉学书目》(袁同礼,1958)、《中国文献西译书目》(王尔敏,1975)和《20世纪中国古代文化经典在域外的传播与影响研究书系》(张西平,2018b)等专著,提取译者、版本、出版社、出版时间等结构化信息,帮助研究者全面、系统地搭建起典籍外译书目体系的整体框架、流变网络,纵览典籍外译的历时发展,再结合下述方式查证、辅助补全缺失信息。

其次,基于翻译史类著作如《汉籍外译史》(马祖毅、任荣珍,1997)、《中国翻译史》(马祖毅,2004)、《西方翻译简史》(谭载喜,2004)、《中西翻译简史》(2009,谢天振)、翻译思想史类、翻译理论类专著如《翻译论集》(罗新璋、陈应年,2009)、《西方翻译理论通史》(刘军平,2009)等进行查漏补缺。此外,还有不少典籍外译研究成果如专著、论文中也整理了典籍外译本的基本信息,如潘文国所著的《中籍英译通论》(2021)、王宏、沈洁、王翠、刘性峰等著的《典籍英译新发展研究》(2021)等专著就是杰出代表。因此,有必要加快整理典籍外译专著、博硕论文等出版和传播,进一步加大中国优秀传统文化的影响力。

第三,以古籍版本目录学整理出的传统国学典籍书目电子化成果为纲,查找、整理对应的典籍外译本目录。以北京大学数字人文团队的典籍电子化成果为例,该团队通过对八种官修目录的数据处理及集成,利用统计分析及可视化等方法,为全类别的古典文献目录研究和知识演变分析构建了交互式可视化分析系统,充分展示古代知识在生产、组织和结构方面的变化。因此我们可在此类成果的基础上进一步对照底本查找译本的现存信息,按图索骥、剥茧抽丝,通过针对性查找,不断探索和发掘有关典籍外译的信息。

第四,通过图书馆检索现存的典籍外译版本目录,查漏补缺以获取更为全面、准确的外译版版本资料,包括但不限于利用OCLC、国内外各大高校、地方等各大图书馆的检索系统,还可以建立相应的图书馆外译版本目录数据库,便于研究人员进行检索和利用。通过此种方法,研究人员不仅可以查漏补缺外译版本目录,还能够获得更多相关的文献资料,从而获得更为丰富和准确的信息。

第五,以各出版物的典籍外译出版信息作为补充,并不断更新最新信息。这些出版物包括各专业出版社、国内外高校出版社及其所推出的各系列丛书,如大中华文库系列英译本、东方圣书(The Sacred Books of the East)、特鲁伯纳东方丛书(Trubners Oriental Series)、佛教圣典丛书(Sacred Books of the Buddhists)等等。此类出版物可提供更详实的典籍外译出版信息,而不断更新的最新信息可进一步提高研究的完整性和准确性。

第六,充分核对、运用典籍外译爱好者、汉学爱好者所创建、维护的相关材料,如网络上的佛教资料、佛教网站专栏下的西文佛经目录等等,例如中华佛典宝库(www.fodian.net)、互联网神圣文本档案馆(www.sacred-texts.com)等非常具有代表性的网站。此类材料可为研究者提供更全面的典籍外译目录信息,帮助我们更好地开展研究工作。

第七,在典籍外译目录数据资源库、网站中设计众包栏目板块,以志愿者众包方式整理、集合散落、珍藏在各地的典籍外译本。随着数字化技术的发展,获取数字资源已成为重要的信息获取途径,其中包括大量的典籍数字化材料。但由于时间、空间和技术等因素,许多珍贵的典籍外译本分散在各地的图书馆、档案馆等不同的文献资源机构,缺乏集中管理和使用,也无法为广大读者提供方便的使用和查询方式。在网站的功能设计中加入众包板块可有效解决此类问题,整合分散的文献资源,提高文献利用率,方便广大读者查阅和研究。通过建立完善的管理机制、激励机制、技术支撑和法律保障等方面保障志愿者众包的顺利推行,可整理、汇集珍藏在全国各地散布的典籍的外译本,并激发广大读者、爱好者的参与热情,推动数字资源共建共享、知识共享和文化交流。

二、如何可视化——典籍外译版本目录可视化路径

数字人文,即用数字技术解决人文问题,涉及数据库、文本处理、自然语言处理、图像识别、知识图谱、数据挖掘以及在线众包等诸多技术,在典籍外译研究时对“人”(译者、作者、传播主体)、“物”(原作、译作、相关研究成果)、“地”(译者生平行迹、出版社、译本流通路径)、“时”(历时、共时)、“事”(译者、译事等)、“因”(译作中的思想、策略、学术思想)、“果”(译作思想、策略对其他作者、译者、作品、术语翻译与演变的影响)等方面都具有得天独厚的优势。

首先,在版本目录可视化中,按电脑预处理、志愿者核对、专家审查相结合的流程,对数据进行降噪、拆分、补全,并对不同目录中的题名和作者信息进行规范化处理。通过典籍外译版本目录可视化,充分展示中国文化在对外传播、沟通、交流时,译者、机构、组织者、赞助者的偏好与变化,并能通过古籍书目呈现古代知识生产、组织和结构等方面的变化。

其次,典籍外译目录可视化处理除了强调典籍历版的变迁外,还有必要进一步厘清译者所选底本和译本之间更加错综复杂的对应关系。同时,由于典籍中儒、道、法家等占据主流,许多译者也集中在儒学外译等领域,在翻译作品分类、主题领域选择等方面存在失衡情况,多个译者翻译一个译本、一个译者翻译多个译本、译者重译等情况也屡见不鲜。因此亟需对当前典籍外译本目录的可视化基础上进一步精细化整理、分析,这也是典籍外译研究的魅力所在。

虽然译者、译作、底本、出版社等诸多节点关系网络有着极强的复杂化特征,但互联网的重要特点是互联、互动,能够实现最后的呈现效果。因此典籍外译版本目录可视化数据库的构建与研究也应重视数据库自身信息的内连接和数据库之间信息的外连接,尽可能地实现数据追踪,从而体现出电子数据的优势,推动新技术环境下史学研究地深化与发展。具体而言,内连接含义有两层:一是指纳入多来源史料中可以相互匹配的信息进行连接以扩充数据库内容;二是指应注意数据库中信息的相互连接,从而拉长研究的时段、代际甚至空间范围等。外连接则主要指主题各异但内容相关的数据库,在相互开放的前提下,实现各数据库之间、相应数据信息的连接、跳转,从而突破单独数据库的时空、内容、范围与主题局限,在数据库建设与研究层面实现共享与共赢,并造福社会。

三、如何应用——典籍外译版本目录集成与可视化的应用

弗朗哥·莫莱蒂(Franco Moretti)指出,数字人文研究应通过远读聚焦比文本小很多或大很多的单位(例如词语、句子、风格、文体等内容的量化分析)理解整个体系。文本标记和挖掘是数字人文远读的重要手段,可揭示传统阅读方式难以发现的问题。在古典文学与文献学领域,相关研究已如火如荼。而对于典籍外译版本目录集成与可视化研究,应包括但不限于以下内容:

首先,将目录中的典籍外译名称按照内在层级结构组织起来,形成树形结构,并以各色图标标示典籍类型、时代等属性,清晰呈现不同典籍之间的关系、脉络、特征及影响。作为一种系统性的典籍编目方法,该方法在典籍学研究中具有广泛应用,可帮助读者深入理解典籍内容,把握其历史背景、文化意蕴及学术价值等方面的特征。在该方法中,典籍被视为一个具有内在层级结构的体系,其包含了不同的篇章、章节、段落、句子等层次结构。按照这种层级结构,可以将典籍分成不同的部分,再进一步分成章、节、段等小部分。在树形结构中,这些部分被表示为树的节点,节点之间的关系和层级结构则用树的分支来表示。

而为了更好地表示典籍的类型、时代等属性,采用可视化技术展示典籍外译目录,如将典籍外译目录转换成词云、散点图、条形图等形式进行展示,并用不同颜色或图标来进行标示。例如用黄色标示儒家经典,蓝色标示佛家经典,红色标示印度教经典等等,这种标示方式可以帮助读者更加清晰地理解典籍的类型、历史背景和学术价值,从而更好地把握不同典籍之间、典籍和译本之间、译本和译本之间的关系、脉络、特征及影响,并使学者通过视觉化的方式更好地理解典籍之间、典籍与外译本之间、译本之间的主题、内容和关联。通过将不同时期的典籍外译版本的关键词进行比较,为研究者提供更深入的思考和探索空间,快速抓取典籍的研究方向和重点、纵览各时期典籍外译主题的变化走势并感知未来趋势,为典籍外译研究提供更多借鉴和参考。

其次,将典籍外译按照出版地点进行标注,在地图上进行可视化展示,直观呈现典籍外译的分布情况、地域特色。这种方法在典籍研究中被广泛应用,因为它可以帮助研究者从地理角度把握典籍研究的方向和发展趋势。在这种方法中,出版地点被视为反映典籍外译分布情况和地域特色的重要指标。通过将典籍外译按照出版地点进行标注,并利用地图工具将其展示出来,可以清晰地展示典籍外译的分布情况和地域特色。可以比较不同地域的典籍外译分布情况、揭示地域文化的差异和典籍研究的地域特色,为研究者提供更深入的思考和探索空间。

此外,对典籍外译目录进行内容分析。利用文本挖掘和自然语言处理技术,对典籍的外译目录进行内容分析、跨文化比较研究,探究翻译者在翻译过程中所采用的翻译策略和技巧,以及翻译结果中的差异和特点,这对于深入了解典籍翻译的历史和文化背景有重要意义,也有利于探究不同翻译文化中对于典籍翻译的理解和实践,以及典籍的跨文化传播对于翻译的影响和启示。

综上所述,依靠量化翻译史数据库、尤其是典籍外译目录的集成和可视化研究,将辅助翻译研究者对大量系统数据材料进行统计分析,帮助翻译学研究者发现隐藏在海量史料中无法依靠传统阅读发现的新知识、新现象,更可以帮助研究者深入了解典籍外译的历史和文化背景,为翻译教育和翻译实践提供有益的启示和借鉴,促进中华文化的传播和跨文化交流。

(作者为复旦大学外国语言文学学院博士生)

【责任编辑:徐锟】
复旦大学外国语言文学学院英语语言文学专业博士生。