打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
出版观察 | 融媒时代,新技术如何为编辑工作赋能

在当下的图书出版领域,文献学术类图书虽然与大众类图书的出版流程、模式等并无差别,但在专业性上,却对编辑自身能力提出更高的要求。编辑不仅要拥有深厚的专业学术知识,而且要成为杂家,和选题相关的知识都要掌握。当下的融媒体传播环境,面对机遇与挑战并存的文献学术类出版物市场,需要文献学术出版人不断进阶

随着互联网技术的发展,信息传播方式被深刻地改变,以纸质为载体的知识信息内容有了越来越多的表达方式。然而,图书的载体可以改变,编辑的根本任务不会改变。在信息技术革命风起云涌的今天,文献学术出版人如何从历史中汲取养分和精神力量,在纷繁的信息中,爬梳剔抉,寻找优质选题;又如何借助新技术的优势,让传统出版与新兴媒体相融相促,推出高质量出版物?本期,继续特邀几位传统出版、数字出版领域出版人谈新时代下文献学术编辑如何转型提升。

 

融媒时代,新技术如何为编辑工作赋能

洪 涛

古联(北京)数字传媒科技有限公司总经理

首先,古联(北京)数字传媒科技有限公司(简称“古联公司)是中华书局的古籍数字化公司,主要承担的是古籍数据库建设、数字技术研发等工作,与书局的传统出版有所不同,属于广义的“融媒”的概念。其次,古联公司成立五年以来,我个人并没有完全参与过图书的编辑工作,所以对于“融媒时代,文献学术类编辑应该如何做”这类话题我暂不提个人看法,我想稍微调换角度,谈一下在当今的技术条件下,我们能给编辑哪些帮助。

“融媒”这个概念讲的是多种媒体的整合与运作,在一家出版社内部会有独立的部门操盘,对编辑个人来说更多的是信息利用。“其背后隐含了更多的概念:数据、技术、创新、服务,等等。对于文献学术类图书编辑来说,我想要关注新技术工具可能为编辑工作带来的生产力提升。

使用数据库开展工作已经是每个编辑必备的技能,核查引文、核对史实、检查字型读音,面对这样的基础工作,数据库和网络更多地替代了传统工具书成为编辑的首选。市场上的数据库是丰富的也是芜杂的,编辑使用前首先要了解数据库的性质和特点。如中华书局的“中华经典古籍库”注重整理出版成果的高质量呈现。其他一些数据库有的注重海量文本,有的注重特色资源。最近比较热的一个事件来源于北大微博使用“须知少年凌云志,曾许人间第一流”一诗,过程不再详述。吴庆坻《题三十小像》的末句“须知少日拏云志,曾许人间第一流”不知何时被网友加了两句“哪晓岁月蹉跎过,依然名利两无收”成为“新诗”。用户自己生产的内容如今在搜索引擎的推波助澜下反而被大部分人当成了原作。“知乎”上一篇文章提到,在“中华经典古籍库”所收钱仲联先生主编《清诗记事》中查到原诗,算是加深了对原作的认识和对整个事件的了解,由此感慨互联网时代人们生产的海量数据导致我们的知识图谱被污染。在这个数据获取更加便利的融合时代,编辑在工作中注意选择一个可信的数据源成为首要问题。

技术依托数据在不断发展。以前很多不敢奢望的提高文献学术类图书编辑生产力的工具和方法正不断出现。我使用过传统校对软件,倍感其在文献整理类稿件上的无力。在加工“中华经典古籍库”数据的过程,我们对纸书常见编校错误有了更多的认识。通过十几亿字整理本古籍的数据加工,发现不少易错的问题可以用数字技术进行检查。古联公司在开发“中华经典古籍库”之后第一个想到的就是利用古籍库的数据辅助编校工作。比如引文核对,我们利用“中华经典古籍库的数据”制作了一套引文核对系统,分析稿件中的引文信息,并和数据库自动比对,检查文献引用原文和出处是否有误。这对于核查引文工作量比较大的稿件,编辑效率的提升是非常明显的。又如我们制作了一套繁简转换工具,除了制作专业的繁简对照字表,还让机器学习了大量繁简体对应的出版物,如中华书局出版的繁体竖排本古籍和“中华国学文库'这套书,学习各种固定搭配、转换语境和转换规则,让繁简转换可以更加准确。这个编辑工具中还植入了大量的注号、标点、规范字等依靠规则可以自动检查的内容,由此构成了一个对文献学术稿件更有针对性的机器检查系统。也许这个编辑工具并不是所有编辑都能够接触到,但是其除了依托底层资源库和机器学习的部分外,核心就是用计算机进行本文处理。其中有一些检查工作是编辑可以利用office软件能够完成的。这套利用机器检查稿件问题的工作方式并不难建立。希望相关编辑能够根据自己手头稿件建立更有针对性的检查方法和检查数据。

“中华经典古籍库”(镜像版)阅读界面

再举一个例子。古籍自动标点技术很多年前就有人在不断探索,但是进展不大,以至于大家对古籍自动标点的实用性并不看好。这两年,随着深度学习模型的开发,古籍自动标点的效果突飞猛进地发展。最近实验的结果表明,排除一些特殊领域和格式的古籍,自动标点的正确率(包含错标和漏标的情况)达到92%左右。这个数值还在随着模型的调整不断提高。在很多人看来92%的正确率并没有什么意义,与出版的要求相距甚远。但是从实际工作角度来说,在自动标点的基础上继续由人工标点,相比于单纯人工标点,可以显著提高标点工作的效率。自动标点也可以作为辅助检查手段,发现一些人工标点的错误。不仅仅是自动标点,最近几年OCR文本识别、古籍分词、命名实体识别等技术都有了长足的发展,虽然还和人工的精准度有显著的差别,但是如果善加利用,还是能够起到提升编校工作效率的作用。

除了数据和技术,融媒时代另外一个重要特征是互联。当今流行的“数字人文”,其中一个概念就是打破传统人文学者单枪匹马的研究模式,让人文学者和数据科学家一起工作来解决问题。编辑的工作模式往往也是单枪匹马,一本书负责到底。但是遇到那些超大部头的作品,个人往往无能为力。古联公司最近两年面对这种状况,开发了一个基于众包模式的在线编校平台,将大部头作品拆分成小的部分,放在众包平台上,在网上招揽人员共同开展校对和编辑工作,协助责任编辑加快稿件的处理速度。众包环节需要大量的流程优化和组织工作,并不容易。处理后也依然需要后续流程才能达到出版要求。但在实践上取得了很好的效果,大幅提升了大部头作品的编辑出版速度,成为一种具有发展价值的工作模式。

古联公司这些年来,一方面开发专业数据库产品,一方面做传统出版与数字技术的融合。在图书出版前和出版后的不同环节,传统业务都有与数字技术融合发展的要求。在文献学术出版领域,我们更加关注于出版前的融合,通过技术、数据和平台提高生产速度和编辑质量。如果要对编辑提出什么希望的话,就是希望编辑在新时代更多地关注技术发展带来的变革,更主动地利用数字技术解决问题。同时,欢迎一线的编辑们能够提出问题,我们来尝试着给出答案。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
学术期刊文言引文校对盲区问题探究
【网络首发】大型文献类丛书出版的优化路径探析——以《荆楚文库·文献编》为例
国学大数据时代来了
古籍整理成果与现代信息技术的融合——古联“自动标点系统”上线
新时代的易学古籍数据库建设
刘沅先生《十三经恒解》笺解本即将出版——编辑缘起和整理说明
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服