8月21-25日,以“全媒体、高质量、新业态”为主题的第九届中国数字出版博览会在京举办。
在本次数博会上,方正电子作为传媒出版领域领先的提供商和服务商,展现了深耕行业30余年的专业积淀和创新技术成果,研发的“智能排版技术”还摘得2018-2019年度数字出版“创新技术”奖项。
与此同时,在大会的三场分论坛上:“人工智能发展论坛”、“2019智慧教育发展国际论坛”、“第三届期刊融合发展高峰论坛”,方正电子数字出版产品事业部产品总监杨勇、方正集团数字出版技术国家重点实验室高级算法研究员谢海华、方正电子数字出版产品事业部产品总监周坤、方正电子知识服务事业部产品运营及推广总监赵婧以四场精彩的演讲,系统的呈现了方正电子深耕数字出版领域的创新与实践成果。
No.1人工智能发展论坛
如今,中国的人工智能产业在全球浪潮推动下,已经进入一个崭新的时代。
在这次由方正电子协办的人工智能发展论坛上,来宾们围绕人工智能国内外理论与实践,积极交流人工智能在出版业应用的经验与进展情况。
方正电子数字出版产品事业部产品总监杨勇及方正集团数字出版技术国家重点实验室高级算法研究员谢海华,分别从实际应用及底层技术的角度,呈现了方正电子将AI用于出版的最新成果——“智能编校排系统”。
AI助力智能审校
方正电子数字出版产品事业部产品总监杨勇
杨勇表示,目前,方正电子依托国家数字出版重点实验室,结合人工智能相关技术,如词法分析、句法分析等等对这套系统进行了改良再开发,已经将人工智能的成果切切实实地落到图书的日常生产中。
方正智能审校能够辅助编辑人员发现知识相关、格式相关、语境相关等常见及疑难问题,帮助编辑处理稿件中常见的知识类、格式类错误,让编辑把精力更多地放在内容本身以及学术上面,从而保证图书质量,提升审读效率。
系统主要包括四部分功能:
■字词类审校
包括常见敏感词,错别字,异体字,“的、地、得”等常见错误检查。也包括基于人工智能的易混淆词和搭配不当检查。
■逻辑体例审校
包含上下文查重、大纲、数学公式、图表序号的检查。
■格式审校
包括对千分位、全半角、标点符号的检查。
■知识性审校
有针对性地面向不同学科领域,如面向人文社科类的历史纪年检查、面向自然科学的拉丁学名检查、面向行业的术语译文检查、名言警句检查等等。
这套系统的开发背景,源自于方正电子长期以来在出版领域的沉淀与积累。
“我们发现很多出版社面临着工作强度大、重复劳动多、出版周期长、成本上涨快等等现实问题。开发方正智能辅助编校排系统是希望能为出版机构‘减负',用机器帮助‘人工作业',这套系统能为出版机构提供图书数字化生产平台,满足作者、编辑、校对、排版等不同角色间跨地域、跨终端的生产作业需求。”杨勇说。
杨勇表示,从实际的应用效果看,“智能编校排系统”不仅审校速度快,同时也很“专业”。“智能编校排系统”集成国家及行业标准,辞海及专业术语,降低了专业图书的审校门槛。以往需要老编辑或者外校才能看出来的错误,年轻编辑通过审校工具也能轻易发现,审校效率大幅提升。
除了“智能审校”,这套系统还可以提供“智能比对”、“智能排版”服务。一本200页的理工类图书稿件,使用“智能排版”只要大约3分钟就能完成,加上人工修图,总共5个小时完成排版。而人工大概要16个小时。不仅如此,“智能排版”还能一键生成PDF、WORD、DOCBOOK、EPUB等多种格式,用实力帮助编辑“减负”。
解构“智能审校”的底层逻辑
方正集团数字出版技术国家重点实验室
高级算法研究员谢海华
领略了“智能编校排系统”的强大优势,在同期论坛上,方正集团数字出版技术国家重点实验室高级算法研究员谢海华为大家深入解读了“智能审校”背后采用的算法及技术,同时也展现了这项技术的更多应用前景。
谢海华表示,预训练语言模型、数据增强技术、句法分析、联合学习、实体链接等自然语言处理领域的前沿技术和方法,应用于解决易混淆词误用、搭配不当、叠字叠词、标点符号误用、引证错误等问题的检查和纠正当中。
这项技术未来研究的方向还包括:语法错误识别和纠正,专业及特定领域文献的术语识别,针对命名实体的实体链接,以及基于知识库、词典的检索。“相信随着技术的不断成熟,将来能为专业出版提供更专业的技术支持。”谢海华说。
No.2 2019智慧教育发展国际论坛
2019智慧教育发展国际论坛主要面向高校、中小学教师等人群,围绕教育数字出版转型升级、融合发展等议题,探讨教育出版服务教育现代化的新模式。
方正电子数字出版产品事业部产品总监周坤向来宾们介绍了针对教育出版的解决方案——方正慧云教育融合出版方案。
看方正电子如何用技术助力教育出版
方正电子数字出版产品事业部产品总监周坤
周坤表示,现如今随着教育政策的变化、学习者的变化以及教学过程的变化,出版社的教材出版正面临新的压力和动力,教材与课程融合的需求越来越突出。
方正慧云教育融合出版方案,包括教材出版与课程出版两大版块。其中,教材出版以纸质教材为中心,融合互联网技术,建设能帮助学生自主学习的教材;课程出版以纸质教材为主线串联课程,建设课程体系,服务于教学过程。
方正慧云融合出版方案四个特色
目前,这套出版方案已经在北京大学出版社、国家开放大学出版社、武汉理工大学出版社、大连海事大学出版社等多所高校出版社投入应用,帮助出版机构强化自身优势,打造融合出版。
No.3 第三届期刊融合发展高峰论坛
于8月23日举办的第三届期刊融合发展高峰论坛,旨在推动期刊深度融合发展,提升期刊品牌意识及国际影响力、树立行业融合创新典范、推广融合发展经验。
方正电子知识服务事业部产品运营及推广总监赵婧在论坛上分享了XML数据在学术出版领域的应用成果,同时系统分析了基于XML技术的全流程科技出版服务平台,在推动学术行业生产力变革方面的广阔前景。
XML数据在学术出版的应用
方正电子知识服务事业部产品运营及推广总监赵婧
“就当前中国科技期刊的发展态势,出版方式数字化、传播效应立体化、出版模式开放化是大势所趋。但目前学术刊社的排版、内容运营流程,远远跟不上时代的发展步伐,变革已经是势在必行。”赵婧说。
赵婧表示,基于对国内期刊出版现状的调研分析,方正电子推出了方正学术出版云服务平台。以XML作为可跨平台的数据存储的方式,聚焦数字出版的核心,即数字内容的存储和发布方式,为出版单位打造出一个高效智能的数字化出版平台。
目前,此平台已经能够帮助刊社实现出版过程的数字化管控、单篇稿件即刻生产、多种格式成品文件同步生成,大幅提高工作效率。同时,平台可以利用XML数据组建刊社自主运营的“资源中心”,实现学术资源二次出版,助力学术传播,形成大数据报告,推动期刊新媒体融合发展。
“从2018年6月,方正学术出版云服务平台正式运营至今,已有200多种期刊完成了生产方式的转变,覆盖了北京、上海、天津、江苏等18个省份,涉及理学、农学、工程技术、生物医学等核心学科,并且带动了传统欧亿体育中国有限公司官网企业的转型升级,支撑了为学术期刊提供专业服务的企业。”赵婧说。
方正学术出版云服务平台工作原理
“在未来,我们希望基于XML技术帮助刊社打造出一个全流程科技出版服务平台,连接作者、刊社及专家,解决从采编、生产、发布、传播直至运营的整条生态链。最终目的是以此为基础,实现行业各类相关知识发表、集成、存储服务一体化平台,成为创新知识服务中心,用数据的力量推动行业变革。”赵婧说。
XML技术应用展望
就在这届数博会上,中国新闻出版研究院发布了《2018—2019中国数字出版产业年度报告》,报告显示出版单位转型创新能力提升、业态复合化趋势渐显都是数字出版产业发展的趋势。在出版业转型融合持续深入发展的当下,方正电子将继续携手传媒出版同仁,助力出版业转型融合不断深化,迈向高质量发展。