第A8版:关注 上一版3  4下一版
 
标题导航
  内容检索:
 
  2019年8月13日 星期 放大 缩小 默认 >>返回首页
揭秘现实版“大案牍术”
档案数字化背后,要做一系列精细活
  编页码
  修裱
  著录
  
  现代快报+/ZAKER南京见习记者 顾闻 摄

  “大案牍术”是什么?这个词,就连文史专家也觉得陌生。电视剧《长安十二时辰》的热播,带火了它。剧中解释,相当于现代的大数据。靖安司中,徐宾最擅长在档案中发掘有用信息。

  唐朝对档案的利用,真的这么发达吗?不知道。不过,进入档案数字化时代的今天,“大案牍术”真的可以实现。近日,现代快报记者探访江苏省档案馆,揭秘现实版“大案牍术”。

  

  现代快报+/ZAKER南京记者 刘静妍

  查档大厅,人人可以操作“大案牍术”

  “我们在《长安十二时辰》里看到的所谓的‘大案牍术’,实际上是作者的艺术创作,是一种虚构。”江苏省档案馆管理部主任蔡宜军告诉现代快报记者,剧中,在很短时间内,利用档案能查到很多东西,并且很快得出结论。这在当时的条件下,几乎是不可能实现的。

  “大案牍术”依赖的是人脑的记忆,每次都要临时调度大量人力和物力,突击整理和分析档案。“而如今有了现代化的工具,利用计算机,我们可以把人力、物力的投入放在平时。当需要查询时候,就很便捷了。”

  8月9日下午,在江苏省档案馆,不少人正用查档大厅的电脑查询想找的档案。

  “带上身份证,便可以查阅开放档案。”一位工作人员介绍,身份证验证后,便可以获得一个授权码,然后在查档区的电脑上登录系统,根据题名、年份、责任者、机构等进行检索。检索到想要的内容,提交申请,获得审批之后,便可以看到全文了。

  数字化的背后环环相扣,都是精细活

  现在,在档案馆的查档大厅检索、利用档案,已经非常便捷了。其实,这背后有一系列的“精细活”。记者探访江苏省数字档案中心,见证了纸质档案数字化的幕后全流程。从档案出库、拆卷、编页码等前期处理,到修裱、扫描、著录和数据挂接,再到档案装订、入库……环环相扣,并且每个环节有质量检查。

  首先是拆卷,进行初步鉴定和简单筛选,看看里面有没有破损的地方、重复的内容,然后进行编页码。“不是每一卷都是非常完整的,有的卷打开以后破损很严重,拆的时候就要很小心。参差不齐、大小不一、黑白不均,有被老鼠咬过的,有水淹过的、有火烧过的……”江苏省数字档案中心副主任刘兢兢介绍,历史档案的纸张会有破损、皱褶、折痕,拆卷之后,要先压平,需要修裱的要拿去修,全部都处理好了,才能进行扫描。

  著录是最重要的环节,与档案的检索、查阅直接相关。90后李乐宁是著录组组长,记者采访时,她正聚精会神地对着电脑屏幕,在密密麻麻的表格中依次输入档号、文件号、责任者、题名、文种等信息。长时间盯着电子表格,不会眼花吗?李乐宁说,工作六七年,也不是没出过差错,但总体上已经练得很娴熟了。“在著录项里,要把档案的信息提取出来。比如简报,如果只把简报两个字录入在档案的题名里,那么就没有检索的意义了,因此需要提取出:什么时间、什么内容的简报。”刘兢兢介绍。而档案的文本并不统一,有繁体的、文言的,甚至还有别字、文法不规范的,自动识别难以完成,就必须人工著录。

  著录完成之后,是数据上传、挂接,完成目录与扫描图片的关联。最后,普通的档案要经过装订,线装书还要恢复原貌,大小不等的便条要整齐地贴在里面,档案才能入库保存。

  “文字、声像、录音、图片,各种载体的档案都要数字化。现在大批量的是纸质档案的数字化,便于跨馆、跨区域、跨时空地利用。”

  珍贵原件在库房妥善保存,颐养天年

  档案数字化以后,珍贵的原件便可以回到库房“颐养天年”了。档案库房,对于温湿度都是有规定的,要求温度控制在14~24℃,相对湿度控制在45~60%,稳定的环境,能使档案得到妥善的保存。

  江苏省档案馆的特藏库,是“镇馆之宝”的集中之地。馆藏珍贵档案,都保存在这个库房:有中国档案文献遗产《朋僚函札》《南京长江大桥建设档案》以及重点革命历史档案;有唐代以来的书画精品、明代诰命和清代翁同龢的题跋;还有3万多盒录像带、12万张照片、5000多枚印章等特殊载体档案……

  其中,录像带保存了上世纪八九十年代江苏电视台播放的所有新闻类、专题类、文艺类等节目。老照片已经全部数字化了,属于公开档案的部分照片,在一楼查档大厅都能查阅到。还有唱片档案,是上世纪20年代至60年代的黑胶唱片,包括当时上海知名歌手周璇、京剧名家的唱片等等,这些现在基本上也数字化了,但目前还没有上网公开。

  “这些全部要数字化,分期分批公开。”江苏省档案馆法规宣教处处长张少敏说。

  档案将更有“智慧”,实现全文检索

  江苏省档案馆有一个区域,整齐排列着一排排大约一人高的柜子,柜子由一格格抽屉组成,抽屉里装满了小卡片。蔡宜军介绍,这些是最初的纸质档案检索工具。在档案数字化之前,它们在早期的“大案牍术”中扮演着重要角色。

  经过一段时间的发展和演变,现在,江苏省档案馆正在进行档案的全文数字化,也就是把原来的档案变成计算机可以识别的图片格式文件,通过题名、责任者等著录项中的关键词进行检索。

  “下一步,是把档案转化成可以进行全文搜索的数据格式。加上现在各行各业形成的电子文档,这些都是可以进行全文数据检索的。”蔡宜军说,以此为基础,才能实现档案的“大数据”管理、检索和应用。

  国家档案局原局长、中央档案馆原馆长杨冬权也曾提出:“档案数字化,是把纸质档案扫描成图片,这些图片上的档案内容,还需要人来解读,不能成为数据,由电脑来处理。今后,应该把这些图片转化为电脑可以读的字,变成电脑可以任意检索的数据,进入大数据系统,可以任意检索、主动推送、深度挖掘。”这也就是“智慧档案”,比现在的档案数字化更高级。因为档案数字化需要对扫描的档案进行文字识别、注录标题并输入电脑,工作量巨大,难度也很大。今后全文内容识别的OCR技术更先进,是档案人的下一个目标方向和风口。

放大 缩小 默认
 
现代快报版权所有 版权声明  | 联系方式 | 网管信箱 | 广告服务

苏ICP备10080896号-6 广告热线:96060 版权申明 本网法律顾问:江苏曹骏律师事务所曹骏律师

版权所有 江苏现代快报传媒有限公司 @copyright 2007~2016 xdkb.net corperation.All rights reserved.