近年来重庆红岩革命历史博物馆已经实施了多期数字化保护项目,馆藏三级以上文物大部分都完成了文物数字化信息采集工作,已经留存了大量平面文物,如信件、报刊、书籍、档案文档的高精度电子图片资料,以及部分重点革命文物的三维扫描模型等文物数据资料。在本次馆藏革命文物数字化保护项目中,特意选取了不同年份、不同材质、不同保存状况且亟待修复的部分文物进行本体数据采集。同时,针对馆藏平面文物部分,数字化采集工作选取了部分馆藏文物进行平面高精度扫描做信息留存,文物本体信息结合高精度的数字化扫描内容的数据信息,一方面丰富了文物数据的信息全面性,建立更完善的文物数字化信息资源,另一方面,可以为后续的文物修复、文物活化利用及文物史实研究提供帮助。
项目建设内容:
- 文物本体信息数字化采集。馆藏革命历史文物蕴含着丰富的革命历史文化信息。将革命文物扫描的数字化信息和文物本体信息结合,为文物及历史研究提供更全面的信息。
- 平面文物数字化采集。选取部分馆藏革命历史平面文物进行高精度扫描,对平面文物进行数字化信息留存。
- 三维数字化采集。采用三维扫描设备对文物进行点云扫描建模贴图,构建文物的三维模型。
- 文物本体数据管理系统。文物本体数据管理系统将作为一个功能模块嵌入到文物保护修复管理系统中,系统支持对采集到的文物本体信息(笔迹、色料、成分、结构等)进行综合数据管理、分析、统计,为文物研究人员进行文物成分分析、文物本体劣化预测等提供直观数据依据。
- 文物数据采集及预处理支撑环境。为确保本项目数据的安全性,需在文物数据采集及后期数据使用过程中在本地完成数据存储及系统部署,需要搭建相关的数字化资源采集支撑环境。
###本系列文章来源于某单位公开发布的需求征集文稿,本站发布仅用于学习交流。本文主要介绍该整体方案中的文物数字化方案。
1 文物本体信息数字化采集
本次选取不同年份、不同材质、不同保存状况且亟待修复的馆藏文物 69 件/套进行深度数据采集分析,同时选取 50 件/套馆藏文物实施文物本体信息采集留存。本次数字化采集文物以近现代书籍、手稿、书信、衣物等纸质和纺织品类文物为主。本次采用无损分析技术为主,结合部分微损手段,实现文物本体材料、现有状态及病害等的表观信息及物质数据留存,为后期开展的文物考证、保护、修复、监测、展出等留存可挖掘利用的基础数据。
1.1 本次项目采集文物概况
重庆红岩革命历史博物馆馆藏文物以近现代书籍、手稿、书信、衣物等纸质和纺织品类文物为主。本次文物本体信息采集分为两部分,一部分为文物本体信息深度采集:选取不同年份、不同材质、不同保存状况且亟待修复的 69 件(套),进行文物本体检测分析与信息提取,为馆藏文物的保护、修复、研究提供科技支撑;另一部分为数据留存:共选取文物 50 件(套),为后期的跟踪、应用、展示、研究等提供支撑。详细表格见附件 1、附件 2。
序号 | 内容 | 数量(件套) | 材质 | 文物等级 |
1 | 本体信息深度采集部分 | 8 | 纸 | 一级文物 |
3 | 棉麻纤维 | |||
1 | 金属无机质 | |||
14 | 纸 | 二级文物 | ||
5 | 棉麻纤维 | |||
2 | 皮革及金属 | |||
21 | 纸 | 三级文物 | ||
12 | 棉麻纤维 | |||
3 | 皮革及金属 | |||
2 | 数据留存部分文物 | 5 | 无机质文物 | 一级文物 |
23 | 纺织品文物 | |||
6 | 无机质文物 | 二级文物 | ||
2 | 纺织品文物 | |||
14 | 无机质文物 | 三级文物 |
1.2 文物本体数据采集实施内容
本项目将对所选取的纸质文物、棉麻纤维文物、纺织品文物、皮革及金属文物进行本体信息采集,采集内容包含文物表面的微观形貌、文物材质的成分、频谱、结构,以及 PH 值等相关数据信息。采集方式包含超景深显微镜检测、纤维染色分析、电镜能谱 SEM-EDS 检测、pH 值检测、红外光谱检测、扫描电镜 SEM 检测、液相色谱-质谱联用仪 LC-MS 检测、金相显微分析、XRF、拉曼光谱检测方式,并完成文物样品检测报告撰写。
2 平面文物数字化采集
重庆红岩革命历史博物馆馆藏珍贵平面文物蕴含了丰富的革命历史文化信息。本项目将对平面类文物进行数字化扫描,为历史研究,爱国主义教育提供可靠材料,同时为后期平面文物内容活化做基础。
针对平面文物的数字化,按照画幅大小分为两类。第一类是画幅小于 A3 幅面的平面文物,采用高精度平面线性扫描仪进行采集;第二类是画幅大于 A3 幅面的平面文物,采用高像素数码相机拍摄照片矩阵生成正射影像的方式做采集。建设内容:
序号 | 建设内容 | 数量 | 单位 | |
1 | 平面文物数字化采集 | A3 及以下幅面数据扫描采集 | 80000 | 页 |
A3 及以下幅面数据后期处理 | 80000 | 页 | ||
超大幅面数据采集 | 350 | 页 | ||
超大幅面数据后期处理 | 350 | 页 |
3 文物三维数字化采集
遴选 25 件馆藏文物进行三维数字化采集,制作文物三维模型,可用于文物保护、研究、展示、教育和文创开发,项目将采用统一的技术路线进行文物三维建模。
应用三维扫描技术和数字高清近景摄影测量对馆藏珍贵文物进行数字化采集,运用的设备主要高精度三维扫描仪、有全画幅数码单反相机、自动转台、柔光箱等,形成配准后的三维数字化模型。 建设内容:
序号 | 建设内容 | 数量 | 单位 | ||
1 | 文物三维数据采集 | 文物三维扫描 | 25 | 件 | |
数据后期处理 | 25 | 件 | |||
三维展示模型制作 | 25 | 件 |
4 数据预处理
平面文物高精度扫描完成后,针对平面文物内容数据进行数据预处理,为后续通用 OCR 识别模型训练做基础数据处理。不限于《新华日报》的数据字体,包括其他报刊类文物印刷体文字的数据提取,建立该时期报刊类印刷字体库,建立平面文物 OCR 模型真实训练数据集(含图像预处理、数据标注等),同时建立验证数据集及测试数据集,用于未来对通用革命文物 OCR 识别模型训练做样本数据集准备。
主要工作内容是:
- 数据标注,主要针对识别目标样本进行人工数据标注;
- 建立真实训练数据集、验证数据集和测试数据集。
重庆红岩革命历史博物馆馆藏报刊类、信件类文物较多,以印刷体和手写体文字识别为主,大部分民国时期的报刊类文物和信件类文物均为繁体竖版,通过对重庆红岩革命历史博物馆纸质印刷体报刊文物的数字化采集样本进行人工标注,对平面文物的高清扫描图片进行文本检测及文本识别的数据标注,分别建立文本检测和文本识别的标注数据集,为后续的识别模型训练及优化提供相关标注及测试数据集。
文本检测数据集,根据重庆红岩馆馆藏平面文物的高清图片数据进行文本检测数据标注,包括竖排排版、文字方向等内容进行文本检测数据标注。
文本识别数据集,文本识别数据集和文本检测数据集的区别在于,文本识别数据集中的图片主体是文本,而没有大量的背景。根据重庆红岩馆馆藏平面文物的高清图片数据进行文本识别数据标注,利用标注工具对繁体字字符、文本检测的数据集截图进行人工标注合成数据集等。
具体工作内容如下:
序号 | 项目 | 数据标注工作内容 | 指标要求 | 数量 | 单位 |
1 | 平面报刊文物数据标注 | 根据馆方提供的平面文物数据资源,对《新华日报》以外的平面文物图片印刷竖版繁体字符进行数据标注,建立真实训练数据集、验证数据集及测试数据集。 | 标注不少于 3500 张平面文物报刊的印刷体图片资料,标注数据量不得少于 300000 条。 | 3500 | 张 |
5 文物本体数据管理系统
文物本体数据管理系统支持对采集到的文物本体信息进行综合数据管理、分析、统计,为文物研究人员进行文物成分分析、文物本体劣化预测等提供直观数据依据。
文物本体数据管理系统支持文物本体数据导入、文物本体数据管理、文物本体数据查询、文物本体数据导出等功能。
5.1 文物本体数据管理系统功能
1、系统登录
系统支持 B/S 构架,用户支持通过管理员分配的专属账号密码通过藏品及文物数字资源管理系统进行单点登录。
2、文物本体数据导入
- 系统支持对多种文物本体数据进行导入,为文物本体研究提供原始数据支持。
- 系统支持批量文物本体数据录入以及添加特定文物数据的操作。
- 批量文物本体数据录入支持按照特定的录入格式,将资料进行整理后,批量进行系统导入。
- 特定文物数据添加,支持按照系统录入信息进行文物本次相关信息的手动录入。
3、文物本体数据管理
- 系统支持对文物本体数据进行分类、查看、删除等操作。
- 文物本体数据分类,系统管理员支持对文物本体信息进行自定义分类分组操作,如按照文物类别、文物破损类型等多种组别进行信息分类。
- 文物本体数据查看,系统支持通过表单的方式将文物本体信息进行罗列,系统用户支持直观查看文物本体信息简述以及点击进入进行详细图片、报告等信息的查看。
- 文物本体数据删除,系统管理员支持对文物本体信息进行删除,删除文件支持容错操作,当管理员对文件误删除时,可一键进行文件的恢复。
- 文物本体数据标签,系统管理支持对文物本体数据进行标签设置,便于用户对文物的查询。
- 文物本体数据分权管理,系统支持对文物本体数据进行分权管理,设定各类本体数据的查看权限。
4、文物本体数据查询
系统支持通过多种查询条件(关键词、分类等)对文物本体数据进行快捷查询。系统提供以下几种数据查询方式:
- 文物名称检索:支持通过文物名称进行文物本体数据的快速定位。
- 文物分类检索:支持通过文物分类对特定类型文物进行范围性检索。
- 文物标签检索:支持按照文物标签对文物进行快速定位。
- 文物等级检索:支持按照文物等级对文物进行快速定位。
5、文物本体数据导出
- 系统用户支持在授权情况下对文物本体数据进行导出。
- 系统支持按照特定的模版对文物本体数据进行 excel、word 或者 pdf 文件的导出操作。
- 导出文物本体数据支持添加水印。
6、文物本体数据统计
支持对系统内的文物本体数据进行统计分析,支持统计总体文物本体数据量、多种类文物本体数据量、文物本体破损情况(主要集中在哪几种破损情况)等信息。
7、系统管理
- 系统管理支持系统日志管理、用户管理、修改密码、权限管控等功能。
- 日志管理:系统管理员支持对用户在系统中的操作行为进行查看。
- 用户管理:系统管理员支持对系统用户账号进行管理以及对用户信息进行增删改查操作以及对用户的密码进行重置。
- 权限管控:系统管理员支持对系统用户的浏览、下载权限进行控制。
- 修改密码:系统管理员支持通过修改密码对自己的账号密码进行修改。
8、系统注销
系统用户支持在不使用系统时,进行系统注销登出操作,系统支持定时任务,用户未进行系统操作超过一定的时间后,将自动进行系统登出操作。
5.2 与文物保护修复管理系统对接
文物本体数据管理系统与文物保护修复管理系统完成数据接口对接,能够实现文物保护修复管理系统中针对文物数据的交互打通,能够实现应用层之间的数据的相互调用。
6 文物数据采集及预处理支撑环境
重庆红岩革命历史博物馆内包含众多涉密文物以及文物研究文献数据,为了保障数据的安全以及防止数据在云端环境暴露、外泄。项目将实现本地化建设,自建设备房配套系统运行环境,进行业务保障、数据管理。
6.1 文物数据采集支撑环境
本次项目采集为馆藏文物的重要信息,不适合上外网云服务平台。为确保本项目数据的安全性,需在文物数据采集及后期数据使用过程中在本地完成数据存储及系统部署。本地数据采集环境应配置应用、数据库服务器并提供网络环境、用电、安全保障。综合考虑纪念馆本地机房的现有条件及本项目的文物数据采集支撑环境需求,在现有机房增加一体化机柜作为文物数据采集的运行支撑环境。
一体化机柜将文物数据采集需要的基础设施产品进行深度整合,包含 UPS、配电、制冷、机柜、消防等多个子系统,一体化机柜采用全密封设计,能应用在多种恶劣室内环境中,无需单独设置机房。未来可以通过智能监控系统实时查看文物数据采集的支撑环境情况,并对采集的文物数据提供高可靠性的存储和应用环境。——文物数据采集支撑环境设备清单见附件。
6.2 物数据采集预处理支撑环境,略
6.3 文物数据信息安全保障
序号 | 描述 | 模块 | 数量 | 单位 |
1 | 信息安全建设 | 防火墙 | 1 | 套 |
防病毒网关 | 1 | 套 | ||
综合日志审计系统 | 1 | 套 | ||
数据库审计系统 | 1 | 套 | ||
IT 运维审计系统 | 1 | 套 |
1.1. 项目背景 1
1.2. 建设目标 1
1.3. 建设内容 2
1.4. 项目整体预算 2
2.建设方案 3
2.1. 革命文物数字化资源采集 3
2.1.1. 文物本体信息数字化采集 4
2.1.2. 平面文物数字化采集 5
2.1.3. 文物三维数字化采集 6
2.1.4. 数据预处理 6
2.1.5. 文物本体数据管理系统 7
2.1.6. 文物数据采集及预处理支撑环境 9
2.2. 革命文物数字资源活化利用 14
2.2.1. 新华日报内容活化 14
2.2.2. 中共中央南方局资源活化 21
2.3. 革命文物数字化保护工作规范 22
2.3.1. 规范编制目标 22
2.3.2. 规范编制内容及要求 22
3.实施进度 23