4.1.2信息资源数字化过程
信息资源数字化过程可以称为数字化流程,它是对于数字化工作的整个顺序描述,首先要制定完善的数字化流程,探讨分析各个具体环节数字化过程、数字化技术、信息需求及数字化后期处理等问题,这是信息资源数字化的前提与基础。可见,数字化流程是一个系统的过程,不仅仅指数字转化单一环节,而且应该涵盖数字化前及数字化后的工作环节。任通顺(2009)对数字化前现实条件(如数字化目标、资金、软硬件技术、人力资源、用户需求等)进行了详细分析⑥。结合具体实际数字化工作,信息资源数字化过程大致有以下几个步骤。
(1)数字化准备工作。数字化准备工作包括合理统筹规划、数字化目标确立、数字化工作环境的设置、软硬件系统的安装调试、人力资源调配等基础工作。如许多珍贵资源和易碎载体资源在数字化过程中对工作环境都有一定的严格要求。因此,设置数字化工作环境应该尽可能咨询专家意见从资源、场地、安全等方面满足数字化操作所需要的特殊要求⑦。
(2)原始数字资源再生产。主要包括通过相应工作设备(如扫描仪、数码相机、数码摄像机等)和软件技术完成模拟到数字信息的转换,使实物信息以数字形式存储及表现,如获取黑白或彩色图像,以及通过视频或音频压缩卡获取的数字视频或音频文件等。
(3)数字资源再加工。对转换后的数字资源进行优化处理,可适当进行数据压缩,提高数据质量,主要包括图像的切割、改变大小或格式、生成缩略图像或检索专用图像、添加数字水印、OCR提取文字等,以及对视频文件的分段,提取语音或字幕的文本,进行场景变换侦测,从视频影像中抓取具有代表性的图像等。
(4)数字资源加工标引。这一阶段主要指将数字加工后得到的数据文件设置数据置标,并按照用户需求在数据索引系统中建立与数据相对应的索引信息,并将它和编制的目录以一个唯一标识符关联起来。
(5)数字资源保存。经过数字资源标引工序以后,依据一定的格式规定与顺序要求,工作人员将数字加工得到的数字信息存储到存储系统(如网络数据库系统)中去,同时也将数据信息包括相关的结构信息和目录进行数据备份到存储系统或其他存储介质(如光盘库、磁带系统等)中作长期备份保存。
4.1.3信息资源数字化相关技术
信息资源数字化相关技术主要包括硬件与软件技术两大部分,硬件技术包括数字化过程所需的硬件设备如扫描仪、数码相机、数码摄像机、打印机、音卡、视频卡等有关设备,以及连接这些硬件设备的计算机网络基础设施。软件技术包括数字加工系统、全息数字化技术、图像处理技术、光学字符识别技术、元数据析出软件及质量控制软件等。下面简单对信息资源数字化涉及的技术进行介绍。
(1)硬件技术。典型的硬件技术包括数字化过程所需的常用设备,如扫描仪、数码相机、数码摄像机、打印机、音卡、视频卡等,以及连接这些硬件设备的计算机网络基础设施。其中数码相机和扫描仪是目前采用的两种不同图像生成设备,用于两种不同的生产方式。扫描仪是将传统印刷图片转化为数字图像的重要工具之一,从直接的图片、照片、胶片到各类图纸以及各类文稿资料都可以用扫描仪输入到计算机中,“扫描仪的主要性能指标有分辨率、灰度级、色彩位数、扫描速度、接口和软件支持度”等①;数码相机、数码摄像机是图像、视频数字化过程的主要设备,数码相机是数字图片生成的重要影像工具,其图像质量(成像器件CCD的分辨率)是数字图片最为关键的因素。数码摄像机最大的优点是清晰度高、体积小,便于携带,既可拍摄动态的影像,也能像数码相机一样,拍摄静态的图像②;打印机是数字文本、图片、图像等输出的重要设备,目前常用的打印机为针打、喷墨和激光3种;声卡又称音频卡,用来处理音频信号。
……
展开