打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
文书档案数字化

文书档案数字化形成的电子文件数量巨大,一般县级档案馆文书档案达几百万页,将其数字化,所需存储空间很大。选择好档案数字化副本存储格式,既可减少存储空间,也可提高上传、下载速度,具有重要意义。



常见的文书档案数字化图像格式
1.1 JPG (JPEG) 格式
这是我们接触最多的图像格式。手机拍摄下来的照片格式一般为JPG格式。JPEG是 Joint PhotographicExperts Group的缩写,直译是“联合图像专家小组”。也就是说,该格式是由这个软件开发小组制定的。这种图像格式,就是把图像压缩,使图像变得很小,所占存储空间也就很小。在网络上易于传输,一般网页上的图片都是这种格式。这种压缩是损坏性压缩,把图像中重复或不重要的信息去除,容易造成图像数据的损伤。JPEG格式优点也多,可用最少的磁盘空间得到较好的图像品质。

1.2 JPEG2000格式
JPEG2000是JPEG的升级版,其特点:一是更高的压缩率,一般比JPEG高出30%左右;二是支持无损压缩;三是能实现渐进传输。在网上看一些图片,如网速较慢,往往先看到图像的轮廓,然后出现模糊图像,接着图像会越来越清晰,这就是图像渐进式下载过程。JPEG2000重要特性是支持渐进传输。

1.3 BMP格式
BMP图像是微软推出的图像格式,在Windows操作系统中是作为标准图像格式的,Windows应用程序一般都会支持BMP格式。BMP是英文Bitmap的简写,应用较广泛。与JPEG比,它几乎不进行压缩。由于几乎不进行压缩,所以图像信息非常丰富。它优点突出,缺点也突出。缺点即是太占地方。

1.4 RAW 格式
数码相机进行图像格式切换,常见的是JPEG格式同RAW格式的相互切换。JPEG格式是一种压缩格式,而RAW格式则是几乎未经处理而直接从数码相机或数码摄像机生成的图像。如果同一数码相机,采用两种格式拍摄,再经过图像处理软件进行调整,比如调曝光度、饱和度、对比度等,则RAW格式会更生动、更接近实际;JPEG格式由于进行了有损压缩,后续很难进行校正,几乎无调整余地。

1.5 GIF格式
GIF格式是英文Graphics Interchange Format的缩写,即为可交换图形格式,是作为一种公用标准而设计的。主要用来解决跨平台图像格式问题。GIF可制作成透明图像、动画等,在网络上大量使用。

1.6 PNG格式
PNG格式可以说是完全为网络而生的图像格式,是替代无损压缩的位图格式,如GIF格式。PNG具有可编辑性,能制作成透明图片,是最近几年才被大多数浏览器支持的图像格式。尽管它的压缩率较高,但与JPEG比还是太大。

1.7 TIFF格式
TIFF是英文Tag Image File Format的缩写,意思是标签图像文件格式。TIFF、JPEG和PNG都是较为流行的高位彩色图像格式,主要用来存储包括照片和艺术图片在内的图像。可以是多页文件,即多个图像组成一个TIFF文件。TIFF图像文件格式有漏洞,可受到远程攻击或是被诱使打开恶意文档。

1.8 PDF格式
PDF是近几年流行起来的图像文件格式,是英文Portable Document Format的缩写,意为便携式文档格式。如职称申报系统,几乎所有图像都需生成相应的PDF文件。这种格式可以最少的文件数量上传,也便于阅读。







常用格式图像大小比较  
我们对文书档案数字化,可采用扫描方法获取图像,也可采用拍摄方法获取图像。下面我们分别采用这两种方法获取图像,然后将其按不同的图像格式保存,比较一下图像大小。
实验一:用摄像头拍摄一张色彩单一封面,分别采用JPEG、PNG、BMP、TIFF格式存储,大小如下表。
通过上述知道,BMP是没有任何压缩的图像格式,可理解为拍摄的图像大小为901KB,其余几种格式都有不同程度的压缩,压缩率最高的是JPEG格式。也就是说,一个901KB的图像,生成JPEG才20KB大小。次之为PNG格式为418KB。由小至大排序为JPEG、PNG、TIFF、BMP。实验二:换一张色彩丰富的封面进行拍摄,分别采用JPEG、PNG、BMP、TIFF格式存储,大小如下表。比较这两张表,会发现随着色彩的丰富,除了BMP格式外,其它格式图像都变大了,由小至大排序为JPEG、PNG、TIFF、BMP。
通过两次试验,可得结论:(1) 在上述几种图像格式中,JPEG是最小的图像格式,BMP是最大的图像格式。TIFF是较BMP格式第二大的图像格式。(2) 当相同的像素大小(两次均宽640像素,高480像素)时,色彩变化对BMP格式影响不大。其余格式都随着色彩变化而有相应变化,越丰富越大。

实验三:把拍摄换成扫描,生成灰度文档,分别采用JPEG、PNG、BMP、TIFF格式存储,大小如下表。
结论:BMP是没有任何压缩的图像格式,可理解为扫描生成的灰度图像大小为917KB,压缩率最高的是JPEG格式,它只占扫描生成图像的23%。由小至大排序为JPEG、PNG、TIFF、BMP。

实验四:以彩色模式扫描同一文档,分辨率相同,分别采用JPEG、PNG、BMP、TIFF格式存储,其大小如下表。
结论:BMP是没有任何压缩的图像格式,可理解为扫描生成的彩色图像大小为2742KB,彩色模式下,压缩率最高的还是JPEG格式,它只占扫描生成彩色图像的8.8%。而TIFF增长较大,PNG次之,这说明TIFF、PNG格式文件保存了较丰富的图像信息。由小至大排序与灰度试验一样,依次是JPEG、PNG、TIFF、BMP。

实验五:扫描多页文件,生成TIFF和PDF文档,比较文档大小。扫描4页文件,彩色模式,如下表。
生成4页JPEG文件所占空间大小
结论:(1)生成的a.PDF文件大小为575KB,基本等于4页JPG格式的文件大小之和 (156+158+128+131≈575)。
(2) 生成的b.TIFF文件所占空间为a.PDF所占空间的7倍。这个倍数并不是固定的,但TIFF文件要比PDF文件大得多,至少2倍以上。






文书档案数字化图像格式选择  
《纸质档案数字化规范》 (以下简称规范) 规定:纸质档案数字图像长期保存格式为TIFF、JPEG或JPEG2000等通用格式,图像压缩率的选择可根据实际应用需求而定。纸质档案数字图像利用时,也可从网络浏览速度、易操作性、存储空间占用等方面进行综合考虑,将图像转换为PDF等其他格式。不难看出,纸质档案数字图像保存格式为TIFF、JPEG或JPEG2000格式。

我们具体应依据什么确定文书档案数字化图像格式。《规范》要求“数字图像清晰、完整、不失真,图像效果最接近档案原貌。为最大限度保留档案原件信息,便于多种方式的利用,宜全部采用彩色模式进行扫描”。即扫描出的图像尽可能接近实体。扫描出的图像我们可以无限接近实体,但这些图像必须保存下来,才能生成数字图像。JPEG格式,是损坏性压缩文件,压缩率越高,损坏越大,只是我们肉眼难以分辨,当你想再次修正这种图像时,可修正的余地很少,在更多细节上无法修正。但它的好处是存储空间小,传输速度快。文书档案数字化后,能满足文字识别需要就可以了,所以,在300dpi下彩色扫描的数字档案,采用JPEG格式保存较好。TIFF格式与JPEG格式相比,优点是可将多页图像生成一份文档,能保存丰富的图像信息。但它所占存储空间是JPEG文件数倍,所以我认为重要的文书档案,可采用这种格式,一般文件不宜采用。应注意,PDF格式不是数字化图像长期保存格式。但从数字文件管理、调用等方面看,却非常便捷,应将PDF纳入长期保存档案基本格式,而非仅仅作为应用层次的转化格式。




本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
图片格式分不清?JPG、TIF、PNG,不同格式区别到底在哪里
JPEG,PNG,TIFF,这三种图片格式有什么不同?
文件格式
你应该知道的常见影像存储格式与用途
常见的几种图像文件格式简介
文件保存的各种格式
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服