百科狗-知识改变命运!
--

zip是什么格式

小肉包1年前 (2023-12-19)阅读数 6#综合百科
文章标签格式方法

本教程操作环境:windows10系统、Dell G3电脑。

zip是什么格式ZIP文件格式是一种数据压缩和文档储存的文件格式,原名Deflate,发明者为菲尔·卡茨(Phil Katz),

他于1989年1月公布了该格式的资料。ZIP通常使用后缀名“.zip”,它的MIME格式为application/zip。当前,ZIP格式属于几种主流的压缩格式之一,其竞争者包括RAR格式以及开放源码的7z格式。从性能上比较,RAR及7z格式较ZIP格式压缩率较高,而7-Zip由于提供了免费的压缩工具而逐渐在更多的领域得到应用。Microsoft从Windows ME操作系统开始内置对zip格式的支持,即使用户的计算机上没有安装解压缩软件,也能打开和制作zip格式的压缩文件,OS X和流行的Linux操作系统也对zip格式提供了类似的支持。因此如果在网络上传播和分发文件,zip格式往往是最常用的选择。

技术介绍

ZIP是一种相当简单的分别压缩每个文件的存档格式。分别压缩文件允许不必读取另外的数据而检索独立的文件;理论上,这种格式允许对不同的文件使用不同的算法。不管用何种方法,对这种格式的一个告诫是对于包含很多小文件的时候,存档会明显的比压缩成一个独立的文件(在类Unix系统中一个经典的例子是普通的tar.gz存档是由一个使用gzip压缩的TAR存档组成)要大。

ZIP的规约指出文件可以不经压缩或者使用不同的压缩算法来存储。然而,在实际上,ZIP几乎差不多总是在使用卡茨(Katz)的DEFLATE算法。

ZIP支持基于对称加密系统的一个简单的密码,已知有严重的缺陷,已知明文攻击,字典攻击和暴力攻击。ZIP也支持分卷压缩。

在近来一段时间,ZIP加入了包括新的压缩和加密方法的新特征,不过这些新特征并没有被许多任务所支持并且没有得到广泛应用。

缺点:

由于出现于市场的时间早,今日Zip文件与其他压缩格式相比有众多无法忽视的缺点。

原生并不支持Unicode文件名称,容易导致一部分的资源共享困难,在东亚文化圈的资源交流尤其显著;无法与7z相比的压缩比率以及如WinRAR的Recovery Record修复支持功能的缺乏亦都是其衰微的原因。

压缩方法

如下方法:

Shrinking(方法1)

收缩(Shrinking)是LZW的微小调整的一个异体,同样也受到LZW专利问题的影响。从来没有明确的是这项专利是否涵盖反收缩,不过一些开放源码的项目(例如Info-ZIP)决定谨慎行事,在默认的构造里不包含反收缩的支持。

Reducing(方法2-5)

缩小(Reducing)包括压缩重复字节序列的组合,然后应用一个基于概率的编码得到结果。

Imploding(方法6)

爆聚(Imploding)包括使用一个滑动窗口压缩重复字节序列,然后使用多重Shannon-Fano树压缩得到结果。

Tokenizing(方法7)

令牌化(Tokenizing)的方法数是保留的。PKWARE规约没有为其定义一个算法。

Deflate和增强的Deflate(方法8和9)

这些方法使用众所周知的Deflate算法。Deflate允许最大32K的窗口。增强的Deflate允许最大64K的窗口。增强版完成任务稍稍成功一些,但是并没有被广泛的支持。

Deflate比较尺寸是52.1MiB(使用pkzip for Windows,版本8.00.0038测试)

增强的Deflate比较尺寸是52.8MiB(使用pkzip for Windows,版本8.00.0038测试)

PKWARE Data Compression Library Imploding(方法10)

PKWARE数据压缩库爆聚(PKWARE Data Compression Library Imploding),官方ZIP格式规约就此没有给出更多的信息。

比较尺寸是61.6MiB(使用pkzip for Windows,版本8.00.0038测试,选择二进制模式)

方法11

此方法被PKWARE保留。

Bzip2(方法12)

此方法使用众所周知的bzip2算法。此算法比deflate高效但是并没有被(基于Windows平台的)工具所支持。

zip是什么格式

比较尺寸是50.6MiB(使用pkzip for Windows,版本8.00.0038测试)

所谓.gz文件其实就是标准GNU zip(gzip)压缩算法压缩的存档文件。它可以有效地压缩和解压缩单个或多个文件,通常用于在Unix和Linux系统上压缩文件。以·tar.gz为扩展名的是一种压缩文件,在Linux和OSX下常见,Linux和OSX都可以直接解压使用这种压缩文件。通常最常见的就是以 gzip 来压缩了。因为利用了 tar 与 gzip 的功能,所以 tarball 档案一般的附档名就会写成 .tar.gz 或者是简写为 .tgz

扩展知识:

Jean-loup Gailly和Mark Adler最初开发了Gzip格式并于1992年10月31日发布了gzip程序(解压缩gzip的软件)。直到现在,gzip格式和程序还在Unix系统中广泛使用,用于压缩文件,方便传输和存储。gzip现在由GNU计划(英语:GNU Project)开发和维护。

通常gzip仅用来压缩单个文件,多个文件的压缩通常是先将这些文件合并成一个.TAR存档,然后再使用gzip进行压缩,最后生成的.tar.gz或者.tgz文件就是所谓的“tar压缩包”或者“tarball”。必须先解压缩这些文件,然后使用TAR程序展开它们。

鹏仔微信 15129739599 鹏仔QQ344225443 鹏仔前端 pjxi.com 共享博客 sharedbk.com

免责声明:我们致力于保护作者版权,注重分享,当前被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理!邮箱:344225443@qq.com)

图片声明:本站部分配图来自网络。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!

内容声明:本文中引用的各种信息及资料(包括但不限于文字、数据、图表及超链接等)均来源于该信息及资料的相关主体(包括但不限于公司、媒体、协会等机构)的官方网站或公开发表的信息。部分内容参考包括:(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供参考使用,不准确地方联系删除处理!本站为非盈利性质站点,本着为中国教育事业出一份力,发布内容不收取任何费用也不接任何广告!)