有关ZIP文件,压缩,加密和替代方法的全部信息

披露: 您的支持有助于保持网站的正常运行!我们会为此页面上推荐的某些服务收取推荐费.


介绍

文件大小很昂贵。我们有时会忘记这一点,因为购买的个人计算机的磁盘空间是我们需要的磁盘空间的5或10倍。对于大多数个人用户而言,磁盘空间并不昂贵.

但是对于在线业务和面向Web的公司,文件大小可能会变得很重要。如果您托管数千(或数百万)个文件,则数据存储成本将成为严重的问题。而且,如果将这些文件提供给成千上万(或数百万)的最终用户,带宽成本也是一个巨大的问题。.

所有关于ZIP文件

将每个文件的大小减少30%或40%可带来巨大的好处。此外,在传输文件时(例如用户下载内容时),每次传输都具有微小的额外带宽和计算成本-传输100MB文件比传输十个10MB文件便宜.

因此,如此多的在线可下载文件都使用ZIP或其他压缩格式也就不足为奇了。重要的一点是要了解ZIP(和其他)文件,它们如何工作以及需要使用什么文件.

几种流行的内容管理系统(尤其是WordPress)使用ZIP文件进行主题和插件上传以及系统备份存档,因此,运行WordPress(或其他CMS)网站的任何人都可以通过其他动机来了解此主题.

ZIP有什么作用?

ZIP(或.zip)是一种存档文件格式。许多文件(包括文件夹和子文件夹)可以“压缩”到单个ZIP文件中。 ZIP文件比原始文件小得多,归档文件可以作为一个整体传输(而不是几个单独的文件).

一般来说,ZIP文件不能被应用程序使用或查看。例如,如果您将图片或电影压缩,则必须先“解压缩”文件,然后才能看到图片或电影。因此,ZIP如今主要用作文件传输格式。它还用于文件系统备份.

ZIP的替代品

有几种不同的文件格式和实用程序,可完成与ZIP几乎完全相同的功能:tar,7zip,rar.

尽管某些基础数学和理论有所不同,但从用户角度来看,这些在很大程度上是可以互换的。在本文中,我们将主要讨论ZIP文件,但是所有内容几乎都适用于其他格式。与众不同的一件事是,您可能需要使用哪些工具来解压缩文件或将其解压缩以使用。本文结尾将包括有关这些工具的信息,这些工具适用于最受欢迎的格式以及ZIP.

无损压缩

ZIP最重要的是,它使文件更小。要了解ZIP的工作方式,您必须了解数据压缩的工作原理.

有两种压缩方式:有损压缩和无损压缩。有损压缩最容易理解。通过删除一些细节或保真度,可以使数据更小。这通常是通过音乐和图像来完成的-我们只删除了一些细节,下采样只是一点点,降低了分辨率。之所以可行,是因为人类只能感知到很多。您可以在没有任何人注意的情况下从图像中提取很多.

但是有损压缩在某些情况下不起作用。您不能向某人发送删除了某些功能的软件应用程序,也不能向其发送缺少某些文件的文件档案.

无损压缩意味着以一种可以完全重建原始文件的方式使数据变小,而不会丢失任何信息.

无损压缩的(简化)示例

要想像如何做到这一点,请想象图像的像素列表。每个像素都是由六位数字表示的特定颜色(例如3D590D)。成千上万个这样的像素阵列对图像所需的信息进行编码。图像,如果我们放到此像素颜色列表的中间,我们看到了:

3F39A1 | 3F39A1 | 3F39A1 | 3F39A1 | 3F39A2 | 3F39BB

那可能性有多大?几个彼此相邻的像素具有相同的颜色,然后是几个稍有不同的像素?极有可能.

我们可以指定一个特定的符号(例如%)来表示“重复”,然后将该像素字符串压缩为:

3F39A1 | %| %| %| 3F39A2 | 3F39BB

接下来,我们可以定义一个增量符号,该符号可以让我们根据先前的颜色指定一种颜色。 3F39A1和3F39A2之间的差仅是一个,从那里到最后一个值的差为19:

3F39A1 | %| %| %| + | +19

最后,我们可以删除分隔符,剩下以下内容:

3F39A1 %%% ++ 19

所以现在我们将像素列表压缩为51个字符,变为13个字符-减少了将近75%.

现实生活中的无损压缩

实际上,使用更多技术,无损压缩要复杂得多。它适用于基础数据,而不适用于文件格式内的颜色表示。但是概念是相同的:使用数据中的模式(重复,增量排序)来寻找保存信息的方式,同时减少存储信息所需的位数.

各种压缩软件实用程序内置了有关如何压缩和解压缩数据的说明。.

加密

ZIP(和其他存档程序)可以做的另一件事是加密。这是当文件受密码保护时,只有具有密码的人才能解压缩该文件.

重要的是要认识到加密文件的密码保护 不是 允许的事情。密码不会存储在任何地方,无法恢复密码,并且您无法规避加密或更改密码.

这是因为在文件加密中,密码实际上是在加密算法中使用的.

一个(简化的)密码加密示例

让我们从上一个示例中提取压缩的字符串:

3F39A1 %%% ++ 19

现在,我们需要一个密码-假设12345。我们可以使用密码本身来对字符串进行加密.

首先,我们需要将所有非字母数字转换成数字。百分号是ASCII中的25,加号是2B.

(请注意,这不是这种编码在现实生活中的工作方式,这只是一个概念性示例。)

3F39A12525252B2B19

现在,我们将根据密码更改每个数字。为此,我们将密码中的数字添加到字符串的数字中。数字从0-9到A-F。当他们到达F时,它们回绕到0.

3F39A12525252B2B19
+12345123451234512345
———————-
416DF2486A37507C3C45

如果不知道原始密码,则无法重建最后的字符串416DF2486A37507C3C45。这就是密码加密的工作方式.

现实生活中的加密

实际上,它要复杂得多。加密算法处理基础数据(位和字节),而不是数字表示形式,并且它们使用密码的方式比按位加法更复杂.

但是您实际上不需要知道任何这些。要了解的重要一点是,密码实际上是在加密本身中使用的,而不是作为登录网站等个人身份的手段.

如何使用Zip文件

大多数计算机系统(无论是Windows,Mac还是Linux)都内置了对压缩和解压缩ZIP文件的支持。.

压缩文件

视窗

在文件资源管理器中,您可以打开上下文菜单(单击鼠标右键),“新文件夹”项附近将是“新压缩文件夹”或“新Zip存档”之类的项。 (措辞会因您的确切操作系统和版本而异。)

这将创建一个存档文件夹,您可以设置其名称。只需将项目拖入其中,它们就会被添加到存档中.

苹果电脑

对于Mac,只需用两指单击文件或文件夹以打开上下文菜单并压缩它。压缩后,您将无法将新项目拖入其中。因此,如果您要压缩档案,则需要确保将其中的所有文件都放在一个文件夹中,然后再压缩该文件夹.

解压缩文件

对于大多数系统上的大多数ZIP文件,只需像打开文件一样单击(或双击)即可完全将其解压缩,或在归档文件中打开一个窗口,以便您可以从其中提取单个项目.

其他格式和实用程序

如果您要使用其他压缩格式之一,例如.tar,.7z,.gz或.rar,则需要下载并安装其他实用程序.

Windows上用于压缩和解压缩文件的最受欢迎的工具是:

  • 7-Zip-此工具具有其自己的压缩文件格式(7ZIP或.7z),但也解压缩了其他几种流行的格式.

对于Mac,您可能需要两个不同的应用程序才能打开各种格式:

  • Unarchiver(取消存档程序)—处理几乎所有存档文件格式,但是某些.rar文件存在问题。 (.rar格式有点奇怪,并且有很多变化。)
  • Unrarx-这是一个基本应用程序,具有非常没有吸引力的用户界面。但这在处理一些奇怪的.rar问题时非常方便.

处理多部分档案

存档格式的优点之一是可以将单个存档文件分解成几个单独的部分,然后重新组合。这在软盘时代经常使用,当时单个磁盘的容量不足以容纳整个文件.

如今,多部分存档文件的最常见原因可能是非常大的视频和电影的文件共享。如果要花费一个小时来下载整个电影,最好将其分解成较小的文件,这样,如果出现故障或文件损坏,下载程序就不必重新开始。.

视窗

对于制作和提取多部分的Zip文件(和其他类型的存档),最容易使用的工具是免费的7-Zip.

要制作存档,只需打开实用程序并按照说明进行操作-并不困难.

要提取多部分归档文件,必须确保所有文件都具有相同的基本名称,并正确地在文件名后附加零件号,如下所示:

  • file_name.part01.zip
  • file_name.part02.zip
  • file_name.part03.zip

这些文件需要一起放在一个文件夹中。您只需像常规档案一样打开第一个档案,系统就会找到其余的档案。但是,如果其中任何一个名称错误,您都会遇到问题.

苹果电脑

在Mac中,提取多部分文件与在Windows中提取文件完全相同,只是您将使用Unarchiver工具或其他实用程序。对文件名的关注非常重要.

对于创建多部分文件,最简单的方法是使用终端(命令行)。只需cd到具有您要压缩的文件的目录,然后:

zip -r -s MaximumSize ArchiveName.zip FolderName /

  • MaximumSize是您要在输出中找到的最大文件大小
    • 100000k = 100MB
    • 1克= 1 GB
    • 1t = 1 TB
  • ArchiveName.zip是新的输出文件名
  • FolderName是包含您要存档的文件的现有文件夹的名称

(您还可以使用命令行来完成所有其他压缩和解压缩需求。而且,如果您大量使用命令行并归档文件,则可以查看此Bash函数,该函数充当通用提取工具.

小心存档

如果您定期处理ZIP和其他归档文件,则可能是因为您正在从Internet下载大量文件。如果要从BitTorrent或其他文件共享系统获取这些文件,则需要注意下载的存档文件.

ZIP文件和其他类型的存档可能包含病毒和其他恶意软件。如果您打开一个归档文件并找到了您所期望的文件格式以外的其他文件格式,尤其是诸如.exe之类的可执行文件格式,请不要打开它.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me