Sve o ZIP datotekama, kompresiji, šifriranju i alternativama

Objava: Vaša podrška pomaže održavanju web mjesta! Naplaćujemo naknadu za preporuku za neke usluge koje preporučamo na ovoj stranici.


Uvod

Veličina datoteke je skupa. To zaboravljamo ponekad jer kupujemo osobna računala s 5- ili 10 puta više prostora na disku nego što će nam ikada trebati. Za većinu pojedinačnih korisnika prostor na disku nije skup.

No, za internetske tvrtke i tvrtke koje se bave mrežama veličina datoteke može postati velika stvar. Ako ugostite tisuće (ili milijune) datoteka, troškovi pohrane podataka postaju ozbiljna briga. A ako te datoteke poslužite tisućama (ili milijunima) krajnjih korisnika, troškovi propusnosti također su velika briga.

Sve o ZIP datotekama

Smanjivanje veličine svake od tih datoteka za 30% ili 40% može biti velika korist. Uz to, prilikom prijenosa datoteka (primjerice, kada korisnik nešto preuzima), svaki prijenos ima malu dodatnu širinu pojasa i računske troškove – jeftinije je prenijeti na 100MB datoteku nego prenijeti deset datoteka od 10 MB..

Zbog toga vas ne bi trebalo čuditi da toliko mnogo dostupnih datoteka putem Interneta koristi ZIP ili neki drugi format kompresije. Važno je znati malo o ZIP (i drugim) datotekama, kako rade i što ih trebate koristiti.

Nekoliko popularnih sustava upravljanja sadržajem (osobito WordPress) koristi ZIP datoteke za prijenos tema i dodataka, kao i za arhivu sigurnosnih kopija sustava, pa svatko tko vodi web stranicu WordPressa (ili druge CMS) ima dodatni poticaj za razumijevanje ove teme.

Što radi ZIP?

ZIP (ili .zip) je format arhivske datoteke. Mnoge datoteke, uključujući mape i podmape, mogu se „komprimirati“ u jednu ZIP datoteku. ZIP datoteka je mnogo manja od izvornih datoteka i arhiva se može prenijeti kao jedna cjelina (umjesto nekoliko pojedinačnih datoteka).

Općenito govoreći, ZIP datoteke ne mogu koristiti aplikacije niti ih pregledavati. Ako, primjerice, upalite sliku ili film, ne možete vidjeti sliku ili film dok ne “raspakirate” datoteku. Iz tog razloga se ZIP danas uglavnom koristi kao format prijenosa datoteka. Također se koristi za sigurnosno kopiranje datotečnog sustava.

Alternativa ZIP-u

Postoji nekoliko različitih formata datoteka i alata koji postižu gotovo potpuno iste stvari kao i ZIP: tar, 7zip, rar.

Iako su neke osnovne matematike i teorija različite, iz perspektive korisnika su one uglavnom izmjenjive. U ovom ćemo članku uglavnom govoriti samo o ZIP datotekama, ali sve se odnosi gotovo jednako na ove ostale formate. Razlikuje se samo ono što će vam trebati alati za raspakiranje ili raspakiranje datoteka za upotrebu. Na kraju članka bit će navedene informacije o tim različitim alatima za najpopularnije formate, zajedno s ZIP-om.

Kompresija bez gubitaka

Najvažnija stvar ZIP-a je da datoteke čini manjim. Da biste razumjeli kako ZIP to radi, morate razumjeti kako funkcionira kompresija podataka.

Postoje dvije vrste kompresije – kompresija gubitka i kompresija bez gubitaka. Kompresiju gubitaka najlakše je razumjeti; podaci se umanjuju uklanjanjem nekih detalja ili vjernosti. To se često događa s glazbom i slikama – samo malo detalja uklanjamo, umanjivanje uzorka je samo malo, smanjujemo razlučivost. To djeluje zato što ljudi mogu samo toliko percipirati; možete izvući dosta slike bez da itko primijeti.

Ali kompresija gubitka ne djeluje u nekim slučajevima. Ne možete nekome poslati softverski program s uklonjenom nekom funkcijom ili arhivu datoteka s nedostatkom nekih datoteka.

Kompresija bez gubitaka znači smanjivanje podataka na takav način da se izvornik može u potpunosti rekonstruirati – niti jedna informacija se ne gubi.

(Pojednostavljeni) primjer kompresije bez gubitaka

Da biste zamislili kako se to može učiniti, zamislite popis piksela za sliku. Svaki je piksel određene boje koji je predstavljen sa šest znamenki (poput 3D590D). niz tisuća tih piksela kodira informacije potrebne za sliku. Slika da ako smo se našli na sredini ovog popisa piksela boja i vidjeli smo ovo:

3F39A1 | 3F39A1 | 3F39A1 | 3F39A1 | 3F39A2 | 3F39BB

Koliko je to vjerojatno? Nekoliko piksela jedna pored druge iste boje, a slijedi par koji se tek malo razlikuje? Vrlo moguće.

Mogli bismo označiti određeni simbol (poput%) koji bi značio „ponoviti“ i komprimirati taj niz piksela u:

3F39A1 | % | % | % | 3F39A2 | 3F39BB

Zatim bismo mogli definirati simbol prirasta koji nam omogućava odrediti jednu boju na temelju prethodne boje. Razlika između 3F39A1 i 3F39A2 je samo jedna, a razlika do zadnje vrijednosti od tamo iznosi 19:

3F39A1 | % | % | % | + | 19

Napokon, mogli bismo ukloniti razmaknice, ostavljajući nam sljedeće:

3F39A1 %%% ++ 19

Sada smo komprimirali taj popis piksela od 51 znaka do 13 – gotovo 75% smanjenje.

Stvarno sažimanje bez gubitaka

U stvarnosti, kompresija bez gubitaka mnogo je složenija, koristeći više tehnika. I radi na osnovnim podacima, a ne na prikazu boja unutar formata datoteke. No koncept je isti: koristite uzorke u podacima (ponavljanje, inkrementalno sekvenciranje) da biste pronašli načine opreziranja podataka, a istovremeno smanjili broj bita potrebnih za njihovo spremanje..

Upute za kopiranje i raspakiranje podataka ugrađene su u različite uslužne programe za zip.

Šifriranje

Još jedna stvar koju ZIP (i drugi arhivatori) mogu učiniti je šifriranje. Ovo je kada je datoteka zaštićena lozinkom tako da je samo netko s tom lozinkom može raspakirati.

Važno je shvatiti da je zaštita lozinkom za šifrirane datoteke nije stvar dopuštenja. Zaporka se ne pohranjuje nigdje, ne oporavlja se lozinkom i ne možete zaobići šifriranje ili promijeniti zaporku.

To je zato što se sa enkripcijom datoteke lozinka zapravo koristi u algoritmu šifriranja.

Primjer (pojednostavljeno) šifriranje zaporke

Uzmimo naš komprimirani niz iz posljednjeg primjera:

3F39A1 %%% ++ 19

Sada nam treba lozinka – recimo 12345. Mogli bismo je i sami iskoristiti kako bismo šifrirali niz.

Najprije moramo pretvoriti sve ne-alfanumeričke znamenke u brojeve. Znak postotka je 25 u ASCII, a znak plus je 2B.

(Napominjemo, to ne funkcionira tako kodiranje u stvarnom životu – ovo je samo idejni primjer.)

3F39A12525252B2B19

Sada ćemo mijenjati svaku znamenku na temelju lozinke. Da bismo to učinili, dodaćemo cifre lozinke u znamenke niza. Brojke kreću od 0-9, a zatim A-F. Kad stignu do F, ponovno se vrate na 0.

3F39A12525252B2B19
+12345123451234512345
———————-
416DF2486A37507C3C45

Završni niz, 416DF2486A37507C3C45, nije moguće rekonstruirati bez poznavanja izvorne lozinke. To funkcionira (vrsta) šifriranja zaporke.

Šifriranje u stvarnom životu

Zapravo, mnogo je složenije od toga. Algoritmi za šifriranje rade na osnovnim podacima (bitovima i bajtovima), a ne na njihovom numeričkom prikazu i lozinku koriste na složenije načine od bitnog dodavanja.

Ali ništa od toga zapravo ne morate znati. Važno je shvatiti da se lozinka zapravo koristi u samoj šifriranju, a ne kao sredstvo osobne identifikacije poput prijave na web mjesto.

Kako se koriste Zip datoteke

Većina računalnih sustava – bilo da su to Windows, Mac ili Linux – ima ugrađenu podršku za komprimiranje i raspakivanje ZIP datoteka.

Zipping datoteke

Windows

U File Exploreru možete otvoriti kontekstualni izbornik (desnom tipkom miša) i blizu će stavka “Nova mapa” biti stavka za nešto poput “Nova komprimirana mapa” ili “Nova Zip arhiva.” (Tekst će se razlikovati ovisno o vašem OS-u i verziji.)

Tako ćete stvoriti arhivsku mapu i možete postaviti njeno ime. Jednostavno povucite stavke u nju i one će biti dodane u arhivu.

ortak

Za Mac možete jednostavno kliknuti datoteku ili mapu dva prsta da biste otvorili kontekstualni izbornik i komprimirali ga. Nakon što ga komprimirate, ne možete povući nove stavke u njega. Ako želite komprimirati arhivu, morat ćete biti sigurni da su sve datoteke koje želite u njoj zajedno biti u mapi, a zatim komprimirati mapu.

Raspakiranje datoteka

Za većinu ZIP datoteka na većini sustava, jednostavnim klikom (ili dvostrukim klikom), kao što biste otvorili datoteku, ili ćete je potpuno raspakirati ili otvoriti prozor u arhivu kako biste iz nje mogli izvući pojedine stavke.

Ostali formati i uslužni programi

Ako želite koristiti neki od alternativnih formata kompresije, poput .tar, .7z, .gz ili .rar, morat ćete preuzeti i instalirati dodatni uslužni program.

Najpopularniji alat za komprimiranje i raspakivanje datoteka u sustavu Windows je:

  • 7-Zip – Ovaj alat ima vlastiti format datoteke kompresije (7ZIP ili .7z), ali također komprimira nekoliko drugih popularnih formata.

Za Mac će vam trebati dvije različite aplikacije za otvaranje različitih formata:

  • Unarchiver – Ovo obrađuje gotovo svaki format arhivske datoteke, ali ima problem s nekim .rar datotekama. (Format .rar je pomalo čudan i ima mnogo varijacija.)
  • Unrarx – ovo je aplikacija s golim kostima s vrlo neprivlačnim korisničkim sučeljem. Ali to je korisno za rješavanje nekih čudnijih .rar problema.

Suočavanje s višedijelnim arhivima

Jedna od prednosti formata arhiva je ta što se jedna arhivska datoteka može razbiti na nekoliko pojedinačnih dijelova i zatim ponovno sastaviti. Ovo se često koristilo u danima disketa, kada jedan disk nije bio dovoljno velik da drži cijelu datoteku.

Danas je najčešći razlog za dvodijelne arhivske datoteke vjerojatno dijeljenje datoteka vrlo velikih video zapisa i filmova. Ako će vam biti potreban sat vremena za preuzimanje cijelog filma – bolje je da je razbijen na manje datoteke, tako da ako dođe do kvara ili oštećenja datoteke, uređaj za preuzimanje ne mora sve započeti iznova.

Windows

Za izradu i izdvajanje višedijelnih Zip datoteka (i drugih vrsta arhiva), najlakši alat za upotrebu je besplatni 7-Zip.

Za pravljenje arhiva jednostavno otvorite uslužni program i slijedite upute – to nije strašno teško.

Za izdvajanje višedijelne arhive morate biti sigurni da sve datoteke imaju isto osnovno ime i da li su ispravno dodane s brojem dijelova, kao što je ovaj:

  • file_name.part01.zip
  • file_name.part02.zip
  • file_name.part03.zip

Te datoteke trebaju biti zajedno u jednoj mapi. Jednostavno otvorite prvu poput obične arhive, a sustav će pronaći ostale. Ako je bilo koji od njih pogrešno imenovan, imat ćete problem.

ortak

Ekstrahiranje višedijelnih datoteka na Macu potpuno je isto kao u Windowsu, osim što ćete koristiti alat Unarchiver ili neki drugi uslužni program. Zabrinutost zbog imena datoteka vrlo je važna.

Za stvaranje višedijelnih datoteka najlakše je koristiti terminal (naredbeni redak). Samo cd u imenik koji sadrži datoteke koje želite komprimirati i:

zip -r -s MaximumSize ArchiveName.zip FolderName /

  • MaximumSize je najveća veličina datoteke koju želite u ispisu
    • 100000k = 100MB
    • 1g = 1 GB
    • 1t = 1 TB
  • ArchiveName.zip je novo ime izlazne datoteke
  • FolderName je naziv postojeće mape koja sadrži ono što želite arhivirati

(Možete koristiti i naredbeni redak za ispunjavanje svih ostalih potreba za kompresijom i dekompresijom. A ako puno radite s naredbenim retkom i arhivirate datoteke, možete provjeriti ovu Bash funkciju koja djeluje kao univerzalni alat za vađenje.

Pažljivo s arhivima

Ako se redovito bavite ZIP-om i drugim arhivima, to je vjerojatno zato što s Interneta preuzimate puno datoteka. Ako ove datoteke dobivate iz BitTorrent-a ili nekog drugog sustava za dijeljenje datoteka, morate biti oprezni u arhivima koje preuzmete.

ZIP datoteke i druge vrste arhiva mogu sadržavati viruse i drugi zlonamjerni softver. Ako otvorite arhivu i pronađete format datoteke različit od očekivanog, posebno izvršni format poput .exe, ne otvarajte ga.

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me