ASCII kódolás: Kezdők, kezdők … Minden szükséges információt megvan itt.

Közzététel: Támogatása segít fenntartani a webhely működését! Az ezen az oldalon javasolt szolgáltatások némelyikén referenciadíjat keresünk.


Az ASCII egy olyan karakterkódolás, amelyet a számítógépek használnak karakterek (betűk, számok, szimbólumok, szóközök, behúzások stb.) Tárolására és visszakeresésére bitmintázatként a memóriában és a merevlemezeken tárolás céljából..

Magas szintű „karakterkódolás” azt jelenti, hogy egy szimbólumot bináris számmá alakítanak, és egy „karaktertérképet” használnak a bináris szám betűtípusként történő olvasásához..

És a MIME típusok lehetővé teszik a felhasználók számára, hogy karaktereken túl adatokat küldjenek, például képeket és videókat.

ASCII, Karakterkódolás, MIME típusok

Karakterkódolás

A karakterkódolás legkorábbi formája ugyanúgy megy vissza, mint az elektromos távíró. Valójában a Morse-kód és később a Baudot-kód volt az első valaha létrehozott szabványosított karakterkód.

A kódolás egy második rétegét, az úgynevezett titkosítást vagy rejtjelzést, akkoriban a katonaság is létrehozta, de ez egy meglehetősen más téma.

Csak az 1950-es években kezdtük el az ASCII felé vezető modern folyamatot. Az IBM azzal kezdte el, hogy kódolási sémákat fejlesztett ki a 7000-es sorozatú számítógépekhez.

Az IBM bináris kódolt tizedesje (BCD) négy bites kódolást használt a lyukasztókártyákon. Ez volt a módszer a tizedes számok bináris formában történő tárolására.

Tehát a 0000 (0) és 1111 (15) közötti számok helyett 0000 (0) és 1001 (9) között változtak – mind a négy bit egy számjegyű.

Később az IBM létrehozta a BCD kibővített változatát, az úgynevezett kiterjesztett bináris kódolt decimális cserélő kódot (EBCDIC). Ez egy 8 bites kódolási rendszer volt az összes szabványos nyomtatható karakterhez.

Ugyanebben az évben, 1963-ban bevezették az ASCII-t.

7 bites kódolási sémát használ. Ez 128 különböző számot jelent.

Ez a 7 bites számformátum furcsának tűnhet. Végül is: nem a 8-bites vagy a 16-bites vagy a 32-bites számítógépek és így tovább?

Ma vannak. De a korai számítógépeket nem így építették fel.

Sőt, a számítógépek memóriája értékes volt, és nem volt oka extra bit használatához, ha nem volt rá szüksége. A 6 bites kód (amely létezett) nem fogja lefedni az összes kis- és nagybetűt, számot és alapvető írásjeleket. De egy 7 bites kód megtett – még tartalékot is.

Mivel a számítógépek 8 bites (1 bájtos) struktúrába rendeződnek, az ASCII fokozatosan nem hivatalos 8 bites kódrá alakult, ahol a többi 128 karakter nem volt szabványosítva.

Ez az állapot egy ideig fennállt. 1991-ben a 8 bites hivatalos formátum lett az UTF-8 ISO (Nemzetközi Szabványügyi Szervezet) által fenntartott formátumban.

Akkoriban felmerült kihívás az volt, hogy csak egy ábécét lehessen támogatni egy 7 vagy 8 bites kódolással.

A nyelvek szélesebb körének támogatása érdekében az Unicode kódoló sémát és az univerzális karakterkészletet együtt hozták létre. Az Unicode-nak van néhány kódolási típusa, az UTF-8 az a 8-bites kódolás, amely kompatibilis az ASCII-vel, és amely az ASCII helyett a mai domináns karakterkódoló szabványként szolgál az interneten.

Az UTF-8 növekedése

Ezenkívül az UTF-16 és az UTF-32 sok karakterű nyelvnél használatos. Kínai, japán és arab nyelven azonban mind az UTF-8 megjeleníthető.

Ennek eredményeként az UTF-8 messze a leggyakoribb kódolási formátum az interneten. És az angolul beszélõk számára a dolgok különösen egyszerûek, mert az ASCII elsõ 128 karaktere megegyezik a Unicode betûivel.

Tehát a HTML használatához az ASCII táblázat hivatkozása egy karakter létrehozására függetlenül attól függ, hogy milyen kódolási formátumot használ.

Ahol az ASCII belefér

Az ASCII az „információcsere amerikai szabványkódja”, és az Amerikai Szabványügyi Szövetség (később az Amerikai Nemzeti Szabványügyi Intézet átnevezése) hozta létre..

Az ASCII szabványt 1960-ban indították és 1963-ban adták ki. Ez a távírási kódok kiterjesztése volt, és először a Bell adatszolgáltatások használták fel..

Az évek során jelentős módosításokat hajtottak végre. 2007-ig ez volt a legszélesebb körben használt karakterkódolás az interneten, de helyére UTF-8 került.

Az internet váltása az ASCII-ről és a Microsoft ANSI-ről az UTF-8-ra nagyrészt a Google kezdeményezéseinek tulajdonítható, mivel az internethasználat egyre nemzetközibbé vált, és az ASCII csak latin karaktereket tudott megjeleníteni..

Fontos megjegyezni, hogy az UTF-8 egy típusú kódolás, míg az Unicode a karakterkészlet; mivel a Unicode első 128 karaktere megegyezik az ASCII-val, akkor elfogadható hivatkozni egy ASCII-táblára, amikor karaktereket generál HTML-ben.

Az ASCII képes egy „menekülési szekvenciát” használni az alternatív ábécé megjelenítéséhez, amely lehetővé tette, hogy nemzetközi szabványvá váljon, de az Unicode ezt közvetlenül kezeli.

Az Unicode 1987-ben az Appleből származott, és 1991-ben az Unicode Consortium projektjévé vált. Az ASCII-t az ASA hozta létre, ám az ISO továbbfejlesztése az ISO nyilatkozatainak részeként folytatódott..

Az UTF-8 kódolási nevét az Internet Assigned Numbers Authority (IANA), azaz az összes HTML, CSS és XML szabványnak megfelelő szabványok használják. Az IANA a nagyobb ICANN egy részlege, amely a nonprofit szervezet határozza meg az internetes protokollt és a domainneveket.

Összefoglalva: az ASCII a 60-as években a távíró kódból fejlődött ki, felnőtt és az Unicode karakterkészlet részévé vált, amelyet az UTF-8, az interneten a legelterjedtebb kódolási formátum használ..

A domain nevek és a weboldal kódja attól függ, hogy ez az egységes karaktertérkép megfelelően működjön-e.

Ez azt jelenti, hogy a modern internet legegyedibb létezik az 1870-es években kitalált karakterformátum, amelyet az 1960-as években ASCII-ként számítógépesítettek, az 1990-es évek Unicode-jával modernizálták az interneten, és általánosan elfogadták az UTF-8 2007-es többségi felhasználása révén..

Vezérlő karakterek vs nyomtatható karakterek

Az ASCII-ben kétféle karakter létezik: nyomtatható és vezérlőkarakterek.

A vezérlő karakterek a 0-31 és a 127 számokat határozzák meg. A vezérlő karakterek magukban foglalják az írás minden olyan részét, amely lehetővé teszi új bekezdések, lapok, a sorok végét, a fájl elválasztókat és egy csomó darabot, amelyek főleg átlátszóak.

Ezeket a vezérlőkaraktereket abban az időben hozták létre, amikor a nyomtatott kártyák nagy részét képezték a számítási folyamatnak. Ezen funkciók némelyikét azóta cserélték, de a vonalformázó elemek nagy része továbbra is fennáll manapság. A 127-es kód valójában a törlés kódja (csak valódi ASCII-ban, nem ANSI vagy Unicode-ban).

Az összes nyomtatható karakter az, amire számíthat. Vannak minden kisbetűs karakter (a-z) és nagybetűs karakter (A-Z), számok, szimbólumok és írásjelek mellett – lényegében mindent, amit egy tipikus billentyűzeten lehet látni. Ezek az alapelemek tartalmazzák az összes írott szót.

ASCII használata XML-ben és HTML-ben

Minden HTML oldalhoz hozzá van rendelve egy karakterkódolási formátum.

Eltérő rendelkezés hiányában a HTML kódolás alapértelmezés szerint az UTF-8 lesz. A tiszta ASCII vagy ANSI, vagy bármilyen speciális, egyedi formátum használatához csak annyit kell tennie, hogy deklarációt tartalmaz egy metacímkében..

HTML 4 esetén:

HTML5 esetén:

A karakterkészlet címkében használhatja az UTF-8, ANSI vagy ASCII karaktereket:"US-ASCII" vagy megkeresheti a használni kívánt karakterkészletet, általában egy ISO-szám megadásával. A teljes lista megtalálható az IANA karakterkészletek oldalon.

Karakterkód beszúrási formátum

Általában azonban, ha valaki az ASCII kód ​​használatára utal, akkor azt akarja, hogy tisztázza, vajon valódi US-ASCII-t jelent-e egy metacímkével, vagy csak arra kér, hogy mutasson be egy speciális karaktert..

A HTML-ben bármikor használhat speciális karaktereket, például a centszimbólum (¢) vagy fordított kérdőjel-karaktert (¿) – általában Unicode-szimbólumot vagy US-ASCII-t (8-bites) használhat. karakter, ilyen hivatkozás beírásával:

¢ a HTML-ben a következőképpen néz ki: ¢

¿A HTML-ben a következőképpen néz ki: ¿

Tehát kezdődik egy &# követi egy négyjegyű számot, pontosvesszővel véget vetve (;).

Ilyen módon képesek a karakterek megjelenítésére az ASCII / Unicode számuk alapján.

Természetesen a vezérlő karakterek formázási funkciót hajtanak végre, vagy egyáltalán nem fognak működni, attól függően, hogy melyiket használja, és melyik valódi karakterkészletet felsorolta a metacímkéjében.

Tehát a HTML-ben a „&# ”Számot, de amikor megjelenik a böngészőben, látni fogja a karaktert.

HTML speciális entitás karakterek

Tegyük fel például, hogy csak azt szeretné, hogy mutasson egy & szimbólum az oldalon.

Nem csak írhatja be a HTML-be, de beírhatja a megfelelő ASCII-t vagy Unicode-t is.

A HTML egy jelölőnyelv, tehát míg a normál betűk jól működnek, a speciális karakterek és különösen < > zárójelben – kritikus jelentőséggel bírnak abban, hogy a böngésző hogyan olvassa le és mutassa meg a HTML-t.

Nem kell azonban mindig beírnia a Unicode / ASCII hivatkozási számot. A HTML 4.0 és újabb verziók esetében vannak olyan speciális entitások, amelyek hasonlóan működnek, mint a Unicode hivatkozások, de a szám megjegyzése helyett egy szót megjegyeznek.

¢ a HTML-ben a következőképpen néz ki: ¢

¿ a HTML-ben a következőképpen néz ki: ¿

E karakterreferenciák teljes listája megtalálható a W3 konzorciumban.

Referencia táblázat

Mindezen előzetes bemutatóval egyszerűen kereshet egy helyet egy ASCII vagy Unicode hivatkozás megtalálására. Ne keresse tovább, itt található a 000-127 hivatkozás, és a teljes Unicode formátumot megtalálhatja a Wikipédián.

Ne feledje, hogy a 000-032 és a 127 karakterek általában nem nyomtathatók, így ezeket „NA” betűvel jelöljük.

ASCII

table.wiht002 {
szegélytávolság: 0px;
border-összeomlás: összeomlás;
margin-left: auto;
jobb oldali margó: automatikus;
margin-bottom: 1,5em;
szöveg igazítás: középpont;
}

asztal, tr, td
{
párnázat: 0px;
margin: 0px;
}
td.bor
{
szél-bal: 1 képpont szilárd # 000;
párnázat-bal: 1em;
jobb margó: 1em;
}
td.break
{
margó-bal: 2em;
jobb margó: 2em;
}
td.sep
{
szegély alsó: 1 képpont szilárd # 000;
}
td.sepbor
{
szegély alsó: 1 képpont szilárd # 000;
szél-bal: 1 képpont szilárd # 000;
párnázat-bal: 1em;
jobb margó: 1em;
}

0NA32NA64@@96``
1NA?33!!65AA97egyegy
2NA?34""66BB98bb
3NA?35##67CC99cc
4NA?36$$68DD100dd
5NA?37%%69EE101ee
6NA?38&&70FF102ff
7NA?3971GG103gg
8NA?40((72HH104hh
9NA41))73énén105énén
10NA42**74JJ106jj
11NA43++75KK107kk
12NA44,,76LL108ll
13NA4577MM109mm
14NA?46..78NN110nn
15NA?47//79OO111oo
16NA?480080PP112pp
17NA?491181QQ113qq
18NA?502282RR114rr
19NA?513383SS115ss
20NA?524484TT116tt
21NA?535585UU117uu
22NA?546686VV118vv
23NA?557787WW119ww
24NA?568888xx120xx
25NA?579989YY121yy
26NA?58::90ZZ122ZZ
27NA?59;;91[[123{{
28NA?60<<92\\124||
29NA?61==93]]125}}
30NA?62>>94^^126~~
31NA?63??95__127NA?

ASCII eszközök és források

Nagyon sok történelemről van szó, hogyan alakultak ki a karakterkódok, és azoknak a szervezeteknek, amelyek együtt tartják ezeket a szabványokat a többiünk számára. Mivel a legtöbb internetes fejlesztő és a W3C az UTF-8-on áll, legalább a közeljövőben, azaz az oldalak lesznek kódolva.

Szüksége lesz néhány erőforrásra, hogy segítsen, ha más formátumban kezdi el a kézi kódolást, vagy jó lehet, ha átfogó referenciával rendelkezik.

Források listája

  • Az IANA karakterkészletek oldala

  • HTML speciális karakterek a W3 konzorcium által

  • Teljes Unicode formátum a Wikipédián

  • Csak az 0130-0255 ASCII táblázata

  • Az ASCII története az ASCII-világon

  • Az Unicode karakterek listája a Wikipédián.

ASCII Art

Az ASCII egyetlen összefoglalója sem lenne teljes, ha az ASCII-ra hivatkoznánk.

Speciális szoftver vagy szimbólumok kézzel kódolva használhatók a kép alakjának megváltoztatásához, csak szimbólumok felhasználásával. Ez a fajta effektus az 1980-as évek óta létezik, és népszerűvé vált olyan rendszerekben, mint a Commodore Amiga Computer.

Különbséget tesz még az „Oldskool” ASCII művészet, amely tiszta ASCII-t használ a parancssorban, és „Newskool”, amely az Unicode speciális karaktereit használja még összetettebb műalkotások készítéséhez..

Itt egy kép egy zebróról:

ASCII Art Zebra

ISO-8859-1

Az ISO-8859-1 egy karakterkódoló szabvány. Ezt a Nemzetközi Szabványügyi Szervezet (ISO) 1998-ban adta ki az ASCII kiterjesztéseként.

ASCII és ISO-8859-1

A leghíresebb karakterkódoló szabvány az ASCII. Az ASCII 7 bites nyolc bites byte-ot használt az angol íráshoz használt legalapvetőbb 128 karakter kódolására. Számos rendszer-specifikus felhasználást fejlesztettek ki a nyolcadik (magas sorrendű) bitre.

Például egy rendszer használta a római és a közötti váltáshoz dőlt betű nyomtatási stílusok. Más rendszerek további karakterek kódolására használtak. Mind a nyolc bájt használatával 256 karakter kódolható.

Mivel az eredeti ASCII-készlet nem tartalmazott számos olyan karaktert, amely a nem-angol nyelvben történő íráshoz szükséges (például betűk diakritikus jelekkel), a karakterkészlet 256-ra történő kiterjesztése jelentősen megnövelte annak képességeit.

Az IS0-8859-1 az egyik ilyen kiterjesztés. Nemcsak platformokon átívelő szabványnak szánták azt. Mivel ez a szabványos 8 bites ASCII szuperhalmaza, visszamenőleg kompatibilis: az ASCII-ban kódolt dokumentum könnyen dekódolható az ISO-8859-1 használatával.

ISO-8859-1 és HTML

A szabvány szerint az ISO-8859-1 volt az alapértelmezett karakterkódolás a HTML 4-ben. Ugyanakkor a legtöbb böngésző ANSI-nek nevezett ISO-8859 szuperkészletet támogatott..

Az ANSI további 32 karaktert tartalmaz, amelyek üresek voltak az ISO-8859-1 szabványban. (Legtöbbször, amikor az ISO-8859-1 karakterek listáját látja, ez valójában a teljes ANSI lista.)

Ma a HTML5 szabvány UTF-8-at használ, egy nagyon nagy szupersettet, amely tartalmazza az eredeti ASCII, ISO-8859-1 és ANSI kódolásokat..

Ugyanakkor a legtöbb angol nyelvű HTML dokumentum, még azok is, amelyek kifejezetten az ISO-8859-1 vagy UTF-8 karakterkészletként deklarálják, valójában a kisebb ASCII karakterkészletet használják. Ennek két oka van:

  • Az ASCII szokásos QWERTY billentyűzeten írható be.

  • A HTML előállításához használt sok technológia csak az ASCII-t támogatja.

Mivel az ISO-8859-1 és az UTF-8 egyaránt ASCII-kompatibilis, ez általában nem okoz problémát.

ISO-8859-1 és karakter entitások

Az ISO-8859-1 szabványban elérhető kibővített karakterkészlet csak ASCII-dokumentumban állítható elő HTML karakter entitások felhasználásával. Ezek azok a karakterláncok, amelyek az ampersanddal kezdődik (“&”), És pontosvesszővel („; ”) fejeződik be.

Például a szerzői jogi szimbólum (a körben egy „C” betű) közvetlenül kódolható az ISO-8859-1 vagy az UTF-8 használatával. Mivel azonban a legtöbb billentyűzeten nincs „©” gomb, sok ember könnyebben írja be a © billentyűt.

Ezt a fájlban hat ASCII karakter tárolja: &, c, o, p, y és; A webböngészők ezután megjelenítik a felhasználónak a megfelelő ISO-8859-1 karaktert.

A nem ASCII ISO-8859-1 karakterek többsége HTML karakter entitásokat nevezett. Azokat, amelyek nem, be lehet gépelni számkódjukkal. A numerikus kód valójában a bináris kódolás decimális (10. alap) változata.

Például a szerzői jogi szimbólum kódolása 10101001 bináris formátumban található, amely a 10 alap 169-es. Így beírhatja a © vagy a ©.

Nem ASCII karakterek az ISO-8859-1 és ANSI szabványokban

Az ábrán szereplő 128-159 karakterek ANSI karakterek, amelyek nem tartoznak az ISO-8859-be. Az ISO-8859-1 / ANSI első 127 kódja itt nem szerepel, mivel azonosak az ASCII-vel, amelyet fent felsoroltunk.

karakter
HTML név
HTML szám
Leírás
eurójelet
,,egyetlen alacsony idézőjelű idézőjel
ƒƒƒkisbetűs f betűvel
dupla alacsony-9 idézőjel
vízszintes ellipszis
tőr
kettős tőr
ˆmódosító levél circumflex ékezetes
ezredes jel
ŠŠŠnagybetűs S betűvel
<<egy balra mutató szög idézet
ŒŒŒtőkekötés OE
ŽŽkaptál Z betű karonnal
bal oldali idézőjel
jobb egyetlen idézőjel
bal oldali idézőjel
jobb dupla idézőjel
golyó
en kötőjel
em kötőjel
~˜~tilde
TM védjegy jele
ššškisbetű S betűvel
>>jobbra mutató szög idézőjel
œœœkisbetűs ligature oe
žžkisbetűvel z karonnal
ŸŸŸY nagybetű diaeresissel
 nem törő hely
¡ ¡ ¡fordított felkiáltójel
¢ ¢ ¢cent jele
£ £ £font jel (valuta)
¤ ¤ ¤pénznem jele
¥ ¥ ¥jen / jüan jel
¦ ¦ |törött függőleges sáv
§ § §szakasz jel
¨ ¨ ¨trémával
© © ©szerzői jogi jel
ª ª ªnői rendi mutató
« « «bal oldali dupla szög idézőjel (guillemet)
¬ ¬ ¬nincs aláírás (logika)
­ ­lágy / diszkrecionális kötőjel
® ® ®bejegyzett védjegy
¯ ¯ ¯távolság makró / overline
° ° °fok jel
± ± ±plusz / mínusz jel
² ² ²második felirat (négyzet)
³ ³ ³felirat három (kockával)
´ ´akut akcentus
µ µ μmikro jel
bekezdésjel (oroszlány)
· · ·középső pont
¸ ¸ ¸cédille
¹ ¹ ¹feliratú
º º ºférfias ordinális mutató
» » »derékszögű idézőjel (guillemet)
¼ ¼ ¼egynegyed rész (1 több mint 4)
½ ½ ½fele frakció (1 több mint 2)
¾ ¾ ¾háromnegyedes frakció (3 több mint 4)
¿ ¿ ¿fordított kérdőjel
À À Ànagybetűs A súlyos ékezettel
Á Á Ánagybetűs A, éles betűvel
  Ânagybetű A körül körbefutással
à à Ãnagybetű A és tilde
Ä Ä Änagybetűvel, diaeresissel
Å Å Ånagybetűs A betű a fenti gyűrűvel
® ® ®tőke AE ligatúra
Ç Ç ÇC nagybetű cedillával
È È Ènagybetűs E súlyos betűkkel
É É Énagybetűs E, éles betűkkel
Ê Ê Ênagybetű E körflexel
Ë Ë Ënagybetűs E betűvel
ÉN ÉN ÉNI. nagybetű súlyos ékezettel
ÉN ÉN ÉNI. nagybetű akut ékezetes betűvel
ÉN ÉN ÉNI. nagybetű körflexel
ÉN ÉN ÉNI. nagybetű diaeresissel
Ð Ð Ðnagybetűs ETH (Dogecoin szimbólum)
Ñ Ñ ÑN nagybetűvel tilde-vel
Ò Ò Ònagybetűs O súlyos ékezettel
Ó Ó Ónagybetű O, éles betűkkel
Ô Ô Ônagybetű O, körbeflexvel
Õ Õ Õnagybetű O-val tilde-vel
Ö Ö Önagybetű O és diaeresis
× × ×szorzás jele
Ø Ø Ønagybetűs O perjel
Ù Ù Ùnagybetűs U súlyos ékezettel
Ú Ú Únagybetűs U, éles betűkkel
Û Û Ûnagybetű U, kör keresztmetszettel
Ü Ü Ünagybetű U, diaeresissel
Y Y YY nagybetű akut ékezetes betűvel
Þ Þ Þnagybetűs THORN
ß ß ßkisbetűs éles s (Eszett / scharfes S )
à à àkis a betű súlyos ékezettel
á á ákisbetűs, éles ékezetes betűvel
â â âkisbetűs a circumflex betűvel
ã ã ãkisbetűs a tilde betűvel
ä ä äkisbetűs ae diarésszel
å å åkisbetűvel a gyűrűvel fent
æ æ ækisbetűs ae ligatúra
ç ç çc kisbetű cedillával (cé cédille)
è è èkisbetűs e súlyos ékezettel
é é ée kisbetű, akut ékezetes betűvel
ê ê êkisbetűs kör keresztmetszettel
ë ë ëkisbetűs e-betűvel
én én éni kisbetű súlyos ékezetes betűvel
én én éni kisbetű éles betűvel
én én énkisbetűs i körflexel
én én énkisbetűs i, diaeresissel
D / TD> ðcode> ðkisbetűs eth
ñ ñ ñn kisbetűvel tilde-vel
ò ò òkisbetűs o súlyos ékezetes betűvel
ó ó óo kisbetű, éles betűvel
ô ô ôo nagybetűs körflexel
Õ Õ Õkisbetűs o, tilde betűvel
ö ö ökisbetűs o, diaesézissel
÷ ÷ ÷megosztási jel
ø ø økisbetűs o perjel
ù ù ùkisbetűs u súlyos ékezettel
ú ú úkisbetűs u, ékezetes betűvel
û û ûkisbetűs kör keresztmetszettel
ü ü ükisbetűs u, diaeresissel
ý ý ýy kisbetű éles ékezetes betűvel
þ þ þkisbetűs tövis
ÿ ÿ ÿy kisbetű diaeresissel

Unicode

Az Unicode a karakterkódolás szabványa, amelyet a The Unicode Consortium kezeli.

Amint már megvitattuk, a számítógépes rendszerek nem szó szerint tárolnak karaktereket (betűket, számokat, szimbólumokat) – a merevlemezen lévő dokumentumban nem található apró kép az egyes betűkből. Mint tudnod kellene, minden karakter bináris bit sorozatát kódolja – 1s és 0s. Például az „a” kisbetű kódja 01100001.

De a 01100001 önkényes – nincs semmi különös abban a bitsorban, amelynek az „a” betűvé kell válnia – a számítógépes ipar együttesen megállapodott abban, hogy „a” -t jelent. Tehát hogyan érkezik az egész iparág abban, hogy képviselje az összes lehetséges karaktert? Karakterkódoló szabványdal. A kódoló szabvány egyszerűen meghatározza az összes lehetséges karaktert, és mindegyikhez hozzárendel egy bit sorozatot.

A számítástechnika elmúlt évtizedeiben számos karakterkódoló szabványt használtak szerte a világon. Sokáig a legszélesebb körben elfogadott szabvány az ASCII volt. Az ASCII problémája az, hogy csak viszonylag korlátozott számú karaktert kódolt – legfeljebb 256 karaktert. Ez kizárta a nem latin nyelveket, sok fontos matematikai és tudományos szimbólumot, sőt néhány alapvető írásjelet is.

Az ASCII angol és más, a latin ábécét használó nyelveken kívül az egyéb ábécéket használó nyelvcsoportok általában a saját karakterkódolásukat használják. Mivel ezeket a kódolási sémákat egymástól elkülönítve határozták meg, gyakran ellentmondásosak; lehetetlen volt egyetlen kódolási sémát használni több nyelvre egyszerre.

Az Unicode-t eredetileg úgy alakították ki, és továbbfejlesztik, különös tekintettel a kihívások leküzdésére. Az Unicode célja a uniersal, unimeghaltak, és univárakozási kód azonosító minden graféma számára, a világ minden nyelvén és írási rendszerénél.

UTF-8

Az Unicode-t számos karakterkódolási sémában alkalmazták, de a legszélesebb körben alkalmazott szabvány az UTF-8. Az UTF-8 szinte egyetemesvé vált a modern számítástechnika minden típusához.

Az UTF-8 karaktereket legfeljebb 4 8 bites kódblokk segítségével kódol. Az ASCII karakterenként csak 8 bitet használt. A korábban az ASCII-ben szereplő Unicode karaktereket az UTF-8-ban egyetlen 8 bites tömb reprezentálja, ugyanazok a 8 bit, mint az ASCII-ben. Ez az ASCII szöveget tovább kompatibilisvé teszi az UTF-8-ban. (Ez egyike annak a sok oknak, amely miatt az UTF-8 lett az univerzális szabvány – az átmenet viszonylag könnyű volt.)

A 8 × 4 séma több mint egymillió kódponttal rendelkezik az UTF-8-hoz, lehetővé téve az Unicode számára, hogy karaktereket kódoljon 129 szkriptből és írásrendszerből..

Források az Unicode megértéséhez

  • Bevezetés az írórendszerekbe és a Unicode-ba nagyon alapos, még ékesszóló magyarázat a karakterkódolásról általában, és különösen a Unicode-ról; Ha csak egy dolgot tudsz elolvasni a Unicode-on, akkor ezt olvassa el
  • A Unicode szabvány: A műszaki bevezetés a Unicode szabvány hivatalos magyarázata
  • A BMP-hez és azon túl! egy oktatóprogram a Unicode-ról, osztálytermi bemutatóra vagy önálló tanulásra
  • A Unicode oktatóanyaga elmagyarázza, hogyan működik a Unicode, beleértve az érdekes részleteket, például a karakterek kombinációját, és hogy a Unicode elemző motorjának hogyan kell működnie.

Könyvek az Unicode-ról

  • Jukka Korpela, a Unicode Explained, jó áttekintést nyújt az Unicode-ról és a végrehajtás során felmerülő különféle fejlesztési kihívásokról
  • Unicode Demystified: Richard Gillam praktikus programozói útmutatója a kódolási szabványhoz hasznos, ha kissé keltezett magyarázat az Unicode-ról, sok Java-központú megvalósítási specifikációval
  • Betűtípusok és kódolások, Yannis Haralambous, nemcsak az Unicode-ról szól, hanem lehet az a könyv, amelyet érdemes elolvasni; lefedi a szövegek kódolásának és számítógépes ábrázolásának történetét, elméleti és gyakorlati alapot biztosítva a Unicode és számos szorosan kapcsolódó téma megértéséhez.

Unicode referenciaanyag

Miután megismerte a Unicode-ot, többnyire azt kell találnia, hogy konkrét részleteket kell keresnie – például egy adott karakter pontos kódolását..

  • A C / C ++ Unicode Cheatsheet információt nyújt a Microsoft C / C ++ Unicode konvertálásáról
  • Az XML és Unicode Technology Reports egy műszaki jelentés, amely az XML és Unicode együttes használatának különféle aspektusaira terjed ki
  • A Decode Unicode online Unicode szótárt biztosít egy gyönyörű felhasználói felülettel, amely lehetővé teszi az összes meghatározott Unicode karakter megtekintését, még a helyi font támogatása nélkül is.
  • A Nyelvekre vonatkozó adatok kereshető információkat nyújtanak a Unicode karakterkészletek különböző nyelvekkel történő használatáról
  • A Unicode Navigator az Unicode karakterek szervezett listáját tartalmazza

Unicode eszközök

  • A Unicode Analyzer egy olyan Chrome böngésző-bővítmény, amely információkat nyújt a weboldalakon és a dokumentumokban található Unicode-szövegről
  • Karakter azonosító egy Firefox bővítmény, amely helyi menüt kínál a kiválasztott Unicode karakterekkel kapcsolatos további információk megtalálásához
  • Unicode karakterek beillesztéséhez az interneten a szöveges mezőkbe próbálkozzon a Unicode szimbólumokkal a Chrome-ban vagy a Unicode beviteli eszközzel a Firefox-hoz
  • Az UnicodeDataBrowser grafikus felhasználói felületet biztosít a UnicodeData.txt fájl könnyebb olvasásához
  • A Polyglot 3000 automatikusan azonosítja a szövegek nyelvét
  • A Unicode felsorolja az Unicode karakter billentyűzetkiosztását a különböző Unicode által támogatott szkriptekhez
  • A Babel egy Python könyvtár a nemzetközivé válás és a lokalizáció széles skálájához
  • A D-Type Unicode Text Engine egy C ++ könyvtár, amely kiváló minőségű Unicode szöveg elrendezésére, megjelenítésére és szerkesztésére szolgál bármilyen eszközön, platformon vagy operációs rendszeren.
  • A Nunicode egy C könyvtár az UTF-8 dokumentumok kódolására és dekódolására
  • A hordozható UTF-8 Unicode támogatást nyújt a PHP karakterláncokhoz
  • A Tesseract OCR optikai karakterfelismerést biztosít az Unicode szöveghez
  • A Popchar egy továbbfejlesztett karaktertérkép, amely lehetővé teszi a karakterek könnyű megtalálását és beírását az Unicode tér teljes tartományából
  • A Unicode Utilities számos érdekes és hasznos online eszközt kínál a Unicode-val való együttműködéshez
  • Az Edicode rugalmas online Unicode billentyűzetet kínál a szöveg beírásához különféle nemzetközi szkriptek felhasználásával
  • A Quickkey egy rugalmas billentyűzet-kiterjesztés az első 65 000 meghatározott Unicode karakter beírásához
  • A Unicode Code Converter minden beírt karakterkódot ugyanazon karakter több különféle kódolásá konvertálja
  • A CharFunk egy JavaScript segédprogram, amely számos érdekes ellenőrzést és műveletet végrehajt Unicode karakterekkel
  • A Kreative Recode a különböző kódolásokból származó szöveges fájlokat Unicode-ba konvertálja
  • A BabelMap Online egy böngészőn belüli Unicode billentyűzetet kínál, megjelenítő karakterekkel, hexa vagy decimális kódolással

Szöveg- és kódszerkesztők

A legtöbb mai szövegszerkesztő, kódszerkesztő és IDE alapértelmezés szerint Unicode-ot használ, vagy könnyen kezelheti az Unicode-ot. A Sublime, a Notepad ++, az Atom és az Eclipse alapértelmezett karakterkódolása UTF-8. Az UTF-8 használatához a Vim és az Emacs módosításához szüksége lehet:

  • Unicode használata az Emacs segítségével
  • Unicode használata a Vim segítségével

Van egy maroknyi kód- és szövegszerkesztő, amelyeket kifejezetten a kibővített Unicode karakterkészlet kezelésére terveztek:

  • A MinEd egy Unicode szövegszerkesztő, amely kontextusban támogatja a karakterek beillesztését a Unicode karaktertér teljes tartományából
  • A Classical Text Editor egy fejlett szerkesztő, amely a szövegek kritikus és tudományos kiadásaival foglalkozik, beleértve a többnyelvű szövegeket, a Unicode karakterkészlet széles skáláját használva.

Unicode Betűtípusok

A betűtípusok és az Unicode közötti kapcsolat kissé ferde. Az Unicode-t úgy hozták létre, hogy visszamenőleg kompatibilis legyen az ASCII-val – az ASCII-ban formázott szöveg gyakorlatilag probléma nélkül dekódolható Unicode-ként. És az Unicode-kódolt szöveg ASCII betűkészletekkel jeleníthető meg, mindaddig, amíg csak az ASCII-ben megjelenő kis karakterkészletet használják.

Manapság a legtöbb számítógépen elérhető betűkészletek Unicode-val vannak kódolva. Tehát ebből a szempontból a legtöbb betűtípus „Unicode betűkészlet”. A legtöbb betűkészlet azonban nem támogatja a teljes Unicode szabvány különösen nagy részét.

Általában ez nem jelent problémát; valaki, aki több nyelven vagy kibővített karakterkészlettel ír szöveget, több különféle betűtípust használhat – egyet latin szkriptekhez, egyet minden CJK nyelvhez, és egy matematikai szimbólumokhoz (például). Időnként azonban hasznos lehet olyan egyedi betűtípusok használata, amelyek a Unicode karakterterület nagy százalékát tartalmazzák. Erre akkor lehet szükség, ha egyszerű szöveges és forráskódú környezetben dolgozunk, ahol több betűkészlet használata nem lehetséges, vagy amikor a különféle szkriptek közötti vizuális egység különösen fontos.

Az alábbiakban említjük meg a legjelentősebb betűtípus-projekteket, amelyek kiterjesztett Unicode támogatást nyújtanak. A Unicode betűtípusok ezen az oldalon a teljes listát, ideértve az elavult és elavult betűkészleteket is tartalmazhatja. Az ázsiai nyelvek betűkészítéséhez lásd a CJK betűkészletek listáját.

  • Az Everson Mono egy egyszintes betűtípus, amelyet az Unicode szabvány egyik kezdeményezője hozott létre; kijelentette, hogy a karakterjeleket szolgáltatja a Unicode karakterterület lehető legnagyobb részéhez, és (az írástól kezdve) 92 Unicode karakterblokk támogatott.
  • A Noto a Google által kifejlesztett nagyszámú betűkészlet, amely együttesen támogatást nyújt a Unicode karakterkészletek túlnyomó többségének, azzal a szándékkal, hogy a teljes Unicode szabványt támogatja.
  • A Deja Vu Fonts egy betűtípuscsalád, amely széles körű lefedettséget nyújt az Unicode szabványnak, Serif, Sans és Monospace verziókkal.
  • A GNU FreeFont egy betűtípuscsalád, amely Serif, Sans és Mono típusú arcokat biztosít 37 írásrendszerhez és 12 Unicode szimbólumtartományhoz.
  • A GNU Unifont egy egyszintes, bittérképes betűkészlet, teljes lefedettséggel a Unicode 8.0 Basic többnyelvű síkhoz, széles, de hiányos lefedettség a kiegészítő többnyelvű síkhoz.

Számos érdekes betűtípus létezik, amelyek speciális felhasználásra kódolják a Unicode szabvány egy adott részhalmazát.

  • A Junicode betűkészlet a középkori szakemberek számára
  • A Last Resort a „végső lehetőség egyik betűkészlete”; a hagyományos karakterjelek helyett minden karakterjel ténylegesen információkat mutat magáról az Unicode karakterről
  • Az Unicode betűkészletek az ősi szkriptekhez egy olyan projekt, amely betűkészlet létrehozására szolgál több ősi és klasszikus ábécé számára
  • Az Unimath Plus kibővített tudományos és matematikai szimbólumokat kínál

És itt van néhány további Unicode betűkészlet-forrás, ha még mindig nem találja meg azt, amit keres:

  • SIL Betűtípusok betűkészlete különféle alul támogatott nyelvek számára, amelyeket a SIL International hozott létre, egy nonprofit kisebbségi nyelvi közösség
  • Az Unicode karaktertartományok és az őket támogató Unicode betűtípusok segítenek betűtípus megtalálásában az Unicode karakterek bármely tartományához.

Emoji források

A hangulatjelek azok a vicces kis mosolygó arcok és remek jelek, amelyeket szöveges üzenetbe helyezhet. Valójában a Unicode szabvány része. A Unicode hangulatjelek részét nem egyetemesen támogatják, ezért ha be szeretné illeszteni az hangulatjeleket alkalmazásába vagy webhelyére, szüksége lehet segítségre. Itt vannak olyan források, amelyek segítenek a Unicode hangulatjelek használatában és felépítésében.

Emoji referencia

  • Az Emojipedia egy hangulatjel-karakterek kereshető adatbázisa
  • Tudom hangulatjeleket? információt nyújt az Unicode hangulatjelek natív támogatásáról iOS, Android, OS X és Windows rendszereken, valamint a nagyobb böngészőkön
  • A WTF Emoji Alapítvány egy kissé komoly szervezet, amely az emoji továbbfejlesztésére szentelt; futtatják az Emoji Dictionary-t.
  • Az Emoji cheat sheet gyors útmutatást nyújt az Emoji beírási kódokhoz

Emoji könyvtárak

  • Vegye fel a hangulatjeleket az alkalmazásokba, és fordítson le több szállítói standard között, ezzel a PHP hangulatjel-könyvtárral; vagy próbáld ki ezt a PHP7 hangulatjel-könyvtárat, amely lehetővé teszi, hogy név szerint a hangulatjelekre hivatkozzon a kódjában
  • Az Emoji for Python támogatja a hivatalos Unicode hangulatjeleket és több álnév-készletet is; A Django fejlesztői a django-emoji csomagot is használhatják
  • Emoji Golang Emoji támogatást nyújt a Go programozási nyelvéhez
  • a Rubyban többféle Emoji támogatás is létezik, de valószínűleg a Github általi felhasználás a legjobb
  • Az Emoji-Java Emoji támogatást nyújt a Java-ban
  • A Coloremoji.sty megkönnyíti a színes színes hangulatjelek beillesztését a LaTeX dokumentumokba
  • Npm, a Node.js csomagkezelő rendszere számos hangulatjel-csomagot tartalmaz:
    • A hangulatjelek és a csomópont hangulatjelek alapvető támogatást nyújtanak a hangulatjelekhez,
    • Az Ember-cli-emoji az Emojify.js-vel együttműködve hangulatjel-segítőket biztosít az Ember.js-alkalmazásokhoz.
    • A Markdown-it-emoji hangulatjelekkel egészíti ki a markdown-it Markdown-elemzőt
  • Az Emoji Syntax egy buta könyvtár az Atom szövegszerkesztő számára, amely hangulatjeleket ad hozzá a kódsorokhoz azok jelentése alapján.

Emoji billentyűzetek és gyűjtemények

  • Az EmojiXpress iOS számára egy Emoji gyűjtemény és billentyűzet az iPhone számára
  • Az Emojione egy platformon átívelő Emoji kollekció, amely a Creative Commons licenc nélküli műalkotásait tartalmazza a fejlesztők számára
  • Az iDiversicons különféle Emoji karakterek és iPhone billentyűzet széles skáláját kínálja.

MIME típusok

A MIME a „többcélú internetes e-mail kiterjesztések” kifejezést jelenti. Ez az internetes szabvány, amelyet az online továbbított különféle fájltípusok azonosítására használnak. Eredetileg azt az e-mailt fejlesztették ki, amelyet az SMTP (Simple Mail Transfer Protocol) útján küldtek, amely az e-mail továbbítás internetes szabványa. Manapság a MIME rendkívül fontos más kommunikációs protokollokban, mint például a HTTP.

MIME története

Az ASCII és a karakterkódolás történetét már tárgyaltuk. De az információküldés történetén ennél sokkal több van.

Az idővel az üzenetünk egyre összetettebbé vált, és nyilvánvalóvá vált, hogy ez a szabványos formátum nem elég. A hang- vagy videofájlokat tartalmazó multimédiás képeket egyáltalán nem határozták meg. Ugyanez vonatkozik a nyelvekre, amelyek nem használják az angol ábécét. A helyzet végül megváltozott, amikor két ember egyesítette erőit: Nathaniel Borenstein és Ned Freed.

Javaslatuk újradefiniálta az üzenetek formátumát annak érdekében, hogy az e-mail több objektumot tartalmazzon egyetlen üzenetben; nem ASCII karakterek, valamint nem angol nyelvek használata; valamint a képek, hang és videó használata. Ezzel született a MIME, amely 1993-ban lett a hivatalos szabvány.

A javaslat meghatározta a 7 bites, 8 bites, base64, bináris és idézettel nyomtatható kódolási szabványokat is. Ezeknek a kódoló szabványoknak azt kellett biztosítaniuk, hogy minden adat valóban megtörténjen. Ezenkívül információkat tartalmazott a Content-Type fejléc használatáról, amely a továbbított adatok típusának megfelelő azonosításához szükséges.

Melyek a MIME típusok??

A MIME típusok olyan azonosítók, amelyek segítségével azonosítják a sok fájlformátumot, amelyeket minden nap továbbítanak az interneten. Ezeket az IANA (Internet Assigned Numbers Authority) szabványosítja. A MIME típusokat először az IETF (Internet Engineering Task Force) által kiadott Megjegyzéskérdés: 2045 (RFC 2045) közzétette és ilyenként nevezi meg, amely a Borenstein és a Freedom által benyújtott hivatalos javaslat..

Szerkezet

A MIME típusok egy típust és egy altípust tartalmaznak, amelyek két karakterláncot tartalmaznak előrejelző perjelrel. A típus egy kategóriát jelöl és diszkrét vagy többrészes lehet. Minden típusnak van egy meghatározott altípusa. A MIME típusokat hagyományosan kisbetűkkel írják.

A diszkrét típusok közé tartozik a szöveg, kép, audio, video és alkalmazás. A többrészes típusok olyan dokumentumkategóriát képviselnek, amelyet külön részekre bontanak, és gyakran különféle MIME-típusokat tartalmaznak. Ide tartoznak az űrlapadatok és a byterange-ok.

Egyes MIME típusok előtagja x vagy vnd. Az x előtag azt jelenti, hogy még nem regisztrálták az IANA-ban, és a vnd jelzi az eladó előtagját.

Általános MIME típusok

Alkalmazás:

  • alkalmazás / msword (.doc)
  • application / vnd.openxmlformats-officedocument.wordprocessingml.document (.docx)
  • application / vnd.openxmlformats-officedocument.wordprocessingml.template (.dotx)
  • application / vnd.ms-powerpoint (.ppt)
  • alkalmazás / ecmascript (.es)
  • application / x-javascript (.js)
  • alkalmazás / oktet-stream (.bin, .exe)
  • jelentkezés / pdf (.pdf)
  • alkalmazás / postscript (.ps, .ai, .eps)
  • alkalmazás / rtf (.rtf)
  • alkalmazás / x-gtar (.gtar)
  • alkalmazás / x-gzip (.gz)
  • alkalmazás / x-java-archívum (.jar)
  • application / x-java-serialized-object (.ser)
  • application / x-java-vm (.class)
  • alkalmazás / x-tar (.tar)
  • alkalmazás / zip (.zip)
  • alkalmazás / x-7z-tömörített (.7z)
  • alkalmazás / x-rar-tömörített (.rar)
  • alkalmazás / x-sokkhullámú vaku (.swf)
  • application / vnd.android.package-archive (.apk)
  • alkalmazás / x-bittorrent (.torrent)
  • alkalmazás / epub + zip (.epub)
  • application / vnd.ms-excel (.xsl)
  • application / x-font-ttf (.tff)
  • alkalmazás / rss + xml (.rss, .xml)
  • alkalmazás / vnd.adobe.air-alkalmazás-telepítő-csomag + zip (.air)
  • application / x-debian-pack (.deb)
  • alkalmazás / json (.json)

Hang:

  • audio / x-midi (.mid, .midi)
  • audio / x-wav (.wav)
  • audio / mp4 (.mp4a)
  • audio / ogg (.ogg)
  • audio / MPEG (.mp3)

Kép:

  • kép / bmp (.bmp)
  • kép / gif (.gif)
  • image / jpeg (.jpeg, .jpg, .jpe)
  • kép / tiff (.tiff, .tif)
  • image / x-xbitmap (.xbm)
  • kép / x-ikon (.ico)
  • image / svg + xml (.svg)
  • kép / png (.png)

Szöveg:

  • szöveg / html (.htm, .html)
  • szöveg / sima (.txt)
  • szöveg / gazdag szöveg (.rtf, .rtx)
  • szöveg / css (.css)
  • szöveg / csv (.csv)
  • szöveg / naptár (.ics)

Videó:

  • videó / MPEG (.mpg, .mpeg, .mpe)
  • video / ogg (.ogv)
  • videó / gyors idő (.qt, .mov)
  • video / x-msvideo (.avi)
  • videó / mp4 (.mp4)
  • video / webm (.webm)

Erőforrások

A MIME típusok lehetővé tették, hogy jobb és gazdagabb e-mail élményt kapjunk. Az erőforrások alábbi listája segít mélyebben megismerni, hogy miként és miért jöttek létre, valamint hogyan kell megfelelően konfigurálni a webszervert a MIME típusú támogatáshoz, és még sok más.

Online források

A következő lista linkeket tartalmaz az öt részből álló javaslathoz, amely a MIME standard tervezetévé vált.

  • RFC 2045 (PDF): A javaslat első része meghatározza a MIME üzenetek szerkezetének leírására használt fejléceket..
  • RFC 2046 (PDF): a második dokumentum meghatározza a MIME adathordozó gépelési rendszer általános felépítését és a médiatípusok kezdeti készletét.
  • RFC 2047 (PDF): a javaslat harmadik része olyan kiterjesztéseket ír le, amelyek lehetővé teszik a nem US-ASCII szöveges adatokat az internetes levél fejlécében.
  • RFC 2048 (PDF): a negyedik rész leírja, hogyan regisztrálhatók az új MIME típusok az IANA-n.
  • RFC 2049 (PDF): az ötödik dokumentum a MIME megfelelőségi kritériumait írja le, példákkal a MIME üzenet formátumaira.
  • Médiatípusok: az összes médiatípus teljes listája, amely linket is tartalmaz az új médiatípusok regisztrálására szolgáló alkalmazáshoz.
  • A MIME srácok: Hogyan változtak meg két internetes guru örökre az e-mail: Nathaniel Borenstein és Ned Freed interjúin alapuló cikk, amely érdekes betekintést nyújt munkájukba.

oktatóanyagok

A következő források hasznos útmutatásokat nyújtanak a MIME típusok kezeléséről, a megfelelő szerverkonfigurációról és egyebekről.

  • A kiszolgáló MIME-típusainak megfelelő konfigurálása: megvitatja, hogy a webmestereknek miért kell gondoskodniuk a webszerver megfelelő konfigurálásáról, mivel új MIME-típusok kerülnek hozzáadásra, különösen a Gecko-alapú böngészők esetében.
  • A HTML audio és video elemek által támogatott média formátumok: felsorolja a MIME típusokat, amelyeket a HTML5 új audio és video elemek támogatnak
  • Mi a MIME szippantás: ez a cikk részletes magyarázatot nyújt a MIME szippantásról és arról, hogyan lehet elkerülni a hozzá kapcsolódó sebezhetőségeket.
  • Magyarázott MIME-típusok: Miért nincs szükség a Linux és Mac OS X fájlkiterjesztésekre: érdekes felolvasás, amely magyarázza a Windows és a Linux / Mac OS X számítógép közötti különbségeket..
  • A megfelelő MIME-típus kiválasztása a JavaScripthez: Jelenleg egynél több MIME-típus van a JavaScript-hez. Ez az oktatóanyag ismerteti az egyes felhasználási eseteket.

Könyvek

Habár nincs olyan könyv, amely kizárólag a MIME-típusoknak szólna, még mindig van rendes számú könyv szorosan kapcsolódó témákban, amelyek néhány fejezetet szentelnek nekik.

  • Lawrence Hughes internetes e-mail protokolljai, szabványai és megvalósítása (1998): fejlettebb felhasználók számára, ez a könyv megerősíti az e-mail szoftverek fejlesztéséhez szükséges alapvető koncepciók ismereteit, és alaposan leírja a legfontosabb internetes e-mail protokollokat és kiterjesztéseket, például az SMTP, POP3, IMAP , MIME és DSN.
  • Internetes e-mail programozás (1999), készítette: David Wood: alapvető útmutató, amely magában foglalja az összes fontos koncepciót, amely az alkalmazások e-mail képességekre történő felépítéséhez szükséges. A témák között szerepelnek különféle e-mail protokollok, e-mail formátumok, beleértve a MIME típusokat, és rengeteg példa.
  • Alapvető e-mail szabványok (1999), Peter Loshin: ez a könyv kötelező, mindenki számára, aki alaposabb megértést szeretne kapni az e-mail szabványokról. Átfogó elemzést nyújt az IETF által közzétett legfontosabb RFC-kről, valamint azok lehetséges felhasználásáról. A CD-n található könyv teljes kereshető digitális változatát is tartalmazza.
  • MH & xmh (2006), Jerry Peek: ez a könyv ingyenesen elérhető online és a GNU-GPL licenc alatt jelent meg. A harmadik fejezet részletesen ismerteti a MIME típusokat és a többrészes üzeneteket

Eszközök

Az alábbi linkek néhány hasznos eszközt tartalmaznak a MIME típusok érvényességének ellenőrzéséhez.

  • Milyen MIME-típusokat támogat a böngésző: online eszköz, amely megmondja, hogy melyik MIME-típust támogatja böngészője, mihelyt betölti az oldalt.
  • MIME Validator: ingyenes online MIME validátor, amely ellenőrzi, hogy a MIME üzenetek megfelelnek-e az IETF szabványoknak..
  • MIME: újabb ingyenes online ellenőrző bármely fájlhoz.

Bővítse ismereteit a MIME típusokról

A MIME típusok jelentéktelennek tűnhetnek a felszínen, de jelentős változásokat hoztak az e-mail üzenetküldés működésében. Az erőforrások e listája tovább vonzza a kíváncsiságot, és mélyebb megértést nyújt Önnek arról, hogy az interneten keresztül továbbított e-mailek és fájlok hogyan változtak az évek során.

összefoglalás

A legtöbb ember csak gépel, és nem igazán gondolkodik azon, hogy mi történik. Néhányan vágynak arra, hogy gondolkodjanak a betűkészlet és a tipográfia finomságain.

De még ennél is kevesebb az a szám, akik tudják, vagy szeretnének tudni, mi történik a színfalak mögött – hogy a gombnyomás hogyan váljon betűvé a számítógép képernyőjén.

Mindenki számára ez átlátszó vagy triviális.

De amint bebizonyítottuk, a nyelv ábrázolási folyamata aligha triviális, és hatalmas mennyiségű munka ment annak átláthatóvá tételéhez. A Unicode Consortium számtalan fejlesztővel, tervezővel és nyelvészekkel lehetővé tette bárki számára, hogy bármilyen karaktert írjon, bármilyen nyelvről, bármilyen szkriptre, bármilyen számítógépre.

Ez figyelemre méltó eredmény, és szükséges lépés az egyetemes írástudás, valamint a számítógépekhez és az internethez való egyetemes hozzáférés felé.

GYIK

K. Mi a különbség az ASCII, a Unicode és az UTF-8 között?

A. Az ASCII az 1960-as évek régebbi szabványa, míg az Unicode az 1980-as évek végén jött létre.

Az ASCII csak 128 vagy 256 karakterből áll, de az Unicode több mint 10 000 karakterből áll.

Az Unicode a karaktertábla, az UTF-8 (vagy UTF-16 vagy UTF-32) a kódolás szintje. A Unicode 0-256 és az ASCII majdnem azonosak, csak néhány kisebb különbséggel a vezérlő karakterek között.

Az UTF-8 a leggyakoribb kódolás az interneten manapság – és az alapértelmezett.

Kérdés: Meg kell jelentenem, hogy milyen kódolási típust használom a weboldalamhoz?

A. Csak akkor, ha tudja, hogy egyedi kódolási típust kell használnia.

Ha nem deklarál egyet, a legtöbb böngésző alapértelmezés szerint az UTF-8 lesz. Ha weblapot hoz létre idegen nyelven, különösen nem latinul, akkor ellenőrizze, hogy UTF-8-at használ, vagy válasszon speciális karakterkészletet.

Kérdés: Szeretnék-e megjegyezni az ASCII-kódokat a HTML írásához?

A. Csak akkor, ha rendkívül hatékonyan próbál lenni.

A mai webhelyek többsége dinamikus, és HTML-kódot generál az Ön számára olyan rendszereken keresztül, mint egy tartalomkezelő rendszer (CMS). Ha fejlesztő vagy, akkor valószínűleg más programozási nyelveket fog használni a HTML mellett, és ezeknek a nyelveknek speciális módjai lehetnek az ASCII szimbólumok generálására..

Végül, amint azt fentebb tárgyaltuk, ezek közül a kódok közül sok speciális karakterneveket használ HTML-ben az ASCII-számok helyett.

K. Különbözik a karakterkódolás a különböző operációs rendszereken?

A. Némileg.

Az Unicode kissé különbözik a Windows vs Unix / Linux rendszerektől. Például a Windows az UTF-16LE, míg a Linux általában az UTF-8.

Most természetesen az operációs rendszer által használt kódolás eltérhet a weboldalon található kódolástól, de az operációs rendszer és a webböngésző együttesen alakítják át a karakterkódokat valami, amit a számítógép képes megjeleníteni.

Időnként a régebbi operációs rendszerekben ez a konvertálás nem működik, és csak üres karaktereket látsz. (Például, láthat egy külföldi webhelyet a Windows XP rendszeren.)

Q. Az ASCII Art fantasztikus! Hol készíthetek saját?

A. Az AsciiWorld.com számos nagyszerű galériát és eszközt tartalmaz a szoftverrészlegben, például átalakítókat és „festőket”. Érezd jól magad!

Egyéb érdekes dolgok

Több útmutató, oktatóanyag és infographics található a kódoláshoz és a weboldal fejlesztéshez:

  • CSS3 – Bevezetés, útmutatók és források: ez egy remek hely a weblapok elrendezésének megtanulására.

  • PostScript bevezetés és források: mindent megtudhat az oldal megjelenítési nyelvéről, amely megváltoztatta a világot.

  • Lorem Ipsum: Tanulja meg, hogyan lehet a „dummy text” -et használni a formatervezéshez, mielőtt a tartalom meg lett írva.

HTML kezdőknek – Végső útmutató

Ha igazán szeretne HTML-t tanulni, akkor készítettünk egy könyv hosszú cikket, HTML kezdőknek – Végső útmutató. És ez valóban a végső útmutató; az elejétől a mesterig elvisz.

HTML kezdőknek - Végső útmutató
HTML kezdőknek – Végső útmutató

Webdiagnosztika, amelyet soha nem fog elfelejteni

A Unicode előtt gyakori volt olyan webhelyek felkeresése, ahol az egész szöveget üres négyzetek jelölték. A dolgok sokat megváltoztak. Infographics Web Design Trendsünkben, amelyet Soha nem fogsz elfelejteni, áttekintjük, hogyan működött az internet korábban.

Webdiagnosztika, amelyet soha nem fog elfelejteni
Webdiagnosztika, amelyet soha nem fog elfelejteni

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map