ASCII Kodiranje: Početnici, novaci … Ovdje imamo sve potrebne podatke.

Objava: Vaša podrška pomaže održavanju web mjesta! Naplaćujemo naknadu za preporuku za neke usluge koje preporučamo na ovoj stranici.


ASCII je vrsta kodiranja znakova koja se koristi za računala za pohranjivanje i dohvaćanje znakova (slova, brojeva, simbola, razmaka, udubljenja itd.) Kao bitnih obrazaca za pohranu u memoriji i na tvrdom disku.

“Kodiranje znakova” na visokoj razini znači pretvorbu simbola u binarni broj i korištenje “mape znakova” za čitanje binarnog broja kao vrste slova.

A MIME vrste omogućuju korisnicima slanje podataka izvan znakova, poput slika i videozapisa.

ASCII, kodiranje znakova, MIME tipovi

Kodiranje znakova

Najraniji oblik kodiranja znakova potiče još od električnog telegrafa. U stvari, Morseov kôd, a kasnije i Baudot kod, bili su neki od prvih standardiziranih kodova znakova ikada kreiranih.

Drugi sloj kodiranja zvan enkripcija ili šifriranje uspostavili su i tadašnji vojnici, ali to je prilično drugačija tema.

Tek smo 1950-ih započeli moderni proces prema ASCII. IBM je ovo započeo razvijanjem shema kodiranja za upotrebu na svojim računalima serije 7000.

IBM-ov binarni kodirani decimalni broj (BCD) koristio je četverosobno kodiranje na punchcards. Bio je to način pohranjivanja decimalnih brojeva u binarni oblik.

Dakle, umjesto brojeva od 0000 (0) do 1111 (15), oni su prelazili od 0000 (0) do 1001 (9) – svaka četiri bita predstavljaju jednu znamenku.

Kasnije je IBM stvorio Proširenu verziju BCD-a pod nazivom Prošireni binarni kodirani decimalni kôd za razmjenu (EBCDIC). Bio je to 8-bitni sustav kodiranja za sve standardne znakove za ispis.

Iste godine 1963. uveden je ASCII.

Koristi 7-bitnu shemu kodiranja. To predstavlja 128 različitih brojeva.

Ovaj 7-bitni oblik broja može se činiti čudnim. Uostalom, nisu li računala sva 8-bitna ili 16-bitna ili 32-bitna itd?

Danas su. Ali rana računala nisu izgrađena na taj način.

Nadalje, memorija na računalima bila je dragocjena i nije bilo razloga da trošite dodatni zalogaj ako vam ne treba. 6-bitni kod (koji je postojao) ne bi obuhvatio sva velika i mala slova, brojeve i osnovne interpunkcijske znakove. Ali 7-bitni kôd je učinio – ima prostora za uštedu.

Kako su se računala smjestila u 8-bitnu (1-bajtnu) strukturu, ASCII se postupno pretvorio u neslužbeni 8-bitni kod, gdje ostalih 128 znakova nije bilo standardizirano.

To je stanje postojalo neko vrijeme. 1991. godine 8-bitni je postao službeni format kakav održava ISO (Međunarodna organizacija za standardizaciju) za UTF-8.

U ovom trenutku, međutim, bio je izazov da samo jedna abeceda može biti podržana 7 ili 8-bitnim kodiranjem.

Da bi se podržao širi sloj jezika, dizajnirana je shema kodiranja Unicode, zajedno s Univerzalnim setom znakova. Unicode ima nekoliko tipova kodiranja, UTF-8 je 8-bitno kodiranje koje je kompatibilno sa ASCII i koje je danas postalo zamijenilo ASCII kao prevladavajući standard za kodiranje znakova na webu..

Rast UTF-8

Uz to, UTF-16 i UTF-32 postali su korišteni za jezike s puno znakova. Međutim, u kineskom, japanskom i arapskom jeziku svi se mogu prikazati u UTF-8.

Kao rezultat toga, UTF-8 je najčešći oblik kodiranja na webu. A za govornike engleskog jezika stvari su posebno jednostavne, jer su prvih 128 znakova ASCII jednaki onima u Unicode-u.

Dakle, za upotrebu u HTML-u referenca na ASCII tablicu za stvaranje znaka će raditi bez obzira na format kodiranja koji koristite.

Tamo gdje se ASCII uklapa

ASCII označava “Američki standardni kodeks za razmjenu informacija”, a kreirao ga je Američki savez za standarde (kasnije preimenovan u Američki nacionalni institut za norme).

Standard ASCII pokrenut je 1960., a objavljen 1963. Bio je to proširenje telegrafskih kodova i prvi put ga je koristio podatkovni servis Bell.

Tijekom godina napravljene su veće revizije. Do 2007. bila je najčešće korišteno kodiranje znakova na webu, ali zamijenjeno je UTF-8.

Prebacivanje weba s ASCII-a i Microsoftovog ANSI-a na UTF-8 može se u velikoj mjeri pripisati Googleovim inicijativama, jer je upotreba interneta postajala sve međunarodnija i ASCII je mogao prikazivati ​​samo latinične znakove.

Važno je napomenuti da je UTF-8 vrsta kodiranja, dok je Unicode skup znakova; jer je prvih 128 znakova Unicode-a isto što i ASCII, prihvatljivo je uputiti se na ASCII tablicu prilikom generiranja znakova u HTML-u.

ASCII ima mogućnost korištenja “slijeda bijega” za prikazivanje alternativnih abeceda, što mu je omogućilo da postane međunarodni standard, ali Unicode to rješava izravnije.

Unicode je nastao iz Applea 1987. godine, a projekt je postao Konzorcij Unicode 1991. ASCII je kreirao ASA, ali njegovo daljnje usavršavanje nastavilo je kao dio deklaracija iz ISO-a.

Kodirajuće ime UTF-8 koristi se svim standardima koji su u skladu s Internet Assigned Numbers Authority (IANA), što znači sve HTML, CSS i XML. IANA je odjel šireg ICANN-a, što je neprofitna organizacija koja određuje internetski protokol i imena domena.

Da zaključimo, ASCII se razvio iz telegrafskog koda u 60-ima, odrastao je i postao dio Unicode skupa znakova, koji koristi UTF-8, najdominantniji format kodiranja na webu.

Imena domena i kôd web stranice ovise o ispravnoj radu ove jedinstvene mape znakova.

To znači da u samom korijenu modernog interneta postoji format znakova izumljen 1870-ih, informatiziran kao ASCII 1960-ih, moderniziran za web s Unicode 1990-ih, a široko prihvaćen putem većinske upotrebe UTF-8 u 2007.

Kontrolni znakovi vs znakovi za ispis

Postoje dvije vrste znakova u ASCII, znakovi za ispis i kontrolni znakovi.

Kontrolni znakovi definiraju brojeve 0-31 i 127. Kontrolni znakovi uključuju sve dijelove pisanja koji omogućuju nove odlomke, kartice, kraj redaka, separatore datoteka i puno komada koji su uglavnom prozirni.

Ovi kontrolni znakovi nastali su u vrijeme kada su ispisane kartice predstavljale velik dio računarskog procesa. Neke od ovih karakteristika od tada su zamijenjene, ali puno dijelova za oblikovanje linija i danas postoji. Kod 127 zapravo je kod za brisanje (samo u stvarnom ASCII, a ne ANSI ili Unicode).

Svi znakovi za ispis su ono što biste mogli očekivati. Postoje svi mali slova (a-z) i velika slova (A-Z), zajedno s brojevima, simbolima i interpunkcijskim znakovima – u osnovi sve što se vidi na tipičnoj tipkovnici. Ti se glavni znakovi sastoje od svih napisanih riječi.

Korištenje ASCII u XML i HTML

Svaka HTML stranica ima dodijeljen oblik kodiranja znakova.

Ako nije drugačije navedeno, HTML kodiranje prema zadanom će biti UTF-8. Za korištenje čistog ASCII, ANSI ili bilo kojeg posebnog, jedinstvenog formata, sve što trebate učiniti je imati deklaraciju u metaoznaci.

Za HTML 4:

Za HTML5:

U oznaci skupa možete upotrebljavati UTF-8, ANSI ili ASCII pomoću charset ="nas-ASCII" ili možete potražiti određeni skup znakova koji se koriste, obično deklariranjem ISO broja. Potpuni popis nalazi se na stranici IANA skupova znakova.

Format unosa koda znakova

No općenito, kad se netko odnosi na korištenje ASCII koda, htjet će da razjasne znače li TRUE US-ASCII s metaoznakom ili ako samo traže od vas da prikažete poseban znak.

U HTML-u, bilo kada želite koristiti poseban znak, poput recimo centa simbola (symbol) ili obrnutog znaka upitnika (¿) – općenito biste mogli koristiti Unicode simbol ili US-ASCII (8-bitni) slovom upišite referencu poput ove:

¢ u HTML-u izgleda ovako: ¢

¿U HTML-u izgleda ovako: ¿

Dakle, započnite s an &#, nakon čega slijedi četveroznamenkasti broj, a završava s zarezom (-.

Na ovaj način možete prikazati znakove na temelju njihovog ASCII / Unicode broja.

Naravno, kontrolni znakovi će obavljati funkciju oblikovanja ili uopće neće raditi, ovisno o tome koji koristite i koji je pravi skup znakova naveden u vašoj meta oznaci.

Tako u HTML-u vidite “&Broj “, ali kad se prikaže u vašem pregledniku, vidjet ćete znak.

Znakovi HTML posebnog entiteta

Recimo, na primjer, da želite pokazati samo & simbol na vašoj stranici.

Ne možete ga samo unijeti u HTML, već možete upisati odgovarajući ASCII ili Unicode.

HTML je označni jezik, tako da dok normalna slova rade dobro, posebni znakovi i posebno < > zagrade – od presudne su važnosti za to kako preglednik čita i prikazuje HTML.

Ipak ne morate uvijek upisivati ​​Unicode / ASCII referentni broj. Za HTML 4.0 i novije verzije postoje posebni entiteti koji djeluju slično kao Unicode referenca, ali umjesto memoriranja broja memorirate riječ.

¢ u HTML-u izgleda ovako: ¢

¿ u HTML-u izgleda ovako: ¿

Potpuni popis tih znakova nalazi se u konzorciju W3.

Referentna tablica

Uz sve te upute, možda ćete jednostavno potražiti lako mjesto za pronalaženje ASCII ili Unicode reference. Ne tražite dalje, ovdje imamo reference 000-127, a puni Unicode format možete pronaći na Wikipediji.

Imajte na umu da znakovi 000-032 i 127 uglavnom nisu za ispis i da su stoga označeni s „NA“.

ASCII

tablica.wiht002 {
razmak granice: 0px;
granična kolaps: slom;
margina-lijevo: auto;
margina-desno: auto;
marža-dno: 1,5em;
poravnavanje teksta: središte;
}

stol, tr, td
{
padding: 0px;
marža: 0px;
}
td.bor
{
obrub lijevo: 1px krutina # 000;
padding-left: 1em;
margina-desno: 1em;
}
td.break
{
margina-lijevo: 2em;
margina-desno: 2em;
}
td.sep
{
obrub-dno: 1px krutina # 000;
}
td.sepbor
{
obrub-dno: 1px krutina # 000;
obrub lijevo: 1px krutina # 000;
padding-left: 1em;
margina-desno: 1em;
}

0NA32NA64@@96``
1NA?33!!6597
2NA?34""66BB98bb
3NA?35##67CC99cc
4NA?36$$68DD100dd
5NA?37%%69EE101ee
6NA?38&&70FF102ff
7NA?3971GG103gg
8NA?40((72HH104hh
9NA41))73jaja105jaja
10NA42**74JJ106jj
11NA43++75KK107kk
12NA44,,76LL108ll
13NA4577MM109mm
14NA?46..78NN110nn
15NA?47//79OO111oo
16NA?480080PP112pp
17NA?491181PP113qq
18NA?502282RR114rr
19NA?513383SS115aa
20NA?524484TT116tt
21NA?535585UU117uu
22NA?546686VV118vv
23NA?557787WW119ww
24NA?568888xx120xx
25NA?579989YY121yy
26NA?58::90ZZ122zz
27NA?59;;91[[123{{
28NA?60<<92\\124||
29NA?61==93]]125}}
30NA?62>>94^^126~~
31NA?63??95__127NA?

ASCII Alati i resursi

Puno je povijesti o tome kako su se razvijali znakovni kodovi i o organizacijama koje te standarde drže zajedno za ostale nas. S većinom internet programera i W3C-a koji se nastanjuju na UTF-8, barem trenutnu budućnost, tako će se stranice kodirati.

Trebat će vam neki resursi koji će vam pomoći iako ako pokrenete ručno kodiranje u drugim formatima, ili može biti lijepo samo ako imate sveobuhvatnu referencu.

Popis resursa

  • Stranica seta znakova IANA

  • HTML Specijalni znakovi konzorcija W3

  • Cijeli Unicode format na Wikipediji

  • ASCII tablica od samo 0130-0255

  • Povijest ASCII na ASCII-Svijetu

  • Popis znakova Unicode na Wikipediji.

ASCII čl

Nijedan sažetak ASCII-a ne bi bio potpun bez reference na članak ASCII.

Za dobivanje oblika slike može se koristiti posebni softver ili simboli ručno kodirani, koristeći samo simbole. Ova vrsta efekta postoji od 1980-ih godina i postala je popularna u sustavima poput Commodore Amiga Computer.

Postoji čak razlika između “Oldskool” ASCII umjetnosti koja koristi čisti ASCII u naredbenom retku i “Newskool” koji koristi posebne likove u Unicodeu da bi napravio još složenija umjetnička djela.

Evo slike glave zebre:

ASCII Art Zebra

ISO-8859-1

ISO-8859-1 je standard za kodiranje znakova. Objavila ga je Međunarodna organizacija za standardizaciju (ISO) 1998. godine kao proširenje za ASCII.

ASCII i ISO-8859-1

Najpoznatiji standard za kodiranje znakova je ASCII. ASCII je koristio 7 bita osam-bitnog bajta kako bi kodirao najosnovnije 128 znakove koji se koriste za pisanje engleskog jezika. Brojne uporabe za sustav razvijene su za osmi bit (visoki red).

Na primjer, jedan sustav koristio ga je za prebacivanje između romske i kurzivan stilovi ispisa. Ostali sustavi koristili su ga za kodiranje dodatnih znakova. Upotrebom svih osam bajtova može se kodirati 256 znakova.

Budući da izvorni skup ASCII nije uključivao broj znakova potrebnih za pisanje u uobičajenim ne-engleskim jezicima (poput slova s ​​dijakritičkim oznakama), proširivanje skupa znakova na 256 znatno je povećalo njegove mogućnosti.

IS0-8859-1 je jedno od tih proširenja. Zamišljeno je da bude međunarodni, među-platformski standard. Budući da je to superset standardnog 8-bitnog ASCII-a, kompatibilan je s nazad: dokument kodiran u ASCII lako se može dekodirati pomoću ISO-8859-1.

ISO-8859-1 i HTML

Prema standardu, ISO-8859-1 je zadano kodiranje znakova u HTML-u 4. Međutim, većina preglednika podržava superset ISO-8859, zvan ANSI.

ANSI sadrži dodatnih 32 znaka koji su u ISO-8859-1 bili prazni. (Većinu vremena kada vidite popis znakova ISO-8859-1, to je zapravo cijeli ANSI popis.)

Danas HTML5 standard koristi UTF-8, vrlo veliki superset koji uključuje izvorne kodove ASCII, ISO-8859-1 i ANSI.

Međutim, većina HTML dokumenata na engleskom jeziku, čak i oni koji izričito deklariraju ISO-8859-1 ili UTF-8 kao skup znakova, zapravo koriste manji ASCII skup znakova. Postoje dva razloga za to:

  • ASCII se može upisati na standardnoj QWERTY tipkovnici.

  • Mnoge tehnologije koje se koriste za stvaranje HTML-a podržavaju samo ASCII.

Budući da su ISO-8859-1 i UTF-8 kompatibilni s ASCII, to obično ne pravi probleme.

ISO-8859-1 i karakteri

Prošireni skup znakova dostupan u ISO-8859-1 može se proizvesti u dokumentu samo za ASCII pomoću HTML entiteta znakova. To su žice koje započinju s ampersandom (“&”) I završava točkom sa zarezom (“; “).

Na primjer, simbol autorskih prava (krug s natpisom “C”) može se izravno kodirati pomoću ISO-8859-1 ili UTF-8. No kako na većini tipkovnica ne postoji tipka “©”, mnogim ljudima je lakše upisati ©.

To je spremljeno u datoteci kao šest ASCII znakova: &, c, o, p, y i ;. Web-preglednici tada korisniku prikazuju odgovarajući znak ISO-8859-1.

Većina znakova koji nisu ASCII ISO-8859-1 su imenovali jedinice entiteta HTML. Oni koji ne mogu biti upisani svojim numeričkim kodom. Brojčani je kod zapravo decimalna (osnovna 10) verzija binarnog kodiranja.

Na primjer, simbol autorskog prava kodiran je kao 10101001 u binarnom obliku, što iznosi 169 u bazi 10. Tako da možete upisati © ili ©.

Znakovi koji nisu ASCII u ISO-8859-1 i ANSI

Znakovi 128-159 na ovom grafikonu su ANSI znakovi koji nisu uključeni u ISO-8859. Prvih 127 kodova u ISO-8859-1 / ANSI nisu uključeni ovdje, jer su identični ASCII koji smo naveli gore.

Lik
HTML naziv
HTML broj
Opis
znak eura
,,jedinstveni navodnik s niskim brojem 9
ƒƒƒmalo slovo f s kukom
dvostruka niska vrijednost 9
vodoravna elipsa
bodež
dvostruki bodež
ˆmodifikator slova cirkuflex naglasak
po mille znak
ŠŠŠveliko slovo S s karonom
<<pojedinačni navod o kutu lijevo
ŒŒŒkapitalna ligacija OE
ŽŽveliko slovo Z s karonom
lijevi jedinstveni navodnik
desni jedinstveni navodnik
lijevi dvostruki navodnik
desni dvostruki navodnik
metak
crtica
em crtica
~˜~tilda
Znak marke TM
šššmalo slovo S s karonom
>>pravocrtni navodnik navodnika
œœœmala ligatura oe
žžmalo slovo z s karonom
ŸŸŸveliko slovo Y s dijarezom
 neprobijajući prostor
¡ ¡ ¡obrnuti uskličnik
¢ ¢ ¢znak cent
£ £ £znak funte (valuta)
¤ ¤ ¤znak valute
¥ ¥ ¥jen / yuan znak
¦ ¦ |slomljena okomita traka
§ § §odjeljak znak
¨ ¨ ¨dijarezom
© © ©autorsko pravo
ª ª ªženski ordinalni indikator
« « «lijevi dvokutni navodnik (guillemet)
¬ ¬ ¬ne znak (logika)
­ ­mekani / diskrecijski crtica
® ® ®registrirani zaštitni znak
¯ ¯ ¯razmak makrona / prekrivanje
° ° °znak stupnja
± ± ±znak plus / minus
² ² ²superkripta dva (u kvadratu)
³ ³ ³superkript tri (u kockicama)
´ ´akut
µ µ μmikro znak
znak stavka (stolica)
· · ·srednja točka
¸ ¸ ¸sedilja
¹ ¹ ¹superskript jedan
º º ºmuški redni indikator
» » »desni dvokutni navodnik (guillemet)
¼ ¼ ¼jedna četvrtina frakcije (1 iznad 4)
½ ½ ½jedna polovica frakcije (1 iznad 2)
¾ ¾ ¾tri četvrtine frakcija (3 preko 4)
¿ ¿ ¿obrnuti znak pitanja
À À Àveliko slovo A s grobnim naglaskom
Á Á Áveliko slovo A s akutnim naglaskom
  Âveliko slovo A s obodom
Ă Ă Ăveliko slovo A s tildom
Ä Ä Äveliko slovo A s dijaresom
A A Aveliko slovo A s prstenom iznad
Æ Æ Ækapitalna AE ligatura
Ç Ç Çveliko slovo C s cedillom
E E Eveliko slovo E s grobnim naglaskom
É É Éveliko slovo E s akutnim naglaskom
Ę Ę Ęveliko slovo E s obodom
Ë Ë Ëveliko slovo E s dijarezom
Ì Ì Ìveliko slovo I s grobnim naglaskom
Í Í Íveliko slovo I s akutnim naglaskom
Î Î Îveliko slovo I s obrubom
Ï Ï Ïveliko slovo I s dijaresom
Ð Ð Ðveliko slovo ETH (Dogecoin simbol)
Ñ Ñ Ñveliko slovo N s tildom
Ò Ò Òveliko slovo O s grobnim naglaskom
Ó Ó Óveliko slovo O s akutnim naglaskom
Ô Ô Ôveliko slovo O s obodom
Õ Õ Õveliko slovo O s tildom
Ö Ö Öveliko slovo O s dijaresom
× × ×znak množenja
Ø Ø Øveliko slovo O kosa crta
Ù Ù Ùveliko slovo U s grobnim naglaskom
Ú Ú Úveliko slovo U s akutnim naglaskom
Û Û Ûveliko slovo U s obodom
Ü Ü Üveliko slovo U s dijaresom
Y Y Yveliko slovo Y s akutnim naglaskom
Þ Þ Þveliko slovo THORN
ß ß ßmala slova oštra s (oštro s / scharfes S )
à à àmalo slovo a s grobnim naglaskom
á á ámalo slovo a s akutnim naglaskom
â â âmalo slovo a s obodom
à à Ãmalo slovo a s tildom
ä ä ämalo slovo a s dijarezom
Å Å Åmalo slovo a sa prstenom iznad
æ æ æmala ligatura
ç ç çmalo slovo c sa cedillom (cé cédille)
è è èmalo slovo e s grobnim naglaskom
é é émalo slovo e s akutnim naglaskom
ê ê êmalo slovo e s obodom
ë ë ëmalo slovo e s dijarezom
ì ì ìmalo slovo i s grobnim naglaskom
í í ímalo slovo i s akutnim naglaskom
Î Î Îmalo slovo i s obodom
ï ï ïmalo slovo i s dijarezom
ð / td> ðcode> ðmalo slovo et
ñ ñ ñmalo slovo n s tildom
Ò Ò Òmalo slovo o s grobnim naglaskom
ó ó ómalo slovo o s akutnim naglaskom
ô ô ômalo slovo o s obodom
õ õ õmalo slovo o s tildom
Ö Ö Ömalo slovo o s dijarezijom
÷ ÷ ÷znak podjele
ø ø ømalo slovo o s kosom kosom
ù ù ùmalo slovo u s grobnim naglaskom
Ú Ú Úmalo slovo u s akutnim naglaskom
Û Û Ûmalo slovo u s obodom
ü ü ümalo slovo u s dijarezijom
ý ý ýmalo slovo y s akutnim naglaskom
Þ Þ Þtrn malih slova
Ÿ Ÿ Ÿmalo slovo y s dijarezom

unicode

Unicode je standard za kodiranje znakova kojim upravlja Konzorcij Unicode.

Kao što smo već raspravljali, računalni sustavi ne pohranjuju doslovno znakove (slova, brojeve, simbole) – u dokumentu na tvrdom disku ne postoji sitna slika svakog slova. Kao što biste sada trebali znati, svaki se znak šifrira kao niz binarnih bitova – 1 i 0. Na primjer, kod za malo slovo “a” je 01100001.

Ali 01100001 je proizvoljan – nema ničeg posebnog u tom nizu bitova koji bi trebali učiniti slovo “a” – računalna industrija kolektivno se složila da to znači “a”. Pa kako se cijela industrija dogovara kako predstaviti svaki mogući lik? Sa standardom kodiranja znakova. Standard za kodiranje jednostavno određuje sve moguće znakove koji su na raspolaganju i svakom dodjeljuje niz bita.

U posljednjih nekoliko desetljeća računalstva širom svijeta korišteno je nekoliko standarda za kodiranje znakova. Dugo vremena, univerzalno prihvaćeni standard bio je ASCII. Problem ASCII-a je što je on samo kodirao relativno ograničen broj znakova – najviše 256. To je isključilo ne latinske jezike, mnoge važne simbole iz matematike i znanosti, pa čak i neke osnovne interpunkcijske znakove.

Osim što ASCII upotrebljava na engleskom i drugim jezicima koji koriste latiničnu abecedu, jezične skupine koje koriste druge abecede imaju tendenciju da koriste svoje kodiranje znakova. Budući da su te sheme kodiranja definirane odvojeno jedna od druge, često su se sukobljavale; bilo je nemoguće koristiti jednu shemu kodiranja za više jezika istovremeno.

Unicode je prvotno zamišljen i nastavlja se razvijati, posebice s namjerom da prevlada ove izazove. Cilj Unicode-a je osigurati uniersal, unified, i unique identifikator koda za svaki grafem na svakom jeziku i sustavu pisanja na svijetu.

UTF-8

Unicode je implementiran u nekoliko shema kodiranja znakova, ali standard koji se danas najčešće koristi je UTF-8. UTF-8 postao je gotovo univerzalan za sve vrste modernog računarstva.

UTF-8 kodira znakove koristeći do 4 8-bitna kodna bloka. ASCII koristi samo 8 bita po znaku. Znakovi Unicode prethodno uključeni u ASCII predstavljeni su u UTF-8 jednim 8-bitnim dijelom, istim 8 bitova koji su korišteni u ASCII. Zbog toga je ASCII tekst naprijed kompatibilan u UTF-8. (Ovo je jedan od mnogih razloga što je UTF-8 postao univerzalni standard – prijelaz je bio relativno lagan.)

Shema 8 × 4 pruža UTF-8 s preko milijun kodnih točaka, omogućavajući Unicode za kodiranje znakova iz 129 skripti i pisaćih sustava.

Resursi za razumijevanje Unicode-a

  • Uvod u sustave pisanja i Unicode vrlo je temeljito, čak i rječito, objašnjenje kodiranja znakova općenito, a Unicode posebno; ako na Unicodeu možete pročitati samo jednu stvar, ovo je za čitanje
  • Unicode standard: Tehnički uvod službeno je objašnjenje Unicode standarda
  • Na BMP i dalje! je udžbenik na Unicode-u, pogodan za prezentaciju ili samostalno učenje
  • Unicode Vodič objašnjava kako Unicode funkcionira, uključujući zanimljive detalje poput kombiniranja znakova i kako bi mehanizam za raščlanjivanje Unicode trebao funkcionirati.

Knjige o Unicode

  • Unicode objasnio, Jukka Korpela, pruža dobar pregled Unicode-a i različitih razvojnih izazova koji dolaze s njegovom primjenom.
  • Unicode Demystified: Vodič praktičnog programera za kodiranje standarda, Richard Gillam, korisno je, ako je donekle datirano, objašnjenje Unicode-a, s puno specifičnosti implementacije usmjerene na Javu
  • Fontovi i Encodings, Yannis Haralambous, ne odnosi se samo na Unicode, već bi mogla biti knjiga koju najviše vrijedi pročitati; Obuhvaća povijest kodiranja i predstavljanja teksta na računalima, pružajući teorijsku i praktičnu osnovu za razumijevanje Unicode-a i brojnih usko povezanih predmeta.

Unicode referentni materijal

Jednom kada steknete osnovno razumijevanje Unicode-a, uglavnom će vam biti potrebno da potražite određene detalje – poput točnog kodiranja određenog znaka..

  • C / C ++ Unicode varalica pruža informacije o pretvaranju Microsofta C / C ++ u Unicode
  • XML i Unicode Technology Reports popis je tehničkih izvještaja koji pokrivaju različite aspekte upotrebe XML-a i Unicode-a zajedno
  • Decode Unicode pruža internetski rječnik Unicode s prekrasnim korisničkim sučeljem, koji vam omogućuje pregled svih definiranih Unicode znakova, čak i bez lokalne podrške fonta
  • Podaci o jezicima pružaju informacije o pretraživanju korištenja Unicode skupova znakova s ​​različitim jezicima
  • Unicode Navigator nudi organizirani popis svih Unicode znakova

Unicode Alati

  • Unicode Analyzer je proširenje preglednika Chrome koje pruža informacije o tekstu Unicode na web stranicama i dokumentima
  • Identifikator znakova je dodatak za Firefox koji nudi kontekstni izbornik za pronalaženje više informacija o odabranim znakovima Unicode
  • Za umetanje znakova Unicode u tekstualna polja na webu pokušajte s Unicode Symbols za Chrome ili Unicode Alat za unos za Firefox
  • UnicodeDataBrowser pruža GUI za lakše čitanje UnicodeData.txt datoteke
  • Poliglot 3000 automatski prepoznaje jezik bilo kojeg teksta
  • Unicode nudi popis rasporeda znakova Unicode tipkovnice za razne skripte koje podržava Unicode
  • Babel je Python knjižnica za širok spektar zadataka internacionalizacije i lokalizacije
  • D-Type Unicode Text Engine je knjižnica C ++ za postavljanje, prikazivanje i uređivanje visokokvalitetnog teksta Unicode na bilo kojem uređaju, platformi ili operativnom sustavu
  • Nunicode je C knjižnica za kodiranje i dekodiranje UTF-8 dokumenata
  • Prijenosni UTF-8 nudi Unicode podršku za PHP žice
  • Tesseract OCR pruža optičko prepoznavanje znakova za Unicode tekst
  • Popchar je poboljšana mapa znakova koja vam omogućuje lako pronalaženje i upisivanje znakova iz čitavog raspona Unicode prostora
  • Unicode Utilities nudi niz zanimljivih i korisnih mrežnih alata za rad s Unicode
  • Edicode nudi fleksibilnu internetsku tipkovnicu Unicode za tipkanje teksta pomoću različitih međunarodnih skripti
  • Quickkey je fleksibilno proširenje tipkovnice za tipkanje prvih 65 000 definiranih Unicode znakova
  • Pretvarač koda Unicode pretvara bilo koji uneseni kôd znaka u nekoliko različitih kodiranja istog znaka
  • CharFunk je JavaScript uslužni program za izvođenje brojnih zanimljivih provjera i operacija na Unicode znakovima
  • Kreativni Recode pretvara tekstualne datoteke iz različitih kodiranja u Unicode
  • BabelMap Online nudi tipkovnicu Unicode unutar preglednika, s izlazom u znakovima za prikaz, kao i šesterostrukim ili decimalnim kodiranjem

Uređivači teksta i koda

Većina današnjih uređivača teksta, uređivača koda i IDE-a ili Unicode koriste prema zadanim postavkama ili lako mogu koristiti Unicode. Sublime, Notepad ++, Atom i Eclipse postavljeni su na UTF-8 kao zadano kodiranje znakova. Vim i Emacs možda će trebati promjena postavke za upotrebu UTF-8:

  • Korištenje Unicode s Emacs-om
  • Korištenje Unicode s Vimom

Tu je i pregršt uređivača koda i teksta posebno dizajniranih za rukovanje proširenim nizom znakova Unicode:

  • MinEd je uređivač teksta Unicode s kontekstualnom podrškom za umetanje znakova iz cijelog raspona Unicode prostora znakova
  • Uređivač klasičnih tekstova napredni je uređivač za rad s kritičkim i znanstvenim izdanjima tekstova, uključujući višejezične tekstove koristeći širok raspon znakova Unicode

Unicode fontove

Odnos fontova i Unicode malo je pokošen. Unicode je stvoren da bude kompatibilan s nazad ASCII – tekst formatiran u ASCII može se dekodirati kao Unicode gotovo bez problema. I Unicode kodirani tekst može se prikazati pomoću ASCII fontova, sve dok se koristi samo mali skup znakova koji se pojavljuju u ASCII.

Danas je većina fontova dostupnih na većini računala kodirana s Unicode. Dakle, s tog stajališta, većina fontova su “Unicode fontovi.” Međutim, većina fontova ne podržava posebno veliki skup čitavog Unicode standarda.

Obično to nije problem; netko tko piše tekst na više jezika ili s proširenim setom znakova može upotrijebiti nekoliko različitih fontova – jedan za latiničnu pisaču, drugi za svaki CJK jezik i drugi za matematičke simbole (na primjer). Međutim, ponekad može biti korisno imati pojedinačne fontove koji sadrže veliki postotak prostora s znakovima Unicode. Ovo bi moglo biti potrebno kod rada u običnom tekstu i okruženju izvornog koda gdje uporaba više fontova nije izvediva ili kada je vizualno jedinstvo između više skripti posebno važno.

Slijede najistaknutiji projekti fonta koji pružaju široku podršku Unicode. Za cjelovitiji popis, uključujući neispravne i zastarjele fontove, pogledajte ovu stranicu Unicode fontova. Za unos azijskih jezika pogledajte ovaj popis CJK fontova.

  • Everson Mono je jednostanični font koji je stvorio jedan od pokretača standarda Unicode; njegova navedena svrha je osigurati glifove za što veći broj znakova Unicode, i (prema pisanju ovog teksta) 92 Unicode znakovni blokovi su podržani.
  • Noto je veliki skup zaslonskih fontova koji je razvio Google, a koji zajedno podržavaju veliku većinu skupova znakova Unicode, s namjerom da na kraju podrže cijeli Unicode standard.
  • Deja Vu Fontovi je obitelj fontova koja pruža široku pokrivenost standarda Unicode, s verzijama Serif, Sans i Monospace.
  • GNU FreeFont je obitelj fontova koja omogućuje lica tipa Serif, Sans i Mono za 37 sustava za pisanje i 12 raspona simbola Unicode..
  • GNU Unifont je jednooslovni, bitmap font kompletne pokrivenosti za višejezičnu ravninu Unicode 8.0 i širok, ali nepotpun, za dodatnu višejezičnu ravninu.

Postoji i niz zanimljivih fontova koji kodiraju određeni podskup standarda Unicode za specijaliziranu upotrebu.

  • Junicode je skup fontova za srednjovjekovnjake
  • Last Resort je “font of last resort”; umjesto konvencionalnih znakova glifova, svaki glif zapravo prikazuje informacije o samom znaku Unicode
  • Unicode fontovi za drevne skripte je projekt kreiranja skupa fontova za nekoliko starih i klasičnih abeceda
  • Unimath Plus pruža prošireni skup znakova i matematike

Evo nekoliko dodatnih izvora fontova Unicode ako i dalje ne možete pronaći ono što tražite:

  • SIL Fontovi broj fontova za razne jezike koji nisu potpomognuti, stvorio SIL International, globalna neprofitna zajednica koja služi manjinskim jezičkim zajednicama
  • Rasponi znakova Unicode i fontovi Unicode koji ih podržavaju pomoći će vam da pronađete font za bilo koji raspon znakova Unicode..

Resursi Emoji

Emoji su ona smiješna mala nasmiješena lica i palčeve naprijed u koje možete staviti svoje tekstne poruke. Oni su zapravo dio Unicode standarda. Emoji dio Unicode-a nije univerzalno podržan, pa ako želite uključiti Emoji u svoju aplikaciju ili web mjesto, možda će vam trebati neka pomoć. Ovdje su resursi koji će vam pomoći da koristite i gradite pomoću Unicode emojija.

Emoji referenca

  • Emojipedia je baza podataka Emoji znakova koja se može pretraživati
  • Mogu li Emoji? pruža informacije o izvornoj podršci za Unicode emojije na iOS-u, Androidu, OS-u X i Windows-u, kao i glavnim preglednicima.
  • Fondacija WTF Emoji je pomalo ozbiljna organizacija posvećena unapređenju emojija; vode Emoji rječnik.
  • Emoji varalica nudi brzu referencu za Emoji upisne kodove

Knjižnice Emoji

  • Uključite Emoji u aplikacije i prenesite između nekoliko dobavljačkih standarda s ovom PHP Emoji bibliotekom; ili isprobajte ovu biblioteku emojija PHP7 koja vam omogućava slanje Emojija po imenu unutar vašeg koda
  • Emoji for Python podržava i službene emojije Unicode i nekoliko skupova aliasa; Django programeri mogu koristiti i paket django-emoji
  • Emoji Golang pruža podršku Emoji za programski jezik Go
  • U Rubyju postoji nekoliko dragulja za Emoji podršku, ali onaj Github-a je vjerojatno najbolji
  • Emoji-Java pruža podršku za Emoji u Javi
  • Coloremoji.sty olakšava uključivanje Emoji u boji u dokumente LaTeX-a
  • Npm, sustav upravljanja paketima za Node.js ima nekoliko paketa emojija:
    • Emoji i emojiji čvora pružaju osnovnu podršku za emojije,
    • Ember-cli-emoji surađuje s Emojify.js za pružanje emoji pomagača vašim Ember.js aplikacijama
    • Markdown-to-emoji dodaje emoji kako bi podržao markdown-it Markdown parser
  • Emoji Syntax je blesava knjižnica za uređivač teksta Atoma koja dodaje emoji u redoslijede koda na temelju njihovog značenja.

Tipkovnice i zbirke Emojija

  • EmojiXpress za iOS je kolekcija Emoji i tipkovnica za iPhone
  • Emojione je kolekcija Emoji na više platformi s Creative Commons licenciranim umjetničkim djelima, besplatnim za programere
  • iDiversicons nudi širok spektar različitih Emoji znakova i tipkovnicu iPhone.

Vrste MIME

MIME označava “Višenamjenska proširenja internetske pošte.” Internet standard koristi se za identificiranje različitih vrsta datoteka koje se prenose na mreži. U početku je razvijen za e-poštu koja je poslana preko SMTP-a (Simple Mail Transfer Protocol) koji je internetski standard za prijenos e-pošte. MIME je danas iznimno važan u ostalim komunikacijskim protokolima kao što je HTTP.

MIME Povijest

Već smo raspravljali o povijesti ASCII i kodiranju znakova. No, u priči slanja informacija postoji mnogo više od ovoga.

S vremenom su naše poruke postale složenije i postalo je očito da ovaj standardni format nije dovoljan. Multimedijske slike koje sadrže audio ili video datoteke uopće nisu definirane. Isto se odnosi i na jezike koji nisu upotrebljavali englesku abecedu. Situacija se konačno počela mijenjati kada su dvije osobe udružile snage: Nathaniel Borenstein i Ned Freed.

Njihov je prijedlog redefinirao format poruka kako bi e-pošta mogla sadržavati više objekata u jednoj poruci; upotreba znakova koji nisu ASCII, kao i jezika koji nisu engleski; i upotrebu slika, audio i video zapisa. Ovo je rođenje MIME-a koji je 1993. postao službeni standard.

Prijedlog je također definirao standarde kodiranja koji su 7bit, 8bit, base64, binarni i ispisni s kotiranjem. Ti standardi kodiranja trebali su osigurati da se svi podaci doista šalju. Uključivao je i podatke o korištenju zaglavlja vrste sadržaja koji su potrebni za pravilno identificiranje vrste podataka koji se prenose.

Što su MIME tipovi?

MIME tipovi su identifikatori koji se koriste za identificiranje mnogih formata datoteka koji se svakodnevno šalju na Internetu. Standardizira ih IANA (Internet Assigned Numbers Authority). MIME tipovi prvi su definirani i imenovani kao takvi u Zahtjevu za komentare: 2045 (RFC 2045) koji je objavio IETF (Internet Engineering Task Force) koji je službeni prijedlog podnio Borenstein i Freed.

Struktura

MIME tipovi sastoje se od tipa i podtipa koji su dva niza odvojena kosom naprijed. Vrsta predstavlja kategoriju i može biti diskretna ili višeslojna. Svaka vrsta ima određenu podvrstu. MIME se tradicionalno pišu malim slovima.

Diskretne vrste uključuju tekst, sliku, audio, video i aplikaciju. Vrste dijelova predstavljaju kategoriju dokumenata koji se raščlanjuju na različite dijelove i često uključuju različite MIME tipove. Uključuju podatke obrasca i vanjske domete.

Neke vrste MIME imaju prefiks ili x ili vnd. Prefiks x znači da nije registriran u IANA-i, a vnd označava prefiks specifičan za dobavljača.

Uobičajene vrste MIME

primjena:

  • aplikacija / msword (.doc)
  • aplikacija / vnd.openxmlformats-officedocument.wordprocessingml.document (.docx)
  • aplikacija / vnd.openxmlformats-officedocument.wordprocessingml.template (.dotx)
  • aplikacija / vnd.ms-powerpoint (.ppt)
  • aplikacija / ecmascript (.es)
  • aplikacija / x-javascript (.js)
  • aplikacija / oktet-stream (.bin, .exe)
  • aplikacija / pdf (.pdf)
  • aplikacija / postscript (.ps, .ai, .eps)
  • aplikacija / rtf (.rtf)
  • aplikacija / x-gtar (.gtar)
  • aplikacija / x-gzip (.gz)
  • aplikacija / x-java-archive (.jar)
  • aplikacija / x-java-serialized-objekt (.ser)
  • aplikacija / x-java-vm (.class)
  • aplikacija / x-tar (.tar)
  • aplikacija / zip (.zip)
  • aplikacija / komprimirana x-7z (.7z)
  • aplikacija / komprimiran x-rar (.rar)
  • aplikacija / x-shockwave-flash (.swf)
  • aplikacija / vnd.android.package-archive (.apk)
  • aplikacija / x-bittorrent (.torrent)
  • aplikacija / epub + zip (.epub)
  • aplikacija / vnd.ms-excel (.xsl)
  • aplikacija / x-font-ttf (.tff)
  • aplikacija / rss + xml (.rss, .xml)
  • application / vnd.adobe.air-application-installer-paket + zip (.air)
  • aplikacija / x-debian-package (.deb)
  • aplikacija / json (.json)

Audio:

  • audio / x-midi (. sredina, .midi)
  • audio / x-wav (.wav)
  • audio / mp4 (.mp4a)
  • audio / ogg (.ogg)
  • audio / mpeg (.mp3)

Slika:

  • slika / bmp (.bmp)
  • slika / gif (.gif)
  • image / jpeg (.jpeg, .jpg, .jpe)
  • slika / tiff (.tiff, .tif)
  • image / x-xbitmap (.xbm)
  • image / x-icon (.ico)
  • image / svg + xml (.svg)
  • image / png (.png)

Tekst:

  • text / html (.htm, .html)
  • tekst / običan (.txt)
  • tekst / obogaćeni tekst (.rtf, .rtx)
  • text / css (. css)
  • tekst / csv (.csv)
  • tekst / kalendar (.ics)

Video:

  • video / mpeg (.mpg, .mpeg, .mpe)
  • video / ogg (.ogv)
  • video / quicktime (.qt, .mov)
  • video / x-msvideo (.avi)
  • video / mp4 (.mp4)
  • video / webm (.webm)

Resursi

MIME vrste omogućile su nam bolje i bogatije iskustvo slanja e-pošte. Sljedeći popis resursa pomoći će vam da saznate više detalja o tome kako su i zašto postali, kao i kako pravilno konfigurirati web poslužitelj za podršku tipa MIME i još mnogo toga.

Internetski resursi

Sljedeći popis uključuje poveznice na prijedlog od pet dijelova koji je postao standardni nacrt za MIME.

  • RFC 2045 (PDF): prvi dio prijedloga sadrži različite zaglave koji se koriste za opisivanje MIME poruka.
  • RFC 2046 (PDF): drugi dokument definira opću strukturu MIME sustava za tipkanje medija i početni skup vrsta medija.
  • RFC 2047 (PDF): treći dio prijedloga opisuje proširenja koja dopuštaju tekstualne podatke koji nisu US-ASCII u poljima zaglavlja internetske pošte..
  • RFC 2048 (PDF): četvrti dio opisuje kako se nove MIME vrste mogu registrirati na IANA.
  • RFC 2049 (PDF): peti dokument opisuje MIME kriterije sukladnosti s primjerima formata MIME poruka.
  • Vrste medija: potpuni popis svih vrsta medija, koji također uključuje vezu na aplikaciju za registraciju novih vrsta medija.
  • Momci MIME: Kako su zauvijek promijenjena dva gurua interneta: članak zasnovan na intervjuima s Nathaniel Borenstein i Nedom Freedom koji daje zanimljiv uvid u njihov rad.

Tutoriali

Sljedeći resursi daju korisne upute za rukovanje MIME tipovima, ispravnu konfiguraciju poslužitelja i još mnogo toga.

  • Pravilno konfiguriranje MIME tipova poslužitelja: govori o tome zašto bi se webmasteri trebali pobrinuti za pravilno konfiguriranje web poslužitelja jer se dodaju nove MIME vrste, posebno za preglednike sa sjedištem u Gecku.
  • Medijski formati podržani HTML audio i video elementima: pruža popis vrsta MIME podržanih novim audio i video elementima u HTML5
  • Što je MIME njuškanje: ovaj članak daje detaljno objašnjenje o MIME njuškanju i kako izbjeći ranjivosti povezane s njim.
  • Objašnjene vrste MIME: Zašto Linux i Mac OS X ne trebaju ekstenzije datoteka: zanimljivo štivo koje objašnjava jednu od razlika između Windows računala i računala Linux / Mac OS X.
  • Odabir vrste MIME za JavaScript: trenutno postoji više MIME vrsta za JavaScript. Ovaj će vam vodič pružiti objašnjenje slučajeva korištenja za svaki od njih.

knjige

Iako ne postoje knjige posvećene isključivo MIME tipovima, još uvijek postoji pristojan broj knjiga na usko povezane teme koje im posvećuju nekoliko poglavlja..

  • Internet protokoli, standardi i implementacija e-pošte (1998) Lawrencea Hughesa: usmjerena na naprednije korisnike, ova knjiga jača znanje o bitnim pojmovima potrebnim za razvoj softvera za e-poštu i temeljito opisuje ključne internetske protokole e-pošte i proširenja poput SMTP, POP3, IMAP , MIME i DSN.
  • Programiranje internetske e-pošte (1999) Davida Wooda: osnovni vodič koji obuhvaća sve važne koncepte potrebne za izgradnju aplikacija na vrhu mogućnosti e-pošte. Teme koje uključuju pokrivaju razne protokole e-pošte, formate e-pošte uključujući MIME tipove i obilje primjera.
  • Osnovni standardi e-pošte (1999.) Petera Loshina: ova knjiga mora biti neophodna za sve koji žele steći dubinsko razumijevanje standarda e-pošte. Pruža temeljitu analizu najvažnijih RFC-ova koje objavljuje IETF kao i njihovu potencijalnu upotrebu. Također uključuje i digitalnu verziju knjige na CD-u koju možete pretraživati ​​u potpunosti.
  • MH & xmh (2006) Jerry Peek: Ova je knjiga slobodno dostupna putem Interneta i objavljena pod GNU-GPL licencom. Treće poglavlje objašnjava vrlo detaljno MIME tipove i višestambene poruke

alat

Linkovi u nastavku sadrže nekoliko korisnih alata za provjeru valjanosti MIME tipova.

  • Što MIME tipovi podržavaju moj preglednik: internetski alat koji će vam reći koje vrste MIME tipovi preglednika podržavaju čim učitate stranicu.
  • MIME Validator: besplatni online MIME validator koji provjerava usklađenost MIME poruka sa IETF standardima.
  • Što je MIME: još jedna besplatna internetska provjera za bilo koju datoteku.

Proširite svoje znanje o MIME vrstama

MIME vrste mogu se činiti beznačajnima na površini, ali donijele su velike promjene u načinu rada naših poruka e-pošte. Ovaj popis resursa trebao bi pobuditi vašu znatiželju i pružiti vam dublje razumijevanje načina na koji se e-pošta i datoteke poslane putem Interneta transformiraju tijekom godina..

Sažetak

Većina ljudi samo tipka i ne razmišlja puno o onome što se događa. Odabranih nekoliko ljudi smeta razmišljanje o ljepoti dizajna i tipografije fonta.

Ali još manji je broj ljudi koji znaju ili im je stalo da znaju što se događa iza kulisa – kako pritiskanje tipke postaje slovo na ekranu računala.

Svima drugima ona je transparentna ili trivijalna.

No, kao što smo pokazali, postupak predstavljanja jezika teško je trnovit, a ogroman dio posla uložen je u to da bude toliko transparentan. Konzorcij Unicode, zajedno s nebrojenim programerima, dizajnerima i lingvistima, omogućili su bilo kome pisanje bilo kojeg znaka, s bilo kojeg jezika, bilo kojeg skripta, na bilo kojem računalu.

Ovo je zapaženo dostignuće i nužan korak ka univerzalnoj pismenosti i univerzalnom pristupu računalima i internetu.

Pitanja

P. Kakva je razlika između ASCII, Unicode i UTF-8?

. ASCII je stariji standard iz 1960-ih, dok je Unicode nastao krajem 1980-ih.

ASCII ima samo 128 ili 256 znakova, ali Unicode ima preko 10 000.

Unicode je tablica znakova, UTF-8 (ili UTF-16 ili UTF-32) je razina kodiranja. Unicode 0-256 i ASCII gotovo su identični, s tek malim razlikama u kontrolnim znakovima.

UTF-8 je danas najčešće kodiranje na webu – i zadano.

P. Trebam li prijaviti koju vrstu kodiranja koristim za svoju web stranicu?

. Samo ako znate trebate koristiti jedinstvenu vrstu kodiranja.

Ako je ne deklarirate, većina preglednika zadat će UTF-8. Ako stvarate web stranicu na stranom jeziku, posebice ne latinskom, provjerite upotrebljavate li UTF-8 ili odaberete posebnu shemu.

P. Trebam li zapamtiti bilo koji ASCII kod za pisanje HTML-a?

. Samo ako pokušavate biti izuzetno učinkoviti.

Većina web stranica danas je dinamična i generira HTML za vas kroz sustave poput sustava za upravljanje sadržajem (CMS). Ako ste programer, vjerojatno ćete uz HTML koristiti i druge programske jezike, a ti jezici mogu imati posebne načine generiranja tih ASCII simbola.

Konačno, kao što je gore spomenuto, mnogi od tih kodova koriste posebna imena slova u HTML-u umjesto ASCII brojeva.

P. Da li se kodiranje znakova razlikuje u različitim operativnim sustavima?

. Nešto.

Unicode se malo razlikuje u sustavu Windows vs Unix / Linux. Na primjer, Windows koristi UTF-16LE, dok Linux obično koristi UTF-8.

Sada se, naravno, kodiranje koje koristi vaš operativni sustav može razlikovati od kodiranja na web stranici, ali vaš OS i web-preglednik rade zajedno na pretvaranju znakovnih kodova u nešto što vaše računalo može prikazati.

Ponekad, u starijim operativnim sustavima, ta pretvorba možda neće raditi i vidjeli biste samo prazne znakove. (Na primjer, to je nešto što biste mogli posjetiti na stranoj web lokaciji u sustavu Windows XP.)

P. ASCII Umjetnost je sjajna! Gdje mogu napraviti svoje?

. AsciiWorld.com ima nekoliko sjajnih galerija i alata u odjeljku sa softverom, poput pretvarača i “slikara”. Zabavi se!

Ostale zanimljive stvari

Imamo više vodiča, vodiča i infografika vezanih za kodiranje i izradu web stranica:

  • CSS3 – Uvod, vodiči i resursi: ovo je sjajno mjesto za početak učenja izgleda web stranica.

  • Uvod i resursi PostScript-a: saznajte sve o jeziku za prikaz stranice koji je promijenio svijet.

  • Lorem Ipsum: naučite kako koristiti “lutki tekst” za dizajn, prije nego što je sadržaj napisan.

HTML za početnike – Ultimativni vodič

Ako zaista želite naučiti HTML, izradili smo članak o duljini knjige, HTML za početnike – Ultimate Guide. I zaista je to krajnji vodič; vodit će vas od samog početka do majstorstva.

HTML za početnike - Ultimativni vodič
HTML za početnike – Ultimativni vodič

Trendovi web dizajna koje nikada nećete zaboraviti

Prije Unicodea bilo je uobičajeno posjetiti web stranice na kojima je sav tekst predstavljen praznim okvirima. Stvari su se puno promijenile. U našim trendovima veb stranica s web dizajnom nikada nećete zaboraviti kako se krećemo po onome što je nekada bio Internet.

Trendovi web dizajna koje nikada nećete zaboraviti
Trendovi web dizajna koje nikada nećete zaboraviti

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map