ASCII kodavimas: pradedantiesiems, pradedantiesiems … Mes turime visą čia jums reikalingą informaciją.

Atskleidimas: Jūsų palaikymas padeda išlaikyti svetainę! Mes uždirbame siuntimo mokestį už kai kurias paslaugas, kurias rekomenduojame šiame puslapyje.


ASCII yra simbolių kodavimo tipas, naudojamas kompiuteriams, norint išsaugoti ir nuskaityti ženklus (raides, skaičius, simbolius, tarpus, įtraukas ir tt) kaip bitų modelius, skirtus saugoti atmintyje ir standžiajame diske..

„Simbolių kodavimas“ aukštu lygiu reiškia simbolio pavertimą dvejetainiu skaičiumi ir „simbolių žemėlapio“ naudojimą, norint perskaityti dvejetainį skaičių kaip raidės tipą..

O MIME tipai leidžia vartotojams siųsti duomenis, išskyrus simbolius, pvz., Vaizdus ir vaizdo įrašus.

ASCII, simbolių kodavimas, MIME tipai

Simbolių kodavimas

Ankstyviausia simbolių kodavimo forma yra tokia pati kaip elektrinio telegrafo. Tiesą sakant, Morzės kodas, o vėliau ir „Baudot“ kodas buvo vieni iš pirmųjų kada nors sukurtų standartizuotų simbolių kodų.

Antrąjį kodavimo sluoksnį, vadinamą šifravimu ar šifravimu, sukūrė ir to meto kariškiai, tačiau tai yra gana skirtinga tema.

Tik šeštajame dešimtmetyje pradėjome modernų procesą link ASCII. IBM tai pradėjo kurdama kodavimo schemas, skirtas naudoti jų 7000 serijos kompiuteriuose.

IBM dvejetainis kodinis dešimtainis (BCD) perforatoriuose naudojo keturių bitų kodavimą. Tai buvo būdas saugoti dešimtainius skaičius dvejetainėje formoje.

Taigi, vietoj skaičių, esančių nuo 0000 (0) iki 1111 (15), jie svyravo nuo 0000 (0) iki 1001 (9) – kiekvienas keturi bitai reiškia vieną skaitmenį.

Vėliau IBM sukūrė išplėstinę BCD versiją, pavadintą „Extended Binary Coded Decimal Interchange Code“ (EBCDIC). Tai buvo 8 bitų kodavimo sistema visiems standartiniams spausdinamiems simboliams.

Tais pačiais 1963 metais buvo įvesta ASCII.

Tam naudojama 7 bitų kodavimo schema. Tai reiškia 128 skirtingus skaičius.

Šis 7 bitų skaičiaus formatas gali pasirodyti keistas. Galų gale, ne visi kompiuteriai yra 8 bitų, 16 bitų arba 32 bitų ir pan?

Šiandien jie yra. Tačiau ankstyvieji kompiuteriai nebuvo taip sukonstruoti.

Be to, kompiuterių atmintis buvo brangi ir nebuvo jokios priežasties naudoti papildomą bitą, jei jums to nereikėjo. 6 bitų kodas (jis egzistavo) neapimtų visų didžiausiųjų ir mažųjų raidžių, skaičių ir pagrindinių skyrybos ženklų. Bet 7 bitų kodas padarė – su atsarga.

Kai kompiuteriai įsitvirtina 8 bitų (1 baito) struktūroje, ASCII pamažu virto neoficialiu 8 bitų kodu, kur kiti 128 simboliai nebuvo standartizuoti..

Ši būsena išsilaikė kurį laiką. 1991 m. 8 bitų formatas tapo oficialiu UTF-8 ISO (Tarptautinės standartizacijos organizacijos) palaikomu formatu.

Tačiau iššūkis, kuris iškilo tuo metu, buvo tas, kad 7 arba 8 bitų kodavimą galėjo palaikyti tik viena abėcėlė.

Siekiant paremti platesnį kalbų diapazoną, buvo sukurta „Unicode“ kodavimo schema kartu su universaliu simbolių rinkiniu. „Unicode“ yra keletas kodavimo tipų, UTF-8 yra 8 bitų kodavimas, suderinamas su ASCII, kuris šiandien pakeitė ASCII kaip dominuojantį simbolių kodavimo standartą žiniatinklyje..

UTF-8 augimas

Be to, UTF-16 ir UTF-32 tapo naudojamos kalboms su daugybe simbolių. Tačiau kinų, japonų ir arabų kalbas galima parodyti UTF-8.

Todėl UTF-8 yra bene labiausiai paplitęs kodavimo formatas žiniatinklyje. Kalbantiems anglams viskas yra ypač lengva, nes pirmieji 128 ASCII simboliai yra tokie patys kaip „Unicode“.

Taigi, norint naudoti HTML, nuoroda į ASCII lentelę kuriant simbolį veiks, neatsižvelgiant į tai, kokį kodavimo formatą naudojate.

Kur telpa ASCII

ASCII reiškia „Amerikos standartinį informacijos mainų kodą“, jį sukūrė Amerikos standartų asociacija (vėliau pervadinta į Amerikos nacionalinį standartų institutą)..

ASCII standartas buvo pradėtas naudoti 1960 m. Ir išleistas 1963 m. Tai buvo telegrafo kodų pratęsimas ir pirmą kartą buvo naudojamas „Bell“ duomenų tarnybose..

Bėgant metams buvo padaryta esminių pataisų. Iki 2007 m. Jis buvo plačiausiai naudojamas simbolių kodavimas internete, tačiau jis buvo pakeistas UTF-8.

Žiniatinklio perėjimą nuo ASCII ir „Microsoft ANSI“ prie UTF-8 daugiausia galima priskirti „Google“ iniciatyvoms, nes interneto naudojimas tapo vis labiau tarptautinis, o ASCII galėjo rodyti tik lotyniškus rašmenis..

Svarbu pažymėti, kad UTF-8 yra kodavimo rūšis, o „Unicode“ yra simbolių rinkinys; kadangi pirmieji „Unicode“ 128 simboliai yra tokie patys kaip ASCII, generuojant simbolius HTML yra priimtina remtis ASCII lentele.

ASCII turi galimybę naudoti „pabėgimo seką“ rodydamas alternatyvias abėcėles, kurios leido jai tapti tarptautiniu standartu, tačiau „Unicode“ tai tvarko tiesiogiai.

„Unicode“ kilo iš „Apple“ 1987 m., O 1991 m. Tapo „Unicode“ konsorciumo projektu. ASCII sukūrė ASA, tačiau toliau jį tobulino kaip ISO deklaracijų dalį..

Koduotą UTF-8 pavadinimą naudoja visi standartai, atitinkantys interneto priskirtų numerių valdymą (IANA), ty visus HTML, CSS ir XML. IANA yra didesnio ICANN skyrius, nesiekiantis pelno, kuris nustato interneto protokolą ir domenų pavadinimus.

Apibendrinant galima pasakyti, kad ASCII išsivystė iš telegrafo kodo šeštajame dešimtmetyje, užaugo ir tapo „Unicode“ simbolių rinkinio, kurį naudoja UTF-8, dominuojančiu kodavimo formatu žiniatinklyje, dalimi..

Domenų vardai ir tinklalapio kodas priklauso nuo to, ar tinkamai veikia šis suvienodintas simbolių žemėlapis.

Tai reiškia, kad pačioje šiuolaikinio interneto šaknyje egzistuoja simbolių formatas, išrastas 1870-aisiais, kompiuterizuotas kaip ASCII septintajame dešimtmetyje, modernizuotas žiniatinkliui naudojant 1990-ųjų „Unicode“ ir plačiai pritaikytas naudojant UTF-8 daugiausiai 2007 m..

Valdymo simboliai vs Spausdinami simboliai

ASCII yra dviejų tipų simboliai: spausdinami ir valdymo simboliai.

Valdymo ženklai apibūdina skaičius 0-31 ir 127. Valdymo ženklai apima visas rašymo dalis, kurios leidžia kurti naujas pastraipas, skirtukus, eilučių pabaigą, failų atskyrėjus ir daugybę vienetų, kurie yra daugiausia skaidrūs..

Šie kontroliniai ženklai buvo sukurti tuo metu, kai spausdintos kortelės buvo didelė skaičiavimo proceso dalis. Nuo to laiko kai kurios iš šių funkcijų buvo pakeistos, tačiau daugybė linijų formatavimo dalių vis dar egzistuoja. 127 kodas iš tikrųjų yra ištrinimo kodas (tik realiame ASCII, o ne ANSI ar „Unicode“).

Visi atspausdinami simboliai yra tai, ko galite tikėtis. Yra visi mažosios raidės (a-z) ir didžiosios raidės (A-Z), taip pat skaičiai, simboliai ir skyrybos ženklai – iš esmės viskas, kas matoma tipinėje klaviatūroje. Šie pagrindiniai simboliai susideda iš visų parašytų žodžių.

ASCII naudojimas XML ir HTML

Kiekvienas HTML puslapis turi jam priskirtą simbolių kodavimo formatą.

Jei nenurodyta kitaip, HTML kodavimas bus numatytasis kaip UTF-8. Norint naudoti gryną ASCII, ANSI ar bet kurį specializuotą, unikalų formatą, viskas, ką reikia padaryti, yra deklaracija meta žyme..

HTML 4:

HTML5:

Charset tag’e galite naudoti UTF-8, ANSI arba ASCII naudodami charset ="us-ascii" arba galite ieškoti konkretaus simbolių rinkinio, kurį norite naudoti, paprastai skelbdami ISO numerį. Visą sąrašą galite rasti IANA simbolių rinkinių puslapyje.

Simbolių kodo įterpimo formatas

Paprastai, kai kas nors nurodo naudoti ASCII kodą, norėsite, kad jie paaiškintų, ar jie reiškia TIKRA US-ASCII su metažyma, ar jie tiesiog prašo parodyti specialų simbolį.

HTML, bet kuriuo metu, kai norite naudoti specialųjį simbolį, pavyzdžiui, pasakyti cento simbolį (¢) arba apverstą klaustuko ženklą (¿) – paprastai galėtumėte naudoti „Unicode“ simbolį arba US-ASCII (8 bitų). simbolis, įrašant tokią nuorodą:

¢ HTML atrodo taip: ¢

¿HTML atrodo taip: ¿

Taigi jūs pradedate nuo &#, einantis po keturių skaitmenų, baigiant kabliataškiu (;).

Tokiu būdu jūs galite parodyti simbolius pagal jų ASCII / Unicode numerį.

Žinoma, valdymo simboliai atliks formatavimo funkciją arba iš viso neveiks, atsižvelgiant į tai, kurį naudojate ir kurį tikrą simbolių rinkinį įtraukėte į savo metažymą.

Taigi HTML tekste matote „&# “Numerį, bet kai jis bus rodomas naršyklėje, matysite simbolį.

HTML specialiųjų subjektų simboliai

Tarkime, kad norite tiesiog parodyti & simbolis jūsų puslapyje.

Galite ne tik įvesti jį į HTML, bet ir įvesti atitinkamą ASCII arba Unicode.

HTML yra žymėjimo kalba, todėl, nors įprastos raidės veikia gerai, specialieji simboliai ir ypač < > skliausteliuose – kritiškai svarbu, kaip naršyklė skaito ir rodo HTML.

Vis dėlto nereikia visada įvesti „Unicode“ / ASCII nuorodos numerio. HTML 4.0 ir naujesnėse versijose yra specialių subjektų, kurie veikia panašiai kaip „Unicode“ nuoroda, tačiau užuot įsimenę skaičių, įsimenate žodį.

¢ HTML atrodo taip: ¢

¿ HTML atrodo taip: ¿

Visą šių simbolių nuorodų sąrašą galite rasti W3 konsorciume.

Informacinė lentelė

Turėdami omenyje visa tai, galite tiesiog ieškoti lengvos vietos, kur rasti ASCII arba „Unicode“ nuorodas. Daugiau nežiūrėkite, čia yra nuorodos 000–127, o visą „Unicode“ formatą galite rasti Vikipedijoje.

Atminkite, kad 000–032 ir 127 ženklai paprastai nėra spausdinami ir todėl žymimi raide „NA“.

ASCII

table.wiht002 {
atstumas tarp sienų: 0 taškų;
sienos žlugimas: žlugimas;
paraštė-kairė: auto;
paraštė-dešinė: automatinis;
paraštės apačia: 1,5em;
suderinti tekstą: centre;
}

stalas, tr, td
{
paminkštinimas: 0px;
paraštė: 0px;
}
td.bor
{
kraštinė-kairė: 1px kietas # 000;
paminkštinimas kairėje: 1em;
paraštės dešinė: 1em;
}
td.pradzia
{
paraštė-kairė: 2em;
paraštės dešinė: 2em;
}
td.sep
{
kraštas-dugnas: 1 taškas kietas # 000;
}
td.sepbor
{
kraštas-dugnas: 1 taškas kietas # 000;
kraštinė-kairė: 1px kietas # 000;
paminkštinimas kairėje: 1em;
paraštės dešinė: 1em;
}

0NA32NA64@@96``
1NA?33!!65AA97aa
2NA?34""66BB98bb
3NA?35##67CC99cc
4NA?36DoleriųDolerių68DD100dd
5NA?37%%69EE101ee
6NA?38&&70FF102ff
7NA?3971GG103gg
8NA?40((72HH104hh
9NA41))73105ii
10NA42**74JJ106jj
11NA43++75KK107kk
12NA44,,76LL108ll
13NA4577MM109mm
14NA?46..78NN110nn
15NA?47//79OO111oo
16NA?480080PP112pp
17NA?491181QQ113qq
18NA?502282RR114rr
19NA?513383SS115ss
20NA?524484TT116tt
21NA?535585UU117uu
22NA?546686VV118vv
23NA?557787WW119ww
24NA?568888XX120xx
25NA?579989YY121yy
26NA?58::90ZZ122zz
27NA?59;;91[[123{{
28NA?60<<92\\124||
29NA?61==93]]125}}
30NA?62>>94^^126~~
31NA?63??95__127NA?

ASCII įrankiai ir šaltiniai

Simbolių kodai vystėsi daug istorijų ir organizacijos, kurios šiuos standartus laikosi kartu su mumis. Dauguma interneto kūrėjų ir W3C įsikuria UTF-8 bent jau artimiausioje ateityje, tai yra, kaip bus koduojami puslapiai.

Jums reikės tam tikrų išteklių, kurie jums padėtų, jei pradėsite rankinį kodavimą kitais formatais, arba gali būti malonu tiesiog turėti išsamią nuorodą apie.

Šaltinių sąrašas

  • IANA simbolių rinkinių puslapis

  • W3 konsorciumo HTML specialieji simboliai

  • Visas „Unicode“ formatas Vikipedijoje

  • ASCII lentelė tik 0130-0255

  • ASCII istorija „ASCII-World“

  • „Unicode“ simbolių sąrašas Vikipedijoje.

ASCII str

Jokia ASCII santrauka nebus išsami be nuorodos į ASCII straipsnį.

Gali būti naudojama speciali programinė įranga arba rankiniai kodai, skirti atvaizdo formai naudoti tik simbolius. Šis efekto tipas egzistavo nuo devintojo dešimtmečio ir buvo populiarus tokiose sistemose kaip „Commodore Amiga“ kompiuteris.

Yra net skirtumas tarp „Oldskool“ ASCII meno, kuris komandinėje eilutėje naudojamas grynas ASCII, ir „Newskool“, kuris naudoja specialiuosius „Unicode“ simbolius dar sudėtingesniems meno kūriniams kurti..

Čia yra zebro galvos nuotrauka:

ASCII „Art Zebra“

ISO-8859-1

ISO-8859-1 yra simbolių kodavimo standartas. 1998 m. Ją išleido Tarptautinė standartizacijos organizacija (ISO) kaip papildymą ASCII.

ASCII ir ISO-8859-1

Garsiausias simbolių kodavimo standartas yra ASCII. ASCII panaudojo 7 bitus aštuonių bitų baito, kad užkoduotų paprasčiausius 128 simbolius, naudojamus angliškai rašyti. Aštuntajam (aukštosios eilės) bitui buvo sukurta nemažai konkrečiai sistemai skirtų naudojimo būdų.

Pavyzdžiui, viena sistema naudojo ją perjungti iš romėnų į ir kursyvas spausdinimo stiliai. Kitos sistemos jį naudojo, kad užkoduotų papildomus simbolius. Naudojant visus aštuonis baitus, galima užkoduoti 256 ženklus.

Kadangi originaliame ASCII rinkinyje nebuvo daug simbolių, reikalingų rašyti bendromis ne anglų kalbomis (pvz., Raidės su diakritiniais ženklais), praplečiant ženklų rinkinį iki 256, žymiai padidėjo jo galimybės.

IS0-8859-1 yra vienas iš tų plėtinių. Tai buvo ketinama būti tarptautiniu, įvairių platformų standartu. Kadangi tai yra standartinio 8 bitų ASCII viršutinis rinkinys, jis suderinamas atgal: ASCII koduotas dokumentas gali būti lengvai iššifruojamas naudojant ISO-8859-1.

ISO-8859-1 ir HTML

Pagal standartą, numatytasis simbolių kodavimas HTML 4 buvo ISO-8859-1. Tačiau dauguma naršyklių palaikė standartą ISO-8859, vadinamą ANSI..

ANSI yra papildomi 32 simboliai, kurie buvo tušti ISO-8859-1. (Dažniausiai, kai matote ISO-8859-1 simbolių sąrašą, tai iš tikrųjų yra visas ANSI sąrašas.)

Šiandien HTML5 standartas naudoja UTF-8, labai didelį superkomplektą, kuriame yra originalūs ASCII, ISO-8859-1 ir ANSI kodavimai..

Tačiau dauguma anglų kalbos HTML dokumentų, net ir tų, kurie aiškiai deklaruoja ISO-8859-1 arba UTF-8 kaip savo simbolių rinkinį, iš tikrųjų naudoja mažesnį ASCII simbolių rinkinį. Tam yra dvi priežastys:

  • ASCII galima įvesti įprastoje QWERTY klaviatūroje.

  • Daugybė HTML generavimui naudojamų technologijų palaiko tik ASCII.

Kadangi abu ISO-8859-1 ir UTF-8 yra suderinami su ASCII, tai paprastai nesukelia jokių problemų.

ISO-8859-1 ir simbolių subjektai

Išplėstinis simbolių rinkinys, pasiekiamas ISO-8859-1, gali būti pateiktas tik ASCII dokumente, naudojant HTML simbolių subjektus. Tai stygos, prasidedančios simboliu (“&“) Ir baigti kabliataškiu („; “).

Pvz., Autorių teisių simbolis (apskritimas, kuriame yra raidė „C“) gali būti užkoduotas tiesiogiai, naudojant ISO-8859-1 arba UTF-8. Bet kadangi daugumoje klaviatūrų nėra klavišo ©, daugeliui žmonių lengviau įvesti ©.

Tai saugoma faile kaip šeši ASCII simboliai: &, c, o, p, y ir. Tada interneto naršyklės vartotojui rodo atitinkamą simbolį ISO-8859-1.

Dauguma ne ASCII ISO-8859-1 simbolių yra pavadinę HTML simbolių subjektus. Tų, kurie to nedaro, galima įvesti su savo skaitmeniniu kodu. Skaitinis kodas iš tikrųjų yra dešimtainė (bazinė 10) dvejetainio kodavimo versija.

Pvz., Autorių teisių simbolis užkoduotas kaip 10101001 dvejetainėje, o 169 – 10 bazėje. Taigi galite įvesti © arba ©.

Ne ASCII simboliai ISO-8859-1 ir ANSI

Šioje diagramoje esantys 128-159 simboliai yra ANSI simboliai, neįtraukti į ISO-8859. Pirmieji 127 kodai, esantys ISO-8859-1 / ANSI, čia neįtraukti, nes jie yra identiški ASCII, kurį išvardijome aukščiau.

Charakteris
HTML vardas
HTML numeris
apibūdinimas
eurų ženklas
vienas kabučių ženklas žemas-9
ƒƒƒmaža raidė f su kabliu
dviguba maža-9 kabutė
horizontalioji elipsė
durklas
dvigubas durklas
ˆˆˆmodifikatoriaus raidės circumflex akcentas
už tūkstantmečio ženklą
ŠŠŠdidžioji raidė S su caronu
viena kairiojo kampo citata
ŒŒŒkapitalo ligatūra OE
ŽŽkaptialinė raidė Z su caronu
kairėje kabutėje
dešinysis kabutė
kairėje kabutėje
dešinė dviguba kabutė
kulka
en brūkšnys
em brūkšnys
˜˜˜tilde
TM prekės ženklas
šššmažosios raidės S su caronu
teisingo kampo kabutė
œœœmažosios ligatūros oe
žžmažoji raidė z su caronu
ŸŸŸdidžiosios raidės Y su diaereze
 nepralaužanti erdvės
¡ ¡ ¡apverstas šauktukas
¢ ¢ ¢centų ženklas
£ £ £svaro ženklas (valiuta)
¤ ¤ ¤valiutos ženklas
¥ ¥ ¥jenos / juanio ženklas
¦ ¦ ¦sulaužyta vertikali juosta
§ § §skyriaus ženklas
¨ ¨ ¨diaerezė
© © ©autorinis ženklas
ª ª ªmoteriškas ordinarinis rodiklis
« « «kairysis dvigubo kampo kabutė (giltinė)
¬ ¬ ¬nepasirašyti (logika)
­ ­ Visiem, kas noklusina, tacuminkšta / pasirenkama brūkšnelis
® ® ®registruotas prekės ženklas
¯ ¯ ¯tarpai makrokomandoje / perbraukti
° ° °laipsnio ženklas
± ± ±pliuso / minuso ženklas
² ² ²antrasis indeksas (kvadratas)
³ ³ ³3 viršutinis raktas (kubas)
´ ´ ´ūmus akcentas
µ µ µmikro ženklas
pastraipos ženklas (pagalvė)
· · ·vidurinis taškas
¸ ¸ ¸Cedilla
¹ ¹ ¹Viršutinis vienas
º º ºvyriškas ordininis rodiklis
» » »dešinysis dvigubo kampo kabutė (giltinė)
¼ ¼ ¼ketvirtadalio dalis (1 daugiau nei 4)
½ ½ ½pusė frakcijos (1 per 2)
¾ ¾ ¾trijų ketvirčių dalis (3 daugiau nei 4)
¿ ¿ ¿apverstas klaustukas
À À Àdidžioji raidė A su graudžiu akcentu
Á Á Ádidžiosios raidės A su aštriu akcentu
  Âdidžiosios raidės A su apskritimo lanku
à à Ãdidžioji raidė A su tilde
Ä Ä Ädidžiosios raidės A su diaerezė
Å Å Ådidžioji raidė A su žiedu aukščiau
Æ Æ Ækapitalas AE ligatūra
Ç Ç Çdidžioji raidė C su cedilla
È È Èdidžioji E raidė su graudžiu akcentu
É É Édidžiosios raidės E su aštriu akcentu
Ê Ê Êdidžiosios raidės E su apskritimo lanku
Ë Ë Ëdidžioji raidė E su diaerezė
Ì Ì ÌI didžioji raidė su graudžiu akcentu
Í Í Ídidžioji I raidė su aštriu akcentu
Î Î Îdidžioji I raidė su „ympflex“
Ï Ï Ïdidžioji I raidė su diaereze
Ð Ð Ðdidžioji raidė ETH („Dogecoin“ simbolis)
Ñ Ñ Ñdidžioji raidė N su tilde
Ò Ò Òdidžioji raidė O su graudžiu akcentu
Ó Ó Ódidžioji raidė O su aštriu akcentu
Ô Ô Ôdidžioji raidė O su ketera
Õ Õ Õdidžioji raidė O su tilde
Ö Ö Ödidžioji raidė O su diaereze
× × ×daugybos ženklas
Ø Ø Ødidžiosios raidės O brūkšnys
Ù Ù Ùdidžioji raidė U su gravitacijos akcentu
Ú Ú Údidžioji raidė U su aštriu akcentu
Û Û Ûdidžioji raidė U su apskritimo lanku
Ü Ü Üdidžioji raidė U su diaereze
Ý Ý Ýdidžioji raidė Y su aštriu akcentu
Þ Þ Þdidžioji raidė THORN
ß ß ßsmulkiosios raidės mažosiomis raidėmis (Esett / scharfes S )
à à àmaža raidė su graudžiu akcentu
á á ámažosios raidės a su aštriu akcentu
â â âmažosios raidės a su circumflex
ã ã ãmažosios raidės a su tilde
ä ä ämažosios raidės a su diaereze
å å åmažosios raidės a su žiedu aukščiau
æ æ æmažosios ae ligatūra
ç ç çmažosios raidės c su cedilla (cé cédille)
è è èmažosios raidės e su gravitacijos akcentu
é é émažosios raidės e su aštriu akcentu
ê ê êmažosiomis raidėmis e su circumflex
ë ë ëmažosios raidės e su diaereze
ì ì ìi mažoji raidė su graudžiu akcentu
í í íi mažoji raidė su aštriu akcentu
î î îi mažosios raidės su circumflex
ï ï ïi mažosios raidės su diaerezė
ð / td> ðkodas> ðmažosiomis raidėmis eth
ñ ñ ñmažoji raidė n su tilde
ò ò òmažoji raidė o su gravitacijos akcentu
ó ó ómažoji raidė o su aštriu akcentu
ô ô ômažosios raidės o su circumflex
õ õ õmažoji raidė o su tilde
ö ö ömažoji raidė o su diaerezė
÷ ÷ ÷padalijimo ženklas
ø ø ømažoji raidė o su pasvirusiu brūkšniu
ù ù ùmažoji raidė u su gravitacijos akcentu
ú ú úmažosios raidės u su aštriu akcentu
û û ûmažosios raidės u su circumflex
ü ü ümažosiomis raidėmis u su diaerezė
ý ý ýmažosios raidės y su aštriu akcentu
þ þ þmažosios raidės erškėčiai
ÿ ÿ ÿmažosios raidės y su diaereze

Unicode

„Unicode“ yra simbolių kodavimo standartas, valdomas „The Unicode Consortium“.

Kaip mes aptarėme, kompiuterinės sistemos nerašo ženklų (raidžių, skaičių, simbolių) pažodžiui – kietajame diske dokumente nėra mažos kiekvienos raidės paveikslėlio. Kaip jūs dabar turėtumėte žinoti, kiekvienas simbolis užkoduotas kaip dvejetainių bitų seka – 1 ir 0. Pavyzdžiui, mažųjų raidžių „a“ kodas yra 01100001.

Bet 01100001 yra savavališkas – toje bitų eilutėje nėra nieko ypatingo, kuri turėtų ją paversti „a“ raide – kompiuterių pramonė kolektyviai sutiko, kad tai reiškia „a“. Taigi, kaip visa pramonė susitarta, kaip pavaizduoti kiekvieną įmanomą personažą? Su simbolių kodavimo standartu. Kodavimo standartas tiesiog nurodo visus galimus simbolius ir kiekvienam priskiria bitų eilutę.

Per pastaruosius kelis skaičiavimo dešimtmečius visame pasaulyje buvo naudojami keli ženklų kodavimo standartai. Ilgą laiką visuotinai priimtiniausias standartas buvo ASCII. „ASCII“ problema ta, kad ji užkoduota tik palyginti nedaug simbolių – daugiausia 256. Tai pašalino ne lotynų kalbas, daugybę svarbių matematikos ir mokslo simbolių ir net keletą pagrindinių skyrybos ženklų.

Be ASCII vartojimo angliškai ir kitomis kalbomis, kurios naudoja lotynišką abėcėlę, kalbų grupės, naudojančios kitas abėcėles, buvo linkusios naudoti savo ženklų kodavimą. Kadangi šios kodavimo schemos buvo apibrėžtos viena nuo kitos, jos dažnai prieštaravo; tuo pačiu metu nebuvo įmanoma naudoti vienos kodavimo schemos kelioms kalboms.

„Unicode“ iš pradžių buvo sumanyta ir toliau plėtojama, būtent siekiant įveikti šiuos iššūkius. „Unicode“ tikslas yra pateikti a uniersalis, unifiedė, ir unieilutės kodo identifikatorius kiekvienai grafikai bet kuria pasaulio kalba ir rašymo sistema.

UTF-8

„Unicode“ buvo įdiegtas keliose simbolių kodavimo schemose, tačiau šiandien plačiausiai naudojamas standartas yra UTF-8. UTF-8 tapo beveik universalus visų tipų šiuolaikiniams kompiuteriams.

UTF-8 koduoja simbolius, naudodamas iki 4 8 ​​bitų kodų blokus. ASCII naudojo tik 8 bitus vienam simboliui. Unicode simboliai, anksčiau įtraukti į ASCII, UTF-8 pavaizduoti vienu 8 bitų paketu, tais pačiais 8 bitais, kurie buvo naudojami ASCII. Tai daro ASCII tekstą suderinamą su UTF-8. (Tai yra viena iš daugelio priežasčių, kodėl UTF-8 tapo universaliu standartu – perėjimas buvo gana lengvas.)

8 × 4 schema suteikia UTF-8 daugiau nei milijoną kodų, leidžiančių „Unicode“ koduoti simbolius iš 129 scenarijų ir rašymo sistemų.

Šaltiniai „Unicode“ supratimui

  • Įvadas į rašymo sistemas ir „Unicode“ yra labai kruopštus, net iškalbingas paaiškinimas apie simbolių kodavimą paprastai, o ypač „Unicode“; jei „Unicode“ galite perskaityti tik vieną dalyką, tai reikia skaityti
  • „Unicode“ standartas: techninis įvadas yra oficialus „Unicode“ standarto paaiškinimas
  • Į BMP ir ne tik! yra „Unicode“ pamoka, tinkama pristatymui klasėje arba savarankiškam mokymuisi
  • „Unicode“ pamoka paaiškina, kaip veikia „Unicode“, įskaitant įdomias detales, tokias kaip simbolių derinimas, ir kaip turėtų veikti „Unicode“ analizės variklis..

Knygos apie „Unicode“

  • Jukka Korpela „Unicode Explained“ pateikia gerą „Unicode“ ir įvairių plėtros iššūkių, susijusių su jo įgyvendinimu, apžvalgą.
  • „Unicode Demystified“: Richardo Gillamo praktinis programuotojo kodavimo standarto vadovas yra naudingas, jei šiek tiek pasenęs, „Unicode“ paaiškinimas, turintis daug „Java“ orientuotų diegimo ypatumų.
  • Yannis Haralambous šriftas ir šifravimas yra ne tik apie „Unicode“, bet gali būti knyga, kurią verta perskaityti; joje aprašoma teksto kodavimo ir vaizdavimo kompiuteriuose istorija, suteikiant teorinį ir praktinį pagrindus suprasti „Unicode“ ir keletą glaudžiai susijusių dalykų.

„Unicode“ etaloninė medžiaga

Kai susipažinsi su „Unicode“, dažniausiai tau teks ieškoti konkrečios informacijos, tokios kaip tikslus tam tikro simbolio kodavimas..

  • „C / C ++“ „Unicode“ žaidimų kodo lapas pateikia informaciją apie „Microsoft C / C ++“ konvertavimą į „Unicode“
  • XML ir Unicode technologijos ataskaitos yra techninių ataskaitų sąrašas, apimantis įvairius XML ir Unicode naudojimo aspektus
  • „Decode Unicode“ teikia internetinį „Unicode“ žodyną su gražia vartotojo sąsaja, leidžiančia peržiūrėti visus apibrėžtus „Unicode“ simbolius, net neturint vietinio šrifto palaikymo.
  • Duomenys apie kalbas pateikia informaciją apie paiešką „Unicode“ simbolių rinkiniuose naudojant įvairias kalbas
  • „Unicode Navigator“ pateikia organizuotą visų „Unicode“ simbolių sąrašą

„Unicode“ įrankiai

  • „Unicode Analyzer“ yra „Chrome“ naršyklės plėtinys, teikiantis informaciją apie „Unicode“ tekstą tinklalapiuose ir dokumentuose
  • Simbolių identifikatorius yra „Firefox“ papildinys, pateikiantis kontekstinį meniu, kuriame galima rasti daugiau informacijos apie pasirinktus „Unicode“ simbolius
  • Norėdami įterpti „Unicode“ simbolius į žiniatinklio teksto laukus, išbandykite „Unicode“ simbolius „Chrome“ arba „Unicode“ įvesties įrankį „Firefox“.
  • „UnicodeDataBrowser“ pateikia GUI, kad būtų lengviau perskaityti „UnicodeData.txt“ failą
  • „Polyglot 3000“ automatiškai nustato bet kokio teksto kalbą
  • „Unicode“ pateikia įvairių „Unicode“ palaikomų scenarijų „Unicode“ simbolių klaviatūros išdėstymą
  • „Babel“ yra „Python“ biblioteka, skirta įvairioms internacionalizacijos ir lokalizacijos užduotims
  • D tipo „Unicode“ teksto variklis yra „C ++“ biblioteka, skirta aukštos kokybės „Unicode“ tekstui išdėstyti, pateikti ir redaguoti bet kuriame įrenginyje, platformoje ar operacinėje sistemoje.
  • „Nunicode“ yra C biblioteka, skirta UTF-8 dokumentų kodavimui ir dekodavimui
  • Nešiojamasis UTF-8 teikia „Unicode“ palaikymą PHP stygoms
  • „Tesseract OCR“ suteikia optinį simbolių atpažinimą „Unicode“ tekstui
  • „Popchar“ yra patobulintas simbolių žemėlapis, leidžiantis lengvai rasti ir įvesti simbolius iš visos „Unicode“ erdvės srities
  • „Unicode Utilities“ teikia daugybę įdomių ir naudingų internetinių įrankių, skirtų darbui su „Unicode“
  • „Edicode“ suteikia lanksčią internetinę „Unicode“ klaviatūrą tekstui įvesti, naudojant įvairius tarptautinius scenarijus
  • „Quickkey“ yra lankstus klaviatūros plėtinys, skirtas įvesti pirmuosius 65 000 apibrėžtų „Unicode“ simbolių
  • „Unicode Code Converter“ konvertuoja bet kurį įvestą simbolio kodą į keletą skirtingų to paties simbolio kodavimų
  • „CharFunk“ yra „JavaScript“ programa, skirta atlikti daugybę įdomių „Unicode“ simbolių patikrinimų ir operacijų
  • „Kreative Recode“ paverčia teksto failus iš įvairių kodavimų į „Unicode“
  • „BabelMap Online“ siūlo „Unicode“ klaviatūrą naršyklėje su ekrano simbolių išvestimi, šešioliktainiu ar dešimtainiu kodavimu

Teksto ir kodo redaktoriai

Daugelis šių dienų teksto redaktorių, kodų redaktorių ir IDE arba naudoja „Unicode“ pagal nutylėjimą, arba lengvai naudoja „Unicode“. „Sublime“, „Notepad ++“, „Atom“ ir „Eclipse“ visi yra nustatyti kaip UTF-8 kaip numatytasis simbolių kodavimas. Norint naudoti „UTF-8“, „Vim“ ir „Emacs“ gali reikėti pakeisti nustatymus:

  • „Unicode“ naudojimas kartu su „Emacs“
  • Naudojant Unicode su Vim

Taip pat yra keletas kodų ir teksto redaktorių, specialiai sukurtų tvarkyti išplėstinį „Unicode“ simbolių rinkinį:

  • „MinEd“ yra „Unicode“ teksto rengyklė su kontekstiniu palaikymu simbolių įterpimui iš visos „Unicode“ simbolių vietos
  • Klasikinio teksto redaktorius yra patobulintas redaktorius, skirtas darbui su kritiniais ir moksliniais tekstų leidimais, įskaitant daugiakalbius tekstus, naudojant platų „Unicode“ simbolių rinkinį.

„Unicode“ šriftai

Šriftų ir „Unicode“ santykis yra šiek tiek įstrižas. „Unicode“ buvo sukurtas suderinti su ASCII atgal – ASCII formatuotas tekstas gali būti iššifruotas kaip „Unicode“ be jokių problemų. Unicode koduotas tekstas gali būti rodomas naudojant ASCII šriftus, jei naudojami tik maži simbolių rinkiniai, rodomi ASCII.

Šiandien dauguma šriftų, prieinamų daugelyje kompiuterių, yra užkoduoti „Unicode“. Taigi šiuo požiūriu dauguma šriftų yra „Unicode“ šriftai. Tačiau dauguma šriftų nepalaiko ypač didelio viso „Unicode“ standarto rinkinio.

Paprastai tai nėra problema; kažkas, rašantis tekstą keliomis kalbomis arba turintis išplėstą simbolių rinkinį, gali naudoti kelis skirtingus šriftus – vieną lotyniškam scenarijui, kitą kiekvienai CJK kalbai, kitą – matematikos simboliams (pavyzdžiui). Tačiau kartais gali būti naudinga turėti atskirus šriftus, kuriuose yra didelė „Unicode“ simbolių vietos dalis. To gali prireikti dirbant paprasto teksto ir šaltinio kodo aplinkose, kur neįmanoma naudoti kelių šriftų arba kai vizualinė kelių scenarijų vienybė yra ypač svarbi..

Toliau pateikiami žymiausi šriftų projektai, teikiantys išplėstinę „Unicode“ paramą. Norėdami pamatyti išsamesnį sąrašą, įskaitant pasenusius ir nebenaudojamus šriftus, skaitykite šiame „Unicode“ šriftų puslapyje. Azijos kalbų rašymą rasite šiame CJK šriftų sąraše.

  • „Everson Mono“ yra vienos erdvės šriftas, sukurtas vieno iš „Unicode“ standarto iniciatorių; nurodytas jo tikslas yra pateikti brėžinius kuo didesnėje „Unicode“ simbolių erdvėje, o (nuo šio rašto) palaikomi 92 „Unicode“ simbolių blokai.
  • „Noto“ yra didelis ekrano šriftų rinkinys, kurį sukūrė „Google“ ir kurie kartu palaiko daugumą „Unicode“ simbolių rinkinių, siekiant galiausiai palaikyti visą „Unicode“ standartą.
  • „Deja Vu Fonts“ yra šriftų šeima, teikianti platų „Unicode“ standarto aprėptį, naudojant „Serif“, „Sans“ ir „Monospace“ versijas..
  • „GNU FreeFont“ yra šriftų šeima, teikianti „Serif“, „Sans“ ir „Mono“ tipo veidus 37 rašymo sistemoms ir 12 „Unicode“ simbolių diapazonų..
  • „GNU Unifont“ yra vienos erdvės, bitkoino šriftas su visa „Unicode 8.0 Basic“ daugiakalbio plokštumos aprėptimi ir plačia, bet neišsamia papildomo daugiakalbio plokštumos aprėptimi..

Taip pat yra nemažai įdomių šriftų, koduojančių tam tikrą „Unicode“ standarto pogrupį, skirtą naudoti specializuotai.

  • „Junicode“ yra šriftų rinkinys, skirtas viduramžių žmonėms
  • „Paskutinė priemonė“ yra „paskutinės galimybės šriftas“; vietoj įprastų ženklų brėžinių, kiekvienas brėžinys iš tikrųjų rodo informaciją apie patį „Unicode“ ženklą
  • „Unicode“ senovės scenarijų šriftai yra projektas, skirtas sukurti kelių senovės ir klasikinės abėcėlės šriftų rinkinį.
  • „Unimath Plus“ pateikia išplėstą mokslo ir matematikos simbolių rinkinį

Jei vis tiek nerandate to, ko ieškote, pateikiame keletą papildomų „Unicode“ šrifto šaltinių.

  • „SIL“ šriftuoja daugybę šriftų įvairioms nepakankamai palaikomoms kalboms, kuriuos sukūrė „SIL International“, pasaulinė ne pelno tarnyba, teikianti paslaugas mažumų kalbų bendruomenėms.
  • „Unicode“ simbolių diapazonai ir juos palaikantys „Unicode“ šriftai padės rasti bet kurio „Unicode“ simbolių diapazono šriftą.

Jaustukų šaltiniai

Jaustukai yra tie juokingi šypsenėlių veidai ir nykščių ženklai, kuriuos galite įdėti į savo tekstinius pranešimus. Jie iš tikrųjų yra „Unicode“ standarto dalis. „Unicode“ jaustukų dalis nėra visuotinai palaikoma, todėl, jei norite įtraukti jaustukus į savo programą ar svetainę, gali reikėti pagalbos. Čia yra šaltiniai, kurie padės naudoti ir kurti naudojant „Unicode“ jaustukus.

Jaustukų nuoroda

  • „Emojipedia“ yra jaustukų simbolių duomenų bazė, kurios galima ieškoti
  • Ar galiu jaustukus? teikia informaciją apie „Unicode“ jaustukų palaikymą „iOS“, „Android“, „OS X“ ir „Windows“, taip pat pagrindinėse naršyklėse.
  • WTF jaustukų fondas yra šiek tiek rimta organizacija, skirta jaustukų tobulinimui; jie vykdo jaustukų žodyną.
  • Jaustukų kodų lape pateikiama greita nuoroda į jaustukų įvedimo kodus

Jaustukų bibliotekos

  • Įtraukite jaustukus į programas ir verskite iš kelių pardavėjų standartų naudodami šią PHP jaustukų biblioteką; arba išbandykite šią PHP7 jaustukų biblioteką, leidžiančią koduoti jaustukus pagal savo kodą
  • „Emoji for Python“ palaiko tiek oficialius „Unicode“ jaustukus, tiek kelis slapyvardžių rinkinius; „Django“ kūrėjai taip pat gali naudoti „django-jaustukų“ paketą
  • „Emoji Golang“ teikia jaustukų palaikymą „Go“ programavimo kalba
  • „Ruby“ yra keletas jaustukų palaikymo būdų, tačiau „Github“ yra tikriausiai pats geriausias
  • „Emoji-Java“ teikia jaustukų palaikymą „Java“
  • „Coloremoji.sty“ leidžia lengvai įtraukti spalvotas emocijas į „LaTeX“ dokumentus
  • Npm, „Node.js“ paketų valdymo sistema turi keletą jaustukų paketų:
    • Jaustukai ir mazgų jaustukai teikia pagrindinę jaustukų paramą,
    • „Ember-cli-jaustukai“ veikia kartu su „Emojify.js“, kad „Ember.js“ programoms galėtų suteikti jaustukų pagalbininkų.
    • „Markdown-it-emotic“ prideda jaustukus, kad palaikytų žymėjimo „it“ žymėjimo analizatorių
  • Jaustukų sintaksė yra kvaila „Atom“ teksto rengyklės biblioteka, kuri prideda jaustukus prie kodo eilučių pagal jų reikšmę.

Jaustukų klaviatūros ir kolekcijos

  • „EmojiXpress“, skirta „iOS“, yra „Emoji“ kolekcija ir klaviatūra „iPhone“
  • „Emojione“ yra kelių platformų „jaustukų“ kolekcija, turinti kūrėjams nemokamą „Creative Commons“ licencijuotą meno kūrinį
  • „iDiversicons“ siūlo platų įvairių emocijų ženklų ir „iPhone“ klaviatūros pasirinkimą.

MIME tipai

MIME reiškia „daugiafunkciai interneto pašto plėtiniai“. Tai yra interneto standartas, naudojamas įvairiems internete perduodamų failų tipams identifikuoti. Iš pradžių jis buvo sukurtas el. Laiškams, kurie buvo siunčiami per SMTP (paprastą pašto perdavimo protokolą), kuris yra interneto standartas el. Laiškams perduoti. Šiais laikais MIME yra nepaprastai svarbi kituose komunikacijos protokoluose, tokiuose kaip HTTP.

MIME istorija

Jau aptarėme ASCII istoriją ir simbolių kodavimą. Tačiau informacijos siuntimo istorijoje yra daug daugiau nei tai.

Laikui bėgant mūsų pranešimai ėmė vis sudėtingesni ir tapo akivaizdu, kad šio standartinio formato nepakanka. Daugialypės terpės atvaizdai, kuriuose buvo garso ar vaizdo failų, nebuvo apibrėžti. Tas pats pasakytina apie kalbas, kurios nenaudojo angliškos abėcėlės. Padėtis galutinai pradėjo keistis, kai du žmonės suvienijo jėgas: Nathanielis Borensteinas ir Nedis Libertas.

Jų pasiūlymas iš naujo apibrėžė pranešimų formatą, kad el. Laiške būtų keli objektai vienoje žinutėje; ne ASCII rašmenų, taip pat ne anglų kalbų vartojimas; ir vaizdų, garso ir vaizdo įrašų naudojimą. Taip gimė MIME, kuris 1993 m. Tapo oficialiu standartu.

Pasiūlyme taip pat apibrėžti kodavimo standartai, kurie yra 7 bitų, 8 bitų, base64, dvejetainiai ir kuriuos galima atspausdinti. Šie kodavimo standartai turėjo užtikrinti, kad visi duomenys būtų siunčiami. Jame taip pat buvo informacijos apie turinio tipo antraštės naudojimą, kuri yra būtina norint tinkamai nustatyti perduodamų duomenų tipą.

Kas yra MIME tipai?

MIME tipai yra identifikatoriai, naudojami nustatyti daugybę failų formatų, kasdien perduodamų internete. Juos standartizuoja IANA (interneto priskirtų numerių tarnyba). Pirmiausia MIME tipai buvo apibrėžti ir įvardyti kaip užklausa dėl komentarų: 2045 (RFC 2045), kurią paskelbė IETF (interneto inžinerijos darbo grupė), kuris buvo oficialus pasiūlymas, kurį pateikė „Borenstein“ ir „Freed“..

Struktūra

MIME tipus sudaro tipas ir potipis, kurie yra dvi eilutės, atskirtos brūkšniu į priekį. Tipas žymi kategoriją ir gali būti atskiras arba daugiadalyvis. Kiekvienas tipas turi specifinį potipį. Paprastai MIME tipai rašomi mažosiomis raidėmis.

Diskretiniai tipai yra tekstas, vaizdas, garso, vaizdo įrašas ir programa. Kelių dalių tipai reiškia dokumentų kategoriją, suskirstytą į atskiras dalis ir dažnai apimančius skirtingus MIME tipus. Jie apima formos duomenis ir baitų duomenis.

Kai kurie MIME tipai yra prieš x arba vnd. „X“ priešdėlis reiškia, kad jis nebuvo užregistruotas IANA, o „vnd“ reiškia konkretų pardavėjo priešdėlį.

Įprasti MIME tipai

Taikymas:

  • programa / „msword“ (.doc)
  • aplikacija / vnd.openxmlformats-officedocument.wordprocessingml.document (.docx)
  • aplikacija / vnd.openxmlformats-officedocument.wordprocessingml.template (.dotx)
  • „application / vnd.ms-powerpoint“ (.ppt)
  • programa / ekomaskriptas (.es)
  • programa / x-javascript (.js)
  • programa / okteto srautas (.bin, .exe)
  • paraiška / pdf (.pdf)
  • programa / žinutė (.ps, .ai, .eps)
  • taikymas / rtf (.rtf)
  • taikymas / x-gtar (.gtar)
  • programa / x-gzip (.gz)
  • programa / „x-Java“ archyvas (.jar)
  • aplikacija / „x-Java“ -nuoseklusis objektas (.ser)
  • taikymas / x-java-vm (.klasė)
  • taikymas / x-tar (.tar)
  • programa / ZIP (.zip)
  • taikymas / x-7z suspaustas (.7z)
  • taikymas / x-rar-suglaudintas (.rar)
  • taikymas / „x-shockwave-flash“ (.swf)
  • aplikacija / vnd.android.package-archive (.apk)
  • taikymas / x-bittorrent (.torrent)
  • programa / „epub“ + „ZIP“ (.epub)
  • taikymas / vnd.ms-excel (.xsl)
  • taikymas / x-font-ttf (.tff)
  • aplikacija / rss + xml (.rss, .xml)
  • aplikacija / vnd.adobe.air-application-installer-pack + zip (.air)
  • aplikacija / x-debian-pack (.deb)
  • programa / json (.json)

Garsas:

  • garso / x-midi (.mid, .midi)
  • garso / „x-wav“ (.wav)
  • garso / mp4 (.mp4a)
  • garso / ogg (.ogg)
  • garso / mpeg (.mp3)

Vaizdas:

  • vaizdas / bmp (.bmp)
  • vaizdas / gif (.gif)
  • „image / JPEG“ (.jpeg, .jpg, .jpe)
  • vaizdas / tiff (.tiff, .tif)
  • „image“ / x-xbitmap (.xbm)
  • vaizdas / „x“ piktograma (.ico)
  • vaizdas / svg + xml (.svg)
  • vaizdas / png (.png)

Tekstas:

  • tekstas / html (.htm, .html)
  • tekstas / paprastas (.txt)
  • tekstas / turtingas tekstas (.rtf, .rtx)
  • tekstas / CSS (.css)
  • tekstas / csv (.csv)
  • tekstas / kalendorius (.ics)

Vaizdo įrašas:

  • vaizdo įrašas / mpeg (.mpg, .mpeg, .mpe)
  • vaizdo įrašas / ogg (.ogv)
  • vaizdo įrašas / greitasis laikas (.qt, .mov)
  • vaizdo įrašas / „x-msvideo“ (.avi)
  • vaizdo įrašas / mp4 (.mp4)
  • vaizdo įrašas / internetas (.webm)

Šaltiniai

MIME tipai leido mums gauti geresnę ir turtingesnę el. Pašto patirtį. Šis išteklių sąrašas padės jums išsamiau sužinoti, kaip ir kodėl jie atsirado, kaip tinkamai sukonfigūruoti žiniatinklio serverį MIME tipo palaikymui ir dar daugiau.

Internetiniai šaltiniai

Šiame sąraše yra nuorodos į penkių dalių pasiūlymą, kuris tapo standartiniu MIME projektu.

  • RFC 2045 (PDF): pirmoje pasiūlymo dalyje nurodomos įvairios antraštės, naudojamos apibūdinti MIME pranešimų struktūrą..
  • RFC 2046 (PDF): antrasis dokumentas apibūdina bendrą MIME laikmenų spausdinimo sistemos struktūrą ir pradinį laikmenų tipų rinkinį.
  • RFC 2047 (PDF): trečiojoje pasiūlymo dalyje aprašomi plėtiniai, kurie leidžia ne JAV-ASCII tekstinius duomenis interneto pašto antraštės laukuose.
  • RFC 2048 (PDF): ketvirtoje dalyje aprašoma, kaip naujus MIME tipus galima užregistruoti IANA.
  • RFC 2049 (PDF): penktame dokumente aprašomi MIME atitikties kriterijai ir MIME pranešimų formatų pavyzdžiai.
  • Laikmenų tipai: visas visų laikmenų tipų sąrašas, kuriame taip pat yra nuoroda į programą, skirtą naujų tipų laikmenoms registruoti.
  • MIME vaikinai: kaip amžinai pasikeitė du internetiniai guru: straipsnis, paremtas Nathanielio Borensteino ir Ned Freedo interviu, kuriame pateikiama įdomi įžvalga apie jų darbą.

Pamokos

Šie šaltiniai pateikia naudingus mokymus, kaip tvarkyti MIME tipus, tinkamą serverio konfigūraciją ir dar daugiau.

  • Tinkamas serverio MIME tipų konfigūravimas: aptariama, kodėl žiniatinklio valdytojai turėtų pasirūpinti tinkamai sukonfigūravę savo žiniatinklio serverį, nes pridedami nauji MIME tipai, ypač „Gecko“ pagrįstose naršyklėse..
  • Laikmenos formatai, palaikomi HTML garso ir vaizdo elementų: pateikia MIME tipų, kuriuos palaiko nauji garso ir vaizdo elementai HTML5, sąrašą
  • Kas yra MIME šnipinėjimas: šiame straipsnyje išsamiai paaiškinama, kaip MIME šnipinėti ir kaip išvengti su juo susijusių pažeidžiamumų.
  • Paaiškinti MIME tipai: Kodėl „Linux“ ir „Mac OS X“ nereikia failų plėtinių: įdomus skaitymas, paaiškinantis vieną iš „Windows“ kompiuterio ir „Linux“ / „Mac OS X“ kompiuterio skirtumų.
  • Tinkamo „MIME“ tipo pasirinkimas „JavaScript“: šiuo metu yra daugiau nei vienas „Java“ MIME tipas. Šiame vadove paaiškinsite kiekvieno naudojimo atvejus.

Knygos

Nors nėra knygų, skirtų tik MIME tipams, vis tiek yra nemažas skaičius knygų, susijusių su glaudžiai susijusiomis temomis, kuriose būtų skirti keli skyriai.

  • Lawrence’o Hughes’o interneto el. Pašto protokolai, standartai ir įgyvendinimas (1998 m.): Skirta labiau pažengusiems vartotojams, ši knyga sustiprina žinias apie esmines sąvokas, reikalingas kuriant el. Pašto programinę įrangą, ir išsamiai aprašo pagrindinius interneto el. Pašto protokolus ir plėtinius, tokius kaip SMTP, POP3, IMAP. , MIME ir DSN.
  • Internetinio el. Pašto programavimas (1999 m.), Autorius Davidas Woodas: pagrindinis vadovas, apimantis visas svarbias idėjas, reikalingas programoms kurti, be elektroninio pašto galimybių. Aptariamos temos apima įvairius el. Pašto protokolus, el. Pašto formatus, įskaitant MIME tipus, ir daugybę pavyzdžių.
  • Peterio Loshino esminiai el. Pašto standartai (1999 m.): Ši knyga yra būtina visiems, norintiems išmanyti apie el. Pašto standartus. Čia pateikiama išsami svarbiausių IETF paskelbtų RFC analizė, taip pat jų galimas panaudojimas. Jame taip pat yra kompaktinė knygos, kurioje visiškai galima rasti skaitmeninę knygos versiją, paieška.
  • MH & „xmh“ (2006), autorius Jerry Peek: ši knyga yra laisvai prieinama internete ir išleidžiama pagal GNU-GPL licenciją. Trečiame skyriuje labai išsamiai paaiškinami MIME tipai ir daugiadalygiai pranešimai

Įrankiai

Žemiau esančiose nuorodose yra keletas naudingų įrankių, skirtų patikrinti MIME tipų galiojimą.

  • Kokius MIME tipus palaiko mano naršyklė: internetinis įrankis, kuris jums nurodys, kuriuos MIME tipus palaiko jūsų naršyklė, kai tik įkeliate puslapį.
  • „MIME Validator“: nemokamas internetinis „MIME“ patvirtintojas, tikrinantis, ar MIME pranešimai atitinka IETF standartus..
  • Kas MIME: dar vienas nemokamas internetinis bet kurio failo tikrintuvas.

Išplėskite savo žinias apie MIME tipus

MIME tipai gali atrodyti nereikšmingi, tačiau jie labai pakeitė mūsų el. Pašto pranešimų funkciją. Šis išteklių sąrašas turėtų paskatinti jūsų smalsumą ir suteikti jums gilesnį supratimą apie tai, kaip metams bėgant keitėsi el. Paštas ir failai, perduoti internetu..

Santrauka

Daugelis žmonių tiesiog rašo ir nelabai galvoja apie tai, kas vyksta. Keletas atrodė, kad galvoja apie šrifto dizaino ir tipografijos naujoves.

Bet dar mažiau yra žmonių, kurie žino ar nori žinoti, kas vyksta užkulisiuose – kaip klavišo paspaudimas tampa raide jų kompiuterio ekrane.

Visiems kitiems jis yra skaidrus arba nereikšmingas.

Tačiau, kaip mes parodėme, kalbų vaizdavimo procesas yra beveik nereikšmingas, ir padaryta daug darbo, kad ji taptų tokia skaidri, kokia yra. „Unicode“ konsorciumas kartu su daugybe kūrėjų, dizainerių ir kalbininkų sudarė galimybę kiekvienam parašyti bet kokį simbolį, bet kuria kalba, bet kokiu scenarijumi ir kompiuteryje..

Tai reikšmingas laimėjimas ir būtinas žingsnis link bendrojo raštingumo ir visuotinės prieigos prie kompiuterių ir interneto.

DUK

K. Kuo skiriasi ASCII, „Unicode“ ir UTF-8?

A. ASCII yra senesnis standartas nuo septintojo dešimtmečio, o „Unicode“ atsirado 1980-ųjų pabaigoje.

ASCII yra tik 128 arba 256 simboliai, tačiau „Unicode“ yra daugiau nei 10 000.

„Unicode“ yra simbolių lentelė, UTF-8 (arba UTF-16 arba UTF-32) yra kodavimo lygis. „Unicode 0-256“ ir ASCII yra beveik vienodi, tik su nedideliais skirtumais tarp valdymo simbolių.

Šiandien UTF-8 yra labiausiai paplitęs kodavimas žiniatinklyje – ir numatytasis.

K. Ar turiu deklaruoti, kokį kodavimo tipą naudoju savo tinklalapyje?

A. Tik jei žinote, kad reikia naudoti unikalų kodavimo tipą.

Jei to nedeklaruojate, daugumoje naršyklių numatytasis nustatymas yra UTF-8. Jei kuriate tinklalapį užsienio kalba, ypač ne lotynų kalba, įsitikinkite, kad naudojate UTF-8, arba pasirinkite specialų simbolių rinkinį.

K. Ar reikia įsiminti visus ASCII kodus, kad galėčiau rašyti HTML?

A. Tik jei norite būti nepaprastai efektyvūs.

Daugelis svetainių šiandien yra dinamiškos ir sukuria jums HTML per tokias sistemas kaip turinio valdymo sistema (CMS). Jei esate kūrėjas, greičiausiai, be HTML, naudosite ir kitas programavimo kalbas, kurios gali turėti specialius būdus generuoti tuos ASCII simbolius..

Galiausiai, kaip aptarta aukščiau, daugelis šių kodų naudoja specialius simbolių pavadinimus HTML, o ne ASCII numerius.

K. Ar ženklų kodavimas skiriasi skirtingose ​​operacinėse sistemose?

A. Šiek tiek.

„Unicode“ šiek tiek skiriasi „Windows“ ir „Unix“ / „Linux“. Pvz., „Windows“ naudoja UTF-16LE, o „Linux“ paprastai naudoja UTF-8.

Dabar, be abejo, jūsų operacinės sistemos naudojamas kodavimas gali skirtis nuo tinklalapio kodavimo, tačiau jūsų OS ir žiniatinklio naršyklė veikia kartu konvertuodami simbolių kodus į tai, ką gali rodyti jūsų kompiuteris..

Kartais senesnėse operacinėse sistemose ši konversija gali neveikti ir jūs tiesiog matysite tuščius simbolius. (Pavyzdžiui, tai galite pastebėti apsilankę užsienio svetainėje „Windows XP“.)

Q. ASCII menas yra nuostabus! Kur galiu pasidaryti savo?

A. AsciiWorld.com programinės įrangos skyriuje yra keletas puikių galerijų ir įrankių, tokių kaip keitikliai ir „tapytojai“. Pasilinksmink!

Kiti įdomūs dalykai

Mes turime daugiau vadovų, vadovėlių ir infografikų, susijusių su kodavimu ir svetainių kūrimu:

  • CSS3 – įvadas, vadovai ir šaltiniai: tai puiki vieta pradėti mokytis tinklalapio išdėstymo.

  • „PostScript“ įvadas ir šaltiniai: sužinokite viską apie puslapio rodymo kalbą, kuri pakeitė pasaulį.

  • Loremas Ipsumas: išmokite naudoti „netikrą tekstą“ kurdami dizainą prieš parašydami turinį.

HTML pradedantiesiems – puikus vadovas

Jei tikrai norite išmokti HTML, mes sukūrėme knygos ilgio straipsnį HTML pradedantiesiems – pagrindinis vadovas. Ir tai tikrai yra geriausias vadovas; tai užtruks jus nuo pat pradžių iki meistriškumo.

HTML pradedantiesiems - puikus vadovas
HTML pradedantiesiems – puikus vadovas

Žiniatinklio dizaino tendencijos, kurių niekada nepamiršite

Prieš „Unicode“ buvo įprasta lankytis svetainėse, kuriose visas tekstas buvo pažymėtas tuščiomis dėžutėmis. Reikalai labai pasikeitė. Infografikos tinklalapių kūrimo tendencijose, kurių niekada nepamiršite, metu mes stebime, koks buvo žiniatinklis.

Web dizainas, kurio niekada nepamiršite
Žiniatinklio dizaino tendencijos, kurių niekada nepamiršite

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map