ASCII kodējums: iesācēji, iesācēji …. Mēs esam ieguvuši visu nepieciešamo informāciju šeit.

Atklāšana: Jūsu atbalsts palīdz vietnei darboties! Mēs nopelnām nodošanas maksu par dažiem pakalpojumiem, kurus mēs iesakām šajā lapā.


ASCII ir rakstzīmju kodēšanas veids, ko datoriem izmanto, lai saglabātu un izgūtu rakstzīmes (burtus, ciparus, simbolus, atstarpes, ievilkumus utt.) Kā bitu modeļus, lai tos saglabātu atmiņā un cietajos diskos..

“Rakstzīmju kodējums” augstā līmenī nozīmē simbola pārvēršanu binārā skaitā un “rakstzīmju kartes” izmantošanu, lai nolasītu bināro numuru kā burta veidu.

Un MIME veidi ļauj lietotājiem sūtīt datus, kas pārsniedz rakstzīmes, piemēram, attēlus un video.

ASCII, rakstzīmju kodēšana, MIME veidi

Rakstzīmju kodējums

Agrākais rakstzīmju kodēšanas veids ir tikpat tālu kā elektriskais telegrāfs. Faktiski Morzes kods un vēlāk arī Baudota kods bija daži no pirmajiem standartizētajiem rakstzīmju kodiem, kas jebkad izveidoti.

Otro kodēšanas kārtu, ko sauc par šifrēšanu vai šifrēšanu, izveidoja arī tā laika militāristi, taču tā ir diezgan atšķirīga tēma.

Tikai 50. gados sākām mūsdienīgu procesu virzīties uz ASCII. IBM to sāka, izstrādājot kodēšanas shēmas izmantošanai viņu 7000. sērijas datoros.

IBM binārais kodētais decimāldaļa (BCD) perforatoros izmantoja četru bitu kodējumu. Tas bija veids, kā decimālos skaitļus uzglabāt binārā formā.

Tā vietā, lai skaitļi skaitītos no 0000 (0) līdz 1111 (15), tie svārstījās no 0000 (0) līdz 1001 (9) – katrs četri biti apzīmē vienu ciparu.

Vēlāk IBM izveidoja paplašinātu BCD versiju, ko sauca par paplašināto bināro kodēto decimālo apmaiņas kodu (EBCDIC). Tā bija 8 bitu kodēšanas sistēma visām standarta izdrukājamajām rakstzīmēm.

Tajā pašā 1963. gadā tika ieviesta ASCII.

Tas izmanto 7 bitu kodēšanas shēmu. Tas apzīmē 128 dažādus skaitļus.

Šis 7 bitu numuru formāts varētu šķist dīvains. Galu galā, ne visi datori ir 8 bitu vai 16 bitu, vai 32 bitu un tā tālāk?

Šodien viņi ir. Bet agrīnie datori netika uzbūvēti šādā veidā.

Turklāt atmiņa datoros bija dārga, un nebija iemesla izmantot papildu bitu, ja jums tas nebija vajadzīgs. 6 bitu kods (kas eksistēja) neaptver visus lielos un mazos burtus, ciparus un pamata pieturzīmes. Bet 7 bitu kods bija – ar brīvu vietu.

Tā kā datoriem bija jāatrodas 8 bitu (1 baitu) struktūrā, ASCII pakāpeniski pārvērtās par neoficiālu 8 bitu kodu, kur pārējās 128 rakstzīmes nebija standartizētas..

Šis stāvoklis saglabājās kādu laiku. 1991. gadā 8 bitu kļuva par oficiālo formātu, ko uztur UTF-8 ISO (Starptautiskā standartizācijas organizācija).

Tomēr izaicinājums, kas šajā laikā radās, bija tas, ka 7 vai 8 bitu kodējumu var atbalstīt tikai viens alfabēts.

Lai atbalstītu plašāku valodu klāstu, tika izstrādāta Unicode kodēšanas shēma kopā ar universālo rakstzīmju kopu. Unicode ir daži kodēšanas veidi, UTF-8 ir 8 bitu kodējums, kas ir savietojams ar ASCII, un kurš šodien ir aizstājis ASCII kā dominējošo rakstzīmju kodēšanas standartu tīmeklī..

UTF-8 izaugsme

Turklāt UTF-16 un UTF-32 ir izmantotas valodās ar daudz rakstzīmēm. Tomēr UTF-8 var parādīt gan ķīniešu, gan japāņu, gan arābu valodu.

Tā rezultātā UTF-8 ir visizplatītākais kodēšanas formāts tīmeklī. Angļu valodā runājošajiem viss ir īpaši viegli, jo ASCII pirmie 128 rakstzīmes ir tādas pašas kā Unicode.

Tātad HTML lietošanai atsauce uz ASCII tabulu, lai izveidotu rakstzīmi, darbosies neatkarīgi no tā, kādu kodēšanas formātu izmantojat.

Kur iederas ASCII

ASCII apzīmē “Amerikas standarta kodu informācijas apmaiņai”, un to izveidoja Amerikas standartu asociācija (vēlāk pārdēvēta par Amerikas Nacionālo standartu institūtu).

ASCII standarts tika izveidots 1960. gadā un tika izlaists 1963. gadā. Tas bija telegrāfijas kodu paplašinājums, un to pirmo reizi izmantoja Bell datu dienesti.

Gadu gaitā tika veikti nozīmīgi labojumi. Līdz 2007. gadam tas bija tīklā visplašāk izmantotais rakstzīmju kodējums, taču tas tika aizstāts ar UTF-8.

Tīmekļa pāreja no ASCII un Microsoft ANSI uz UTF-8 lielā mērā ir skaidrojama ar Google iniciatīvām, jo ​​interneta lietošana kļuva arvien starptautiskāka un ASCII spēja parādīt tikai latīņu burtus..

Svarīgi atzīmēt, ka UTF-8 ir kodēšanas veids, bet Unicode ir rakstzīmju kopa; tā kā Unicode pirmās 128 rakstzīmes ir tādas pašas kā ASCII, veidojot rakstzīmes HTML, ir pieļaujams atsaukties uz ASCII tabulu.

ASCII ir iespēja izmantot “aizbēgšanas secību”, parādot alternatīvus alfabētus, kas ļāva tai kļūt par starptautisku standartu, bet Unicode to apstrādā tiešāk.

Unicode radās no Apple 1987. gadā, un tas kļuva par Unicode Consortium projektu 1991. gadā. ASCII izveidoja ASA, taču turpināja tā pilnveidošanu kā daļu no ISO deklarācijām..

UTF-8 kodēšanas nosaukumu izmanto visi standarti, kas atbilst Interneta piešķirto numuru pārvaldei (IANA), kas nozīmē visus HTML, CSS un XML. IANA ir lielāka ICANN nodaļa, kas ir bezpeļņas organizācija, kas nosaka interneta protokolu un domēna vārdus.

Apkopojot, ASCII attīstījās no telegrāfa koda 60. gados, izauga un kļuva par daļu no Unicode rakstzīmju kopas, kuru izmanto UTF-8, kas ir dominējošākais kodēšanas formāts tīmeklī.

Domēna vārdi un tīmekļa lapas kods ir atkarīgs no tā, vai šī vienotā rakstzīmju karte darbojas pareizi.

Tas nozīmē, ka mūsdienu interneta pašā saknē pastāv rakstzīmju formāts, kas izgudrots 1870. gados, datorizēts kā ASCII sešdesmitajos gados, modernizēts tīmeklim ar 1990. gadu Unicode un plaši pieņemts, izmantojot UTF-8 vairākumu 2007. gadā..

Kontroles rakstzīmes vs izdrukājamas rakstzīmes

ASCII ir divu veidu rakstzīmes: izdrukājamas rakstzīmes un vadības rakstzīmes.

Kontroles rakstzīmes definē skaitļus 0-31 un 127. Kontroles rakstzīmes ietver visas rakstīšanas daļas, kas ļauj izveidot jaunus rindkopas, cilnes, rindu beigas, failu atdalītājus un daudz gabalu, kas galvenokārt ir caurspīdīgi.

Šīs vadības zīmes tika izveidotas laikā, kad drukātas kartes bija liela daļa no skaitļošanas procesa. Kopš tā laika dažas no šīm funkcijām ir aizstātas, bet daudzas līnijas formatēšanas daļas joprojām pastāv. Kods 127 faktiski ir dzēšanas kods (tikai reālā ASCII, nevis ANSI vai Unicode).

Visas drukājamās rakstzīmes ir tas, ko jūs varētu gaidīt. Ir visi mazie burti (a-z) un lielie burti (A-Z), kā arī cipari, simboli un pieturzīmes – būtībā viss, kas redzams uz tipiskas tastatūras. Šīs galvenās rakstzīmes satur visus rakstītos vārdus.

ASCII izmantošana XML un HTML

Katrā HTML lapā tai ir piešķirts rakstzīmju kodēšanas formāts.

Ja nav norādīts citādi, HTML kodējums pēc noklusējuma būs UTF-8. Lai izmantotu tīru ASCII vai ANSI, vai jebkuru specializētu, unikālu formātu, ir jādara tikai deklarācija meta tagā..

HTML 4:

HTML5:

Charset tagā varat izmantot UTF-8, ANSI vai ASCII, izmantojot charset ="mums-ascii" vai arī jūs varētu meklēt konkrētu izmantojamo rakstzīmju kopu, parasti deklarējot ISO numuru. Pilns saraksts ir atrodams IANA rakstzīmju kopu lapā.

Rakstzīmju koda ievietošanas formāts

Parasti, kad kāds atsaucas uz ASCII koda izmantošanu, jūs vēlēsities, lai viņš noskaidro, vai tie nozīmē TRUE US-ASCII ar meta-tagu, vai arī viņi tikai lūdz parādīt īpašu rakstzīmi.

HTML formātā jebkurā laikā, kad vēlaties izmantot speciālo rakstzīmi, piemēram, pateikt cent simbolu (¢) vai apgrieztu jautājuma zīmes rakstzīmi (¿) – parasti jūs varētu izmantot Unicode simbolu vai US-ASCII (8 bitu). raksturs, ierakstot atsauci šādi:

¢ HTML izskatās šādi: ¢

¿HTML izskatās šādi: ¿

Tātad jūs sākat ar &# seko četrciparu skaitlis, noslēdzot ar semikolu (;).

Tādā veidā jūs varat parādīt rakstzīmes, pamatojoties uz to ASCII / Unicode numuru.

Protams, vadības rakstzīmes veiks formatēšanas funkciju vai nedarbosies vispār, atkarībā no tā, kuru izmantojat un kuru reālo rakstzīmju kopu esat norādījis savā metatagā.

Tātad HTML formātā tiek parādīts “&# ”Numuru, bet, parādot to jūsu pārlūkprogrammā, jūs redzēsit rakstzīmi.

HTML īpašo entītiju rakstzīmes

Tagad, teiksim, piemēram, jūs vēlaties vienkārši parādīt simbolu & simbols jūsu lapā.

Jūs to varat ne tikai ievadīt HTML, bet arī ievadīt atbilstošo ASCII vai Unicode.

HTML ir iezīmēšanas valoda, tāpēc, lai arī parastie burti darbojas labi, speciālie burti un īpaši < > iekavas – ir kritiski svarīgas tam, kā pārlūks nolasa un parāda HTML.

Tomēr jums vienmēr nav jāievada Unicode / ASCII atsauces numurs. HTML 4.0 un jaunākām versijām ir īpašas entītijas, kas darbojas līdzīgi kā Unicode atsauce, bet tā vietā, lai iegaumētu ciparu, jūs iegaumējat vārdu.

¢ HTML valodā izskatās šādi: ¢

¿ HTML valodā izskatās šādi: ¿

Pilns šo rakstzīmju atsauču saraksts ir atrodams W3 konsorcijā.

Atsauces tabula

Izmantojot visu šo papildinformāciju, jūs, iespējams, vienkārši meklējat vieglu vietu, kur atrast ASCII vai Unicode atsauci. Nemeklējiet vairāk, šeit ir atsauces 000-127, un visu Unicode formātu varat atrast Vikipēdijā.

Ņemiet vērā, ka rakstzīmes 000-032 un 127 parasti nav izdrukājamas, tāpēc tās tiek apzīmētas ar “NA”.

ASCII

table.wiht002 {
atstarpe starp malām: 0 pikseļi;
robežas sabrukums: sabrukums;
margin-left: auto;
labā mala: auto;
robeža-dibens: 1,5em;
text-align: centrs;
}

galds, tr, td
{
polsterējums: 0px;
rezerve: 0px;
}
td.bor
{
kreisās malas: 1xx ciets # 000;
polsterējums-kreisais: 1em;
labā mala: 1em;
}
td.break
{
kreisā mala: 2em;
labā mala: 2em;
}
td.sep
{
robeža-dibens: 1xx ciets # 000;
}
td.sepbor
{
robeža-dibens: 1xx ciets # 000;
kreisās malas: 1xx ciets # 000;
polsterējums-kreisais: 1em;
labā mala: 1em;
}

0NA32NA64@@96``
1NA?33!!65AA97aa
2NA?34""66BB98. lppbb
3NA?35##67CC99cc
4NA?36USDUSD68DD100dd
5NA?37%%69EE101. lppee
6NA?38&&70FF102. lppff
7NA?3971GG103. lppgg
8NA?40((72. lppHH104. lpphh
9NA41))73EsEs105ii
10NA42. lpp**74106. lppjj
11NA43++75KK107. lppkk
12NA44,,76LL108. lppll
13NA4577MM109. lppmm
14NA?46..78. lppNN110nn
15NA?47//79OO111oo
16NA?480080LppLpp112lpplpp
17NA?491181QQ113. lppqq
18NA?502282RR114. lpprr
19NA?513383SS115ss
20NA?52. lpp4484TT116. lpptt
21NA?535585UU117. lppuu
22NA?546686VV118. lppvv
23NA?557787WW119. lppww
24NA?568888XX120xx
25NA?579989YY121. lppyy
26NA?58. lpp::90ZZ122. lppzz
27NA?59;;91[[123. lpp{{
28NA?60<<92. lpp\\124.sēr||
29NA?61==93]]125}}
30NA?62. lpp>>94^^126. lpp~~
31NA?63??95__127. lppNA?

ASCII rīki un resursi

Rakstzīmju kodu attīstībā ir daudz vēstures, kā arī organizācijām, kuras pārējos no mums satur šos standartus. Lielākajai daļai interneta izstrādātāju un W3C vismaz tuvākajā nākotnē apmetoties UTF-8, tas ir, kā tiks kodētas lapas.

Jums tomēr būs nepieciešami daži resursi, kas jums palīdzēs, ja sākat manuālu kodēšanu citos formātos, vai arī tas var būt jauki, ja jums ir visaptveroša atsauce.

Resursu saraksts

  • IANA rakstzīmju kopu lapa

  • W3 konsorcija izveidotās HTML īpašās rakstzīmes

  • Pilns Unicode formāts Vikipēdijā

  • ASCII tabula tikai ar 0130-0255

  • ASCII vēsture ASCII-pasaulē

  • Unikoda rakstzīmju saraksts Vikipēdijā.

ASCII pants

Neviens ASCII kopsavilkums nebūtu pilnīgs, ja nebūtu atsauces uz ASCII artikulu.

Attēla formas iegūšanai, izmantojot neko citu kā simbolus, var izmantot īpašu programmatūru vai simbolus, kas kodēti ar roku. Šāda veida efekti pastāv kopš astoņdesmitajiem gadiem un ir kļuvuši populāri tādās sistēmās kā Commodore Amiga Computer.

Ir pat atšķirība starp “Oldskool” ASCII mākslu, kas komandrindā izmanto tīru ASCII, un “Newskool”, kas izmanto īpašās rakstzīmes Unicode, lai padarītu vēl sarežģītākus mākslas darbus.

Tālāk ir redzams zebras galvas attēls:

ASCII Art Zebra

ISO-8859-1

ISO-8859-1 ir rakstzīmju kodēšanas standarts. Starptautiskā standartizācijas organizācija (ISO) to izlaida 1998. gadā kā ASCII papildinājumu.

ASCII un ISO-8859-1

Visslavenākais rakstzīmju kodēšanas standarts ir ASCII. ASCII izmantoja 7 bitus astoņu bitu baitu, lai kodētu visvienkāršākās 128 rakstzīmes, ko izmanto angļu valodas rakstīšanai. Astotajam (augstās kārtas) bitam tika izstrādāti vairāki ar sistēmu saistīti lietojumi.

Piemēram, viena sistēma to izmantoja, lai pārslēgtos starp romiešu un slīpraksts drukas stili. Citas sistēmas to izmantoja, lai kodētu papildu rakstzīmes. Izmantojot visus astoņus baitus, var iekodēt 256 rakstzīmes.

Tā kā sākotnējā ASCII komplektā nebija iekļauts skaits rakstzīmju, kas vajadzīgas, lai rakstītu valodās, kas nav angļu valodas (piemēram, burti ar diakritiskajām zīmēm), rakstzīmju kopas pagarināšana līdz 256 ievērojami palielināja tās iespējas.

IS0-8859-1 ir viens no šiem paplašinājumiem. Bija paredzēts, ka tas būs starptautisks starpplatformu standarts. Tā kā tas ir standarta 8 bitu ASCII superset, tas ir savietojams ar atpakaļejošu datumu: ASCII kodētu dokumentu var viegli atkodēt, izmantojot ISO-8859-1.

ISO-8859-1 un HTML

Saskaņā ar standartu HTML 4 bija noklusējuma rakstzīmju kodējums HTML 4 formātā. Tomēr lielākā daļa pārlūkprogrammu atbalstīja ISO-8859 virskopu, ko sauc par ANSI..

ANSI satur papildu 32 rakstzīmes, kas bija tukšas standartā ISO-8859-1. (Parasti, kad redzat ISO-8859-1 rakstzīmju sarakstu, tas faktiski ir pilns ANSI saraksts.)

Mūsdienās HTML5 standartā tiek izmantots UTF-8 – ļoti liels supersetts, kas satur oriģinālos ASCII, ISO-8859-1 un ANSI kodējumus..

Tomēr lielākajā daļā angļu valodas HTML dokumentu, pat tādos, kas tieši pasludina ISO-8859-1 vai UTF-8 par savu rakstzīmju kopu, faktiski tiek izmantots mazāks ASCII rakstzīmju komplekts. Tam ir divi iemesli:

  • ASCII var rakstīt uz standarta QWERTY tastatūras.

  • Daudzas no HTML ģenerēšanai izmantotajām tehnoloģijām atbalsta tikai ASCII.

Tā kā gan ISO-8859-1, gan UTF-8 ir saderīgi ar ASCII, tas parasti nerada problēmas.

ISO-8859-1 un rakstzīmju entītijas

Paplašināto rakstzīmju komplektu, kas pieejams standartā ISO-8859-1, var izveidot tikai ASCII dokumentā, izmantojot HTML rakstzīmju entītijas. Šīs ir virknes, kas sākas ar simbolu (“&”) Un beidzas ar semikolu (“; ”).

Piemēram, autortiesību simbolu (apli ar “C” tajā) var kodēt tieši, izmantojot ISO-8859-1 vai UTF-8. Bet, tā kā lielākajā daļā klaviatūru nav taustiņa ©, daudziem ir vieglāk ievadīt ©.

Tas tiek saglabāts failā kā sešas ASCII rakstzīmes: &, c, o, p, y un. Pēc tam tīmekļa pārlūkprogrammas lietotājam parāda atbilstošo rakstzīmi ISO-8859-1.

Lielākajai daļai rakstzīmju, kas nav ASCII ISO-8859-1, ir nosauktas HTML rakstzīmju entītijas. Tos, kuru nav, var rakstīt ar savu ciparu kodu. Skaitliskais kods faktiski ir binārā kodējuma decimālā (10. bāze) versija.

Piemēram, autortiesību simbols ir kodēts kā 10101001 binārā formātā, kas ir 169 bāzes 10. Tātad jūs varētu ievadīt © vai ©.

Rakstzīmes, kas nav ASCII, standartos ISO-8859-1 un ANSI

Šīs diagrammas rakstzīmes 128-159 ir ANSI rakstzīmes, kas nav iekļautas ISO-8859. Pirmie 127 kodi standartā ISO-8859-1 / ANSI šeit nav iekļauti, jo tie ir identiski ASCII, ko mēs esam uzskaitījuši iepriekš..

Raksturs
HTML nosaukums
HTML numurs
Apraksts
eiro zīme
viena pēdiņa zem 9
ƒƒƒmazais f burts ar āķi
dubultā zemu-9 pēdiņa
horizontālā elipse
duncis
dubultā duncis
ˆˆˆmodifikatora burta circumflex akcents
tūkstoš zīmes
ŠŠŠlielais burts S ar karonu
viena kreisā leņķa citāts
ŒŒŒkapitāla ligatūra OE
ŽŽcaptial burts Z ar karonu
kreisās pēdiņas
labā vienotā pēdiņa
kreisās pēdiņas
labā divkāršā pēdiņa
lode
lv domuzīme
em domuzīme
˜˜˜tilde
TM preču zīmes apzīmējums
šššmazais burts S ar caron
taisnā leņķa pēdiņā
œœœmazo saišu oe
žžmazais burts z ar caron
ŸŸŸlielais Y burts ar diaeresis
 nesadalāma telpa
¡ ¡ ¡apgriezta izsaukuma zīme
¢ ¢ ¢centa zīme
£ £ £mārciņas zīme (valūta)
¤ ¤ ¤valūtas zīme
¥ ¥ ¥jena / juaņa zīme
¦ ¦ ¦salauzta vertikālā josla
§ § §sadaļas zīme
¨ ¨ ¨diaerēze
© © ©autortiesību zīme
ª ª ªsievišķīgais kārtas indikators
« « «kreisā dubultā leņķa pēdiņa (guillemet)
¬ ¬ ¬neparakstīt (loģika)
­ ­ Visiem, kas noklusina, tacumaiga / diskrecionāla defise
® ® ®reģistrēta preču zīmes apzīmējums
¯ ¯ ¯atstarpes makro / pārsvītrot
° ° °pakāpes zīme
± ± ±plus / mīnus zīme
² ² ²virsraksts divi (kvadrātā)
³ ³ ³virsraksts trīs (kubs)
´ ´ ´akūts akcents
µ µ µmikro zīme
rindkopas zīme (spilvens)
· · ·vidējais punkts
¸ ¸ ¸cedilla
¹ ¹ ¹virsraksts
º º ºvīrišķīgais ordinārais rādītājs
» » »taisnais dubultā leņķa pēdiņa (guillemet)
¼ ¼ ¼ceturtdaļas daļa (1 pret 4)
½ ½ ½puse frakcijas (1 virs 2)
¾ ¾ ¾trīs ceturtdaļu daļa (3 vairāk nekā 4)
¿ ¿ ¿apgriezta jautājuma zīme
À À Àlielais burts A ar kapu akcentu
Á Á Álielais burts A ar akūtu akcentu
  Âlielais burts A ar circumflex
à à Ãlielais burts A ar tildi
Ä Ä Älielais burts A ar diaeresis
Å Å Ålielais burts A ar gredzenu virs
Æ Æ Ækapitāla AE ligatūra
Ç Ç Çlielais burts C ar cedilla
È È Èlielais E burts ar kapu akcentu
Ē Ē Ēlielais E burts ar akūtu akcentu
Ê Ê Êlielais burts E ar circumflex
Ë Ë Ëlielais burts E ar diaeresis
Ì Ì Ìlielais burts I ar kapu akcentu
Í Í Ílielais burts I ar akūtu akcentu
Î Î Îlielais burts I ar circumflex
Ï Ï Ïlielais burts I ar diaeresis
Ð Ð Ðlielais burts ETH (Dogecoin simbols)
Ñ Ñ Ñlielais burts N ar tilde
Ò Ò Òlielais burts O ar kapu akcentu
Ó Ó Ólielais burts O ar akūtu akcentu
Ô Ô Ôlielais burts O ar circumflex
Õ Õ Õlielais burts O ar tildi
Ö Ö Ölielais burts O ar diaeresis
× × ×reizināšanas zīme
Ø Ø Ølielais burts O slīpsvītra
Ù Ù Ùlielais burts U ar kapu akcentu
Ú Ú Úlielais burts U ar akūtu akcentu
Û Û Ûlielais burts U ar circumflex
Ü Ü Ülielais burts U ar diaeresis
Ý Ý Ýlielais Y burts ar akūtu akcentu
Þ Þ Þlielais burts THORN
ß ß ßmazais burts ar asu s (Esett / scharfes S )
à à àmazs burts a ar kapu akcentu
á á ámazais burts a ar akūtu akcentu
â â âmazais burts a ar circumflex
ã ã ãmazais burts a ar tilde
ä ä ämazais burts a ar diaeresis
å å åmazais burts a ar gredzenu virs
æ æ æmazo ae ligatūra
ç ç çmazais c burts ar cedilla (cé cédille)
è è èmazais e burts ar kapu akcentu
é é émazais e burts ar akūtu akcentu
ê ê êmazais burts e ar circumflex
ë ë ëmazais e burts ar diaresēzi
ì ì ìmazais i burts ar kapu akcentu
í í ímazais i burts ar akūtu akcentu
î î îmazais i burts ar circumflex
ï ï ïmazais i burts ar diaeresis
ð / td> ðkods> ðmazo burtu eth
ñ ñ ñmazais burts n ar tilde
ò ò òmazais o burts ar kapa akcentu
ó ó ómazais o burts ar akūtu akcentu
ô ô ômazais burts o ar circumflex
õ õ õmazais burts o ar tildu
ö ö ömazais o burts ar diarezi
÷ ÷ ÷dalīšanas zīme
ø ø ømazais o burts ar slīpsvītru
ù ù ùmazais burts u ar kapu akcentu
ú ú úmazais burts u ar akūtu akcentu
û û ûmazais burts u ar circumflex
ü ü ümazais burts u ar diaeresis
ý ý ýmazais burts y ar akūtu akcentu
þ þ þmazo burtu ērkšķis
ÿ ÿ ÿmazais burts y ar diaeresis

Unikods

Unicode ir rakstzīmju kodēšanas standarts, kuru pārvalda The Unicode Consortium.

Kā mēs apspriedām, datorsistēmas burtus (burtus, ciparus, simbolus) neuzglabā burtiski – cietajā diskā dokumentā nav sīku attēlu no katra burta. Kā jums tagad vajadzētu zināt, katrs raksturs tiek kodēts kā bināru bitu sērija – 1s un 0s. Piemēram, mazo burtu “a” kods ir 01100001.

Bet 01100001 ir patvaļīgs – šajā bitu virknē nav nekas īpašs, kam vajadzētu padarīt to par burtu “a” – datoru industrija ir kopīgi vienojusies, ka tas nozīmē “a”. Tātad, kā visa nozare vienojas par to, kā pārstāvēt katru iespējamo varoni? Ar rakstzīmju kodēšanas standartu. Kodēšanas standarts vienkārši norāda visas iespējamās pieejamās rakstzīmes un piešķir katrai no tām bitu virkni.

Pēdējās skaitļošanas desmitgadēs visā pasaulē ir izmantoti vairāki rakstzīmju kodēšanas standarti. Ilgu laiku vispārpieņemtākais standarts bija ASCII. ASCII problēma ir tāda, ka tas kodē tikai salīdzinoši ierobežotu rakstzīmju skaitu – maksimums 256. Tas izslēdza valodas, kas nav latīņu valodas, daudzus svarīgus matemātikas un zinātnes simbolus un pat dažas pieturzīmes.

Papildus ASCII lietojumam angļu valodā un citās valodās, kurās tiek izmantots latīņu alfabēts, valodu grupas, kas izmanto citus alfabētus, mēdz izmantot savu rakstzīmju kodējumu. Tā kā šīs kodēšanas shēmas tika definētas viena no otras, tās bieži vien bija pretrunīgas; nebija iespējams vienlaikus izmantot vienu kodēšanas shēmu vairākām valodām.

Unicode sākotnēji tika iecerēts, un to turpina attīstīt, īpaši ar nolūku pārvarēt šīs problēmas. Unicode mērķis ir nodrošināt a uniersāls, unifiedēja un unirindu koda identifikators katrai grafēm visās valodās un rakstīšanas sistēmā pasaulē.

UTF-8

Unicode ir ieviests vairākās rakstzīmju kodēšanas shēmās, taču mūsdienās visplašāk izmantotais standarts ir UTF-8. UTF-8 ir kļuvis gandrīz universāls visiem mūsdienu skaitļošanas veidiem.

UTF-8 kodē rakstzīmes, izmantojot ne vairāk kā 4 8 bitu koda blokus. ASCII izmantoja tikai 8 bitus uz rakstzīmi. Unicode rakstzīmes, kas iepriekš bija iekļautas ASCII, UTF-8 tiek attēlotas ar vienu 8 bitu gabalu, tiem pašiem 8 bitiem, kas tika izmantoti ASCII. Tas padara ASCII tekstu uz priekšu savietojamu UTF-8. (Šis ir viens no daudzajiem iemesliem, kāpēc UTF-8 kļuva par universālo standartu – pāreja bija samērā viegla.)

8 × 4 shēma nodrošina UTF-8 ar vairāk nekā miljonu koda punktiem, ļaujot Unicode kodēt rakstzīmes no 129 skriptiem un rakstīšanas sistēmām.

Resursi Unicode izpratnei

  • Ievads rakstīšanas sistēmās un Unicode ir ļoti rūpīgs, pat daiļrunīgs izskaidrojums rakstzīmju kodēšanai kopumā un it īpaši Unicode; ja vietnē Unicode jūs varat lasīt tikai vienu lietu, tas ir tas, kas jālasa
  • Unicode standarts: tehniskais ievads ir Unicode standarta oficiālais skaidrojums
  • Uz BMP un tālāk! ir apmācība par Unicode, piemērota prezentācijai klasē vai pašmācībai
  • Unicode apmācība izskaidro, kā darbojas Unicode, ietverot interesantu informāciju, piemēram, rakstzīmju apvienošanu, un kā Unicode parsēšanas motoram vajadzētu darboties.

Grāmatas par Unikodu

  • Jukka Korpela piedāvātais Unicode Explained sniedz labu pārskatu par Unicode un dažādiem attīstības izaicinājumiem, kas saistīti ar tā ieviešanu
  • Unicode Demystified: Ričarda Gillama praktiskais programmētāja rokasgrāmata kodēšanas standartam ir noderīgs, kaut nedaudz datēts, Unicode skaidrojums, kurā ir daudz uz Java orientētu ieviešanas specifiku.
  • Yannis Haralambous fonti un kodējumi nav tikai par Unicode, bet varētu būt grāmata, kuru visvairāk vērts lasīt; tas aptver teksta kodēšanas un attēlošanas vēsturi datoros, nodrošinot gan teorētisku, gan praktisku pamatu Unicode un vairāku cieši saistītu priekšmetu izpratnei.

Unicode atsauces materiāls

Kad esat ieguvis pamatzināšanas par Unicode, lielākoties jums nāksies meklēt konkrētu informāciju – piemēram, precīzu konkrēta rakstzīmes kodējumu.

  • C / C ++ Unicode Cheatsheet sniedz informāciju par Microsoft C / C ++ konvertēšanu uz Unicode
  • XML un Unicode Technology Reports ir tehnisko ziņojumu saraksts, kas aptver dažādus XML un Unicode kopīgas lietošanas aspektus
  • Decode Unicode nodrošina tiešsaistes Unicode vārdnīcu ar skaistu lietotāja saskarni, ļaujot jums aplūkot katru definēto Unicode rakstzīmi, pat bez vietējā fonta atbalsta
  • Dati par valodām sniedz meklējamu informāciju par Unicode rakstzīmju kopu izmantošanu dažādās valodās
  • Unicode Navigator nodrošina visu Unicode rakstzīmju sakārtotu sarakstu

Unicode rīki

  • Unicode Analyzer ir pārlūka Chrome paplašinājums, kas sniedz informāciju par Unicode tekstu Web lapās un dokumentos
  • Rakstzīmju identifikators ir Firefox spraudnis, kas nodrošina konteksta izvēlni, lai atrastu vairāk informācijas par atlasītajām Unicode rakstzīmēm
  • Lai ievietotu Unicode rakstzīmes tīmekļa teksta laukos, izmēģiniet Unicode simbolus pārlūkam Chrome vai Unicode ievades rīku pārlūkam Firefox
  • UnicodeDataBrowser nodrošina GUI, lai vieglāk lasītu UnicodeData.txt failu
  • Polyglot 3000 automātiski identificē jebkura teksta valodu
  • Unicode nodrošina Unicode rakstzīmju tastatūras izkārtojumu sarakstu dažādiem Unicode atbalstītajiem skriptiem
  • Bābele ir Python bibliotēka visdažādākajiem internacionalizācijas un lokalizācijas uzdevumiem
  • D-veida Unicode Text Engine ir C ++ bibliotēka augstas kvalitātes Unicode teksta izkārtošanai, atveidošanai un rediģēšanai uz jebkuras ierīces, platformas vai operētājsistēmas
  • Nunicode ir C bibliotēka UTF-8 dokumentu kodēšanai un dekodēšanai
  • Portatīvais UTF-8 nodrošina Unicode atbalstu PHP virknēm
  • Tesseract OCR nodrošina Unicode teksta optisko rakstzīmju atpazīšanu
  • Popchar ir uzlabota rakstzīmju karte, kas ļauj ērti atrast un rakstīt rakstzīmes no visa Unicode telpas diapazona
  • Unicode Utilities nodrošina vairākus interesantus un noderīgus tiešsaistes rīkus darbam ar Unicode
  • Edicode nodrošina elastīgu tiešsaistes Unicode tastatūru teksta ierakstīšanai, izmantojot dažādus starptautiskos skriptus
  • Ātrais taustiņš ir elastīgs tastatūras paplašinājums, lai ierakstītu pirmās 65 000 definētās Unicode rakstzīmes
  • Unicode koda pārveidotājs jebkuru ievadīto rakstzīmju kodu pārveido vairākos atšķirīgos tā paša rakstura kodējumos
  • CharFunk ir JavaScript utilīta, lai veiktu vairākas interesantas pārbaudes un operācijas ar Unicode rakstzīmēm
  • Kreative Recode pārveido teksta failus no dažādiem kodējumiem Unicode
  • BabelMap Online nodrošina iekšējo pārlūka Unicode tastatūru ar izvadi displeja rakstzīmēs, kā arī heksa vai decimālo kodējumu

Teksta un koda redaktori

Lielākā daļa mūsdienu teksta redaktoru, kodu redaktoru un IDE vai nu pēc noklusējuma izmanto Unicode, vai arī var viegli rīkoties ar Unicode. Sublime, Notepad ++, Atom un Eclipse ir iestatīti uz UTF-8 kā noklusējuma rakstzīmju kodējumu. Lai izmantotu UTF-8, Vim un Emacs, iespējams, būs jāmaina iestatījums:

  • Unicode lietošana kopā ar Emacs
  • Izmantojot Unicode ar Vim

Ir arī nedaudz koda un teksta redaktoru, kas īpaši izstrādāti, lai apstrādātu paplašināto Unicode rakstzīmju kopu:

  • MinEd ir Unicode teksta redaktors ar konteksta atbalstu rakstzīmju ievietošanai no visa Unicode rakstzīmju vietas
  • Klasiskā teksta redaktors ir uzlabots redaktors darbam ar kritiskiem un zinātniskiem tekstu izdevumiem, ieskaitot daudzvalodu tekstus, izmantojot plašu Unicode rakstzīmju kopu

Unikoda fonti

Fontu un Unicode attiecības ir nedaudz slīpas. Unicode tika izveidots, lai būtu savietojams ar ASCII – ASCII formatētu tekstu var atšifrēt kā Unicode praktiski bez problēmām. Unicode kodēto tekstu var parādīt, izmantojot ASCII fontus, ja tiek izmantotas tikai nelielas rakstzīmju kopas, kas parādās ASCII.

Mūsdienās vairums datoru pieejamo fontu tiek kodēti ar Unicode. Tātad no šī viedokļa lielākā daļa fontu ir “Unicode fonti”. Tomēr lielākā daļa fontu neatbalsta īpaši lielu pilna Unicode standarta komplektu.

Parasti tā nav problēma; kāds, kas raksta tekstu vairākās valodās vai ar paplašinātu rakstzīmju kopu, var izmantot vairākus dažādus fontus – vienu latīņu valodas skriptam, otru katrai CJK valodai un citu matemātikas simboliem (piemēram). Tomēr dažreiz var būt noderīgi atsevišķi fonti, kas satur lielu daļu Unicode rakstzīmju vietas. Tas varētu būt vajadzīgs, strādājot vienkārša teksta un avota koda vidēs, kur nav iespējams izmantot vairākus fontus vai kad vizuāla vienotība starp vairākiem skriptiem ir īpaši svarīga.

Šie ir visievērojamākie fontu projekti, kas nodrošina paplašinātu Unicode atbalstu. Pilnīgāku sarakstu, ieskaitot novecojušus un novecojušus fontus, skatiet šajā Unicode fontu lapā. Āzijas valodu tipogrāfiju skatiet šajā CJK fontu sarakstā.

  • Everson Mono ir monospace font, kuru izveidojis viens no Unicode standarta iniciatoriem; tā noteiktais mērķis ir nodrošināt glifus pēc iespējas lielākajā daļā Unicode rakstzīmju vietas, un (kopš šī raksta) tiek atbalstīti 92 Unicode rakstzīmju bloki.
  • Noto ir liels displeja fontu komplekts, ko izstrādājusi Google, kas kopā nodrošina atbalstu lielākajai daļai Unicode rakstzīmju kopu ar nolūku galu galā atbalstīt visu Unicode standartu.
  • Deja Vu Fonts ir fontu saime, kas nodrošina plašu Unicode standarta pārklājumu ar Serif, Sans un Monospace versijām..
  • GNU FreeFont ir fontu saime, kas nodrošina Serif, Sans un Mono tipa sejas 37 rakstīšanas sistēmām un 12 Unicode simbolu diapazoniem..
  • GNU Unifont ir vienvietīgs, bitu kartes fonts ar pilnu pārklājumu Unicode 8.0 pamata daudzvalodu plaknei un plašs, bet nepilnīgs Papildu daudzvalodu plaknes pārklājums..

Ir arī vairāki interesanti fonti, kas specializētām vajadzībām kodē noteiktu Unicode standarta apakškopu.

  • Junicode ir fontu komplekts viduslaiku māksliniekiem
  • Pēdējais kūrorts ir “pēdējās iespējas fonts”; parasto rakstzīmju glifu vietā katrs glifs faktiski parāda informāciju par pašu Unicode rakstzīmi
  • Unicode fonti senajiem skriptiem ir projekts, lai izveidotu fontu komplektu vairākiem seniem un klasiskiem alfabētiem
  • Unimath Plus nodrošina paplašinātu zinātnes un matemātisko simbolu komplektu

Un šeit ir daži papildu Unicode fontu resursi, ja joprojām nevarat atrast meklēto:

  • SIL Fonti, kas satur vairākus fontus dažādām nepietiekami atbalstītām valodām, kurus izveidojusi SIL International – globālas bezpeļņas organizācijas, kas apkalpo mazākumtautību valodas kopienas
  • Unicode rakstzīmju diapazoni un Unicode fonti, kas tos atbalsta, palīdzēs atrast fontu jebkuram Unicode rakstzīmju diapazonam.

Emociju resursi

Emocijzīmes ir smieklīgi smaidošas sejas un īkšķu zīmes, kuras varat ievietot īsziņās. Tie faktiski ir daļa no Unicode standarta. Unicode emocijzīmju daļa netiek universāli atbalstīta, tāpēc, ja vēlaties lietotni vai vietni iekļaut emocijzīmes, iespējams, būs nepieciešama palīdzība. Šeit ir resursi, kas palīdzēs jums izmantot un veidot, izmantojot Unicode emocijzīmes.

Emociju atsauce

  • Emojipedia ir emocijzīmju rakstzīmju datu bāze, kurā var meklēt
  • Vai es varu emocijzīmes? sniedz informāciju par Unicode emocijzīmju vietējo atbalstu iOS, Android, OS X un Windows, kā arī lielākajās pārlūkprogrammās
  • WTF Emoji Foundation ir nedaudz nopietna organizācija, kas nodarbojas ar emocijzīmju attīstību; viņi vada emocijzīmju vārdnīcu.
  • Emoji krāpšanās lapa nodrošina ātru atsauci uz Emoji ieejas kodiem

Emociju bibliotēkas

  • Iekļaujiet lietotnēs emocijzīmes un tulkojiet starp vairākiem pārdevēja standartiem, izmantojot šo PHP emocijzīmju bibliotēku; vai izmēģiniet šo PHP7 emocijzīmju bibliotēku, kas kodā ļauj atsaukties emocijzīmes pēc nosaukuma
  • Emoji for Python atbalsta gan oficiālās Unicode emocijzīmes, gan vairākus aizstājvārdu komplektus; Django izstrādātāji var izmantot arī paketi django-emoji
  • Emoji Golang nodrošina Emoji atbalstu Go programmēšanas valodai
  • Ruby ir vairāki emocijzīmes atbalsta veidi, taču Github, iespējams, ir labākais, ko izmantot
  • Emoji-Java nodrošina Emoji atbalstu Java
  • Coloremoji.sty ļauj ērti iekļaut krāsainas emocijzīmes LaTeX dokumentos
  • Npm, Node.js pakešu pārvaldības sistēmai ir vairākas emocijzīmju paketes:
    • Emocijas un mezglu emocijzīmes nodrošina emocijzīmju pamata atbalstu,
    • Ember-cli-emoji darbojas kopā ar Emojify.js, lai jūsu Ember.js lietotnēm sniegtu emocijzīmju palīgus.
    • Atzīmēšanas it-emocijzīmes pievieno emocijzīmes, lai atbalstītu marķēšanas-it-atzīmju parsētāju
  • Emociju sintakse ir muļķīga bibliotēka Atom teksta redaktoram, kas pievieno emocijzīmes kodu rindām, ņemot vērā to nozīmi.

Emociju tastatūras un kolekcijas

  • EmojiXpress iOS ir emocijzīmju kolekcija un tastatūra iPhone
  • Emojione ir vairāku platformu Emoji kolekcija ar izstrādātājiem bezmaksas Creative Commons licencētu mākslas darbu
  • iDiversicons nodrošina plašu dažādu emocijzīmju raksturu un iPhone tastatūru.

MIME veidi

MIME nozīmē “daudzfunkcionāls interneta pasta paplašinājums”. Tas ir interneta standarts, ko izmanto, lai identificētu dažādus tiešsaistē pārsūtītu failu tipus. Sākotnēji tas tika izstrādāts e-pastam, kas tika nosūtīts, izmantojot SMTP (Simple Mail Transfer Protocol), kas ir interneta standarts e-pasta pārsūtīšanai. Mūsdienās MIME ir ārkārtīgi svarīga citos sakaru protokolos, piemēram, HTTP.

MIME vēsture

Mēs jau esam apsprieduši ASCII vēsturi un rakstzīmju kodējumu. Bet informācijas nosūtīšanai ir daudz kas cits.

Ar laiku mūsu ziņojumi sāka kļūt sarežģītāki, un kļuva skaidrs, ka ar šo standarta formātu nepietiek. Multimediju attēli, kas saturēja audio vai video failus, vispār nebija definēti. Tas pats attiecās uz valodām, kurās neizmantoja angļu alfabētu. Situācija beidzot sāka mainīties, kad divi cilvēki apvienoja spēkus: Nataniels Borensteins un Neds Freids.

Viņu priekšlikumā tika no jauna definēts ziņojumu formāts, lai e-pasts vienā ziņojumā varētu saturēt vairākus objektus; rakstzīmju, kas nav ASCII, kā arī valodu, kas nav angļu valodas, lietošana; kā arī attēlu, audio un video izmantošanu. Tā radās MIME, kas 1993. gadā kļuva par oficiālo standartu.

Priekšlikumā tika definēti arī kodēšanas standarti, kas ir 7 bitu, 8 bitu, base64, bināri un ar kotēšanu un izdrukāšanu. Šiem kodēšanas standartiem vajadzēja nodrošināt, ka visi dati patiešām tiek nosūtīti. Tajā bija arī informācija par satura tipa galvenes izmantošanu, kas nepieciešama, lai pareizi identificētu pārsūtīto datu tipu.

Kādi ir MIME veidi?

MIME veidi ir identifikators, ko izmanto, lai identificētu daudzos failu formātus, kas katru dienu tiek pārsūtīti internetā. Tos standartizē IANA (Interneta piešķirto numuru pārvalde). MIME veidi vispirms tika definēti un nosaukti par tādiem komentāru pieprasījumā: 2045 (RFC 2045), ko publicēja IETF (Interneta inženierijas darba grupa), kas bija oficiālais priekšlikums, kuru iesniedza Borenšteins un Brīvs..

Uzbūve

MIME tipi sastāv no veida un apakštipa, kas ir divas virknes, kas atdalītas ar priekšu slīpsvītru. Tips apzīmē kategoriju un var būt diskrēts vai daudzdaļīgs. Katram tipam ir noteikts apakštips. Parasti MIME tipi tiek rakstīti ar mazajiem burtiem.

Diskrēti tipi ietver tekstu, attēlu, audio, video un lietojumprogrammu. Vairāku daļu tipi ir dokumentu kategorija, kas ir sadalīta atsevišķās daļās un bieži ietver dažādus MIME tipus. Tajos ietilpst veidlapu dati un aplikšanas.

Dažus MIME tipus apzīmē ar x vai vnd. Prefikss x nozīmē, ka tas nav reģistrēts IANA, un vnd norāda uz pārdevēja konkrētu prefiksu.

Izplatītākie MIME veidi

Pielietojums:

  • lietojumprogramma / msword (.doc)
  • lietojumprogramma / vnd.openxmlformats-officedocument.wordprocessingml.document (.docx)
  • lietojumprogramma / vnd.openxmlformats-officedocument.wordprocessingml.template (.dotx)
  • lietojumprogramma / vnd.ms-powerpoint (.ppt)
  • pieteikums / ecmascript (.es)
  • lietojumprogramma / x-javascript (.js)
  • lietojumprogramma / oktetu straume (.bin, .exe)
  • pieteikums / pdf (.pdf)
  • pieteikums / postscript (.ps, .ai, .eps)
  • pieteikums / rtf (.rtf)
  • lietojumprogramma / x-gtar (.gtar)
  • lietojumprogramma / x-gzip (.gz)
  • lietojumprogramma / x-java-arhīvs (.jar)
  • lietojumprogramma / x-java-serialized-object (.ser)
  • aplikācija / x-java-vm (.class)
  • pieteikums / x-tar (.tar)
  • lietojumprogramma / zip (.zip)
  • lietojumprogramma / saspiests x-7z (.7z)
  • lietojumprogramma / saspiesta ar x-rar (.rar)
  • lietojumprogramma / x-shockwave-flash (.swf)
  • lietojumprogramma / vnd.android.package-archive (.apk)
  • lietojumprogramma / x-bittorrent (.torrent)
  • lietojumprogramma / epub + zip (.epub)
  • lietojumprogramma / vnd.ms-excel (.xsl)
  • lietojumprogramma / x-font-ttf (.tff)
  • aplikācija / rss + xml (.rss, .xml)
  • pieteikums / vnd.adobe.air-application-installer-pack + zip (.air)
  • lietojumprogramma / x-debian-pack (.deb)
  • lietojumprogramma / json (.json)

Audio:

  • audio / x-midi (.mid, .midi)
  • audio / x-wav (.wav)
  • audio / mp4 (.mp4a)
  • audio / ogg (.ogg)
  • audio / mpeg (.mp3)

Attēls:

  • attēls / bmp (.bmp)
  • attēls / gif (.gif)
  • attēls / jpeg (.jpeg, .jpg, .jpe)
  • attēls / tiff (.tiff, .tif)
  • image / x-xbitmap (.xbm)
  • attēls / x-ikona (.ico)
  • attēls / svg + xml (.svg)
  • attēls / png (.png)

Teksts:

  • teksts / html (.htm, .html)
  • teksts / vienkāršs (.txt)
  • teksts / bagātināts teksts (.rtf, .rtx)
  • teksts / css (.css)
  • teksts / csv (.csv)
  • teksts / kalendārs (.ics)

Video:

  • video / mpeg (.mpg, .mpeg, .mpe)
  • video / ogg (.ogv)
  • video / ātrais laiks (.qt, .mov)
  • video / x-msvideo (.avi)
  • video / mp4 (.mp4)
  • video / tīmeklis (.webm)

Resursi

MIME veidi ļāva mums iegūt labāku un bagātāku e-pasta pieredzi. Šis resursu saraksts palīdzēs jums iegūt padziļinātu informāciju par to, kā un kāpēc tie radās, kā arī par to, kā pareizi konfigurēt tīmekļa serveri MIME veida atbalstam un daudz ko citu.

Tiešsaistes resursi

Šajā sarakstā ir saites uz piecu daļu priekšlikumu, kas kļuva par MIME standarta projektu.

  • RFC 2045 (PDF): priekšlikuma pirmajā daļā ir norādītas dažādas galvenes, kuras izmanto, lai aprakstītu MIME ziņojumu struktūru.
  • RFC 2046 (PDF): otrais dokuments nosaka MIME datu nesēju tipēšanas sistēmas vispārējo struktūru un sākotnējo multivides veidu kopu.
  • RFC 2047 (PDF): priekšlikuma trešajā daļā aprakstīti paplašinājumi, kas interneta pasta galvenes laukos atļauj teksta datus, kas nav ASV-ASCII..
  • RFC 2048 (PDF): ceturtajā daļā aprakstīts, kā jaunus MIME tipus var reģistrēt IANA.
  • RFC 2049 (PDF): piektais dokuments apraksta MIME atbilstības kritērijus ar MIME ziņojumu formātu piemēriem.
  • Multivides tipi: pilns visu multivides veidu saraksts, kurā iekļauta arī saite uz lietojumprogrammu jaunu multivides veidu reģistrēšanai.
  • MIME puiši: kā divi interneta guru mūžīgi mainījās pa e-pastu: raksts, kas balstīts uz Nathaniel Borenstein un Ned Freed intervijām, kas sniedz interesantu ieskatu viņu darbā.

Pamācības

Šie resursi nodrošina noderīgas apmācības par MIME tipu apstrādi, pareizu servera konfigurāciju un daudz ko citu.

  • Serveru MIME tipu pareiza konfigurēšana: apspriež, kāpēc tīmekļa pārziņiem vajadzētu rūpēties par sava tīmekļa servera pareizu konfigurēšanu, jo tiek pievienoti jauni MIME tipi, īpaši pārlūkprogrammām, kuru pamatā ir Gecko.
  • Multivides formāti, kurus atbalsta HTML audio un video elementi: nodrošina MIME tipu sarakstu, kurus atbalsta jaunie audio un video elementi HTML5
  • Kas ir MIME sniffing: šajā rakstā ir sniegts izsmeļošs skaidrojums par MIME sniffing un kā izvairīties no ar to saistītajām ievainojamībām.
  • Izskaidroti MIME veidi: Kāpēc Linux un Mac OS X nav nepieciešami faila paplašinājumi: interesants lasījums, kas izskaidro vienu no atšķirībām starp Windows datoru un Linux / Mac OS X datoru.
  • Pareiza MIME veida atlasīšana JavaScript: pašlaik JavaScript ir vairāk nekā viens MIME tips. Šī apmācība sniegs jums skaidrojumu par katras lietošanas gadījumiem.

Grāmatas

Lai arī nav neviena grāmata, kas būtu veltīta tikai MIME tipiem, joprojām ir pienācīgs skaits grāmatu par cieši saistītām tēmām, kurām veltītas dažas nodaļas.

  • Lawrence Hughes interneta e-pasta protokoli, standarti un ieviešana (1998): vērsta uz pieredzējušākiem lietotājiem, šī grāmata nostiprina zināšanas par būtiskām koncepcijām, kas vajadzīgas e-pasta programmatūras izstrādei, un rūpīgi apraksta galvenos interneta e-pasta protokolus un paplašinājumus, piemēram, SMTP, POP3, IMAP , MIME un DSN.
  • Programmēšana Internet Email (1999), Dāvids Vuds: būtisks ceļvedis, kas aptver visas svarīgās koncepcijas, kas vajadzīgas, lai izveidotu programmas papildus e-pasta iespējām. Aptvertās tēmas ietver dažādus e-pasta protokolus, e-pasta formātus, ieskaitot MIME veidus, un daudz piemēru.
  • Pītera Loshina svarīgi e-pasta standarti (1999): šī grāmata ir obligāta prasība ikvienam, kurš vēlas iegūt padziļinātu izpratni par e-pasta standartiem. Tas sniedz rūpīgu IETF publicēto svarīgāko RFC analīzi, kā arī to iespējamo izmantošanu. Tajā ir arī pilnībā atrodama grāmatas digitālā versija, kurā var meklēt.
  • MH & Džerijs Pīkss xmh (2006): šī grāmata ir brīvi pieejama tiešsaistē un izdota saskaņā ar GNU-GPL licenci. Trešajā nodaļā ļoti sīki izskaidroti MIME veidi un vairāku daļu ziņojumi

Rīki

Zemāk esošajās saitēs ir daži noderīgi rīki, lai pārbaudītu MIME tipu derīgumu.

  • Kādus MIME veidus atbalsta mans pārlūks: tiešsaistes rīks, kas jums pateiks, kurus MIME veidus atbalsta jūsu pārlūkprogramma, tiklīdz ielādējat lapu.
  • MIME Validator: bezmaksas tiešsaistes MIME validators, kas pārbauda MIME ziņojumu atbilstību IETF standartiem.
  • Kas MIME: vēl viens bezmaksas tiešsaistes pārbaudītājs jebkuram failam.

Paplašiniet savas zināšanas par MIME veidiem

MIME veidi uz virsmas var šķist nenozīmīgi, taču tie radīja būtiskas izmaiņas mūsu e-pasta ziņojumapmaiņas darbībā. Šim resursu sarakstam vajadzētu piesaistīt jūsu zinātkāri un sniegt jums dziļāku izpratni par to, kā gadu gaitā ir pārveidoti e-pasti un faili, kas tiek pārraidīti internetā..

Kopsavilkums

Lielākā daļa cilvēku vienkārši raksta un nedomā daudz par notiekošo. Nedaudzi uztraucas domāt par fontu noformējuma un tipogrāfijas niansēm.

Bet vēl mazāks ir to cilvēku skaits, kuri zina vai vēlas uzzināt, kas notiek aizkulisēs – kā taustiņa nospiešana kļūst par burtu viņu datora ekrānā.

Visiem pārējiem tas ir vai nu caurspīdīgs, vai niecīgs.

Bet kā mēs esam parādījuši, valodas attēlošanas process nav diez ko trivi, un ir ieguldīts milzīgs darbs, lai padarītu to tikpat caurspīdīgu. Unicode konsorcijs kopā ar neskaitāmiem izstrādātājiem, dizaineriem un valodniekiem ir ļāvis ikvienam uzrakstīt jebkuru rakstzīmi no jebkuras valodas, ar jebkuru skriptu un uz jebkura datora.

Tas ir ievērojams sasniegums un nepieciešams solis uz vispārēju rakstpratību un vispārēju piekļuvi datoriem un internetam.

BUJ

Q. Kāda ir atšķirība starp ASCII, Unicode un UTF-8?

A. ASCII ir vecāks standarts kopš 1960. gadiem, turpretī Unicode radās 1980. gadu beigās.

ASCII ir tikai 128 vai 256 rakstzīmes, bet Unicode ir vairāk nekā 10 000.

Unicode ir rakstzīmju tabula, UTF-8 (vai UTF-16 vai UTF-32) ir kodēšanas līmenis. Unicode 0-256 un ASCII ir gandrīz identiski, tikai ar nelielām atšķirībām vadības rakstzīmēs.

UTF-8 šodien ir visizplatītākais kodējums tīmeklī – un tas ir noklusējums.

J. Vai man jādeklarē, kādu kodēšanas veidu es izmantoju savai tīmekļa lapai?

A. Tikai tad, ja zināt, ka jāizmanto unikāls kodēšanas tips.

Ja jūs to nedeklarējat, lielākajai daļai pārlūkprogrammu noklusējuma iestatījums būs UTF-8. Ja veidojat vietni svešvalodā, it īpaši ārpus latīņu valodas, pārliecinieties, vai izmantojat UTF-8, vai arī izvēlieties īpašu rakstzīmju kopa.

Q. Vai HTML rakstīšanai man jāiegaumē visi ASCII kodi?

A. Tikai tad, ja jūs mēģināt būt ārkārtīgi efektīvs.

Mūsdienās lielākā daļa vietņu ir dinamiskas un ģenerē HTML, izmantojot tādas sistēmas kā satura pārvaldības sistēma (CMS). Ja esat izstrādātājs, jūs, iespējams, papildus HTML izmantosit citas programmēšanas valodas, un šīm valodām, iespējams, ir īpaši veidi, kā ģenerēt šos ASCII simbolus..

Visbeidzot, kā apspriests iepriekš, daudzos no šiem kodiem HTML tiek izmantoti speciāli rakstzīmju nosaukumi, nevis ASCII numuri.

J. Vai rakstzīmju kodējums dažādās operētājsistēmās atšķiras?

A. Kaut nedaudz.

Unicode operētājsistēmās Windows vs Unix / Linux ir nedaudz atšķirīgs. Piemēram, Windows izmanto UTF-16LE, savukārt Linux parasti izmanto UTF-8.

Tagad, protams, jūsu operētājsistēmas izmantotais kodējums var atšķirties no tīmekļa vietnes kodējuma, taču jūsu operētājsistēma un tīmekļa pārlūkprogramma darbojas kopā, lai pārveidotu rakstzīmju kodus kaut ko jūsu dators var parādīt.

Dažreiz vecākās operētājsistēmās šī konvertēšana var nedarboties, un jūs redzētu tikai tukšas rakstzīmes. (Piemēram, tas ir kaut kas, ko jūs varētu redzēt, apmeklējot ārvalstu vietni operētājsistēmā Windows XP.)

Q. ASCII māksla ir satriecoša! Kur es varu izveidot savu??

A. AsciiWorld.com programmatūras sadaļā ir dažas lieliskas galerijas un rīki, piemēram, pārveidotāji un “krāsotāji”. Izklaidējies!

Citas interesantas lietas

Mums ir vairāk rokasgrāmatu, mācību materiālu un infografiku, kas saistīti ar kodēšanu un vietņu izstrādi:

  • CSS3 – ievads, ceļveži un resursi: šī ir lieliska vieta, kur sākt apgūt tīmekļa lapas izkārtojumu.

  • PostScript ievads un resursi: uzziniet visu par lapas parādīšanas valodu, kas mainīja pasauli.

  • Lorem Ipsum: iemācieties, kā pirms satura uzrakstīšanas izmantot “fiktīvu tekstu” jūsu dizaina izstrādei.

HTML iesācējiem – galīgais ceļvedis

Ja jūs patiešām vēlaties iemācīties HTML, mēs esam izveidojuši grāmatas garuma rakstu HTML HTML iesācējiem – galīgais ceļvedis. Un tas tiešām ir galvenais ceļvedis; tas prasīs jūs no paša sākuma līdz meistarībai.

HTML iesācējiem - galīgais ceļvedis
HTML iesācējiem – galīgais ceļvedis

Web dizaina tendences, kuras jūs nekad neaizmirsīsit

Pirms Unicode bija ierasts apmeklēt vietnes, kur visu tekstu attēloja tukšas rūtiņas. Lietas ir daudz mainījušās. Savā infografikā par Web dizaina tendencēm, kuras jūs nekad neaizmirsīsit, mēs pārbaudām, kā agrāk bija tīmeklis.

Web dizaina tendences, kuras jūs nekad neaizmirsīsit
Web dizaina tendences, kuras jūs nekad neaizmirsīsit

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map