Pengkodean ASCII: Pemula, Pemula …. Kami Telah Mendapatkan Semua Info yang Anda Butuhkan di Sini.

Penyingkapan: Dukungan Anda membantu menjaga situs tetap berjalan! Kami mendapatkan biaya referensi untuk beberapa layanan yang kami rekomendasikan pada halaman ini.


ASCII adalah jenis pengkodean karakter yang digunakan untuk komputer untuk menyimpan dan mengambil karakter (huruf, angka, simbol, spasi, lekukan, dll) sebagai pola bit untuk penyimpanan dalam memori dan pada hard drive.

“Pengodean karakter” pada tingkat tinggi berarti konversi simbol menjadi angka biner dan menggunakan “peta karakter” untuk membaca angka biner sebagai jenis huruf.

Dan tipe MIME memungkinkan pengguna untuk mengirim data melebihi karakter, seperti gambar dan video.

ASCII, Pengodean Karakter, Jenis MIME

Pengkodean Karakter

Bentuk pengkodean karakter paling awal sejauh telegraf listrik. Bahkan, kode Morse, dan kemudian kode Baudot adalah beberapa kode karakter standar pertama yang pernah dibuat.

Lapisan kedua penyandian yang disebut enkripsi atau penyandian juga dibuat oleh militer pada waktu itu, tetapi itu adalah topik yang agak berbeda.

Baru pada 1950-an kami memulai proses modern menuju ASCII. IBM memulai ini dengan mengembangkan skema penyandian untuk digunakan di komputer Seri 7000 mereka.

Binary Coded Decimal (BCD) IBM menggunakan penyandian empat-bit pada kartu punch. Itu adalah cara menyimpan angka desimal dalam bentuk biner.

Jadi alih-alih angka berjalan dari 0000 (0) hingga 1111 (15), mereka berlari dari 0000 (0) hingga 1001 (9) – masing-masing empat bit mewakili satu digit.

Kemudian, IBM menciptakan versi BCD yang Diperluas yang disebut Extended Binary Coded Decimal Interchange Code (EBCDIC). Itu adalah sistem pengkodean 8-bit untuk semua karakter standar yang dapat dicetak.

Pada tahun yang sama, 1963, ASCII diperkenalkan.

Ini menggunakan skema pengkodean 7-bit. Itu mewakili 128 angka berbeda.

Format angka 7-bit ini mungkin tampak aneh. Lagi pula, bukankah komputer semuanya 8-bit atau 16-bit atau 32-bit dan seterusnya?

Hari ini mereka. Tetapi komputer awal tidak dibangun dengan cara itu.

Terlebih lagi, memori pada komputer sangat berharga dan tidak ada alasan untuk menggunakan bit tambahan jika Anda tidak membutuhkannya. Kode 6-bit (yang ada) tidak akan mencakup semua huruf besar dan kecil, angka, dan tanda baca dasar. Tetapi kode 7-bit berhasil – dengan ruang kosong.

Ketika komputer mengendap menjadi struktur 8-bit (1-byte), ASCII secara bertahap berubah menjadi kode 8-bit tidak resmi, di mana 128 karakter lainnya tidak distandarisasi.

Keadaan ini bertahan selama beberapa waktu. Pada tahun 1991, 8-bit menjadi format resmi sebagaimana dipertahankan oleh ISO (International Organization for Standardization) untuk UTF-8.

Tantangan yang muncul saat ini, adalah bahwa hanya satu alfabet yang dapat didukung oleh pengodean 7 atau 8-bit.

Untuk mendukung petak bahasa yang lebih luas, skema penyandian Unicode dirancang, bersama dengan Universal Character Set. Unicode memiliki beberapa jenis penyandian, UTF-8 adalah penyandian 8-bit yang memiliki kompatibilitas dengan ASCII, dan yang telah meningkat untuk menggantikan ASCII sebagai standar penyandian karakter utama di web hari ini.

Pertumbuhan UTF-8

Selain itu, UTF-16 dan UTF-32 telah digunakan untuk bahasa dengan banyak karakter. Namun, bahasa Mandarin, Jepang, dan Arab semuanya dapat ditampilkan di UTF-8.

Akibatnya, UTF-8 sejauh ini merupakan format penyandian yang paling umum di web. Dan untuk penutur bahasa Inggris, semuanya sangat mudah karena 128 karakter pertama ASCII sama dengan yang ada di Unicode.

Jadi untuk digunakan dalam HTML, referensi tabel ASCII untuk membuat karakter akan berfungsi terlepas dari format pengkodean apa yang Anda gunakan.

Di mana ASCII Cocok Untuk

ASCII adalah singkatan dari “Kode Standar Amerika untuk Pertukaran Informasi” dan diciptakan oleh American Standards Association (kemudian dinamai American National Standards Institute).

Standar ASCII dimulai pada tahun 1960 dan dirilis pada tahun 1963. Itu adalah perpanjangan dari kode telegraf dan pertama kali digunakan oleh layanan data Bell.

Revisi besar dilakukan selama bertahun-tahun. Sampai 2007 itu adalah pengkodean karakter yang paling banyak digunakan di web, tetapi digantikan dengan UTF-8.

Peralihan web dari ASCII dan Microsoft ANSI ke UTF-8 sebagian besar disebabkan oleh inisiatif Google, karena penggunaan internet menjadi lebih internasional dan ASCII hanya mampu menampilkan karakter Latin.

Yang penting untuk dicatat, adalah bahwa UTF-8 adalah jenis penyandian, sementara Unicode adalah rangkaian karakter; karena 128 karakter pertama Unicode sama dengan ASCII, dapat diterima untuk merujuk ke tabel ASCII saat membuat karakter dalam HTML.

ASCII memang memiliki kemampuan untuk menggunakan “escape sequence” dalam menampilkan huruf alternatif, yang memungkinkannya untuk menjadi standar internasional, tetapi Unicode menangani ini lebih langsung.

Unicode berasal dari Apple pada tahun 1987, dan menjadi proyek Unicode Consortium pada tahun 1991. ASCII dibuat oleh ASA, tetapi penyempurnaan lebih lanjut berlanjut sebagai bagian dari deklarasi dari ISO.

Nama pengkodean UTF-8 digunakan oleh semua standar yang sesuai dengan Internet Assigned Numbers Authority (IANA) yang berarti semua HTML, CSS, dan XML. IANA adalah departemen ICANN yang lebih besar, yang merupakan organisasi nirlaba yang menentukan protokol internet dan nama domain.

Singkatnya, ASCII berevolusi dari kode telegraf di tahun 60-an, tumbuh, dan menjadi bagian dari rangkaian karakter Unicode, yang digunakan oleh UTF-8, format penyandian yang paling dominan di web.

Nama domain dan kode halaman web bergantung pada agar peta karakter terpadu ini berfungsi dengan baik.

Ini berarti bahwa pada akar dari internet modern, terdapat format karakter yang ditemukan pada tahun 1870-an, terkomputerisasi sebagai ASCII pada tahun 1960-an, dimodernisasi untuk web dengan Unicode tahun 1990-an, dan diadopsi secara luas melalui penggunaan mayoritas UTF-8 pada tahun 2007..

Mengontrol Karakter vs Karakter yang Dapat Dicetak

Ada dua jenis karakter di ASCII, karakter yang dapat dicetak dan karakter kontrol.

Karakter kontrol menentukan angka 0-31, dan 127. Karakter kontrol mencakup semua bagian penulisan yang memungkinkan paragraf baru, tab, akhir baris, pemisah file, dan banyak potongan yang sebagian besar transparan..

Karakter kontrol ini dibuat pada saat kartu yang dicetak adalah bagian besar dari proses komputasi. Beberapa fitur tersebut telah diganti, tetapi banyak bagian pemformatan garis masih ada sampai sekarang. Kode 127 sebenarnya adalah kode untuk dihapus (hanya di ASCII nyata, bukan ANSI atau Unicode).

Semua karakter yang dapat dicetak adalah apa yang Anda harapkan. Ada semua karakter huruf kecil (a-z) dan huruf besar (A-Z), bersama dengan angka, simbol, dan tanda baca – pada dasarnya semua yang terlihat pada keyboard khas. Karakter-karakter utama ini terdiri dari semua kata-kata tertulis.

Menggunakan ASCII dalam XML dan HTML

Setiap halaman HTML memiliki format penyandian karakter yang ditetapkan untuknya.

Kecuali ditentukan lain, penyandian HTML akan default ke UTF-8. Untuk menggunakan ASCII murni, atau ANSI, atau format khusus dan unik apa pun, semua yang perlu dilakukan adalah memiliki deklarasi dalam meta tag.

Untuk HTML 4:

Untuk HTML5:

Dalam tag charset, Anda dapat menggunakan UTF-8, ANSI, atau ASCII dengan menggunakan charset ="kami-ascii" atau Anda bisa mencari set karakter tertentu untuk digunakan, biasanya dengan mendeklarasikan nomor ISO. Daftar lengkap dapat ditemukan di halaman set karakter IANA.

Format Penyisipan Kode Karakter

Namun, secara umum, ketika seseorang merujuk menggunakan kode ASCII, Anda akan ingin mereka mengklarifikasi jika itu berarti BENAR US-ASCII dengan meta-tag, atau jika mereka hanya meminta Anda untuk menampilkan karakter khusus.

Dalam HTML, kapan pun Anda ingin menggunakan karakter khusus, seperti ucapkan simbol cent (¢) atau karakter tanda tanya terbalik (¿) – Anda biasanya dapat menggunakan simbol Unicode atau US-ASCII (8-bit) karakter, dengan mengetik referensi seperti ini:

¢ dalam HTML terlihat seperti: ¢

¿Dalam HTML terlihat seperti: ¿

Jadi, Anda mulai dengan &# diikuti oleh angka empat digit, diakhiri dengan titik koma (;).

Dengan cara ini, Anda dapat menampilkan karakter berdasarkan nomor ASCII / Unicode mereka.

Tentu saja, karakter kontrol akan melakukan fungsi pemformatan atau tidak berfungsi sama sekali, tergantung mana yang Anda gunakan dan set karakter nyata mana yang telah Anda daftarkan dalam tag meta Anda.

Jadi dalam HTML Anda melihat “&# ”, Tetapi ketika ditampilkan di browser Anda, Anda akan melihat karakter.

Karakter Entitas Khusus HTML

Sekarang, katakanlah misalnya Anda hanya ingin menunjukkan & simbol di halaman Anda.

Anda tidak bisa mengetikkannya ke dalam HTML, tetapi Anda bisa mengetikkan ASCII atau Unicode yang sesuai.

HTML adalah bahasa markup, jadi sementara huruf normal berfungsi dengan baik, karakter khusus dan terutama < > tanda kurung – sangat penting untuk bagaimana browser membaca dan menunjukkan HTML.

Anda tidak perlu selalu mengetikkan nomor referensi Unicode / ASCII. Untuk HTML 4.0 dan yang lebih baru, ada entitas khusus yang bekerja mirip dengan referensi Unicode, tetapi alih-alih menghafal nomor yang Anda hafalkan kata.

¢ dalam HTML terlihat seperti: ¢

¿ dalam HTML terlihat seperti: ¿

Daftar lengkap referensi karakter ini dapat ditemukan di konsorsium W3.

Tabel Referensi

Dengan semua petunjuk ini, Anda mungkin hanya mencari tempat yang mudah untuk menemukan referensi ASCII atau Unicode. Tidak terlihat lagi, kami memiliki referensi 000-127 di sini, dan Anda dapat menemukan format Unicode lengkap di Wikipedia.

Perhatikan bahwa karakter 000-032 dan 127 umumnya tidak dapat dicetak dan dengan demikian ditandai dengan “NA.”

ASCII

table.wiht002 {
batas-spasi: 0px;
border-collapse: runtuh;
margin-left: auto;
margin-right: otomatis;
margin-bottom: 1.5em;
perataan teks: tengah;
}

tabel, tr, td
{
padding: 0px;
margin: 0px;
}
td.bor
{
border-left: 1px solid # 000;
padding-left: 1em;
margin-right: 1em;
}
td.break
{
margin-kiri: 2em;
margin-right: 2em;
}
td.sep
{
border-bottom: 1px solid # 000;
}
td.sepbor
{
border-bottom: 1px solid # 000;
border-left: 1px solid # 000;
padding-left: 1em;
margin-right: 1em;
}

0NA32NA64@@96``
1NA?33!!65SEBUAHSEBUAH97SebuahSebuah
2NA?34""66BB98bb
3NA?35##67CC99cc
4NA?36$$68DD100dd
5NA?37%%69EE101ee
6NA?38&&70FF102ff
7NA?3971GG103gg
8NA?40((72HH104hh
9NA41))73sayasaya105sayasaya
10NA42**74JJ106jj
11NA43++75KK107kk
12NA44,,76L.L.108ll
13NA4577M.M.109mm
14NA?46..78NN110nn
15NA?47//79HAIHAI111HaiHai
16NA?480080PP112halhal
17NA?491181QQ113qq
18NA?502282RR114rr
19NA?513383SS115ss
20NA?524484TT116tt
21NA?535585UU117kamukamu
22NA?546686VV118vv
23NA?557787WW119ww
24NA?568888XX120xx
25NA?579989YY121yy
26NA?58::90ZZ122zz
27NA?59;;91[[123{{
28NA?60<<92\\124||
29NA?61==93]]125}}
30NA?62>>94^^126~~
31NA?63??95__127NA?

Alat dan Sumber Daya ASCII

Ada banyak sejarah tentang bagaimana kode karakter berevolusi, dan organisasi yang menyatukan standar-standar ini untuk kita semua. Dengan sebagian besar pengembang internet dan W3C memilih UTF-8, setidaknya untuk waktu dekat, itulah cara bagaimana halaman akan dikodekan..

Anda akan memerlukan beberapa sumber daya untuk membantu Anda jika Anda mulai melakukan penyandian secara manual dalam format lain, atau itu bisa menyenangkan hanya dengan memiliki referensi yang komprehensif di sekitar.

Daftar Sumber Daya

  • IANA set karakter halaman

  • Karakter Khusus HTML oleh konsorsium W3

  • Format Unicode penuh di Wikipedia

  • ASCII Table hanya 0130-0255

  • Sejarah ASCII tentang ASCII-Dunia

  • Daftar karakter Unicode di Wikipedia.

Seni ASCII

Tidak ada ringkasan ASCII yang akan lengkap tanpa referensi ke seni ASCII.

Perangkat lunak khusus dapat digunakan, atau simbol kode tangan, untuk mengambil bentuk gambar menggunakan simbol. Jenis efek ini telah ada sejak 1980-an dan dipopulerkan pada sistem seperti Commodore Amiga Computer.

Bahkan ada perbedaan antara seni ASCII “Oldskool” yang menggunakan ASCII murni di baris perintah, dan “Newskool” yang menggunakan karakter khusus dalam Unicode untuk membuat karya seni yang lebih kompleks lagi..

Ini gambar kepala zebra:

ASCII Seni Zebra

ISO-8859-1

ISO-8859-1 adalah standar pengkodean karakter. Ini dirilis oleh Organisasi Internasional untuk Standardisasi (ISO) pada tahun 1998 sebagai perpanjangan untuk ASCII.

ASCII dan ISO-8859-1

Standar pengkodean karakter yang paling terkenal adalah ASCII. ASCII menggunakan 7 bit byte delapan bit untuk mengkodekan 128 karakter paling dasar yang digunakan untuk menulis bahasa Inggris. Sejumlah penggunaan sistem khusus dikembangkan untuk bit kedelapan (tingkat tinggi).

Misalnya, satu sistem menggunakannya untuk beralih antara roman dan miring gaya pencetakan. Sistem lain menggunakannya untuk menyandikan karakter tambahan. Dengan menggunakan semua delapan byte, 256 karakter dapat dikodekan.

Karena set ASCII asli tidak menyertakan sejumlah karakter yang diperlukan untuk menulis dalam bahasa umum non-Inggris (seperti huruf dengan tanda diakritik), memperluas set karakter ke 256 meningkatkan kemampuannya.

IS0-8859-1 adalah salah satu dari ekstensi itu. Itu dimaksudkan untuk menjadi standar internasional, lintas platform. Karena ini adalah superset dari ASCII 8-bit standar, ia kompatibel dengan backward: dokumen yang dikodekan dalam ASCII dapat dengan mudah diterjemahkan menggunakan ISO-8859-1.

ISO-8859-1 dan HTML

Menurut standar, ISO-8859-1 adalah pengkodean karakter default dalam HTML 4. Namun, sebagian besar browser mendukung superset ISO-8859, yang disebut ANSI.

ANSI berisi 32 karakter tambahan yang kosong di ISO-8859-1. (Sebagian besar waktu, ketika Anda melihat daftar karakter ISO-8859-1, itu sebenarnya adalah daftar ANSI lengkap.)

Saat ini, standar HTML5 menggunakan UTF-8, superset sangat besar yang mencakup ASCII asli, ISO-8859-1, dan pengkodean ANSI.

Namun, sebagian besar dokumen HTML berbahasa Inggris, bahkan yang secara eksplisit menyatakan ISO-8859-1 atau UTF-8 sebagai set karakter mereka, sebenarnya menggunakan set karakter ASCII yang lebih kecil. Ada dua alasan untuk ini:

  • ASCII dapat diketik pada papan ketik QWERTY standar.

  • Banyak teknologi yang digunakan untuk menghasilkan HTML hanya mendukung ASCII.

Karena ISO-8859-1 dan UTF-8 keduanya kompatibel dengan ASCII, ini biasanya tidak menimbulkan masalah.

ISO-8859-1 dan Entitas Karakter

Set karakter diperluas yang tersedia di ISO-8859-1 dapat diproduksi dalam dokumen ASCII saja dengan menggunakan entitas karakter HTML. Ini adalah string yang dimulai dengan ampersand (“&”) Dan mengakhiri dengan titik koma (“; “).

Misalnya, simbol hak cipta (lingkaran dengan “C” di dalamnya) dapat dikodekan secara langsung menggunakan ISO-8859-1 atau UTF-8. Tetapi karena tidak ada tombol “©” di sebagian besar keyboard, banyak orang merasa lebih mudah untuk mengetik ©.

Ini disimpan dalam file sebagai enam karakter ASCII: &, c, o, p, y, dan; Browser web kemudian menampilkan karakter ISO-8859-1 yang sesuai untuk pengguna.

Sebagian besar karakter non-ASCII ISO-8859-1 telah menamai entitas karakter HTML. Yang tidak bisa diketik dengan kode numeriknya. Kode numerik sebenarnya adalah versi desimal (basis 10) dari pengkodean biner.

Misalnya, simbol hak cipta dikodekan sebagai 10101001 dalam biner, yaitu 169 di basis 10. Jadi Anda bisa mengetikkan © atau ©.

Karakter Non-ASCII dalam ISO-8859-1 dan ANSI

Karakter 128-159 pada bagan ini adalah karakter ANSI yang tidak termasuk dalam ISO-8859. 127 kode pertama dalam ISO-8859-1 / ANSI tidak termasuk di sini, karena identik dengan ASCII, yang telah kami sebutkan di atas.

Karakter
Nama HTML
Nomor HTML
Deskripsi
tanda euro
tanda kutip tunggal rendah-9
ƒƒƒhuruf kecil f dengan kait
tanda kutip ganda rendah-9
ellipsis horisontal
pisau belati
belati ganda
ˆˆˆaksen pengubah huruf sirkumfleksa
per mille sign
ŠŠŠhuruf kapital S dengan caron
kutipan sudut kiri tunggal
ŒŒŒligatur modal OE
ŽŽhuruf kapital Z dengan caron
meninggalkan tanda kutip tunggal
tanda kutip tunggal yang tepat
meninggalkan tanda kutip ganda
tanda kutip ganda kanan
peluru
en dash
em dash
˜˜˜tilde
Tanda merek dagang TM
šššhuruf kecil S dengan caron
tanda kutip sudut kanan menunjuk
œœœligatur huruf kecil
žžhuruf kecil z dengan caron
ŸŸŸhuruf kapital Y dengan diaeresis
 ruang tanpa putus
¡ ¡ ¡tanda seru terbalik
¢ ¢ ¢tanda sen
£ £ £tanda pound (mata uang)
¤ ¤ ¤tanda mata uang
¥ ¥ ¥tanda yen / yuan
¦ ¦ ¦bar vertikal rusak
§ § §tanda bagian
¨ ¨ ¨diaeresis
© © ©tanda hak cipta
ª ª ªindikator ordinal feminin
« « «tanda kutip sudut ganda kiri (guillemet)
¬ ¬ ¬tidak masuk (logika)
­ ­tanda hubung lunak / diskresioner
® ® ®tanda merek dagang terdaftar
¯ ¯ ¯spasi makron / garis besar
° ° °tanda derajat
± ± ±tanda plus / minus
² ² ²superskrip dua (kuadrat)
³ ³ ³superscript three (potong dadu)
´ ´ ´aksen akut
µ µ μtanda mikro
tanda paragraf (pilcrow)
· · ·titik tengah
¸ ¸ ¸cedilla
¹ ¹ ¹satu superskrip
º º ºindikator ordinal maskulin
» » »tanda kutip sudut ganda kanan (guillemet)
¼ ¼ ¼fraksi seperempat (1 lebih dari 4)
½ ½ ½satu setengah fraksi (1 lebih dari 2)
¾ ¾ ¾fraksi tiga perempat (3 lebih dari 4)
¿ ¿ ¿tanda tanya terbalik
SEBUAH SEBUAH SEBUAHhuruf kapital A dengan aksen kubur
SEBUAH SEBUAH SEBUAHhuruf kapital A dengan aksen akut
SEBUAH SEBUAH SEBUAHhuruf kapital A dengan sirkumfleksa
SEBUAH SEBUAH SEBUAHhuruf kapital A dengan tilde
SEBUAH SEBUAH SEBUAHhuruf kapital A dengan diaeresis
SEBUAH SEBUAH SEBUAHhuruf kapital A dengan cincin di atas
Æ Æ Æligatur modal AE
Ç Ç Çhuruf kapital C dengan cedilla
È È Èhuruf kapital E dengan aksen kubur
É É Éhuruf kapital E dengan aksen akut
Ê Ê Êhuruf kapital E dengan sirkumfleksa
Ë Ë Ëhuruf kapital E dengan diaeresis
SAYA SAYA SAYAhuruf kapital I dengan aksen kubur
SAYA SAYA SAYAhuruf kapital I dengan aksen akut
SAYA SAYA SAYAhuruf kapital I dengan sirkumfleksa
SAYA SAYA SAYAhuruf kapital I dengan diaeresis
Ð Ð Ðhuruf kapital ETH (simbol Dogecoin)
Ñ Ñ Ñhuruf kapital N dengan tilde
HAI HAI HAIhuruf kapital O dengan aksen kubur
HAI HAI HAIhuruf kapital O dengan aksen akut
HAI HAI HAIhuruf kapital O dengan sirkumfleksa
HAI HAI HAIhuruf kapital O dengan tilde
HAI HAI HAIhuruf kapital O dengan diaeresis
× × ×tanda multiplikasi
HAI HAI HAIhuruf kapital O slash
Ù Ù Ùhuruf kapital U dengan aksen kubur
Ú Ú Úhuruf kapital U dengan aksen akut
Û Û Ûhuruf kapital U dengan sirkumfleksa
Ü Ü Ühuruf kapital U dengan diaeresis
Ý Ý Ýhuruf kapital Y dengan aksen akut
Þ Þ Þhuruf besar THORN
ß ß ßhuruf kecil tajam s (Eszett / scharfes S )
Sebuah Sebuah Sebuahhuruf kecil a dengan aksen kubur
Sebuah Sebuah Sebuahhuruf kecil a dengan aksen akut
Sebuah Sebuah Sebuahhuruf kecil a dengan sirkumfleksa
Sebuah Sebuah Sebuahhuruf kecil a dengan tilde
Sebuah Sebuah Sebuahhuruf kecil a dengan diaeresis
Sebuah Sebuah Sebuahhuruf kecil a dengan cincin di atas
æ æ æligatur ae huruf kecil
ç ç çhuruf kecil c dengan cedilla (cédéille)
è è èhuruf kecil e dengan aksen kubur
é é éhuruf kecil e dengan aksen akut
ê ê êhuruf kecil e dengan sirkumfleksa
ë ë ëhuruf kecil e dengan diaeresis
saya saya sayahuruf kecil i dengan aksen kubur
saya saya sayahuruf kecil i dengan aksen akut
saya saya sayahuruf kecil i dengan sirkumfleksa
saya saya sayahuruf kecil i dengan diaeresis
ð / td>

ð kode> ðhuruf kecil et
huruf kecil n dengan tilde
Hai Hai Haihuruf kecil o dengan aksen kubur
Hai Hai Haihuruf kecil o dengan aksen akut
Hai Hai Haihuruf kecil o dengan sirkumfleksa
Hai Hai Haihuruf kecil o dengan tilde
Hai Hai Haihuruf kecil o dengan diaeresis
÷ ÷ ÷tanda pembagian
Hai Hai Haihuruf kecil o dengan garis miring
ù ù ùhuruf kecil u dengan aksen kubur
ú ú úhuruf kecil u dengan aksen akut
û û ûhuruf kecil u dengan sirkumfleksa
ü ü ühuruf kecil u dengan diaeresis
ý ý ýhuruf kecil y dengan aksen akut
þ þ þhuruf kecil duri
ÿ ÿ ÿhuruf kecil y dengan diaeresis

Unicode

Unicode adalah standar untuk pengkodean karakter yang dikelola oleh The Unicode Consortium.

Seperti yang telah kita bahas, sistem komputer tidak menyimpan karakter (huruf, angka, simbol) secara harfiah – tidak ada gambar kecil dari setiap huruf dalam dokumen di hard drive Anda. Seperti yang seharusnya Anda ketahui sekarang, setiap karakter dikodekan sebagai serangkaian bit biner – 1s dan 0s. Misalnya, kode untuk huruf kecil “a” adalah 01100001.

Tetapi 01100001 sewenang-wenang – tidak ada yang istimewa dari rangkaian bit yang membuatnya menjadi huruf “a” – industri komputer secara kolektif sepakat bahwa itu berarti “a.” Jadi, bagaimana seluruh industri bisa sepakat tentang cara mewakili setiap karakter yang mungkin? Dengan standar pengkodean karakter. Standar pengkodean hanya menentukan semua karakter yang mungkin tersedia, dan memberikan masing-masing string bit.

Ada beberapa standar pengkodean karakter yang digunakan di seluruh dunia selama beberapa dekade terakhir komputasi. Untuk waktu yang lama, standar yang paling diterima secara universal adalah ASCII. Masalah dengan ASCII adalah bahwa itu hanya dikodekan jumlah karakter yang relatif terbatas – paling banyak 256. Ini mengecualikan bahasa non-Latin, banyak simbol matematika dan sains yang penting, dan bahkan beberapa tanda baca dasar.

Selain penggunaan ASCII dalam bahasa Inggris dan bahasa lain yang menggunakan alfabet Latin, grup bahasa yang menggunakan huruf lain cenderung menggunakan pengodean karakter mereka sendiri. Karena skema pengkodean ini didefinisikan terpisah satu sama lain, mereka sering bertentangan; tidak mungkin menggunakan skema pengodean tunggal untuk banyak bahasa pada saat yang bersamaan.

Unicode awalnya disusun, dan terus dikembangkan, khususnya dengan maksud untuk mengatasi tantangan ini. Tujuan Unicode adalah untuk menyediakan uniersal, uniFied, dan unipengidentifikasi kode que untuk setiap grapheme di setiap bahasa dan sistem penulisan di dunia.

UTF-8

Unicode telah diimplementasikan dalam beberapa skema pengkodean karakter, tetapi standar yang paling banyak digunakan saat ini adalah UTF-8. UTF-8 telah menjadi hampir universal untuk semua jenis komputasi modern.

UTF-8 mengkodekan karakter menggunakan hingga 4 blok kode 8-bit. ASCII hanya menggunakan 8 bit per karakter. Karakter Unicode yang sebelumnya termasuk dalam ASCII diwakili dalam UTF-8 oleh satu potongan 8-bit, 8 bit yang sama yang digunakan dalam ASCII. Ini membuat teks ASCII kompatibel dengan maju di UTF-8. (Ini adalah salah satu dari banyak alasan mengapa UTF-8 menjadi standar universal – transisi relatif mudah.)

Skema 8 × 4 memberikan UTF-8 lebih dari satu juta poin kode, memungkinkan Unicode untuk menyandikan karakter dari 129 skrip dan sistem penulisan.

Sumber untuk Memahami Unicode

  • Pengantar Sistem dan Unicode Penulisan adalah penjelasan yang sangat menyeluruh, bahkan fasih, tentang pengkodean karakter secara umum, dan Unicode pada khususnya; jika Anda hanya dapat membaca satu hal di Unicode, ini adalah satu untuk dibaca
  • Standar Unicode: Pendahuluan Teknis adalah penjelasan resmi tentang standar Unicode
  • Untuk BMP dan Beyond! adalah tutorial tentang Unicode, cocok untuk presentasi classrom atau belajar mandiri
  • Tutorial Unicode menjelaskan cara kerja Unicode, termasuk detail menarik seperti menggabungkan karakter, dan bagaimana mesin parsing Unicode berfungsi.

Buku tentang Unicode

  • Dijelaskan Unicode, oleh Jukka Korpela, memberikan gambaran yang baik tentang Unicode dan berbagai tantangan pengembangan yang datang dengan menerapkannya
  • Unicode Demystified: Panduan Programmer Praktis untuk Standar Pengkodean, oleh Richard Gillam, adalah penjelasan Unicode yang bermanfaat, jika agak ketinggalan zaman, dengan banyak implementasi khusus yang berfokus pada Java
  • Font dan Pengkodean, oleh Yannis Haralambous, bukan semata-mata tentang Unicode, tetapi mungkin buku yang paling layak dibaca; itu mencakup sejarah penyandian dan mewakili teks di komputer, memberikan landasan teoretis dan praktis untuk memahami Unicode dan sejumlah mata pelajaran terkait erat.

Bahan Referensi Unicode

Setelah Anda memiliki pemahaman dasar tentang Unicode, sebagian besar Anda akan perlu mencari detail tertentu – seperti pengkodean yang tepat dari karakter tertentu.

  • C / C ++ Unicode Cheatsheet memberikan info tentang konversi Microsoft C / C ++ ke Unicode
  • Laporan Teknologi XML dan Unicode adalah daftar laporan teknis yang mencakup berbagai aspek penggunaan XML dan Unicode bersama-sama
  • Decode Unicode menyediakan kamus Unicode online dengan UI yang indah, memungkinkan Anda untuk melihat setiap karakter Unicode yang ditentukan, bahkan tanpa dukungan font lokal
  • Data pada Bahasa menyediakan informasi yang dapat dicari tentang penggunaan set karakter Unicode dengan berbagai bahasa
  • Unicode Navigator menyediakan daftar semua karakter Unicode yang terorganisir

Alat Unicode

  • Unicode Analyzer adalah ekstensi browser Chrome yang menyediakan informasi tentang teks Unicode di halaman web dan dokumen
  • Character Identifier adalah plugin Firefox yang menyediakan menu konteks untuk menemukan informasi lebih lanjut tentang karakter Unicode yang dipilih
  • Untuk memasukkan karakter Unicode dalam bidang teks di web, coba Simbol Unicode untuk Chrome atau Alat Input Unicode untuk Firefox
  • UnicodeDataBrowser menyediakan GUI untuk memudahkan membaca file UnicodeData.txt
  • Polyglot 3000 secara otomatis mengidentifikasi bahasa teks apa pun
  • Unicode menyediakan daftar tata letak keyboard karakter Unicode untuk berbagai skrip yang didukung Unicode
  • Babel adalah perpustakaan Python untuk berbagai tugas internasionalisasi dan lokalisasi
  • D-Type Unicode Text Engine adalah pustaka C ++ untuk meletakkan, merender, dan mengedit teks Unicode berkualitas tinggi pada perangkat, platform, atau sistem operasi apa pun
  • Nunicode adalah pustaka C untuk encoding dan decoding dokumen UTF-8
  • Portable UTF-8 menyediakan dukungan Unicode untuk string PHP
  • Tesseract OCR menyediakan pengenalan karakter optik untuk teks Unicode
  • Popchar adalah peta karakter yang ditingkatkan yang memungkinkan Anda menemukan dan mengetik karakter dengan mudah dari seluruh jajaran ruang Unicode
  • Unicode Utilities menyediakan sejumlah alat online yang menarik dan bermanfaat untuk bekerja dengan Unicode
  • Edicode menyediakan keyboard Unicode online yang fleksibel untuk mengetik teks menggunakan berbagai skrip internasional
  • Quickkey adalah ekstensi keyboard fleksibel untuk mengetik 65.000 karakter Unicode pertama yang ditentukan
  • Unicode Code Converter mengubah setiap kode karakter yang dimasukkan menjadi beberapa penyandian berbeda dari karakter yang sama
  • CharFunk adalah utilitas JavaScript untuk melakukan sejumlah pemeriksaan dan operasi menarik pada karakter Unicode
  • Kreative Recode mengubah file teks dari berbagai encoding ke Unicode
  • BabelMap Online menyediakan papan ketik Unicode dalam peramban, dengan output dalam karakter tampilan serta penyandian hex atau desimal

Editor Teks dan Kode

Sebagian besar editor teks hari ini, editor kode, dan IDE menggunakan Unicode secara default, atau dapat dengan mudah menangani Unicode. Sublime, Notepad ++, Atom, dan Eclipse semuanya diatur ke UTF-8 sebagai pengkodean karakter default. Vim dan Emacs mungkin perlu perubahan pengaturan untuk menggunakan UTF-8:

  • Menggunakan Unicode dengan Emacs
  • Menggunakan Unicode dengan Vim

Ada juga beberapa editor kode dan teks yang dirancang khusus untuk menangani rangkaian karakter Unicode yang diperluas:

  • MinEd adalah editor teks Unicode dengan dukungan kontekstual untuk memasukkan karakter dari jangkauan penuh ruang karakter Unicode
  • Editor Teks Klasik adalah editor tingkat lanjut untuk bekerja dengan edisi teks kritis dan ilmiah, termasuk teks multi-bahasa menggunakan berbagai rangkaian karakter Unicode

Font Unicode

Hubungan antara font dan Unicode agak miring. Unicode dibuat agar kompatibel dengan ASCII – teks yang diformat dalam ASCII dapat diterjemahkan sebagai Unicode dengan hampir tidak ada masalah. Dan teks yang dikodekan dengan Unicode dapat ditampilkan menggunakan font ASCII, selama hanya set kecil karakter yang muncul di ASCII yang digunakan.

Saat ini, sebagian besar font yang tersedia pada kebanyakan komputer dikodekan dengan Unicode. Jadi, dari sudut pandang itu, sebagian besar font adalah “font Unicode.” Namun, sebagian besar font tidak mendukung serangkaian besar standar Unicode penuh.

Biasanya, ini bukan masalah; seseorang yang menulis teks dalam berbagai bahasa, atau dengan rangkaian karakter yang diperluas, mungkin menggunakan beberapa font yang berbeda – satu untuk skrip Latin, lainnya untuk setiap bahasa CJK, dan lainnya untuk simbol matematika (misalnya). Namun, terkadang bermanfaat untuk memiliki font tunggal yang berisi persentase besar ruang karakter Unicode. Ini mungkin diperlukan ketika bekerja di lingkungan teks biasa dan kode sumber di mana menggunakan beberapa font tidak layak, atau ketika kesatuan visual antara banyak skrip sangat penting.

Berikut ini adalah proyek font yang paling terkenal yang menyediakan dukungan Unicode yang diperluas. Untuk daftar yang lebih lengkap, termasuk font yang mati dan usang, lihat halaman ini dari font Unicode. Untuk pengaturan huruf bahasa Asia, lihat daftar font CJK ini.

  • Everson Mono adalah font monospace yang dibuat oleh salah satu pencetus standar Unicode; tujuan yang dinyatakan adalah untuk menyediakan mesin terbang sebanyak mungkin ruang karakter Unicode, dan (pada tulisan ini) 92 blok karakter Unicode didukung.
  • Noto adalah serangkaian besar font tampilan, yang dikembangkan oleh Google, yang bersama-sama memberikan dukungan untuk sebagian besar rangkaian karakter Unicode, dengan tujuan untuk akhirnya mendukung seluruh standar Unicode.
  • Deja Vu Fonts adalah keluarga font yang menyediakan cakupan luas standar Unicode, dengan versi Serif, Sans, dan Monospace.
  • GNU FreeFont adalah kumpulan font, menyediakan wajah tipe Serif, Sans, dan Mono untuk 37 sistem penulisan dan 12 rentang simbol Unicode.
  • GNU Unifont adalah font bitmap monospace dengan cakupan lengkap untuk Unicode 8.0 Basic Multilingual Plane dan cakupan yang luas, tetapi tidak lengkap, untuk Plane Multilingual Tambahan.

Ada juga sejumlah font menarik yang mengkodekan subset tertentu dari standar Unicode untuk penggunaan khusus.

  • Junicode adalah seperangkat font untuk Medievalists
  • Last Resort adalah “font of last resort”; alih-alih glyph karakter konvensional, setiap glyph sebenarnya menampilkan informasi tentang karakter Unicode itu sendiri
  • Font Unicode untuk Script Kuno adalah proyek untuk membuat serangkaian font untuk beberapa huruf kuno dan klasik
  • Unimath Plus menyediakan serangkaian simbol sains dan matematika

Dan berikut adalah beberapa sumber daya font Unicode tambahan, jika Anda masih tidak dapat menemukan apa yang Anda cari:

  • SIL Fonts sejumlah font untuk berbagai bahasa yang kurang didukung, dibuat oleh SIL International, sebuah komunitas bahasa minoritas nirlaba global
  • Rentang karakter Unicode dan font Unicode yang mendukungnya akan membantu Anda menemukan font untuk rentang karakter Unicode apa pun.

Sumber Daya Emoji

Emoji adalah wajah-wajah tersenyum kecil yang lucu dan tanda jempol yang dapat Anda masukkan ke dalam pesan teks Anda. Mereka sebenarnya bagian dari standar Unicode. Bagian Emoji dari Unicode tidak didukung secara universal, jadi jika Anda ingin memasukkan Emoji ke dalam aplikasi atau situs web Anda, Anda mungkin perlu bantuan. Berikut adalah sumber daya yang akan membantu Anda menggunakan dan membangun dengan emoji Unicode.

Referensi Emoji

  • Emojipedia adalah basis data karakter Emoji yang dapat ditelusuri
  • Bisakah saya Emoji? memberikan informasi tentang dukungan asli untuk Unicode emoji di iOS, Android, OS X, dan Windows, serta browser utama
  • WTF Emoji Foundation adalah organisasi yang sedikit serius didedikasikan untuk kemajuan emoji; mereka menjalankan Kamus Emoji.
  • Lembar cheat Emoji memberikan referensi cepat untuk kode ketik Emoji

Perpustakaan Emoji

  • Sertakan Emoji di aplikasi, dan terjemahkan di antara beberapa standar vendor, dengan pustaka PHP Emoji ini; atau coba pustaka emoji PHP7 ini yang memungkinkan Anda referensi Emoji dengan nama di dalam kode Anda
  • Emoji untuk Python mendukung kedua emoji Unicode resmi dan beberapa set alias; Pengembang Django juga dapat menggunakan paket django-emoji
  • Emoji Golang menyediakan dukungan Emoji untuk bahasa pemrograman Go
  • ada beberapa permata untuk dukungan Emoji di Ruby, tetapi yang oleh Github mungkin adalah yang terbaik untuk digunakan
  • Emoji-Java menyediakan dukungan Emoji di Jawa
  • Coloremoji.sty memudahkan untuk memasukkan Emoji penuh warna dalam dokumen LaTeX
  • Npm, sistem manajemen paket untuk Node.js memiliki beberapa paket emoji:
    • Emoji dan simpul emoji menyediakan dukungan dasar untuk emoji,
    • Ember-cli-emoji bekerja dengan Emojify.js untuk memberikan bantuan emoji ke aplikasi Ember.js Anda
    • Markdown-it-emoji menambahkan emoji untuk mendukung parser penurunan harga-itu
  • Sintaks Emoji adalah perpustakaan konyol untuk editor teks Atom yang menambahkan emoji ke baris kode berdasarkan artinya.

Keyboard dan Koleksi Emoji

  • EmojiXpress untuk iOS adalah koleksi dan keyboard Emoji untuk iPhone
  • Emojione adalah koleksi Emoji lintas-platform dengan karya seni berlisensi Creative Commons gratis untuk pengembang
  • iDiversicons menyediakan beragam karakter Emoji, dan keyboard iPhone.

Jenis MIME

MIME adalah singkatan dari “Internet Mail Extensions.” Ini adalah standar Internet yang digunakan untuk mengidentifikasi berbagai jenis file yang dikirim secara online. Awalnya, ini dikembangkan untuk email yang dikirim melalui SMTP (Simple Mail Transfer Protocol) yang merupakan standar Internet untuk transmisi email. Saat ini, MIME sangat penting dalam protokol komunikasi lain seperti HTTP.

Sejarah MIME

Kami sudah mendiskusikan sejarah ASCII dan pengkodean karakter. Tetapi ada jauh lebih banyak kisah pengiriman informasi daripada ini.

Seiring waktu, pesan kami mulai menjadi lebih kompleks dan menjadi jelas bahwa format standar ini tidak cukup. Gambar multimedia yang berisi file audio atau video tidak ditentukan sama sekali. Hal yang sama berlaku untuk bahasa yang tidak menggunakan alfabet bahasa Inggris. Situasi akhirnya mulai berubah ketika dua orang bergabung: Nathaniel Borenstein dan Ned Freed.

Proposal mereka mendefinisikan kembali format pesan agar email berisi banyak objek dalam satu pesan; penggunaan karakter non-ASCII serta bahasa non-Inggris; dan penggunaan gambar, audio, dan video. Ini adalah kelahiran MIME yang menjadi standar resmi pada tahun 1993.

Proposal juga mendefinisikan standar pengkodean yaitu 7bit, 8bit, base64, binary, dan quotes-printable. Standar pengkodean itu seharusnya memastikan semua data memang dikirim. Ini juga termasuk informasi tentang penggunaan header Tipe Konten yang diperlukan untuk mengidentifikasi dengan benar tipe data yang dikirim.

Apa Itu Jenis MIME?

Jenis MIME adalah pengidentifikasi yang digunakan untuk mengidentifikasi banyak format file yang dikirim setiap hari di Internet. Mereka distandarisasi oleh IANA (Internet Assigned Numbers Authority). Jenis MIME pertama kali didefinisikan dan dinamai seperti itu dalam Request for Comments: 2045 (RFC 2045) yang diterbitkan oleh IETF (Internet Engineering Task Force) yang merupakan proposal resmi yang diajukan oleh Borenstein dan Freed.

Struktur

Tipe MIME terdiri dari tipe dan subtipe yang merupakan dua string yang dipisahkan oleh garis miring ke depan. Jenis mewakili kategori dan dapat diskrit atau multipartai. Setiap jenis memiliki subtipe tertentu. Secara tradisional, tipe MIME ditulis dalam huruf kecil.

Jenis diskret meliputi teks, gambar, audio, video, dan aplikasi. Jenis multi bagian mewakili kategori dokumen yang dipecah menjadi beberapa bagian berbeda dan seringkali menyertakan jenis MIME yang berbeda. Mereka termasuk data formulir dan byteranges.

Beberapa tipe MIME diawali oleh x atau vnd. Awalan x berarti belum terdaftar dengan IANA dan vnd menandakan awalan khusus vendor.

Jenis MIME yang umum

Aplikasi:

  • application / msword (.doc)
  • application / vnd.openxmlformats-officedocument.wordprocessingml.document (.docx)
  • application / vnd.openxmlformats-officedocument.wordprocessingml.template (.dotx)
  • application / vnd.ms-powerpoint (.ppt)
  • application / ecmascript (.es)
  • application / x-javascript (.js)
  • application / octet-stream (.bin, .exe)
  • application / pdf (.pdf)
  • application / postscript (.ps, .ai, .eps)
  • application / rtf (.rtf)
  • application / x-gtar (.gtar)
  • application / x-gzip (.gz)
  • application / x-java-archive (.jar)
  • application / x-java-serialized-object (.ser)
  • application / x-java-vm (.class)
  • application / x-tar (.tar)
  • aplikasi / zip (.zip)
  • application / x-7z-compressed (.7z)
  • application / x-rar-kompresi (.rar)
  • application / x-shockwave-flash (.swf)
  • application / vnd.android.package-archive (.apk)
  • application / x-bittorrent (.torrent)
  • application / epub + zip (.epub)
  • application / vnd.ms-excel (.xsl)
  • application / x-font-ttf (.tff)
  • application / rss + xml (.rss, .xml)
  • application / vnd.adobe.air-application-installer-package + zip (.air)
  • application / x-debian-package (.deb)
  • application / json (.json)

Audio:

  • audio / x-midi (.mid, .midi)
  • audio / x-wav (.wav)
  • audio / mp4 (.mp4a)
  • audio / ogg (.ogg)
  • audio / mpeg (.mp3)

Gambar:

  • image / bmp (.bmp)
  • image / gif (.gif)
  • image / jpeg (.jpeg, .jpg, .jpe)
  • gambar / tiff (.tiff, .tif)
  • image / x-xbitmap (.xbm)
  • gambar / ikon-x (.ico)
  • image / svg + xml (.svg)
  • gambar / png (.png)

Teks:

  • teks / html (.htm, .html)
  • teks / polos (.txt)
  • teks / richtext (.rtf, .rtx)
  • teks / css (.css)
  • teks / csv (.csv)
  • teks / kalender (.ics)

Video:

  • video / mpeg (.mpg, .mpeg, .mpe)
  • video / ogg (.ogv)
  • video / quicktime (.qt, .mov)
  • video / x-msvideo (.avi)
  • video / mp4 (.mp4)
  • video / webm (.webm)

Sumber daya

Jenis MIME memungkinkan kami untuk memiliki pengalaman email yang lebih baik dan lebih kaya. Daftar sumber daya berikut akan membantu Anda mempelajari lebih dalam tentang bagaimana dan mengapa sumber daya itu muncul serta cara mengkonfigurasi server web dengan benar untuk dukungan tipe MIME, dan lainnya.

Sumber Daya Online

Daftar berikut mencakup tautan ke proposal lima bagian yang menjadi konsep standar untuk MIME.

  • RFC 2045 (PDF): bagian pertama dari proposal ini menentukan berbagai header yang digunakan untuk menggambarkan struktur pesan MIME.
  • RFC 2046 (PDF): dokumen kedua menentukan struktur umum sistem pengetikan media MIME dan set awal jenis media.
  • RFC 2047 (PDF): bagian ketiga dari proposal menjelaskan ekstensi yang memungkinkan data teks non-AS-ASCII di bidang header surat Internet.
  • RFC 2048 (PDF): bagian keempat menjelaskan bagaimana tipe MIME baru dapat didaftarkan ke IANA.
  • RFC 2049 (PDF): dokumen kelima menjelaskan kriteria kesesuaian MIME dengan contoh format pesan MIME.
  • Jenis Media: daftar lengkap semua jenis media, yang juga menyertakan tautan ke aplikasi untuk mendaftarkan jenis media baru.
  • The MIME Guys: Bagaimana Dua Guru Internet Mengubah Email Forever: sebuah artikel berdasarkan wawancara dengan Nathaniel Borenstein dan Ned Freed yang memberikan wawasan menarik tentang pekerjaan mereka.

Tutorial

Sumber daya berikut memberikan tutorial bermanfaat tentang penanganan jenis MIME, konfigurasi server yang tepat, dan banyak lagi.

  • Mengonfigurasi Server dengan Benar Jenis MIME: membahas mengapa webmaster harus berhati-hati untuk mengonfigurasi server web mereka dengan benar saat ditambahkan jenis MIME baru, terutama untuk peramban berbasis Gecko.
  • Format media yang didukung oleh elemen audio dan video HTML: menyediakan daftar jenis MIME yang didukung oleh elemen audio dan video baru dalam HTML5
  • Apa itu sniffing MIME: artikel ini memberikan penjelasan menyeluruh tentang sniffing MIME dan bagaimana cara menghindari kerentanan yang terkait dengannya.
  • Jenis MIME Dijelaskan: Mengapa Linux dan Mac OS X Tidak Perlu Ekstensi File: bacaan menarik yang menjelaskan salah satu perbedaan antara komputer Windows dan komputer Linux / Mac OS X.
  • Memilih Jenis MIME yang Tepat untuk JavaScript: saat ini ada lebih dari satu jenis MIME untuk JavaScript. Tutorial ini akan memberi Anda penjelasan tentang masing-masing kasus penggunaan.

Buku

Meskipun tidak ada buku yang didedikasikan hanya untuk tipe MIME, masih ada sejumlah buku yang layak tentang topik yang berkaitan erat yang mendedikasikan beberapa bab untuk mereka.

  • Internet Email Protokol, Standar dan Implementasi (1998) oleh Lawrence Hughes: ditujukan untuk pengguna yang lebih maju, buku ini memperkuat pengetahuan tentang konsep-konsep penting yang diperlukan untuk mengembangkan perangkat lunak email dan secara menyeluruh menjelaskan protokol email utama Internet dan ekstensi seperti SMTP, POP3, IMAP , MIME, dan DSN.
  • Memprogram Email Internet (1999) oleh David Wood: panduan penting yang mencakup semua konsep penting yang diperlukan untuk membangun aplikasi di atas kemampuan email. Topik yang dibahas meliputi berbagai protokol email, format email termasuk jenis MIME, dan banyak contoh.
  • Essential Email Standards (1999) oleh Peter Loshin: buku ini wajib dimiliki bagi siapa pun yang ingin mendapatkan pemahaman mendalam tentang standar email. Ini memberikan analisis menyeluruh tentang RFC paling penting yang diterbitkan oleh IETF serta potensi penggunaannya. Ini juga termasuk versi digital buku yang sepenuhnya dapat dicari pada CD.
  • MH & xmh (2006) oleh Jerry Peek: buku ini tersedia secara gratis secara online dan diterbitkan di bawah lisensi GNU-GPL. Bab ketiga menjelaskan dengan sangat terperinci jenis MIME dan pesan multi bagian

Alat

Tautan di bawah ini menampilkan beberapa alat yang berguna untuk memeriksa validitas tipe MIME.

  • Apa Jenis MIME yang Didukung Browser Saya: alat online yang akan memberi tahu Anda jenis MIME yang didukung browser Anda segera setelah Anda memuat halaman.
  • Validator MIME: validator MIME online gratis yang memeriksa kepatuhan pesan MIME dengan standar IETF.
  • What MIME: checker online gratis lain untuk file apa pun.

Perluas Pengetahuan Anda tentang Jenis MIME

Jenis MIME mungkin tampak tidak signifikan di permukaan tetapi mereka membawa perubahan besar dalam cara kerja pengiriman pesan email kami. Daftar sumber daya ini harus membangkitkan rasa ingin tahu Anda dan memberi Anda pemahaman yang lebih dalam tentang bagaimana email dan file yang dikirimkan melalui Internet telah berubah selama bertahun-tahun..

Ringkasan

Kebanyakan orang hanya mengetik dan tidak terlalu memikirkan apa yang sedang terjadi. Beberapa orang memilih untuk memikirkan tentang desain font dan tipografi.

Tetapi yang lebih kecil lagi adalah jumlah orang yang tahu, atau ingin tahu, apa yang terjadi di balik layar – bagaimana penekanan tombol menjadi huruf di layar komputer mereka.

Bagi semua orang, itu transparan atau sepele.

Tetapi seperti yang telah kami tunjukkan, proses mewakili bahasa hampir tidak sepele, dan sejumlah besar pekerjaan telah dilakukan untuk membuatnya setransparan itu. Konsorsium Unicode, bersama dengan banyak pengembang, perancang, dan ahli bahasa, memungkinkan siapa pun untuk menulis karakter apa pun, dari bahasa apa pun, dalam skrip apa pun, di komputer mana pun.

Ini adalah pencapaian penting, dan langkah penting menuju keaksaraan universal dan akses universal ke komputer dan internet.

Faq

Q. Apa perbedaan antara ASCII, Unicode, dan UTF-8?

SEBUAH. ASCII adalah standar lama dari 1960-an, sedangkan Unicode muncul pada akhir 1980-an.

ASCII hanya 128 atau 256 karakter, tetapi Unicode memiliki lebih dari 10.000.

Unicode adalah tabel karakter, UTF-8 (atau UTF-16 atau UTF-32) adalah tingkat penyandian. Unicode 0-256 dan ASCII hampir identik, dengan hanya beberapa perbedaan kecil pada karakter kontrol.

UTF-8 adalah pengkodean yang paling umum di web saat ini – dan default.

P. Apakah saya harus menyatakan jenis pengodean apa yang saya gunakan untuk halaman web saya?

SEBUAH. Hanya jika Anda tahu Anda perlu menggunakan jenis penyandian yang unik.

Jika Anda tidak mendeklarasikannya, sebagian besar browser akan default ke UTF-8. Jika Anda membuat halaman web dalam bahasa asing, terutama non-Latin, pastikan Anda menggunakan UTF-8 atau pilih rangkaian karakter khusus.

P. Apakah saya perlu mengingat kode ASCII untuk menulis HTML?

SEBUAH. Hanya jika Anda berusaha menjadi sangat efisien.

Sebagian besar situs web saat ini dinamis dan menghasilkan HTML untuk Anda, melalui sistem seperti sistem manajemen konten (CMS). Jika Anda seorang pengembang, Anda mungkin akan menggunakan bahasa pemrograman lain selain HTML, dan bahasa-bahasa tersebut mungkin memiliki cara khusus untuk menghasilkan simbol ASCII tersebut..

Akhirnya, seperti dibahas di atas, banyak dari kode itu menggunakan nama karakter khusus dalam HTML alih-alih nomor ASCII.

Q. Apakah pengkodean karakter berbeda pada sistem operasi yang berbeda?

SEBUAH. Agak.

Unicode sedikit berbeda pada Windows vs Unix / Linux. Sebagai contoh, Windows menggunakan UTF-16LE sedangkan Linux biasanya menggunakan UTF-8.

Sekarang, tentu saja, pengkodean yang digunakan oleh sistem operasi Anda mungkin berbeda dari pengkodean pada halaman web, tetapi OS Anda dan browser web bekerja bersama untuk mengubah kode karakter menjadi sesuatu yang dapat ditampilkan oleh komputer Anda.

Terkadang, dalam sistem operasi yang lebih lama, konversi ini mungkin tidak berfungsi dan Anda hanya akan melihat karakter kosong. (Misalnya, Anda mungkin melihat mengunjungi situs web asing di Windows XP.)

Q. ASCII Art is awesome! Di mana saya bisa membuatnya sendiri?

SEBUAH. AsciiWorld.com memiliki beberapa galeri dan alat hebat di bagian perangkat lunak mereka, seperti konverter dan “pelukis.” Selamat bersenang-senang!

Hal-hal Menarik Lainnya

Kami memiliki lebih banyak panduan, tutorial, dan infografis terkait dengan pengkodean dan pengembangan situs web:

  • CSS3 – Intro, Guides and Resources: ini adalah tempat yang bagus untuk mulai belajar tata letak halaman web.

  • Pendahuluan dan Sumberdaya PostScript: pelajari semua tentang bahasa tampilan halaman yang mengubah dunia.

  • Lorem Ipsum: pelajari cara menggunakan “dummy text” untuk mendesain Anda sebelum kontennya ditulis.

HTML untuk Pemula – Panduan Utama

Jika Anda benar-benar ingin mempelajari HTML, kami telah membuat artikel sepanjang buku, HTML untuk Pemula – Panduan Utama. Dan itu benar-benar panduan utama; itu akan membawa Anda dari awal hingga penguasaan.

HTML untuk Pemula - Panduan Utama
HTML untuk Pemula – Panduan Utama

Tren Desain Web Anda Tidak Akan Pernah Lupa

Sebelum Unicode, adalah umum untuk mengunjungi situs web di mana semua teks diwakili oleh kotak kosong. Banyak hal telah berubah. Dalam Tren Desain Web infografis kami, Anda Tidak Akan Pernah Lupa, kami mempelajari bagaimana dulu web itu.

Tren Desain Web yang Tidak Akan Anda Lupakan
Tren Desain Web Anda Tidak Akan Pernah Lupa

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me