ASCII 인코딩 : 초보자, 초보자…. 여기에 필요한 모든 정보가 있습니다.

폭로: 귀하의 지원은 사이트 운영을 유지하는 데 도움이됩니다! 이 페이지에서 권장하는 일부 서비스에 대한 추천 수수료가 발생합니다.


ASCII는 컴퓨터가 문자 (문자, 숫자, 기호, 공백, 들여 쓰기 등)를 메모리 및 하드 드라이브에 저장하기위한 비트 패턴으로 저장하고 검색하는 데 사용되는 문자 인코딩 유형입니다..

높은 수준의 “문자 인코딩”은 기호를 이진수로 변환하고 “문자 맵”을 사용하여 이진수를 문자 유형으로 읽는 것을 의미합니다..

MIME 형식을 사용하면 이미지 및 비디오와 같은 문자 이외의 문자로 데이터를 전송할 수.

ASCII, 문자 인코딩, MIME 유형

문자 인코딩

가장 초기의 문자 인코딩 형식은 전자 전신만큼 거슬러 올라갑니다. 실제로, 모스 부호와 그 이후의 바우 도트 코드는 최초의 표준화 된 문자 코드 중 일부였습니다..

그 당시의 군사들에 의해 암호화 또는 암호화라고하는 두 번째 암호화 계층도 설정되었지만 이는 다소 다른 주제입니다..

1950 년대가 되어서야 ASCII에 대한 현대적인 프로세스가 시작되었습니다. IBM은 7000 시리즈 컴퓨터에서 사용할 인코딩 체계를 개발하여이를 시작했습니다..

IBM의 BCD (Binary Coded Decimal)는 펀치 카드에서 4 비트 인코딩을 사용했습니다. 십진수를 이진 형식으로 저장하는 방법이었습니다..

따라서 0000 (0)에서 1111 (15)까지의 숫자 대신 0000 (0)에서 1001 (9)까지의 숫자가 실행되었습니다. 각 4 비트는 단일 숫자를 나타냅니다..

나중에 IBM은 EBCDIC (Extended Binary Coded Decimal Interchange Code)라는 확장 버전의 BCD를 작성했습니다. 모든 표준 인쇄 가능 문자를위한 8 비트 인코딩 시스템이었습니다..

같은 해 1963 년에 ASCII가 소개되었습니다..

7 비트 인코딩 체계를 사용합니다. 128 개의 다른 숫자를 나타냅니다.

이 7 비트 숫자 형식은 이상하게 보일 수 있습니다. 결국 컴퓨터가 8 비트 또는 16 비트 또는 32 비트 등이 아닌가??

오늘은 그렇습니다. 그러나 초기 컴퓨터는 그런 식으로 구성되지 않았습니다.

또한 컴퓨터의 메모리는 소중하고 필요하지 않은 경우 추가 비트를 사용할 이유가 없었습니다. 6 비트 코드 (존재 한)는 대문자와 소문자, 숫자 및 기본 문장 부호를 모두 포함하지는 않습니다. 그러나 7 비트 코드는 여유 공간이 부족했습니다..

컴퓨터가 8 비트 (1 바이트) 구조로 정착함에 따라 ASCII는 비공식 8 비트 코드로 점차 바뀌 었으며 다른 128자는 표준화되지 않았습니다..

이 상태는 얼마 동안 지속되었습니다. 1991 년 8 비트는 UTF-8에 대한 ISO (International Organization for Standardization)에서 유지 관리하는 공식 형식이되었습니다..

이 시점에서 제기 된 문제는 알파벳 하나만 7 또는 8 비트 인코딩으로 지원할 수 있다는 것입니다..

보다 광범위한 언어를 지원하기 위해 유니버설 문자 집합과 함께 유니 코드 인코딩 스키마가 고안되었습니다. 유니 코드에는 두 가지 인코딩 유형이 있으며 UTF-8은 8 비트 인코딩으로 ASCII와 호환되며 오늘날 웹에서 주요 문자 인코딩 표준으로 ASCII를 대체합니다..

UTF-8의 성장

또한 UTF-16 및 UTF-32는 문자가 많은 언어에 사용되었습니다. 그러나 중국어, 일본어 및 아랍어는 모두 UTF-8로 표시 될 수 있습니다.

결과적으로 UTF-8은 웹에서 가장 일반적인 인코딩 형식입니다. 영어 사용자의 경우 ASCII의 첫 128 문자가 유니 코드 문자와 동일하기 때문에 특히 쉽습니다..

따라서 HTML에서 사용하기 위해 ASCII 테이블을 참조하여 문자를 만들면 사용하는 인코딩 형식에 관계없이 작동합니다..

ASCII가 맞는 곳

ASCII는 “정보 교환을위한 미국 표준 코드 (American Standard Code for Information Interchange)”의 약자이며 미국 표준 협회 (American Standards Association) (나중에 American National Standards Institute로 이름을 변경 함).

ASCII 표준은 1960 년에 시작되어 1963 년에 릴리스되었습니다.이 코드는 전신 코드의 확장이며 Bell 데이터 서비스에서 처음 사용되었습니다..

수년에 걸쳐 주요 개정이 이루어졌습니다. 2007 년까지 웹에서 가장 널리 사용되는 문자 인코딩 이었지만 UTF-8로 대체되었습니다..

인터넷 사용이 국제화되고 ASCII가 라틴 문자 만 표시 할 수 있었기 때문에 ASCII 및 Microsoft ANSI에서 UTF-8 로의 웹 전환은 Google의 이니셔티브에 크게 기인 할 수 있습니다..

중요한 것은 UTF-8은 인코딩 유형이고 유니 코드는 문자 세트라는 점입니다. 유니 코드의 처음 128자는 ASCII와 동일하므로 HTML로 문자를 생성 할 때 ASCII 테이블을 참조하는 것이 허용됩니다..

ASCII는 대체 알파벳을 표시 할 때 “이스케이프 시퀀스”를 사용할 수있어 국제 표준이되었지만 유니 코드는이를보다 직접적으로 처리합니다..

유니 코드는 1987 년 애플에서 시작하여 1991 년 유니 코드 컨소시엄의 프로젝트가되었습니다. ASCII는 ASA에 의해 만들어졌지만, ISO의 선언의 일부로 계속해서 개선되었습니다..

UTF-8의 인코딩 이름은 모든 HTML, CSS 및 XML을 의미하는 IANA (Internet Assigned Numbers Authority)를 따르는 모든 표준에서 사용됩니다. IANA는 인터넷 프로토콜과 도메인 이름을 결정하는 비영리 단체 인 더 큰 ICANN 부서입니다..

요약하자면, ASCII는 60 년대 전신 코드에서 발전하여 자라며 유니 코드 문자 집합의 일부가되었습니다. 이는 웹에서 가장 지배적 인 인코딩 형식 인 UTF-8에서 사용됩니다..

도메인 이름과 웹 페이지 코드는이 통합 문자 맵이 제대로 작동하도록하는 데 달려 있습니다.

이것은 현대 인터넷의 근본에 1870 년대에 발명되고 1960 년대 ASCII로 컴퓨터 화되었으며 1990 년대 유니 코드로 웹용으로 현대화되었으며 2007 년 UTF-8의 대다수 사용을 통해 널리 채택 된 문자 형식이 있음을 의미합니다..

제어 문자와 인쇄 가능한 문자

ASCII에는 인쇄 가능한 문자와 제어 문자의 두 가지 유형이 있습니다..

제어 문자는 숫자 0-31 및 127을 정의합니다. 제어 문자에는 새 단락, 탭, 줄 끝, 파일 구분 기호 및 주로 투명한 많은 부분을 허용하는 모든 글 부분이 포함됩니다..

이 제어 문자는 인쇄 된 카드가 컴퓨팅 프로세스에서 큰 부분을 차지할 때 만들어졌습니다. 이러한 기능 중 일부가 대체되었지만 현재 많은 행 서식 부분이 여전히 남아 있습니다. 코드 127은 실제로 삭제 용 코드입니다 (ANSI 또는 유니 코드가 아닌 실제 ASCII에서만).

인쇄 가능한 모든 문자가 기대할 수 있습니다. 숫자, 기호 및 문장 부호와 함께 모든 소문자 (a-z) 및 대문자 (A-Z)가 있습니다. 기본적으로 일반적인 키보드에서 볼 수있는 모든 것입니다. 이 기본 문자는 모든 서면 단어로 구성됩니다.

XML 및 HTML에서 ASCII 사용

모든 HTML 페이지에는 문자 인코딩 형식이 할당되어 있습니다.

달리 지정하지 않으면 HTML 인코딩은 기본적으로 UTF-8로 설정됩니다. 순수 ASCII, ANSI 또는 특수하고 고유 한 형식을 사용하려면 메타 태그에 선언해야합니다..

HTML 4의 경우 :

HTML5의 경우 :

charset 태그에서 charset =를 사용하여 UTF-8, ANSI 또는 ASCII를 사용할 수 있습니다"us-ascii" 또는 일반적으로 ISO 번호를 선언하여 사용할 특정 문자 세트를 조회 할 수 있습니다. 전체 목록은 IANA 문자 세트 페이지에서 찾을 수 있습니다.

문자 코드 삽입 형식

그러나 일반적으로 누군가가 ASCII 코드 사용을 언급 할 때 메타 태그가있는 TRUE US-ASCII를 의미하는지 또는 특수 문자를 표시하도록 요구하는지 명확하게 설명해야합니다..

HTML에서 센트 기호 (¢) 또는 거꾸로 된 물음표 문자 (¿)와 같은 특수 문자를 사용하려는 경우 일반적으로 유니 코드 기호 또는 US-ASCII (8 비트)를 사용할 수 있습니다. 다음과 같은 참조를 입력하여 문자 :

HTML에서 ¢는 다음과 같습니다. ¢

HTML에서 ¿는 다음과 같습니다. ¿

그래서 당신은 &# 뒤에 4 자리 숫자가 오며 세미콜론 (;)으로 끝납니다..

이런 식으로 ASCII / 유니 코드 번호를 기반으로 문자를 표시 할 수 있습니다.

물론 제어 문자는 사용하는 기능과 메타 태그에 나열한 실제 문자 세트에 따라 서식 기능을 수행하거나 전혀 작동하지 않습니다..

HTML에서 “&#”숫자이지만 브라우저에 표시되면 문자가 표시됩니다.

HTML 특수 엔티티 문자

예를 들어서 & 페이지의 기호.

HTML에만 입력 할 수는 없지만 해당 ASCII 또는 유니 코드를 입력 할 수 있습니다.

HTML은 마크 업 언어이므로 일반 문자는 잘 작동하고 특수 문자, 특히 < > 대괄호 — 브라우저가 HTML을 읽고 표시하는 방법에 매우 중요합니다.

항상 유니 코드 / ASCII 참조 번호를 입력 할 필요는 없습니다. HTML 4.0 이상에는 유니 코드 참조와 유사하게 작동하지만 숫자를 암기하는 대신 단어를 암기하는 특수 엔티티가 있습니다..

¢ HTML에서는 다음과 같습니다. ¢

¿ HTML에서는 다음과 같습니다. ¿

이러한 문자 참조의 전체 목록은 W3 컨소시엄에서 찾을 수 있습니다.

참조 표

이 모든 리드 업으로 ASCII 또는 유니 코드 참조를 쉽게 찾을 수있는 곳을 찾고있을 것입니다. 더 이상 보지 말고 여기 000-127을 참조하면 Wikipedia에서 전체 유니 코드 형식을 찾을 수 있습니다.

000-032 및 127 문자는 일반적으로 인쇄 할 수 없으므로 “NA”로 표시됩니다.

ASCII

table.wiht002 {
테두리 간격 : 0px;
국경 붕괴 : 붕괴;
왼쪽 여백 : 자동;
오른쪽 여백 : 자동;
마진 바닥 : 1.5em;
텍스트 정렬 : 가운데;
}

테이블, tr, td
{
패딩 : 0px;
여백 : 0px;
}
td.bor
{
국경-왼쪽 : 1px 단색 # 000;
왼쪽 여백 : 1em;
오른쪽 여백 : 1em;
}
td.break
{
왼쪽 여백 : 2em;
오른쪽 여백 : 2em;
}
td.sep
{
경계-하단 : 1px 단색 # 000;
}
td.Sepbor
{
경계-하단 : 1px 단색 # 000;
국경-왼쪽 : 1px 단색 # 000;
왼쪽 여백 : 1em;
오른쪽 여백 : 1em;
}

0NA32NA64@@96``
1NA?33!!6597
2NA?34""6698
NA?35##6799
4NA?36$$68100
5NA?37%%69이자형이자형101이자형이자형
6NA?38&&70에프에프102에프에프
7NA?3971103
8NA?40((72HH104hh
9NA41))73나는나는105나는나는
10NA42**74제이제이106제이제이
11NA43++75케이케이107케이케이
12NA44,,76108
13NA4577미디엄미디엄109미디엄미디엄
14NA?46..78110
15NA?47//79영형영형111영형영형
16NA?480080112
17NA?491181113
18NA?502282아르 자형아르 자형114아르 자형아르 자형
19NA?5183에스에스115에스에스
20NA?524484116
21NA?535585117
22NA?546686VV118VV
23NA?557787119
24NA?568888엑스엑스120엑스엑스
25NA?579989와이와이121와이와이
26NA?58::90122
27NA?59;;91[[123{{
28NA?60<<92\\124||
29NA?61==93]]125}}
30NA?62>>94^^126~~
31NA?63??95__127NA?

ASCII 도구 및 자료

문자 코드가 어떻게 진화했는지에 대한 많은 역사와 우리를 위해 이러한 표준을 함께 유지하는 조직이 있습니다. 대부분의 인터넷 개발자와 W3C가 UTF-8에 정착하면서 최소한 당장 미래에 페이지가 인코딩되는 방식.

다른 형식으로 수동 인코딩을 시작하는 경우 도움이되는 몇 가지 리소스가 필요합니다..

자원 목록

  • IANA 문자 세트 페이지

  • W3 컨소시엄의 HTML 특수 문자

  • Wikipedia의 전체 유니 코드 형식

  • 0130-0255의 ASCII 표

  • ASCII-World에서 ASCII의 역사

  • Wikipedia의 유니 코드 문자 목록.

ASCII 아트

ASCII 아트를 참조하지 않으면 ASCII 요약이 완료되지 않습니다.

특수 소프트웨어를 사용하거나 기호로 직접 코딩하여 기호 만 사용하여 이미지의 형태를 취할 수 있습니다. 이러한 유형의 효과는 1980 년대부터 존재했으며 Commodore Amiga Computer와 같은 시스템에서 널리 사용되었습니다..

명령 행에서 순수 ASCII를 사용하는 “Oldskool”ASCII 아트와 유니 코드의 특수 문자를 사용하여 “복잡한 예술 작품을 만드는”Newskool “사이에는 차이가 있습니다..

다음은 얼룩말의 머리 사진입니다.

ASCII 아트 얼룩말

ISO-8859-1

ISO-8859-1은 문자 인코딩 표준입니다. 1998 년 ISO (International Organization for Standardization)에서 ASCII의 확장으로 릴리스했습니다..

ASCII 및 ISO-8859-1

가장 유명한 문자 인코딩 표준은 ASCII입니다. ASCII는 영어를 쓰는 데 사용되는 가장 기본적인 128자를 인코딩하기 위해 8 비트 바이트의 7 비트를 사용했습니다. 8 번째 (고차) 비트에 대해 여러 시스템 특정 용도가 개발되었습니다..

예를 들어, 한 시스템에서 로마자와 이탤릭체 인쇄 스타일. 다른 시스템에서는 추가 문자를 인코딩하는 데 사용했습니다. 8 바이트를 모두 사용하여 256자를 인코딩 할 수 있습니다..

원래 ASCII 세트에는 비영어권 언어 (예 : 발음 구별 부호가있는 문자)로 작성하는 데 필요한 많은 문자가 포함되어 있지 않으므로 문자 세트를 256으로 확장하면 기능이 크게 향상되었습니다..

IS0-8859-1은 그러한 확장 중 하나입니다. 국제 표준의 크로스 플랫폼 표준이되었습니다. 표준 8 비트 ASCII의 상위 집합이기 때문에 하위 호환성이 있습니다. ASCII로 인코딩 된 문서는 ISO-8859-1을 사용하여 쉽게 디코딩 할 수 있습니다.

ISO-8859-1 및 HTML

표준에 따르면, ISO-8859-1은 HTML 4의 기본 문자 인코딩이었습니다. 그러나 대부분의 브라우저는 ANSI라는 ISO-8859의 상위 집합을 지원했습니다..

ANSI에는 ISO-8859-1에서 비어있는 추가 32자가 포함되어 있습니다. 대부분의 경우 ISO-8859-1 문자 목록이 표시되면 실제로 전체 ANSI 목록입니다.

현재 HTML5 표준은 원래 ASCII, ISO-8859-1 및 ANSI 인코딩을 포함하는 매우 큰 수퍼 세트 인 UTF-8을 사용합니다..

그러나 대부분의 영어 HTML 문서는 ISO-8859-1 또는 UTF-8을 문자 집합으로 명시 적으로 선언 한 경우에도 실제로 더 작은 ASCII 문자 집합을 사용합니다. 이에 대한 두 가지 이유가 있습니다.

  • 표준 QWERTY 키보드에서 ASCII를 입력 할 수 있습니다.

  • HTML을 생성하는 데 사용되는 많은 기술은 ASCII 만 지원합니다..

ISO-8859-1 및 UTF-8은 모두 ASCII와 호환되므로 일반적으로 문제가 발생하지 않습니다..

ISO-8859-1 및 캐릭터 엔티티

ISO-8859-1에서 사용 가능한 확장 문자 세트는 HTML 문자 엔티티를 사용하여 ASCII 전용 문서로 생성 할 수 있습니다. 앰퍼샌드 ( “&”) 세미콜론 (“;”)으로 종료.

예를 들어, 저작권 기호 ( “C”가있는 원)는 ISO-8859-1 또는 UTF-8을 사용하여 직접 인코딩 할 수 있습니다. 그러나 대부분의 키보드에는“©”키가 없으므로 많은 사람들이 쉽게 입력 할 수 있습니다..

이것은 6 개의 ASCII 문자로 파일에 저장됩니다. &, c, o, p, y 및;. 그런 다음 웹 브라우저는 적절한 ISO-8859-1 문자를 사용자에게 표시합니다.

비 ASCII ISO-8859-1 문자의 대부분은 이름이 HTML 문자 엔티티입니다. 숫자 코드로 입력 할 수없는 것. 숫자 코드는 실제로 이진 인코딩의 10 진수 (기본 10) 버전입니다..

예를 들어, 저작권 기호는 10 진수로 169 인 2 진수로 10101001로 인코딩됩니다. 따라서 © 또는 ©를 입력 할 수 있습니다..

ISO-8859-1 및 ANSI의 비 ASCII 문자

이 차트의 문자 128-159는 ISO-8859에 포함되지 않은 ANSI 문자입니다. ISO-8859-1 / ANSI의 처음 127 코드는 위에 나열된 ASCII와 동일하므로 여기에 포함되지 않습니다..

캐릭터
HTML 이름
HTML 번호
기술
유로 기호
작은 따옴표 9 개
ƒƒƒ후크가있는 소문자 f
낮은 9 인용 부호
수평 줄임표
단검
이중 단검
ˆˆˆ수정 자 문자 곡절 악센트
밀 기호 당
에스Š에스캐논이있는 대문자 S
단일 왼쪽 각도 인용
ŒŒŒ자본 합자 OE
캐논이있는 대문자 A
왼쪽 작은 따옴표
오른쪽 작은 따옴표
왼쪽 큰 따옴표
오른쪽 큰 따옴표
총알
대쉬
엠 대시
~˜~틸데
TM 상표 표시
에스š에스캐논이있는 소문자 S
오른쪽을 가리키는 각도 따옴표
œ소문자 합자 oe
캐논 소문자 z
와이Ÿ와이분음 부호가있는 대문자 Y
 끊지 않는 공간
¡ ¡ ¡반전 된 느낌표
¢ ¢ ¢센트 기호
£ £ £파운드 기호 (통화)
¤ ¤ ¤통화 기호
¥ ¥ ¥엔 / 위안 기호
¦ ¦ ¦깨진 세로 막대
§ § §섹션 표시
¨ ¨ ¨분음
© © ©저작권 표시
ª ª ª여성 서수 지표
« « «왼쪽 이중 따옴표 (길레)
¬ ¬ ¬서명하지 않음 (논리)
­ ­ ­소프트 / 임의 하이픈
® ® ®등록 상표 표시
¯ ¯ ¯간격 매크로 / 개요
° ° °학위 표시
± ± ±더하기 / 빼기 기호
² ² ²위첨자 2 (제곱)
³ ³ ³위첨자 3 (큐브)
´ ´ ´급성 악센트
µ µ µ마이크로 사인
단락 기호 (순환)
· · ·중간 점
¸ ¸ ¸세 딜라
¹ ¹ ¹위첨자 하나
º º º남성 서수 표시기
» » »직각 따옴표 (길레)
¼ ¼ ¼1/4 분율 (1 이상 4)
½ ½ ½반 분율 (1 이상 2)
¾ ¾ ¾3/4 분수 (3/4 이상)
¿ ¿ ¿거꾸로 된 물음표
억음 악센트가있는 대문자 A
악센트가있는 대문자 A
곡절 악센트가있는 대문자 A
물결표가있는 대문자 A
분음 부호가있는 대문자 A
위의 고리가있는 대문자 A
Æ Æ Æ자본 AE 합자
세 딜라와 대문자 C
이자형 이자형 이자형억음 악센트가있는 대문자 E
이자형 이자형 이자형악센트가있는 대문자 E
이자형 이자형 이자형곡절 악센트가있는 대문자 E
이자형 이자형 이자형분음 부호가있는 대문자 E
나는 나는 나는억음 악센트가있는 대문자 I
나는 나는 나는악센트가있는 대문자 I
나는 나는 나는곡절 악센트가 붙은 대문자 I
나는 나는 나는분음 부호가있는 대문자 I
대문자 ETH (Dogecoin 기호)
물결표가있는 대문자 N
영형 영형 영형억음 악센트가있는 대문자 O
영형 영형 영형악센트가있는 대문자 O
영형 영형 영형곡절 악센트가있는 대문자 O
영형 영형 영형물결표가있는 대문자 O
영형 영형 영형분음 부호가있는 대문자 O
× × ×곱셈 부호
영형 영형 영형대문자 O 슬래시
억음 악센트가있는 대문자 U
악센트가있는 대문자 U
곡절 악센트가있는 대문자 U
분음 부호가있는 대문자 U
와이 와이 와이악센트가있는 대문자 Y
Þ Þ Þ대문자 THORN
ß ß ß소문자 sharp s (에 제트 / 샤 르페 스 S )
악센트가있는 소문자 a
악센트가있는 소문자 a
곡절 악센트가있는 소문자 a
물결표가있는 소문자 a
분음 부호가있는 소문자 a
위의 고리가있는 소문자 a
æ æ æ소문자 ae 합자
cedilla가있는 소문자 c체 세딜)
이자형 이자형 이자형억음 악센트가있는 소문자 e
이자형 이자형 이자형악센트가있는 소문자 e
이자형 이자형 이자형곡절 악센트가있는 소문자 e
이자형 이자형 이자형분음 부호가있는 소문자 e
나는 나는 나는억음 악센트가있는 소문자 i
나는 나는 나는예음 악센트가있는 소문자 i
나는 나는 나는곡절 악센트가있는 소문자 i
나는 나는 나는분음 부호가있는 소문자 i
ð / td> ðcode>소문자 eth
물결표가있는 소문자 n
영형 영형 영형억음 악센트가있는 소문자 o
영형 영형 영형예음 악센트가있는 소문자 o
영형 영형 영형곡절 악센트가있는 소문자 o
영형 영형 영형물결표가있는 소문자 o
영형 영형 영형분음 부호가있는 소문자 o
÷ ÷ ÷구분 표시
영형 영형 영형슬래시가있는 소문자 o
억음 악센트가있는 소문자 u
예음 악센트가있는 소문자 u
곡절 악센트가있는 소문자 u
분음 부호가있는 소문자 u
와이 와이 와이예음 악센트가있는 소문자 y
þ þ þ소문자 가시
와이 와이 와이분음 부호가있는 소문자 y

유니 코드

유니 코드는 The Unicode Consortium에서 관리하는 문자 인코딩의 표준입니다..

앞에서 설명한 것처럼 컴퓨터 시스템은 문자 (문자, 숫자, 기호)를 문자 그대로 저장하지 않습니다. 하드 드라이브의 문서에 각 문자의 작은 그림이 없습니다. 아시다시피, 각 문자는 일련의 이진 비트 (1과 0)로 인코딩됩니다. 예를 들어, 소문자 “a”의 코드는 01100001입니다..

그러나 01100001은 임의적입니다. 문자를 “a”로 만들어야하는 일련의 비트에 대해서는 특별한 것이 없습니다. 컴퓨터 산업은 집합 적으로 “a”를 의미한다는 데 동의했습니다. 그렇다면 전체 산업은 어떻게 모든 가능한 성격을 나타내는 방법에 동의합니까? 문자 인코딩 표준 인코딩 표준은 사용 가능한 모든 가능한 문자를 간단히 지정하고 각 문자에 비트 열을 할당합니다.

지난 수십 년 동안 전 세계에서 사용 된 몇 가지 문자 인코딩 표준이있었습니다. 오랫동안 가장 보편적으로 받아 들여진 표준은 ASCII였습니다. ASCII의 문제점은 비교적 제한된 수의 문자 (최대 256 자) 만 인코딩한다는 것입니다. 라틴어 이외의 언어, 많은 중요한 수학 및 과학 기호 및 일부 기본 문장 부호는 제외되었습니다..

ASCII가 라틴 알파벳을 사용하는 영어 및 기타 언어로 사용되는 것 외에도 다른 알파벳을 사용하는 언어 그룹은 자체 문자 인코딩을 사용하는 경향이있었습니다. 이러한 인코딩 체계는 서로 별도로 정의 되었기 때문에 종종 충돌했습니다. 여러 언어에 대해 단일 인코딩 체계를 동시에 사용하는 것은 불가능했습니다.

유니 코드는 원래 고안되었으며 특히 이러한 과제를 극복하기 위해 개발되었습니다. 유니 코드의 목표는 유니ersal, 유니해고 유니세계의 모든 언어 및 쓰기 시스템의 모든 그래프에 대한 que 코드 식별자.

UTF-8

유니 코드는 여러 문자 인코딩 체계로 구현되었지만 오늘날 가장 널리 사용되는 표준은 UTF-8입니다. UTF-8은 모든 유형의 최신 컴퓨팅에 거의 보편적으로 적용되었습니다..

UTF-8은 최대 4 개의 8 비트 코드 블록을 사용하여 문자를 인코딩합니다. ASCII는 문자 당 8 비트 만 사용했습니다. 이전에 ASCII에 포함 된 유니 코드 문자는 ASCII에서 사용 된 것과 동일한 8 비트 인 단일 8 비트 청크로 UTF-8로 표시됩니다. ASCII 텍스트를 UTF-8에서 호환 가능하게 만듭니다. (이것은 UTF-8이 보편적 표준이 된 많은 이유 중 하나입니다. 전환이 비교적 쉬웠습니다.)

8×4 체계는 UTF-8에 백만 개 이상의 코드 포인트를 제공하여 유니 코드가 129 개의 스크립트 및 쓰기 시스템에서 문자를 인코딩 할 수 있도록합니다..

유니 코드 이해를위한 리소스

  • 시스템 및 유니 코드 작성 소개는 일반적으로 문자 인코딩, 특히 유니 코드에 대한 매우 철저하고 웅변적인 설명입니다. 유니 코드에서 한 가지만 읽을 수 있다면 이것이 읽을 것입니다
  • 유니 코드 표준 : 기술 소개는 유니 코드 표준에 대한 공식 설명입니다.
  • BMP를 넘어서! classrom 프리젠 테이션 또는 자체 학습에 적합한 유니 코드에 대한 자습서입니다.
  • 유니 코드 자습서에서는 문자 결합과 같은 흥미로운 세부 사항을 비롯하여 유니 코드 작동 방식 및 유니 코드 구문 분석 엔진의 작동 방식에 대해 설명합니다..

유니 코드에 관한 책

  • Jukka Korpela가 설명하는 유니 코드는 유니 코드에 대한 좋은 개요와이를 구현할 때 발생하는 다양한 개발 문제를 제공합니다.
  • Unicode Demystified : Richard Gillam의 Encoding Standard에 대한 실용 프로그래머 가이드는 다소 자바에 중점을 둔 구현 관련 내용이 포함 된 유니 코드에 대한 설명입니다.
  • Yannis Haralambous의 글꼴 및 인코딩은 유니 코드에 관한 것이 아니라 가장 가치있는 책일 수 있습니다. 그것은 컴퓨터에서 텍스트를 인코딩하고 표현하는 역사를 다루며, 유니 코드와 밀접하게 관련된 많은 주제를 이해하기위한 이론적이고 실용적인 기초를 제공합니다..

유니 코드 참조 자료

유니 코드에 대한 기본적인 이해를 마치면 대부분 특정 문자의 정확한 인코딩과 같은 특정 세부 정보를 찾아야합니다..

  • C / C ++ 유니 코드 치트 시트는 Microsoft C / C ++를 유니 코드로 변환하는 방법에 대한 정보를 제공합니다.
  • XML 및 유니 코드 기술 보고서는 XML과 유니 코드를 함께 사용하는 다양한 측면을 다루는 기술 보고서 ​​목록입니다.
  • Decode Unicode는 아름다운 UI가있는 온라인 유니 코드 사전을 제공하므로 로컬 글꼴 지원 없이도 정의 된 모든 유니 코드 문자를 볼 수 있습니다
  • Data on Languages는 다양한 언어로 유니 코드 문자 집합을 사용하는 방법에 대한 검색 가능한 정보를 제공합니다
  • Unicode Navigator는 모든 유니 코드 문자의 체계적인 목록을 제공합니다

유니 코드 도구

  • 유니 코드 분석기는 웹 페이지 및 문서의 유니 코드 텍스트에 대한 정보를 제공하는 Chrome 브라우저 확장입니다.
  • 문자 식별자는 선택한 유니 코드 문자에 대한 자세한 정보를 찾기위한 컨텍스트 메뉴를 제공하는 Firefox 플러그인입니다.
  • 웹의 텍스트 필드에 유니 코드 문자를 삽입하려면 Chrome 용 유니 코드 기호 또는 Firefox 용 유니 코드 입력 도구를 사용해보십시오.
  • UnicodeDataBrowser는 UnicodeData.txt 파일을보다 쉽게 ​​읽을 수 있도록 GUI를 제공합니다.
  • Polyglot 3000은 텍스트의 언어를 자동으로 식별합니다
  • 유니 코드는 다양한 유니 코드 지원 스크립트에 대한 유니 코드 문자 키보드 레이아웃 목록을 제공합니다
  • Babel은 광범위한 국제화 및 현지화 작업을위한 Python 라이브러리입니다.
  • D-Type Unicode Text Engine은 모든 장치, 플랫폼 또는 운영 체제에서 고품질 유니 코드 텍스트를 레이아웃, 렌더링 및 편집하기위한 C ++ 라이브러리입니다.
  • Nunicode는 UTF-8 문서의 인코딩 및 디코딩을위한 C 라이브러리입니다
  • 이식 가능한 UTF-8은 PHP 문자열에 대한 유니 코드 지원을 제공합니다
  • Tesseract OCR은 유니 코드 텍스트를위한 광학 문자 인식 기능을 제공합니다
  • Popchar는 모든 유니 코드 공간에서 문자를 쉽게 찾고 입력 할 수있는 향상된 문자표입니다.
  • 유니 코드 유틸리티는 유니 코드 작업을위한 많은 재미 있고 유용한 온라인 도구를 제공합니다
  • Edicode는 다양한 국제 스크립트를 사용하여 텍스트를 입력 할 수있는 유연한 온라인 유니 코드 키보드를 제공합니다.
  • Quickkey는 처음 65,000 개의 정의 된 유니 코드 문자를 입력 할 수있는 유연한 키보드 확장입니다.
  • 유니 코드 코드 변환기는 입력 된 문자 코드를 동일한 문자의 여러 다른 인코딩으로 변환
  • CharFunk는 유니 코드 문자에 대한 여러 가지 흥미로운 검사 및 작업을 수행하기위한 JavaScript 유틸리티입니다.
  • Kreative Recode는 텍스트 파일을 다양한 인코딩에서 유니 코드로 변환
  • BabelMap Online은 16 진수 또는 10 진수 인코딩뿐만 아니라 디스플레이 문자로 출력되는 브라우저 내 유니 코드 키보드를 제공합니다.

텍스트 및 코드 편집기

오늘날 대부분의 텍스트 편집기, 코드 편집기 및 IDE는 기본적으로 유니 코드를 사용하거나 쉽게 유니 코드를 처리 할 수 ​​있습니다. Sublime, Notepad ++, Atom 및 Eclipse는 모두 기본 문자 인코딩으로 UTF-8로 설정되어 있습니다. Vim과 Emacs는 UTF-8을 사용하기 위해 설정 변경이 필요할 수 있습니다 :

  • Emacs와 함께 유니 코드 사용하기
  • Vim과 함께 유니 코드 사용하기

확장 유니 코드 문자 집합을 처리하도록 특별히 설계된 소수의 코드 및 텍스트 편집기도 있습니다.

  • MinEd는 유니 코드 문자 공간의 전체 범위에서 문자를 삽입 할 수있는 상황 별 지원 기능이있는 유니 코드 텍스트 편집기입니다.
  • Classical Text Editor는 광범위한 유니 코드 문자 집합을 사용하는 다국어 텍스트를 포함하여 중요하고 학술적인 텍스트로 작업하기위한 고급 편집기입니다.

유니 코드 글꼴

글꼴과 유니 코드의 관계는 약간 비스듬합니다. 유니 코드는 ASCII와 역 호환되도록 작성되었습니다. ASCII로 포맷 된 텍스트는 거의 문제없이 유니 코드로 디코딩 될 수 있습니다. ASCII로 표시되는 작은 문자 집합 만 사용하는 한 ASCII 글꼴을 사용하여 유니 코드로 인코딩 된 텍스트를 표시 할 수 있습니다..

오늘날 대부분의 컴퓨터에서 사용 가능한 대부분의 글꼴은 유니 코드로 인코딩됩니다. 따라서 이러한 관점에서 대부분의 글꼴은 “유니 코드 글꼴”입니다. 그러나 대부분의 글꼴은 특히 큰 전체 유니 코드 표준을 지원하지 않습니다..

일반적으로 이것은 문제가되지 않습니다. 여러 언어로 텍스트를 작성하거나 확장 문자 세트를 사용하는 사람은 라틴 스크립트, 각 CJK 언어 및 수학 기호 (예 :) 등 여러 가지 글꼴을 사용할 수 있습니다. 그러나 유니 코드 문자 공간이 많은 단일 글꼴을 사용하는 것이 유용한 경우가 있습니다. 여러 글꼴을 사용할 수없는 일반 텍스트 및 소스 코드 환경에서 작업하거나 여러 스크립트 간의 시각적 통일성이 특히 중요한 경우에 필요할 수 있습니다..

다음은 확장 유니 코드 지원을 제공하는 가장 주목할만한 글꼴 프로젝트입니다. 사용되지 않는 글꼴 및 더 이상 사용되지 않는 글꼴을 포함한 전체 목록은이 유니 코드 글꼴 페이지를 참조하십시오. 아시아 언어 조판에 대해서는이 CJK 글꼴 목록을 참조하십시오..

  • Everson Mono는 유니 코드 표준의 제작자 중 하나가 만든 모노 스페이스 글꼴입니다. 명시된 목적은 가능한 한 많은 유니 코드 문자 공간에 글리프를 제공하는 것이며,이 글을 쓰는 현재 92 개의 유니 코드 문자 블록이 지원됩니다.
  • Noto는 Google에서 개발 한 대규모 디스플레이 글꼴 세트로, 대부분의 유니 코드 문자 세트를 지원하고 궁극적으로 전체 유니 코드 표준을 지원하려는 의도로 제공됩니다..
  • Deja Vu Fonts는 Serif, Sans 및 Monospace 버전과 함께 광범위한 유니 코드 표준을 제공하는 글꼴 모음입니다..
  • GNU FreeFont는 37 개의 필기 시스템과 12 개의 유니 코드 기호 범위를위한 Serif, Sans 및 Mono 유형의 얼굴을 제공하는 글꼴 모음입니다..
  • GNU Unifont는 Unicode 8.0 Basic Multilingual Plane에 대한 완전한 적용 범위와 Supplemental Multilingual Plane에 대한 광범위하지만 불완전한 적용 범위를 가진 단일 공간 비트 맵 글꼴입니다..

특수 용도로 사용되는 유니 코드 표준의 특정 하위 세트를 인코딩하는 흥미로운 글꼴이 많이 있습니다..

  • Junicode는 중세 주의자를위한 글꼴 세트입니다
  • 라스트 리조트는“마지막 리조트의 글꼴”입니다. 기존 문자 글리프 대신 각 글리프가 실제로 유니 코드 문자 자체에 대한 정보를 표시합니다.
  • 고대 스크립트 용 유니 코드 글꼴은 여러 고대 및 고전 알파벳의 글꼴 세트를 만드는 프로젝트입니다.
  • Unimath Plus는 확장 된 과학 및 수학 기호 세트를 제공합니다

원하는 내용을 여전히 찾을 수없는 경우 다음과 같은 추가 유니 코드 글꼴 리소스가 있습니다.

  • SIL Fonts 소수 언어 커뮤니티를 지원하는 글로벌 비영리 단체 인 SIL International에서 만든 다양한 지원되지 않는 언어에 대한 다양한 글꼴
  • 유니 코드 문자 범위 및이를 지원하는 유니 코드 글꼴은 모든 범위의 유니 코드 문자에 대한 글꼴을 찾는 데 도움이됩니다..

이모티콘 자료

이모티콘은 문자 메시지에 넣을 수있는 재미 있고 웃는 얼굴과 엄지 손가락 표시입니다. 실제로는 유니 코드 표준의 일부입니다. 유니 코드의 이모티콘 부분은 보편적으로 지원되지 않으므로 Emoji를 앱이나 웹 사이트에 통합하려면 도움이 필요할 수 있습니다. 유니 코드 이모 지 사용 및 빌드에 도움이되는 리소스는 다음과 같습니다..

이모티콘 참조

  • Emojipedia는 검색 가능한 Emoji 문자 데이터베이스입니다
  • 이모티콘을 사용할 수 있습니까? iOS, Android, OS X 및 Windows 및 주요 브라우저에서 유니 코드 이모티콘을 기본적으로 지원하는 정보를 제공합니다.
  • WTF 이모 지 재단은 이모 지 발전에 전념하는 약간 진지한 조직입니다. 그들은 이모티콘 사전을 실행.
  • 이모티콘 치트 시트는 이모티콘 입력 코드에 대한 빠른 참조를 제공합니다.

이모티콘 라이브러리

  • 이 PHP Emoji 라이브러리를 사용하여 앱에 Emoji를 포함시키고 여러 공급 업체 표준간에 변환 할 수 있습니다. 또는 코드 내에서 이름으로 이모티콘을 참조 할 수있는이 PHP7 이모티콘 라이브러리를 사용해보십시오
  • Python 용 Emoji는 공식 유니 코드 이모티콘과 여러 별칭 세트를 모두 지원합니다. Django 개발자는 django-emoji 패키지를 사용할 수도 있습니다
  • Emoji Golang은 Go 프로그래밍 언어에 대한 Emoji 지원을 제공합니다
  • Ruby에는 Emoji 지원을위한 몇 가지 보석이 있지만 Github의 것이 가장 좋습니다.
  • Emoji-Java는 Java에서 Emoji 지원을 제공합니다
  • Coloremoji.sty를 사용하면 LaTeX 문서에 풀 컬러 이모티콘을 쉽게 포함시킬 수 있습니다.
  • Node.js의 패키지 관리 시스템 인 Npm에는 여러 가지 이모티콘 패키지가 있습니다.
    • 이모티콘 및 노드 이모티콘은 이모티콘에 대한 기본 지원을 제공합니다.,
    • Ember-cli-emoji는 Emojify.js와 연동하여 Ember.js 앱에 이모티콘 도우미를 제공합니다.
    • Markdown-it-emoji는 markdown-it Markdown 파서를 지원하기 위해 그림 이모티콘을 추가합니다
  • 이모티콘 구문은 Atom 텍스트 편집기를위한 바보 같은 라이브러리로, 의미에 따라 코드 라인에 이모티콘을 추가합니다..

이모티콘 키보드 및 컬렉션

  • iOS 용 EmojiXpress는 iPhone 용 이모티콘 모음 및 키보드입니다.
  • Emojione은 Creative Commons 라이선스가있는 아트 워크가 개발자에게 무료로 제공되는 크로스 플랫폼 Emoji 모음입니다.
  • iDiversicons는 다양한 이모티콘 문자와 iPhone 키보드를 제공합니다..

MIME 유형

MIME는 “Multipurpose Internet Mail Extensions”의 약자입니다. 온라인으로 전송되는 다양한 파일 형식을 식별하는 데 사용되는 인터넷 표준입니다. 원래 전자 메일 전송의 인터넷 표준 인 SMTP (Simple Mail Transfer Protocol)를 통해 전송 된 전자 메일 용으로 개발되었습니다. 오늘날 MIME은 HTTP와 같은 다른 통신 프로토콜에서 매우 중요합니다..

MIME 역사

우리는 이미 ASCII와 문자 인코딩의 역사를 논의했습니다. 그러나 이것보다 정보를 보내는 이야기에는 훨씬 더 많은 것이 있습니다.

시간이 지남에 따라 메시지가 더욱 복잡해지기 시작했고이 표준 형식으로는 충분하지 않은 것이 분명해졌습니다. 오디오 또는 비디오 파일이 포함 된 멀티미디어 이미지는 전혀 정의되지 않았습니다. 영어 알파벳을 사용하지 않는 언어에도 동일하게 적용됩니다. 나다니엘 보렌 슈타인 (Nathaniel Borenstein)과 네드 프리드 (Ned Freed).

그들의 제안은 이메일이 하나의 메시지에 여러 객체를 포함 할 수 있도록 메시지 형식을 재정의했다. 영어 이외의 언어뿐만 아니라 비 ASCII 문자 사용; 이미지, 오디오 및 비디오 사용. 이것은 1993 년에 공식 표준이 된 MIME의 탄생이었습니다..

이 제안은 또한 7 비트, 8 비트, base64, 이진 및 인용 인쇄 가능한 인코딩 표준을 정의했습니다. 이러한 인코딩 표준은 모든 데이터가 실제로 전송되도록 보장해야했습니다. 또한 전송되는 데이터 유형을 올바르게 식별하는 데 필요한 Content-Type 헤더 사용에 대한 정보도 포함했습니다..

MIME 타입이란??

MIME 형식은 인터넷에서 매일 전송되는 많은 파일 형식을 식별하는 데 사용되는 식별자입니다. IANA (Internet Assigned Numbers Authority)에 의해 표준화됩니다. MIME 유형은 IETF (Internet Engineering Task Force)가 발행 한 의견 요청 : 2045 (RFC 2045)에서 처음 정의되어 명명되었으며 Borenstein과 Freed가 제출 한 공식 제안.

구조

MIME 형식은 슬래시로 구분 된 두 문자열 인 형식과 하위 형식으로 구성됩니다. 유형은 카테고리를 나타내며 개별 또는 다중 파트 일 수 있습니다. 각 유형에는 특정 하위 유형이 있습니다. 전통적으로 MIME 형식은 소문자로 작성됩니다.

개별 유형에는 텍스트, 이미지, 오디오, 비디오 및 응용 프로그램이 포함됩니다. 멀티 파트 유형은 문서의 범주를 별도의 부분으로 나누고 종종 다른 MIME 유형을 포함합니다. 여기에는 양식 데이터와 바이트 범위가 포함됩니다.

일부 MIME 유형은 x 또는 vnd로 시작합니다. x 접두사는 IANA에 등록되지 않았으며 vnd는 공급 업체별 접두사를 나타냅니다..

일반적인 MIME 유형

신청:

  • 응용 프로그램 /msword(.doc)
  • application / vnd.openxmlformats-officedocument.wordprocessingml.document (.docx)
  • application / vnd.openxmlformats-officedocument.wordprocessingml.template (.dotx)
  • application / vnd.ms-powerpoint (.ppt)
  • 응용 프로그램 / 전자 스크립트 (.es)
  • application / x-javascript (.js)
  • 응용 프로그램 / 옥텟 스트림 (.bin, .exe)
  • 응용 프로그램 /pdf(.pdf)
  • 응용 프로그램 / 포스트 스크립트 (.ps, .ai, .eps)
  • 응용 프로그램 /rtf(.rtf)
  • application / x-gtar (.gtar)
  • application / x-gzip (.gz)
  • application / x-java-archive (.jar)
  • application / x-java-serialized-object (.ser)
  • application / x-java-vm (.class)
  • 응용 프로그램 /x-tar(.tar)
  • 응용 프로그램 /zip(.zip)
  • 응용 프로그램 / x-7z 압축 (.7z)
  • application / x-rar- 압축 (.rar)
  • 응용 프로그램 / x- 충격파 플래시 (.swf)
  • application / vnd.android.package-archive (.apk)
  • 응용 프로그램 /x-bittorrent(.torrent)
  • application / epub + zip (.epub)
  • application / vnd.ms-excel (.xsl)
  • 응용 프로그램 /x-font-ttf(.tff)
  • application / rss + xml (.rss, .xml)
  • application / vnd.adobe.air-application-installer-package + zip (.air)
  • application / x-debian-package (.deb)
  • 응용 프로그램 /json(.json)

오디오 :

  • 오디오 / x- 미디 (.mid, .midi)
  • 오디오 /x-wav(.wav)
  • 오디오 /mp4(.mp4a)
  • 오디오 / 오그 (.ogg)
  • 오디오 / mpeg (.mp3)

영상:

  • 이미지 /bmp(.bmp)
  • 이미지 / gif (.gif)
  • 이미지 /jpeg(.jpeg, .jpg, .jpe)
  • 이미지 /tiff(.tiff, .tif)
  • 이미지 / x-x 비트 맵 (.xbm)
  • 이미지 / x- 아이콘 (.ico)
  • 이미지 /svg+xml(.svg)
  • 이미지 / png (.png)

본문:

  • 텍스트 /html(.htm, .html)
  • 텍스트 / 일반 (.txt)
  • 텍스트 / 리치 텍스트 (.rtf, .rtx)
  • text / css (.css)
  • text / csv (.csv)
  • 텍스트 / 달력 (.ics)

비디오:

  • 비디오 /mpeg(.mpg, .mpeg, .mpe)
  • 비디오 /ogg(.ogv)
  • 비디오 / 퀵타임 (.qt, .mov)
  • 비디오 /x-msvideo(.avi)
  • 비디오 /mp4(.mp4)
  • 비디오 / 웹 (.webm)

자원

MIME 유형을 사용하면 더 풍부하고 풍부한 이메일 경험을 얻을 수있었습니다. 다음 리소스 목록을 통해 MIME 유형 지원을 위해 웹 서버를 올바르게 구성하는 방법과 방법 및 이유에 대해 자세히 배울 수 있습니다..

온라인 자료

다음 목록에는 MIME의 표준 초안이 된 다섯 부분으로 된 제안에 대한 링크가 포함되어 있습니다..

  • RFC 2045 (PDF) : 제안의 첫 번째 부분은 MIME 메시지의 구조를 설명하는 데 사용되는 다양한 헤더를 지정합니다..
  • RFC 2046 (PDF) : 두 번째 문서는 MIME 미디어 타이핑 시스템의 일반적인 구조와 미디어 유형의 초기 세트를 정의합니다..
  • RFC 2047 (PDF) : 제안서의 세 번째 부분은 인터넷 메일 헤더 필드에서 미국 이외의 ASCII 텍스트 데이터를 허용하는 확장을 설명합니다..
  • RFC 2048 (PDF) : 네 번째 부분에서는 IANA에 새로운 MIME 유형을 등록하는 방법을 설명합니다.
  • RFC 2049 (PDF) : 다섯 번째 문서는 MIME 메시지 형식의 예와 함께 MIME 준수 기준을 설명합니다..
  • 미디어 유형 : 모든 미디어 유형의 전체 목록. 여기에는 새 미디어 유형을 등록하기위한 응용 프로그램에 대한 링크도 포함됩니다..
  • MIME Guys : 두 인터넷 전문가가 이메일을 영원히 바꾼 방법 : Nathaniel Borenstein과 Ned Freed와의 인터뷰를 바탕으로 한 기사에 대한 흥미로운 통찰력을 제공하는 기사.

튜토리얼

다음 리소스는 MIME 유형 처리, 적절한 서버 구성 등에 대한 유용한 자습서를 제공합니다..

  • 서버 MIME 유형을 올바르게 구성 : 특히 Gecko 기반 브라우저의 경우 새로운 MIME 유형이 추가 될 때 웹 마스터가 웹 서버를 올바르게 구성해야하는 이유에 대해 설명합니다..
  • HTML 오디오 및 비디오 요소가 지원하는 미디어 형식 : HTML5의 새로운 오디오 및 비디오 요소가 지원하는 MIME 유형 목록을 제공합니다.
  • MIME 스니핑이란 무엇입니까?이 기사는 MIME 스니핑에 대한 철저한 설명과 이와 관련된 취약점을 피하는 방법을 제공합니다..
  • MIME 유형 설명 : Linux 및 Mac OS X에 파일 확장자가 필요하지 않은 이유 : Windows 컴퓨터와 Linux / Mac OS X 컴퓨터의 차이점 중 하나를 설명하는 흥미로운 내용.
  • JavaScript에 적합한 MIME 유형 선택 : 현재 JavaScript에 대해 둘 이상의 MIME 유형이 있습니다. 이 튜토리얼은 각각의 사용 사례에 대한 설명을 제공합니다..

서적

MIME 형식 전용 책은 없지만 몇 가지 장을 다루는 밀접한 관련 주제에 대한 책은 여전히 ​​많습니다..

  • Lawrence Hughes의 인터넷 이메일 프로토콜, 표준 및 구현 (1998) : 고급 사용자를 대상으로하는이 책은 이메일 소프트웨어를 개발하는 데 필요한 필수 개념에 대한 지식을 강화하고 SMTP, POP3, IMAP와 같은 주요 인터넷 이메일 프로토콜 및 확장을 철저하게 설명합니다. , MIME 및 DSN.
  • David Wood의 Internet Internet Programming (1999) : 전자 메일 기능을 기반으로 응용 프로그램을 작성하는 데 필요한 모든 중요한 개념을 다루는 필수 가이드입니다. 다루는 주제에는 다양한 이메일 프로토콜, MIME 유형을 포함한 이메일 형식 및 많은 예제가 포함됩니다..
  • Peter Loshin의 Essential Email Standards (1999) :이 책은 전자 메일 표준에 대한 심층적 인 이해를 원하는 사람에게 반드시 필요한 것입니다. IETF에서 발표 한 가장 중요한 RFC와 잠재적 사용에 대한 철저한 분석을 제공합니다. 또한 CD에서 검색 가능한 디지털 버전의 책을 모두 포함합니다..
  • MH & Jerry Peek의 xmh (2006) :이 책은 온라인으로 자유롭게 구할 수 있으며 GNU-GPL 라이센스에 따라 출판됩니다. 세 번째 장에서는 MIME 유형과 멀티 파트 메시지에 대해 자세히 설명합니다.

도구

아래 링크에는 MIME 유형의 유효성을 검사하는 데 유용한 몇 가지 도구가 있습니다..

  • 브라우저가 지원하는 MIME 유형 : 페이지를로드하자마자 브라우저가 지원하는 MIME 유형을 알려주는 온라인 도구.
  • MIME 검사기 : IETF 표준과 MIME 메시지의 준수 여부를 확인하는 무료 온라인 MIME 검사기.
  • MIME : 파일에 대한 또 다른 무료 온라인 검사기.

MIME 유형에 대한 지식 확장

MIME 유형은 표면적으로 중요하지 않은 것처럼 보이지만 전자 메일 메시징 작동 방식에 큰 변화가있었습니다. 이 리소스 목록은 호기심을 자극하고 인터넷을 통해 전송되는 전자 메일 및 파일이 수년 동안 어떻게 변모했는지에 대한 심층적 인 이해를 제공해야합니다..

요약

대부분의 사람들은 입력 만하고 실제로 무슨 일이 일어나고 있는지에 대해 많이 생각하지 않습니다. 글꼴 디자인과 타이포그래피의 장점에 대해 생각할 귀찮은 사람들.

그러나 컴퓨터 화면에서 키 누르기가 문자가되는 방식을 알고 있거나 알고 싶어하는 사람들의 수는 더 적습니다..

다른 사람들에게는 투명하거나 사소합니다..

그러나 우리가 보여 주듯이, 언어를 표현하는 과정은 사소한 것이 아니며, 많은 양의 작업이 언어를 투명하게 만들었습니다. 수많은 개발자, 디자이너 및 언어 학자와 함께 유니 코드 컨소시엄을 통해 모든 언어, 모든 스크립트, 모든 컴퓨터에서 모든 문자를 작성할 수 있습니다..

이것은 주목할만한 성과이며 컴퓨터와 인터넷에 대한 보편적 인 문해력과 보편적 접근을 향한 필수 단계입니다..

자주하는 질문

Q. ASCII, 유니 코드 및 UTF-8의 차이점은 무엇입니까??

ㅏ. ASCII는 1960 년대의 오래된 표준 인 반면, 유니 코드는 1980 년대 후반에 존재했습니다..

ASCII는 128 자 또는 256 자이지만 유니 코드는 10,000이 넘습니다..

유니 코드는 문자표이고, UTF-8 (또는 UTF-16 또는 UTF-32)은 인코딩 레벨입니다. 유니 코드 0-256과 ASCII는 거의 동일하지만 제어 문자에 약간의 차이가 있습니다..

UTF-8은 오늘날 웹에서 가장 일반적인 인코딩이며 기본값입니다.

Q. 웹 페이지에 어떤 인코딩 유형을 사용하고 있는지 선언해야합니까??

ㅏ. 고유 한 인코딩 유형을 사용해야한다는 것을 알고있는 경우에만.

선언하지 않으면 대부분의 브라우저는 기본적으로 UTF-8로 설정됩니다. 외국어, 특히 라틴 이외의 언어로 웹 페이지를 작성하는 경우 UTF-8을 사용하거나 특수 문자 세트를 선택하십시오.

Q. HTML을 작성하려면 ASCII 코드를 기억해야합니까?

ㅏ. 매우 효율적으로 노력하려는 경우에만.

오늘날 대부분의 웹 사이트는 동적이며 CMS (콘텐츠 관리 시스템)와 같은 시스템을 통해 HTML을 생성합니다. 개발자 인 경우 HTML 외에 다른 프로그래밍 언어를 사용하고있을 수 있으며 이러한 언어에는 ASCII 기호를 생성하는 특별한 방법이있을 수 있습니다..

마지막으로, 위에서 논의한 바와 같이, 이러한 많은 코드는 ASCII 숫자 대신 HTML에서 특수 문자 이름을 사용합니다..

Q. 문자 인코딩이 운영 체제마다 다릅니다?

ㅏ. 약간.

유니 코드는 Windows와 Unix / Linux에서 약간 다릅니다. 예를 들어, Windows는 UTF-16LE을 사용하지만 Linux는 일반적으로 UTF-8을 사용합니다.

물론 운영 체제에서 사용하는 인코딩은 웹 페이지의 인코딩과 다를 수 있지만 OS와 웹 브라우저는 함께 작동하여 문자 코드를 컴퓨터가 표시 할 수있는 것으로 변환합니다..

때로는 이전 운영 체제에서는이 변환이 작동하지 않고 공백 문자 만 표시 될 수 있습니다. 예를 들어 Windows XP에서 외국 웹 사이트를 방문하는 것이 보일 수 있습니다.

Q. ASCII Art는 대단합니다! 내가 직접 만들 수있는 곳?

ㅏ. AsciiWorld.com에는 소프트웨어 섹션에 변환기 및 “페인터”와 같은 멋진 갤러리와 도구가 있습니다. 즐기세요!

다른 흥미로운 것들

코딩 및 웹 사이트 개발과 관련된 추가 가이드, 자습서 및 인포 그래픽이 있습니다.

  • CSS3 — 소개, 가이드 및 리소스 : 웹 페이지 레이아웃 학습을 시작하기에 좋은 장소.

  • PostScript 소개 및 리소스 : 세상을 바꾼 페이지 표시 언어에 대한 모든 정보.

  • Lorem Ipsum : 컨텐츠를 작성하기 전에 디자인에 “더미 텍스트”를 사용하는 방법을 배웁니다..

초보자를위한 HTML-최고의 가이드

HTML을 배우고 싶다면 책을위한 기사 인 HTML for Beginners – Ultimate Guide를 작성했습니다. 그리고 그것은 정말로 궁극적 인 가이드입니다. 처음부터 숙달까지 당신을 데려 갈 것입니다.

초보자를위한 HTML-Ultimate Guide
초보자를위한 HTML-최고의 가이드

잊지 못할 웹 디자인 트렌드

유니 코드 이전에는 모든 텍스트가 빈 상자로 표시되는 웹 사이트를 방문하는 것이 일반적이었습니다. 상황이 많이 바뀌 었습니다. 인포 그래픽 웹 디자인 트렌드에서 우리는 웹 사용 방식을 잊어 버리지 않습니다..

잊을 수없는 웹 디자인 트렌드
잊지 못할 웹 디자인 트렌드

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map