ASCII Encoding: مبتدیان ، Newbies …. تمام اطلاعات مورد نیاز شما را در اینجا کسب کرده ایم.

افشای: پشتیبانی شما به حفظ سایت کمک می کند! ما برای برخی از خدماتی که در این صفحه توصیه می کنیم هزینه ارجاع دریافت می کنیم.


ASCII نوعی رمزگذاری کاراکتر است که برای رایانه ها برای ذخیره و بازیابی کاراکترها (حروف ، اعداد ، نمادها ، فضا ها ، تورفتگی ها و غیره) به عنوان الگوی بیتی برای ذخیره سازی در حافظه و در دیسک های سخت استفاده می شود..

“رمزگذاری کاراکتر” در سطح بالا به معنای تبدیل یک نماد به عدد باینری و استفاده از “نقشه کاراکتر” برای خواندن شماره دودویی به عنوان یک نوع نامه است..

و انواع MIME به کاربران امکان می دهد داده ها را از طریق کاراکترها ، مانند تصاویر و فیلم ها ارسال کنند.

ASCII ، رمزگذاری کاراکتر ، انواع MIME

رمزگذاری کاراکتر

اولین شکل رمزگذاری کاراکتر به تلگراف برقی برمی گردد. در حقیقت ، کد مورس و بعداً کد Baudot برخی از اولین کدهای شخصیتی استاندارد شده بودند که تاکنون ایجاد شده اند.

لایه دوم رمزگذاری به نام رمزگذاری یا رمزگذاری نیز توسط نظامیان آن زمان ایجاد شده است ، اما این یک موضوع نسبتاً متفاوت است.

تا دهه 1950 ما روند جدید را به سمت ASCII شروع نکردیم. IBM این کار را با ایجاد برنامه های رمزگذاری برای استفاده در رایانه های سری 7000 آنها آغاز کرد.

Decimal Coded Decimal (BCD) IBM از رمزگذاری چهار بیتی در کارتهای پانچ استفاده کرد. این یک روش برای ذخیره شماره های اعشاری به شکل دودویی بود.

بنابراین به جای اعداد در حال اجرا از 0000 (0) تا 1111 (15) ، آنها از 0000 (0) به 1001 (9) رسیدند – هر چهار بیت نشان دهنده یک رقم واحد است.

بعداً ، IBM نسخه Extended BCD را بنام Extended Binary Coded Decimal Code Exchange (EBCDIC) ایجاد کرد. این یک سیستم رمزگذاری 8 بیتی برای همه شخصیت های استاندارد قابل چاپ بود.

در همان سال ، 1963 ، ASCII معرفی شد.

از یک برنامه رمزگذاری 7 بیتی استفاده می کند. این نشان دهنده 128 عدد مختلف است.

این قالب 7 بیتی ممکن است عجیب به نظر برسد. بعلاوه ، همه رایانه های 8 بیتی یا 16 بیتی یا 32 بیتی و غیره نیستند?

امروز آنها هستند اما کامپیوترهای اولیه به این روش ساخته نمی شدند.

علاوه بر این ، حافظه در رایانه گرانبها بود و دلیلی برای استفاده از بیت اضافی در صورت عدم نیاز به آن وجود نداشت. یک کد 6 بیتی (که وجود دارد) تمام حروف بزرگ ، کوچک و علامت های نشانه گذاری اصلی را پوشش نمی دهد. اما یک کد 7 بیتی – فضای کافی برای صرفه جویی در – ندارد.

ASCII به عنوان رایانه ها برای ساختاری در یک ساختار 8 بیتی (1 بایت) ، به تدریج به یک کد 8 بیتی غیررسمی تبدیل شدند ، جایی که 128 کاراکتر دیگر استاندارد سازی نشده بودند..

این حالت مدتی ادامه داشت. در سال 1991 ، 8 بیتی همانطور که ISO (سازمان بین المللی استاندارد سازی) برای UTF-8 حفظ کرده بود ، به شکل رسمی تبدیل شد.

هرچند ، مشکلی که در این زمان پیش آمد این بود که فقط یک الفبای را می توان با رمزگذاری 7 یا 8 بیتی پشتیبانی کرد.

به منظور پشتیبانی گسترده تر از زبانها ، طرح رمزگذاری یونیکد به همراه مجموعه شخصیت های جهانی طراحی شد. یونیکد دارای دو نوع رمزگذاری است ، UTF-8 رمزگذاری 8 بیتی است که با ASCII سازگاری دارد ، و به جای آن رسیده است که ASCII را به عنوان استاندارد رمزگذاری نویسه اصلی در وب جایگزین کند..

رشد UTF-8

علاوه بر این ، UTF-16 و UTF-32 برای زبان هایی با شخصیت های زیادی مورد استفاده قرار گرفته اند. با این حال ، همه چینی ، ژاپنی و عربی می توانند در UTF-8 نمایش داده شوند.

در نتیجه ، UTF-8 تقریباً رایج ترین قالب رمزگذاری در وب است. و برای بلندگوهای انگلیسی ، کارها بسیار آسان است زیرا 128 شخصیت اول ASCII همانند شخصیت های یونیکد هستند.

بنابراین برای استفاده در HTML ، مراجعه به جدول ASCII برای ایجاد یک شخصیت ، صرف نظر از آنچه در قالب رمزگذاری استفاده می کنید ، کار خواهد کرد.

جایی که ASCII متناسب با آن است

ASCII مخفف “كد استاندارد استاندارد آمریكا برای تبادل اطلاعات” است و توسط انجمن استاندارد های آمریكا ایجاد شده است (بعداً به موسسه استاندارد ملی آمریكا تغییر نام یافت).

استاندارد ASCII در سال 1960 آغاز شد و در سال 1963 منتشر شد. این برنامه افزودنی کدهای تلگرافی است و برای اولین بار توسط خدمات داده بل استفاده شد.

در سالهای گذشته تجدید نظرهای اساسی انجام شد. تا سال 2007 این رمزگذاری پرکاربردترین کاراکتر در وب بود اما با UTF-8 جایگزین شد.

تغییر وب از ASCII و ANSI مایکروسافت به سمت UTF-8 می تواند تا حد زیادی به ابتکارات Google مربوط شود ، زیرا استفاده از اینترنت بین المللی تر می شد و ASCII فقط قادر به نمایش کاراکترهای لاتین بود.

نکته قابل توجه این است که UTF-8 نوعی رمزگذاری است ، در حالیکه یونیکد کاراکتر مجموعه ای است. از آنجا که 128 کاراکتر اول یونیکد همان ASCII است ، مراجعه به جدول ASCII هنگام تولید کاراکتر در HTML قابل قبول است.

ASCII توانایی استفاده از “دنباله فرار” در نمایش الفبای جایگزین را دارد ، که اجازه می دهد آن را به یک استاندارد بین المللی تبدیل کند ، اما یونیکد مستقیماً این کار را انجام می دهد..

در سال 1987 یونیکد از اپل سرچشمه گرفت و در سال 1991 به پروژه کنسرسیوم یونیکد تبدیل شد. ASCII توسط ASA ایجاد شد ، اما پالایش بیشتر آن به عنوان بخشی از اعلامیه های ISO ادامه یافت..

نام رمزگذاری UTF-8 توسط کلیه استانداردهای مطابق با شماره اعداد اختصاص داده شده به اینترنت (IANA) استفاده می شود که به معنی HTML ، CSS و XML است. IANA یک بخش از ICANN بزرگتر است ، آن غیر انتفاعی است که پروتکل اینترنت و نام دامنه ها را تعیین می کند.

به طور خلاصه ، ASCII در دهه 60 از کد تلگرام تکامل یافت ، بزرگ شد و جزئی از مجموعه کاراکترهای یونیکد شد ، که توسط UTF-8 ، غالب ترین قالب رمزگذاری در وب استفاده می شود..

نام دامنه و کد صفحه وب به داشتن این نقشه شخصیت یکپارچه برای درست کار کردن بستگی دارد.

این بدان معنی است که در ریشه اینترنت مدرن ، یک قالب کاراکتر اختراع شده در دهه 1870 وجود دارد ، که به عنوان ASCII در دهه 1960 رایانه ای شده است ، با یونیکد 1990 در وب مدرن شده و به طور گسترده ای با استفاده از اکثریت UTF-8 در سال 2007 پذیرفته شده است..

کنترل شخصیت ها در مقابل شخصیت های قابل چاپ

در ASCII دو نوع کاراکتر وجود دارد ، کاراکترهای قابل چاپ و شخصیتهای کنترل.

کاراکترهای کنترل اعداد 0-31 و 127 را مشخص می کنند. شخصیت های کنترل شامل تمام قسمت های نوشتاری هستند که پاراگراف ها ، زبانه ها ، انتهای خطوط ، جدا کننده پرونده ها و بسیاری از قطعات را که عمدتا شفاف هستند ، می گذارند..

این شخصیت های کنترل در زمانی ایجاد شده اند که کارتهای چاپی بخش بزرگی از فرآیند محاسبات بودند. برخی از این ویژگی ها از آن زمان جایگزین شده اند ، اما بسیاری از قطعات قالب بندی خط هنوز امروزه وجود دارد. کد 127 در واقع کدی برای حذف است (فقط در ASCII واقعی ، نه ANSI یا یونیکد).

همه شخصیتهای قابل چاپ همان چیزی است که ممکن است انتظار داشته باشید. تمام کاراکترهای کوچک (a-z) و حروف بزرگ (A-Z) به همراه اعداد ، نمادها و علائم نگارشی وجود دارد – اساساً هر آنچه در یک صفحه کلید معمولی دیده می شود. این شخصیت های اصلی شامل کلمات نوشتاری هستند.

استفاده از ASCII در XML و HTML

هر صفحه HTML یک قالب رمزگذاری کاراکتر دارد که به آن اختصاص داده شده است.

مگر در مواردی که مشخص شده باشد ، کدگذاری HTML به صورت UTF-8 پیش فرض خواهد شد. برای استفاده از ASCII خالص ، یا ANSI ، یا هر قالب خاص و منحصر به فردی ، تمام آنچه باید انجام شود این است که یک اظهارنامه در یک برچسب متا داشته باشید.

برای HTML 4:

برای HTML5:

در تگ charset می توانید UTF-8 ، ANSI یا ASCII را با استفاده از charset ="ما-ascii" یا می توانید شخصیت خاصی را که معمولاً با اعلام شماره ISO استفاده می کنید ، جستجو کنید. یک لیست کامل را می توانید در صفحه مجموعه شخصیت های IANA پیدا کنید.

قالب درج کد شخصیت

به طور کلی ، اما وقتی شخصی به استفاده از کد ASCII مراجعه می کند ، می خواهید آنها را روشن کند که منظور آنها TRUE US-ASCII با یک برچسب متناوب است ، یا اینکه آیا فقط از شما درخواست می کنند شخصیت خاصی را به نمایش بگذارید.

در HTML ، هر زمان که می خواهید از یک شخصیت خاص استفاده کنید ، مثلاً می گویند نماد cent (¢) یا یک شخصیت علامت سؤال معکوس (¿) – به طور کلی می توانید از نماد یونیکد یا US-ASCII استفاده کنید (8 بیتی) شخصیت ، با تایپ یک مرجع مانند این:

¢ در HTML به نظر می رسد:

¿در HTML به نظر می رسد:

بنابراین شما با یک شروع می کنید &# به دنبال آن یک عدد چهار رقمی است که با نیمه کلنی (؛) پایان می یابد.

به این ترتیب ، شما می توانید شخصیت ها را بر اساس شماره ASCII / یونیکد خود نمایش دهید.

البته کاراکترهای کنترلی بسته به نوع دیگری که استفاده می کنید و کدام کاراکتر واقعی را که در برچسب متا خود ذکر کرده اید ، یک تابع قالب بندی را انجام می دهند یا اصلاً کار نمی کنند..

بنابراین در HTML “”&شماره “” اما وقتی در مرورگر خود کاراکتر نمایش داده می شوید.

شخصیت های خاص HTML

اکنون ، بیایید مثلاً بگوییم می خواهید فقط نشان دهید & نماد در صفحه خود.

شما فقط نمی توانید آن را در HTML تایپ کنید ، اما می توانید ASCII یا Unicode مربوطه را تایپ کنید.

HTML یک زبان نشانه گذاری است ، بنابراین در حالی که حروف معمولی خوب هستند ، شخصیت های خاص و مخصوصاً < > براکت ها – برای نحوه خواندن و نشان دادن مرورگر HTML HTML بسیار مهم است.

لازم نیست همیشه شماره مرجع Unicode / ASCII را تایپ کنید. برای HTML 4.0 و جدیدتر ، اشخاص ویژه ای وجود دارند که شبیه به یک مرجع یونیکد کار می کنند ، اما به جای حفظ یک شماره ، یک کلمه را به خاطر می آورید.

¢ در HTML به نظر می رسد: ¢

¿ در HTML به نظر می رسد: ¿

لیست کاملی از این منابع شخصیت را می توان در کنسرسیوم W3 یافت.

جدول مرجع

با وجود این همه نتیجه ، شما فقط می توانید به دنبال مکانی آسان برای یافتن مرجع ASCII یا Unicode باشید. دیگر نگاه نکنید ، ما در اینجا 000-127 منابع داریم و می توانید قالب کامل یونیکد را در ویکی پدیا پیدا کنید.

توجه داشته باشید که شخصیت های 000-032 و 127 به طور کلی قابل چاپ نیستند و بنابراین با “NA” نشان داده می شوند.

ASCII

table.wiht002
فاصله مرزی: 0px؛
سقوط مرزی: فروپاشی؛
حاشیه سمت چپ: خودکار؛
حاشیه سمت راست: خودکار؛
حاشیه پایین: 1.5em؛
متن-تراز: مرکز؛
}

جدول ، TR ، TD
{
بالشتک: 0px؛
حاشیه: 0px؛
}
td.bor
{
مرز-چپ: 1px جامد # 000؛
padding-left: 1em؛
حاشیه سمت راست: 1em؛
}
td.break
{
حاشیه سمت چپ: 2em؛
حاشیه سمت راست: 2em؛
}
td.sep
{
مرز-پایین: 1px جامد # 000؛
}
td.sepbor
{
مرز-پایین: 1px جامد # 000؛
مرز-چپ: 1px جامد # 000؛
padding-left: 1em؛
حاشیه سمت راست: 1em؛
}

0NA32NA64@@96``
1NA؟33!!65آآ97آآ
2NA؟34""66بب98بب
3NA؟35##67جج99جج
4NA؟36$$68دد100دد
5NA؟37٪٪69هه101هه
6NA؟38&&70فف102ff
7NA؟3971جج103گرمگرم
8NA؟40((72حح104ساعتساعت
9NA41))73منمن105منمن
10NA42**74جج106جج
11NA43++75کک107کک
12NA44,,76لل108لل
13NA4577مم109مم
14NA؟46..78نن110نن
15NA؟47//79ایای111اواو
16NA؟480080پپ112پپ
17NA؟491181سس113قق
18NA؟502282رر114rr
19NA؟513383سس115ss
20NA؟524484تیتی116تیتی
21NA؟535585توتو117توتو
22NA؟546686VV118vv
23NA؟557787WW119WW
24NA؟568888ایکسایکس120ایکسایکس
25NA؟579989YY121یی
26NA؟58::90زز122zz
27NA؟59؛؛91[[123{{
28NA؟60<<92\\124||
29NA؟61==93]]125}}
30NA؟62>>94^^126~~
31NA؟63??95__127NA؟

منابع و منابع ASCII

تاریخچه زیادی در مورد نحوه تکامل کدهای شخصیت ها و سازمان هایی که این معیارها را برای بقیه ما در اختیار دارند ، وجود دارد. با اکثر توسعه دهندگان اینترنت و W3C در UTF-8 ، حداقل در آینده نزدیک ، مستقر می شوند ، اینگونه رمزگذاری می شود.

اگر رمزگذاری دستی در قالب های دیگر را شروع کنید ، به منابع دیگری نیاز دارید تا بتوانید به شما کمک کنند ، یا این امر می تواند خوب باشد که یک مرجع جامع در اطراف داشته باشید.

فهرست منابع

  • صفحه مجموعه شخصیت های IANA

  • شخصیت های ویژه HTML توسط کنسرسیوم W3

  • قالب کامل یونیکد در ویکی پدیا

  • جدول ASCII فقط 0130-0255

  • تاریخچه ASCII در ASCII-World

  • لیست کاراکترهای یونیکد در ویکی پدیا.

ASCII هنر

هیچ خلاصه ای از ASCII بدون مراجعه به هنر ASCII کامل نخواهد بود.

از نرم افزار ویژه یا نمادهایی با کد دستی استفاده می شود تا شکل دیگری را بدون استفاده از نمادها به خود بگیرد. این نوع افکت ها از دهه 1980 وجود داشته و در سیستم هایی مانند Commodore Amiga Computer محبوبیت زیادی پیدا کرده است.

حتی بین هنر “Oldskool” ASCII که از ASCII خالص در خط فرمان استفاده می شود ، و “Newskool” که از شخصیت های ویژه در یونیکد استفاده می کند ، حتی هنرهای پیچیده تری نیز استفاده می شود..

در اینجا تصویری از سر گورخر آورده شده است:

ASCII Art Zebra

ISO-8859-1

ISO-8859-1 یک استاندارد رمزگذاری کاراکتر است. این سازمان در سال 1998 توسط سازمان بین المللی استاندارد (ISO) به عنوان پسوند ASCII منتشر شد.

ASCII و ISO-8859-1

معروف ترین استاندارد رمزگذاری کاراکتر ASCII است. ASCII برای رمزگذاری ابتدایی ترین 128 کاراکتر مورد استفاده برای نوشتن انگلیسی از 7 بیت هشت بایت استفاده کرد. تعدادی از کاربردهای خاص سیستم برای بیت هشتم (مرتبه بالا) توسعه داده شد.

به عنوان مثال ، یک سیستم از آن برای جابجایی بین روم و ایتالیایی سبک های چاپ سایر سیستم ها از آن برای رمزگذاری کاراکترهای اضافی استفاده می کردند. با استفاده از هر هشت بایت ، می توان 256 کاراکتر را رمزگذاری کرد.

از آنجا که مجموعه اصلی ASCII شامل تعداد کاراکترهای لازم برای نوشتن در زبانهای غیرانگلیسی مشترک (مانند حروف دارای علائم دیاکریتیک) نیست ، گسترش کاراکتر تنظیم شده به 256 قابلیت های آن را به شدت افزایش داد.

IS0-8859-1 یکی از این پسوندها است. قرار بود این یک استاندارد بین المللی و بین المللی باشد. از آنجا که این یک Superset از استاندارد 8 بیتی ASCII است ، با عقب سازگار است: یک سند کدگذاری شده در ASCII به راحتی با استفاده از ISO-8859-1 قابل رمزگشایی است.

ISO-8859-1 و HTML

طبق استاندارد ، ISO-8859-1 رمزگذاری کاراکتر پیش فرض در HTML 4. با این حال ، اکثر مرورگرها از یک Superset ISO-8859 پشتیبانی می کنند ، به نام ANSI.

ANSI شامل 32 کاراکتر اضافی است که در ISO-8859-1 خالی بودند. (بیشتر اوقات ، وقتی لیستی از شخصیت های ISO-8859-1 را مشاهده می کنید ، در واقع لیست کامل ANSI است.)

امروزه ، استاندارد HTML5 از UTF-8 استفاده می کند ، یک سوپرست بسیار بزرگ که شامل کدگذاری اصلی ASCII ، ISO-8859-1 و ANSI است..

با این حال ، بیشتر اسناد HTML به زبان انگلیسی ، حتی آنهایی که صریحاً ISO-8859-1 یا UTF-8 را به عنوان مجموعه شخصیت خود اعلام می کنند ، در واقع از مجموعه شخصیت های کوچکتر ASCII استفاده می کنند. دو دلیل برای این وجود دارد:

  • ASCII را می توان در یک صفحه کلید استاندارد QWERTY تایپ کرد.

  • بسیاری از فن آوری های مورد استفاده برای تولید HTML فقط از ASCII پشتیبانی می کنند.

از آنجا که ISO-8859-1 و UTF-8 هر دو سازگار با ASCII هستند ، این معمولاً مشکلی ایجاد نمی کند.

ISO-8859-1 و شخصیت های شخصیت

مجموعه گسترده ای از کاراکترهای موجود در ISO-8859-1 را می توان در یک سند فقط با نام ASCII با استفاده از اشخاص کاراکتر HTML تولید کرد. این رشته هایی هستند که از آمپر شروع می شوند (“&”) و با یک جمع رنگ (” “”) خاتمه دهید.

به عنوان مثال ، نماد حق چاپ (دایره ای با “C” در آن) می تواند مستقیماً با استفاده از ISO-8859-1 یا UTF-8 رمزگذاری شود. اما از آنجا که کلید “©” در اکثر صفحه کلیدها وجود ندارد ، بسیاری از افراد تایپ © را آسانتر می کنند.

این در شش پرونده ASCII در پرونده ذخیره می شود: &, c ، o ، p ، y ، و؛ سپس مرورگرهای وب شخصیت ISO-8859-1 مناسب را به کاربر نشان می دهند.

بسیاری از نویسه های غیر ASCII ISO-8859-1 اشخاص شخصیت HTML را نامگذاری کرده اند. آنهایی که نمی توانند با کد عددی آنها تایپ شوند. کد عددی در واقع نسخه اعشاری (پایه 10) رمزگذاری باینری است.

به عنوان مثال ، نماد کپی رایت به صورت 10101001 در باینری کدگذاری شده است ، که در پایه 10 169 است. بنابراین می توانید © یا © را تایپ کنید.

شخصیت های غیر ASCII در ISO-8859-1 و ANSI

شخصیت های 128-159 در این نمودار شخصیت های ANSI نیستند که در ISO-8859 گنجانده نشده اند. 127 کد اول در ISO-8859-1 / ANSI در اینجا گنجانده نشده است ، زیرا آنها با ASCII یکسان هستند ، که در بالا به آنها اشاره کردیم.

شخصیت
نام HTML
شماره HTML
شرح
علامت یورو
،،علامت نقل قول تک 9 پایین
ƒƒƒحروف کوچک f با قلاب
علامت نقل قول دو برابر کم 9
بیضوی افقی
خنجر
خنجر دوتایی
ˆحرف اصلاح لهجه دور
در هر علامت میل
ŠŠŠحرف بزرگ S با caron
<<نقل قول تک زاویه ای از سمت چپ
ŒŒŒلیگاتور سرمایه OE
ŽŽنامه اسیر Z با caron
،،علامت نقل قول منفرد
علامت نقل قول تک راست
علامت نقل قول مضاعف سمت چپ
علامت نقل قول مناسب دو برابر
گلوله
خط کش
ام داش
~˜~تیلد
علامت تجاری TM
šššحروف کوچک S با کارون
علامت نقل قول زاویه سمت راست
œœœلیگاتور حروف کوچک
žžحروف کوچک z با کارون
ŸŸŸحرف بزرگ Y با دیه
 فضای بدون شکستن
¡ ¡ ¡علامت تعجب معکوس
¢ ¢ ¢علامت سانت
£ £ £علامت پوند (ارز)
¤ ¤ ¤علامت ارز
¥ ¥ ¥علامت ین / یوان
¦ ¦ |شکسته نوار عمودی
§ § §علامت بخش
¨ ¨ ¨دیارزیس
© © ©علامت حق چاپ
ª ª ªشاخص تنشی زنانه
« « «علامت نقل قول دو زاویه سمت چپ
¬ ¬ ¬امضا نکردن (منطق)
­ ­ avkanîخواب نرم / اختیاری
® ® ®علائم تجاری ثبت شده
¯ ¯ ¯فاصله ماکرو / خط مشی
درجه درجه درجهنشان درجه
± ± ±علامت اضافه / منفی
² ² ²متن فوق دو (مربع)
³ ³ ³متن فوق سه (مکعب)
´ ´ ،لهجه حاد
µ µ μعلامت میکرو
علامت بند (گنج)
· · ·نقطه میانی
¸ ¸ ¸سدیلا
¹ ¹ ¹متن فوق
º º ºشاخص حكم مردانه
» » »علامت نقل قول دو زاویه راست (گیلت)
¼ ¼ ¼کسر یک چهارم (1 بیش از 4)
½ ½ ½کسر نیمی (1 بیش از 2)
¾ ¾ ¾کسر سه چهارم (3 بیش از 4)
¿ ¿ ¿علامت سوال معکوس
آ آ آحرف بزرگ A با لهجه سنگین
آ آ آحرف بزرگ A با لهجه حاد
آ آ آحرف بزرگ A با دور
آ آ آحرف بزرگ A با tilde
آ آ آحرف بزرگ A با دیه
آ آ آحرف بزرگ A با انگشتر بالا
Æ Æ Æلیگامان AE سرمایه
Ç Ç Çحرف بزرگ C با سدیلا
È È Èحرف بزرگ E با لهجه سنگین
É É Éحرف بزرگ E با لهجه حاد
E E Eحرف بزرگ E با دور
Ë Ë Ëحرف بزرگ E با دیه
من من مننامه بزرگ من با لهجه سنگین
من من مننامه بزرگ من با لهجه حاد
من من مننامه بزرگ من با دور
من من مننامه بزرگ من با بیماری دیه
Ð Ð Ðحرف بزرگ ETH (نماد Dogecoin)
Ñ Ñ Ñحرف بزرگ N با tilde
صلی الله علیه وآله صلی الله علیه وآله صلی الله علیه وآلهحرف بزرگ O با لهجه سنگین
Ó Ó Óحرف بزرگ O با لهجه حاد
Ô Ô Ôحرف بزرگ O با دور
Õ Õ Õحرف بزرگ O با تیلد
Ö Ö Öحرف بزرگ O با دیه
× × ×علامت ضربدر
Ø Ø Øحرف بزرگ O بریده
Ù Ù Ùحرف بزرگ U با لهجه سنگین
Ú Ú Úحرف بزرگ U با لهجه حاد
Û Û Ûحرف بزرگ U با دور
Ü Ü Üحرف بزرگ U با دیه
Ý Ý Ýحرف بزرگ Y با لهجه حاد
Þ Þ Þنامه بزرگ THORN
ß ß ßحروف کوچک تیز (عزت / شارف س )
آ آ آنامه کوچک a با لهجه سنگین
آ آ آحروف کوچک a با لهجه حاد
آ آ آحروف کوچک a با دور بغل
آ آ آنامه کوچک a با tilde
آ آ آحروف کوچک a با دیه
آ آ آحروف کوچک a با انگشتر بالا
æ æ æحروف کوچک
چ چ چحرف کوچک c با سدیلا (cé cédille)
è è èنامه کوچک e با لهجه سنگین
é é éحرف کوچک e با لهجه حاد
ê ê êحروف کوچک e با متن دور
Ë Ë Ëحروف کوچک e با diaeresis
من من مننامه کوچک من با لهجه سنگین
من من منحرف کوچک من با لهجه حاد
من من منحرف کوچک من با دور
من من مننامه کوچک من با دیه
ð / td> کد> ðنامه حروف کوچک
ñ ñ ñحرف کوچک n با tilde
ò ò òنامه کوچک با لهجه سنگین
ó ó óحرف کوچک با لهجه حاد
ô ô ôحروف کوچک o با دور
õ õ õحروف کوچک o با tilde
ö ö öحروف کوچک o با دیه
÷ ÷ ÷علامت تقسیم
ø ø øنامه کوچک o با برش
Ù Ù Ùنامه کوچک با لهجه سنگین
ú ú úنامه کوچک با لهجه حاد
و و وحروف کوچک با دورگرد
ü ü üحرف کوچک شما با دیه
ý ý ýحرف کوچک y با لهجه حاد
þ þ þنامه کوچک خار
ÿ ÿ ÿحرف کوچک با y دیه

یونیکد

یونیکد یک استاندارد برای رمزگذاری شخصیت است که توسط کنسرسیوم یونیکد مدیریت می شود.

همانطور که بحث کردیم ، سیستم های رایانه ای کاراکترها (حروف ، اعداد ، نمادها) را به معنای واقعی کلمه ذخیره نمی کنند – هیچ تصویر کوچکی از هر حرف در یک سند در هارد دیسک شما وجود ندارد. همانطور که اکنون باید بدانید ، هر شخصیت به صورت یک سری بیت های باینری کدگذاری می شود – 1 و 0. به عنوان مثال ، کد حروف کوچک “a” 01100001 است.

اما 01100001 خودسرانه است – هیچ چیز خاصی در مورد آن دسته از بیت ها وجود ندارد که باید آن را با حرف “a” تبدیل کنند – صنعت رایانه به طور جمعی توافق کرده است که به معنای “الف” است. بنابراین چگونه کل صنعت به توافق رسیده است که چگونه می تواند شخصیت های ممکن را نمایندگی کند؟ با یک استاندارد رمزگذاری کاراکتر. یک استاندارد رمزگذاری به سادگی تمام شخصیت های ممکن موجود را مشخص می کند و هر یک از رشته ها را به آنها اختصاص می دهد.

چندین استاندارد رمزگذاری شخصیت در سراسر جهان طی چندین دهه گذشته محاسبات وجود داشته است. برای مدت طولانی ، استاندارد جهانی پذیرفته شده ASCII بود. مشکل ASCII این است که فقط تعداد نسبتاً محدودی از شخصیت ها را رمزگذاری کرده است – حداکثر 256. این زبانهای غیر لاتین ، بسیاری از نمادهای مهم ریاضی و علمی و حتی برخی از علائم اصلی نگارشی را حذف کردند.

گذشته از استفاده ASCII در انگلیسی و سایر زبانهایی که از الفبای لاتین استفاده می کنند ، گروه های زبانی با استفاده از حروف دیگر که تمایل دارند از رمزگذاری شخصیت خود استفاده کنند. از آنجا که این طرح های رمزگذاری جدا از یکدیگر تعریف می شدند ، اغلب با هم اختلاف داشتند. استفاده از یک برنامه رمزگذاری واحد برای چندین زبان همزمان به غیر ممکن بود.

در ابتدا یونیکد تصور شد و بطور خاص با هدف غلبه بر این چالش ها در حال توسعه است. هدف از یونیکد تهیه یک یونیریشه, یونیسرخ شده ، و یونیشناسه que code برای هر نوع نمودار در هر زبان و سیستم نوشتاری در جهان.

UTF-8

یونیکد در چندین طرح رمزگذاری کاراکتر پیاده سازی شده است ، اما استانداردی که امروزه بیشتر مورد استفاده قرار می گیرد UTF-8 است. UTF-8 برای همه نوع محاسبات مدرن تقریبا جهانی شده است.

UTF-8 با استفاده از 4 بلوک کد 8 بیتی ، کاراکترها را رمزگذاری می کند. ASCII فقط از 8 بیت برای هر کاراکتر استفاده کرده است. کاراکترهای یونیکد که قبلاً در ASCII گنجانده شده بودند ، در UTF-8 توسط یک تکه 8 بیتی ، همان 8 بیت که در ASCII استفاده می شدند ، نشان داده شده اند. این باعث می شود متن ASCII در UTF-8 سازگار با جلو باشد. (این یکی از دلایل زیادی است که UTF-8 به استاندارد جهانی تبدیل شده است – انتقال نسبتاً آسان بود.)

طرح 8 × 4 UTF-8 را با بیش از یک میلیون کد کد فراهم می کند ، به یونیکد اجازه می دهد تا شخصیت های 129 اسکریپت و سیستم نوشتن را رمزگذاری کند..

منابعی برای درک یونیکد

  • مقدمه ای بر سیستم های نوشتن و یونیکد توضیحی کاملاً کامل ، حتی فصیح از رمزگذاری شخصیت به طور کلی ، و به طور خاص یونیکد است. اگر فقط می توانید یک چیز را در یونیکد بخوانید ، این مطلبی است که می توانید بخوانید
  • استاندارد یونیکد: یک معرفی فنی توضیحات رسمی درباره استاندارد یونیکد است
  • به BMP و فراتر از آن! یک آموزش در مورد یونیکد ، مناسب برای ارائه کلاسرو یا خود مطالعه است
  • آموزش یونیکد توضیح می دهد که چگونه یونیکد کار می کند ، از جمله جزئیات جالب مانند ترکیب کاراکترها و نحوه عملکرد یک موتور تجزیه کننده یونیکد.

کتاب در مورد یونیکد

  • یونیکد توضیح داده شده ، توسط Jukka Korpela ، یک مرور کلی درباره یونیکد و چالش های مختلف توسعه که با اجرای آن ارائه می شود ، ارائه می دهد
  • Unicode Demystified: راهنمای برنامه نویسان عملی برای رمزگذاری استاندارد ، توسط ریچارد گیلام ، توضیحی در مورد یونیکد ، اگر تا حدودی تاریخ دار باشد ، با بسیاری از مشخصات اجرای جاوا متمرکز است.
  • فونت ها و رمزگذاری ها ، توسط یانیس هارالامبوس ، فقط مربوط به یونیکد نیست ، بلکه ممکن است کتابی باشد که ارزش خواندن آن را دارد. این تاریخچه رمزگذاری و نمایندگی متن در رایانه ها را پوشش می دهد ، و هم یک پایه نظری و عملی برای درک یونیکد و هم تعدادی از موضوعات نزدیک.

مواد مرجع یونیکد

پس از درک اساسی از یونیکد ، بیشتر خود را پیدا خواهید کرد که می خواهید جزئیات خاصی را جستجو کنید – مانند رمزگذاری دقیق یک شخصیت خاص.

  • برنامه C / C ++ Unicode Cheatsheet اطلاعاتی در مورد تبدیل Microsoft C / C ++ به یونیکد را در اختیار شما قرار می دهد
  • گزارشات فناوری XML و یونیکد لیستی از گزارشهای فنی است که جنبه های مختلف استفاده از XML و یونیکد را در کنار هم قرار می دهد
  • رمزگشایی یونیکد یک فرهنگ لغت یونیکد آنلاین را با یک UI زیبا ارائه می دهد ، به شما امکان می دهد تا شخصیت های یونیکد تعریف شده را حتی بدون پشتیبانی قلم محلی مشاهده کنید
  • اطلاعات در مورد زبانها اطلاعات قابل جستجو در مورد استفاده از مجموعه های شخصیت های یونیکد با زبان های مختلف را در اختیار شما قرار می دهد
  • Unicode Navigator لیستی از همه شخصیت های یونیکد را در اختیار شما قرار می دهد

ابزارهای یونیکد

  • Unicode Analyzer یک برنامه افزودنی مرورگر Chrome است که اطلاعات مربوط به متن یونیکد را در صفحات وب و اسناد ارائه می دهد
  • Character Identifiker یک افزونه Firefox است که یک منوی زمینه برای یافتن اطلاعات بیشتر درباره کاراکترهای یونیکد انتخاب شده فراهم می کند
  • برای درج کاراکترهای یونیکد در قسمت های متنی در وب ، سعی کنید نمادهای یونیکد برای Chrome یا ابزار ورودی یونیکد برای Firefox
  • UnicodeDataBrowser یک رابط کاربری گرافیکی برای خواندن آسانتر فایل UnicodeData.txt ارائه می دهد
  • Polyglot 3000 بطور خودکار زبان هر متنی را مشخص می کند
  • یونیکد لیستی از طرح بندی های صفحه کلید کاراکتر یونیکد را برای اسکریپت های مختلف پشتیبانی شده با یونیکد ارائه می دهد
  • Babel یک کتابخانه پایتون برای طیف گسترده ای از کارهای بین المللی و بومی سازی است
  • D-Type Unicode Text Engine یک کتابخانه C ++ برای طرح ریزی ، ارائه و ویرایش متن با کیفیت بالا یونیکد در هر دستگاه ، سیستم عامل یا سیستم عامل است.
  • Nunicode یک کتابخانه C برای رمزگذاری و رمزگشایی اسناد UTF-8 است
  • قابل حمل UTF-8 پشتیبانی از یونیکد را برای رشته های PHP فراهم می کند
  • Tesseract OCR شناخت شخصیت نوری را برای متن یونیکد فراهم می کند
  • Popchar یک نقشه شخصیت بهبود یافته است که به شما امکان می دهد شخصیت ها را از طیف وسیعی از فضای یونیکد به راحتی پیدا کرده و تایپ کنید
  • برنامه های یونیکد تعدادی ابزار آنلاین جالب و مفید را برای کار با یونیکد فراهم می کند
  • Edicode یک صفحه کلید انعطاف پذیر آنلاین یونیکد برای تایپ متن با استفاده از اسکریپت های مختلف بین المللی فراهم می کند
  • Quickkey یک افزونه صفحه کلید انعطاف پذیر برای تایپ 65000 کاراکتر تعریف شده یونیکد اول است
  • مبدل کد یونیکد هر کد شخصیت وارد شده را به چندین کدگذاری مختلف با همان کاراکتر تبدیل می کند
  • CharFunk یک ابزار جاوا اسکریپت برای انجام تعدادی از بررسی ها و عملیات جالب روی شخصیت های یونیکد است
  • Kreative Recode فایلهای متنی را از رمزگذاری های مختلف به یونیکد تبدیل می کند
  • BabelMap Online یک صفحه کلید یونیکد در مرورگر را ارائه می دهد ، که دارای کاراکترهای نمایشگر و همچنین رمزگذاری هگزا یا دهدهی است.

ویرایشگر متن و کد

بیشتر ویرایشگران متن ، ویرایشگران کد و IDE امروزه یا به طور پیش فرض از یونیکد استفاده می کنند ، یا می توانند به راحتی یونیکد را اداره کنند. Sublime ، Notepad ++ ، Atom و Eclipse همگی در UTF-8 به عنوان رمزگذاری کاراکتر پیش فرض تنظیم شده اند. برای استفاده از UTF-8 ممکن است نیاز به Vim و Emacs باشد:

  • استفاده از یونیکد با Emacs
  • با استفاده از یونیکد با Vim

همچنین تعداد کمی از ویرایشگرهای کد و متن به طور خاص برای کنترل مجموعه کاراکترهای یونیکد توسعه یافته طراحی شده اند:

  • MinEd ویرایشگر متن یونیکد با پشتیبانی متنی برای درج کاراکترها از طیف گسترده ای از فضای شخصیت های یونیکد است
  • ویرایشگر متن کلاسیک یک ویرایشگر پیشرفته برای کار با نسخه های مهم و علمی از جمله متون چند زبانه با استفاده از طیف گسترده ای از مجموعه کاراکترهای یونیکد است.

فونت های یونیکد

رابطه قلم ها و یونیکد کمی مورب است. یونیکد برای سازگاری با عقب با ASCII ایجاد شده است – متن قالب بندی شده در ASCII را می توان به صورت یونیکد رمزگشایی کرد و تقریباً هیچ مشکلی ندارد. و متن رمزگذاری شده یونیکد را می توان با استفاده از قلم های ASCII نمایش داد ، تا زمانی که فقط از مجموعه کوچک شخصیت های نمایش داده شده در ASCII استفاده شود.

امروزه بیشتر فونت های موجود در بیشتر رایانه ها با یونیکد رمزگذاری می شوند. بنابراین ، از این منظر ، بیشتر قلم ها “قلم های یونیکد” هستند. با این حال ، اکثر قلم ها از مجموعه خاصی از استاندارد کامل یونیکد پشتیبانی نمی کنند.

معمولاً این مشکلی نیست؛ کسی که متن را به چند زبان می نویسد ، یا با یک مجموعه کاراکتری گسترده ، ممکن است از چندین فونت مختلف استفاده کند – یکی برای متن لاتین ، دیگری برای هر زبان CJK و دیگری برای نمادهای ریاضی (مثلاً). با این وجود ، داشتن فونتهای منفرد که حاوی درصد زیادی از فضای کاراکترهای یونیکد هستند ، می تواند مفید باشد. این ممکن است هنگام کار در محیط متن ساده و کد منبع در جایی که استفاده از فونت های متعدد امکان پذیر نیست ، لازم باشد ، یا هنگامی که وحدت بینایی بین چندین اسکریپت از اهمیت ویژه ای برخوردار باشد ، لازم باشد..

در زیر قابل توجه ترین پروژه های قلم ارائه پشتیبانی یونیکد گسترده است. برای لیست کامل تر ، از جمله قلم های ناپخته و کم ارزش ، به این صفحه قلم های یونیکد مراجعه کنید. برای تایپ کردن زبانهای آسیایی ، به این لیست قلمهای CJK مراجعه کنید.

  • Everson Mono یک قلم monospace است که توسط یکی از مبانی استاندارد یونیکد ایجاد شده است. هدف بیان شده آن تهیه هر چه بیشتر فضای شخصیت های یونیکد گلیف ها است ، و (طبق این نوشتار) 92 بلوک کاراکتر یونیکد پشتیبانی می شود.
  • Noto مجموعه بزرگی از قلمهای نمایش است که توسط Google ساخته شده است و در کنار هم ، اکثریت زیادی از مجموعه کاراکترهای Unicode را پشتیبانی می کنند ، با این هدف که در نهایت از کل استاندارد Unicode پشتیبانی کنند..
  • Deja Vu Fonts یک خانواده قلم است که پوشش گسترده ای از استاندارد یونیکد را با نسخه های Serif ، Sans و Monospace ارائه می دهد..
  • GNU FreeFont خانواده ای از قلم ها است که چهره هایی از نوع Serif ، Sans و Mono را برای 37 سیستم نوشتن و 12 رده سمبل Unicode فراهم می کند..
  • GNU Unifont یک فونت bitmap با فضای یکپارچه و با پوشش کامل برای هواپیمای اصلی چند زبانه Unicode 8.0 و پوشش گسترده ، اما ناقص برای صفحه چند زبانه تکمیلی است..

همچنین تعداد زیادی فونت جالب وجود دارد که زیر مجموعه خاصی از استاندارد یونیکد را برای استفاده تخصصی رمزگذاری می کند.

  • Junicode مجموعه ای از قلم های قرون وسطایی است
  • Last Resort “فونت آخرین چاره” است؛ به جای گلیف های شخصیت معمولی ، هر گلیف در واقع اطلاعاتی راجع به خود شخصیت یونیکد نمایش می دهد
  • فونت های یونیکد برای اسکریپت های باستانی یک پروژه برای ایجاد مجموعه ای از قلم ها برای چندین الفبای باستانی و کلاسیک است
  • Unimath Plus مجموعه گسترده ای از نمادهای علوم و ریاضیات را ارائه می دهد

و در اینجا برخی منابع اضافی فونت یونیکد وجود دارد ، اگر شما هنوز هم نمی توانید آنچه را که به دنبال آن هستید پیدا کنید:

  • SIL تعدادی فونت برای زبانهای مختلف تحت پشتیبانی ، که توسط SIL International ایجاد شده است ، یک جامعه جهانی غیر انتفاعی در خدمت اقلیت های زبان اقلیت
  • محدوده کاراکترهای یونیکد و قلم های یونیکد که از آنها پشتیبانی می کند به شما کمک می کند تا برای هر طیف وسیعی از کاراکترهای یونیکد قلم پیدا کنید.

منابع ایموجی

ایموجی آن چهره های لبخند کوچک و خنده دار هستند و نشانه هایی را نشان می دهند که می توانید پیام های متنی خود را در آن قرار دهید. آنها در واقع بخشی از استاندارد یونیکد هستند. بخش Emoji از یونیکد به طور جهانی پشتیبانی نمی شود ، بنابراین اگر می خواهید Emoji را در برنامه یا وب سایت خود بگنجانید ، ممکن است به کمک نیاز داشته باشید. در اینجا منابعی وجود دارند که به شما کمک می کنند تا با ایموجی های یونیکد از آنها استفاده کرده و بسازید.

مرجع ایموجی

  • Emojipedia یک پایگاه داده قابل جستجو از شخصیت های Emoji است
  • آیا می توانم ایموجی داشته باشم؟ اطلاعات مربوط به پشتیبانی بومی برای emoji های Unicode در iOS ، Android ، OS X و Windows و همچنین مرورگرهای اصلی
  • بنیاد WTF Emoji یک سازمان کمی جدی است که به پیشرفت ایموجی اختصاص دارد. آنها فرهنگ لغت ایموجی را اجرا می کنند.
  • ورق تقلب در ایموجی یک مرجع سریع برای کدهای تایپ شده Emoji را ارائه می دهد

کتابخانه های Emoji

  • Emoji را در برنامه ها قرار دهید و بین چندین استاندارد فروشنده ، با این کتابخانه PHP Emoji ترجمه کنید. یا این کتابخانه ایموجی PHP7 را امتحان کنید که به شما امکان می دهد Emoji را با نام خود در کد خود ارجاع دهید
  • ایموجی برای پایتون هم از ایموجی های رسمی یونیکد و هم از چندین مجموعه مستعار پشتیبانی می کند. توسعه دهندگان جنگو همچنین می توانند از بسته django-emoji استفاده کنند
  • Emoji Golang پشتیبانی از Emoji را برای زبان برنامه نویسی Go ارائه می دهد
  • چندین پشتیبانی از Emoji در Ruby وجود دارد ، اما یکی از گیتوب احتمالاً بهترین مورد استفاده است
  • Emoji-Java پشتیبانی Emoji را در جاوا ارائه می دهد
  • Coloremoji.sty آسان کردن Emoji تمام رنگ در اسناد LaTeX را آسان می کند
  • Npm ، سیستم مدیریت بسته برای Node.js دارای چندین بسته emoji است:
    • ایموجی ایموجی و گره پشتیبانی اساسی برای emoji را ارائه می دهند,
    • Ember-cli-emoji با Emojify.js همکاری می کند تا یاران ایموجی را به برنامه های Ember.js شما ارائه دهد
    • Markdown-it-emoji برای پشتیبانی از تجزیه کننده Markdown-it ، emoji را اضافه می کند
  • Emoji Syntax یک کتابخانه احمقانه برای ویرایشگر متن Atom است که بر اساس معنای آنها ، emoji را به خطوط کد اضافه می کند.

صفحه کلید و مجموعه های Emoji

  • EmojiXpress for iOS یک مجموعه و صفحه کلید Emoji برای آیفون است
  • Emojione مجموعه ای از Emoji متقابل پلت فرم است که دارای مجوزهای هنری Creative Commons با مجوز رایگان برای توسعه دهندگان است
  • iDiversicons طیف گسترده ای از شخصیت های متنوع Emoji و صفحه کلید آیفون را در اختیار شما قرار می دهد.

انواع MIME

MIME مخفف “پسوندهای نامه اینترنتی چند منظوره” است. این استاندارد اینترنتی است که برای شناسایی انواع فایل های منتقل شده بصورت آنلاین استفاده می شود. در اصل ، این برای نامه الکترونیکی ارسال شده از طریق SMTP (پروتکل انتقال پست الکترونیکی ساده) که استاندارد اینترنت برای انتقال ایمیل است ، تهیه شده است. امروزه ، MIME در سایر پروتکل های ارتباطی مانند HTTP بسیار مهم است.

تاریخچه MIME

ما قبلاً در مورد تاریخچه ASCII و رمزگذاری کاراکترها بحث کرده ایم. اما داستان ارسال اطلاعات بسیار بیشتر از این است.

با گذشت زمان ، پیامهای ما پیچیده تر شدند و آشکار شد که این قالب استاندارد کافی نیست. تصاویر چندرسانه ای حاوی پرونده های صوتی یا تصویری به هیچ وجه تعریف نشده اند. همین موارد در مورد زبانهایی که از الفبای انگلیسی استفاده نمی کردند ، صدق می کند. سرانجام وقتی دو نفر به نیروهای خود پیوستند ، اوضاع تغییر کرد: ناتانیل بورشتاین و ند آزادی.

پیشنهاد آنها قالب پیام ها را مجدداً تعریف كرد تا ایمیل بتواند چندین پیام را در یك پیام بفرستد. استفاده از کاراکترهای غیر ASCII و همچنین زبانهای غیر انگلیسی؛ و استفاده از تصاویر ، صدا و فیلم. این تولد MIME بود که در سال 1993 به استاندارد رسمی تبدیل شد.

این پیشنهاد همچنین استانداردهای رمزگذاری را تعریف کرده که 7bit ، 8bit ، base64 ، دودویی و نقل قول قابل چاپ هستند. این استانداردهای رمزگذاری برای اطمینان از ارسال کلیه داده ها تأمین می شد. این همچنین شامل اطلاعات مربوط به استفاده از عنوان عنوان Content-Type است که برای شناسایی صحیح نوع داده منتقل شده ضروری است.

انواع MIME چیست?

انواع MIME شناسه هایی هستند که برای شناسایی بسیاری از قالب های پرونده ای که هر روز در اینترنت منتقل می شوند مورد استفاده قرار می گیرند. آنها توسط IANA (اداره اعداد اختصاص داده شده به اینترنت) استاندارد می شوند. انواع درخواستهای MIME برای اولین بار در درخواست اظهار نظر تعریف و نامگذاری شدند: 2045 (RFC 2045) که توسط IETF (کارگروه مهندسی اینترنت) منتشر شده است و این پیشنهاد رسمی بود که توسط بورشتاین و فرید ارائه شد..

ساختار

انواع MIME از یک نوع و یک زیرگروه تشکیل شده است که دو رشته با یک برش رو به جلو از هم جدا شده اند. نوع نمایانگر یک دسته است و می تواند گسسته یا چند بخشی باشد. هر نوع یک زیرگروه خاص دارد. به طور سنتی ، انواع MIME با حروف کوچک نوشته می شوند.

انواع گسسته شامل متن ، تصویر ، صدا ، فیلم و برنامه است. انواع چند بخش دسته ای از اسناد را نشان می دهد که به قسمت های مشخص تقسیم می شوند و اغلب شامل انواع مختلف MIME می شوند. اینها شامل داده های فرم و متغیرهای ضربتی است.

برخی از انواع MIME توسط x یا vnd پیشوند دارند. پیشوند x بدین معنی است که در IANA ثبت نشده است و vnd حاوی پیشوند خاص فروشنده است.

انواع معمول MIME

کاربرد:

  • برنامه / کلید واژه (.doc)
  • برنامه / vnd.openxmlformats-officedocument.wordprocessingml.document (.docx)
  • برنامه / vnd.openxmlformats-officedocument.wordprocessingml.template (.dotx)
  • برنامه / vnd.ms-powerpoint (.ppt)
  • برنامه / ecmascript (.es)
  • برنامه / x-javascript (.js)
  • برنامه / octet-stream (.bin ، .exe)
  • برنامه / pdf (.pdf)
  • برنامه / ارسال نامه (.ps ، .ai ، .eps)
  • برنامه / rtf (.rtf)
  • برنامه / x-gtar (.gtar)
  • برنامه / x-gzip (.gz)
  • برنامه / x-Java-Archive (.jar)
  • برنامه / x-Java-serial-object (.ser)
  • برنامه / x-java-vm (. کلاس)
  • برنامه / x-tar (.tar)
  • برنامه / zip (.zip)
  • برنامه / x-7z فشرده (0.7z)
  • برنامه / X-rar فشرده شده (.rar)
  • برنامه / X-shockwave-flash (.swf)
  • برنامه / vnd.android.package-بایگانی (.apk)
  • برنامه / x-bittorrent (.torrent)
  • برنامه / epub + zip (.epub)
  • برنامه / vnd.ms-excel (.xsl)
  • برنامه / x-font-ttf (.tff)
  • برنامه / rss + xml (.rss ، .xml)
  • برنامه / vnd.adobe.air-Application-installer-pack + zip (.air)
  • برنامه / بسته x-debian (.deb)
  • برنامه / json (.json)

سمعی:

  • صوتی / x-midi (.میاد ، .میدی)
  • صوتی / x-wav (.wav)
  • صوتی / mp4 (.mp4a)
  • صوتی / ogg (.ogg)
  • صوتی / مگاپیکسلی (.mp3)

تصویر:

  • تصویر / bmp (.bmp)
  • تصویر / gif (.gif)
  • تصویر / jpeg (.jpeg ، .jpg ، .jpe)
  • تصویر / tiff (.tiff ، .tif)
  • تصویر / x-xbitmap (.xbm)
  • تصویر / آیکون x (.ico)
  • image / svg + xml (.svg)
  • تصویر / png (ppng)

متن:

  • text / html (.htm ، .html)
  • متن / ساده (.txt)
  • متن / richtext (.rtf ، .rtx)
  • متن / css (.css)
  • متن / CSV (. csv)
  • متن / تقویم (.ics)

فیلم:

  • ویدیو / MPEG (.mpg ، .mpeg ، .mpe)
  • ویدئو / ogg (.ogv)
  • ویدیو / سریع ((qq ، .mov))
  • ویدیو / x-msvideo (.avi)
  • ویدیو / mp4 (.mp4)
  • ویدیو / وب (.webm)

منابع

انواع MIME به ما امکان می دهد تجربه ایمیل بهتر و غنی تری داشته باشیم. لیست زیر از منابع به شما کمک می کند تا درباره عمق بیشتری درباره چگونگی و چرایی ایجاد آنها و همچنین نحوه پیکربندی صحیح یک سرور وب برای پشتیبانی از نوع MIME ، و اطلاعات بیشتر به عمق بیشتری کسب کنید.

منابع آنلاین

لیست زیر پیوندهایی به طرح پیشنهادی پنج قسمتی دارد که به عنوان پیش نویس استاندارد برای MIME تبدیل شده است.

  • RFC 2045 (PDF): در قسمت اول پیشنهاد ، هدرهای مختلفی برای توصیف ساختار پیام های MIME استفاده می شود.
  • RFC 2046 (PDF): سند دوم ساختار کلی سیستم تایپ رسانه MIME و مجموعه اولیه انواع رسانه را تعریف می کند.
  • RFC 2047 (PDF): بخش سوم پیشنهادات پسوندهایی را توصیف می کند که داده های متنی غیر آمریکایی-ASCII را در قسمت های هدر پست الکترونیکی اینترنت اجازه می دهد..
  • RFC 2048 (PDF): قسمت چهارم چگونگی ثبت انواع جدید MIME را می توان در IANA شرح داد.
  • RFC 2049 (PDF): سند پنجم معیارهای سازگاری MIME را با نمونه هایی از قالب های پیام MIME شرح می دهد.
  • انواع رسانه ها: لیست کاملی از انواع رسانه ها ، همچنین شامل پیوندی به برنامه ثبت نام انواع رسانه جدید است.
  • MIME Guys: How Two Gurus Internet برای همیشه ایمیل تغییر داد: مقاله ای که بر اساس مصاحبه ها با ناتانیل بورشتاین و ند فرید ساخته شده است که بینشی جالب از کار آنها می دهد.

آموزشها

منابع زیر آموزشهای مفیدی در مورد نحوه کار با انواع MIME ، تنظیمات مناسب سرور و موارد دیگر ارائه می دهد.

  • به درستی پیکربندی انواع سرور MIME: بحث می کند که چرا وب مسترها باید مراقب باشند که سرورهای وب خود را بطور صحیح پیکربندی کنند زیرا انواع جدید MIME اضافه می شوند ، به خصوص برای مرورگرهای مبتنی بر Gecko.
  • قالب های رسانه ای پشتیبانی شده توسط عناصر صوتی و تصویری HTML: لیستی از انواع MIME را پشتیبانی می کند که توسط عناصر جدید صوتی و تصویری در HTML5 پشتیبانی می شوند.
  • Snipering MIME چیست: این مقاله توضیحی کامل در مورد خرناس MIME و نحوه جلوگیری از آسیب پذیری های مرتبط با آن ارائه می دهد.
  • انواع MIME توضیح داده شده: چرا لینوکس و Mac OS X آیا نیازی به پسوند فایل ندارند: یک خواندن جالب که یکی از تفاوت های رایانه ویندوز و رایانه Linux / Mac OS X را توضیح می دهد.
  • انتخاب نوع مناسب MIME برای JavaScript: در حال حاضر بیش از یک نوع MIME برای JavaScript وجود دارد. در این آموزش توضیحی در مورد موارد استفاده برای هر یک ارائه می شود.

کتابها

اگرچه هیچ كتابی صرفاً اختصاص به انواع MIME وجود ندارد ، اما هنوز هم تعداد كتاب مناسبی در موضوعات مرتبط با هم وجود دارد كه چند فصل را به آنها اختصاص می دهد.

  • پروتکل ها ، استاندارد ها و پیاده سازی های ایمیل اینترنتی (1998) توسط لارنس هیوز: با هدف کاربران پیشرفته تر ، این کتاب دانش مفاهیم ضروری مورد نیاز برای تهیه نرم افزار ایمیل را تقویت می کند و پروتکل ها و برنامه های افزودنی ایمیل اصلی اینترنتی مانند SMTP ، POP3 ، IMAP را بطور کامل شرح می دهد. ، MIME و DSN.
  • برنامه نویسی ایمیل اینترنتی (1999) توسط دیوید وود: یک راهنمای اساسی که کلیه مفاهیم مهم لازم برای ساخت برنامه های کاربردی در بالای قابلیت های ایمیل را در بر می گیرد. مباحث تحت پوشش شامل پروتکل های مختلف ایمیل ، قالب های ایمیل از جمله انواع MIME و مثال های زیادی است.
  • استانداردهای ضروری ایمیل (1999) نوشته پیتر لوشین: این کتاب برای هر کسی که به دنبال درک عمیق از استانداردهای ایمیل است ، ضروری است. این یک تجزیه و تحلیل کامل از مهمترین RFC های منتشر شده توسط IETF و همچنین استفاده بالقوه آنها را ارائه می دهد. همچنین شامل یک نسخه دیجیتالی کاملاً قابل جستجو در CD است.
  • MH & xmh (2006) توسط جری پیک: این کتاب بصورت رایگان آنلاین و تحت مجوز GNU-GPL منتشر شده است. در فصل سوم با جزئیات کامل انواع MIME و پیام های چند پارت توضیح داده شده است

ابزارها

پیوندهای زیر چند ابزار مفید برای بررسی اعتبار انواع MIME دارند.

  • چه نوع MIME از مرورگر من پشتیبانی می کند: یک ابزار آنلاین که به شما می گوید MIME را به محض بارگیری صفحه از کدام نوع MIME پشتیبانی می کند..
  • MIME Validator: یک اعتبار سنج آنلاین MIME آنلاین که انطباق پیام های MIME با استانداردهای IETF را بررسی می کند.
  • چه MIME: یکی دیگر از چک های آنلاین رایگان برای هر پرونده.

دانش خود را در مورد انواع MIME گسترش دهید

انواع MIME ممکن است از نظر سطح ناچیز به نظر برسند اما تغییرات عمده ای در نحوه عملکرد پیام رسانی ایمیل ما به همراه داشته است. این لیست از منابع باید کنجکاوی شما را ترسیم کند و درک عمیق تری از نحوه انتقال ایمیل و پرونده های ارسال شده به اینترنت در طی سالها ارائه دهد..

خلاصه

اکثر مردم فقط درباره آنچه اتفاق می افتد فکر نمی کنند و فکر نمی کنند. چند انتخاب زحمت برای فکر کردن در مورد زیبایی های طراحی فونت و تایپوگرافی.

اما تعداد افرادی که می دانند یا مراقبت از دانستن آنهاست ، حتی کمتر است – چه چیزی در پشت صحنه اتفاق می افتد – چگونه یک صفحه کلید تبدیل به یک نامه روی صفحه رایانه آنها می شود.

برای همه افراد دیگر ، این مسئله شفاف یا بی اهمیت است.

اما همانطور که نشان دادیم ، روند نمایندگی زبان به سختی پیش پا افتاده است و کار عظیمی انجام شده است تا آن را به همان اندازه شفاف تبدیل کند. کنسرسیوم یونیکد به همراه توسعه دهندگان ، طراحان و زبان شناسان بی شماری این امکان را برای شما فراهم کرده است که هر شخصیت ، از هر زبان ، به هر اسکریپت ، بر روی هر رایانه ای را بنویسد..

این یک دستاورد قابل توجه و یک گام ضروری برای سواد جهانی و دسترسی جهانی به رایانه ها و اینترنت است.

سؤالات متداول

س: تفاوت بین ASCII ، یونیکد و UTF-8 چیست?

آ. ASCII استاندارد قدیمی تر از دهه 1960 است ، در حالی که یونیکد در اواخر دهه 1980 به وجود آمد.

ASCII فقط 128 یا 256 کاراکتر دارد ، اما یونیکد بیش از 10،000 عدد دارد.

یونیکد جدول کاراکترهاست ، UTF-8 (یا UTF-16 یا UTF-32) سطح رمزگذاری است. یونیکد 0-256 و ASCII تقریباً یکسان هستند و فقط تفاوت های جزئی در شخصیت های کنترل وجود دارد.

UTF-8 رایج ترین رمزگذاری در وب است – و پیش فرض.

س: آیا لازم است اعلام کنم از چه نوع کدگذاری استفاده می کنم برای صفحه وب من?

آ. فقط اگر بدانید باید از یک نوع رمزگذاری منحصر به فرد استفاده کنید.

اگر یکی را اعلام نکنید ، بیشتر مرورگرها به صورت پیش فرض در UTF-8 قرار دارند. اگر در حال ایجاد یک صفحه وب به زبان خارجی ، به ویژه غیر لاتین هستید ، مطمئن شوید که یا از UTF-8 استفاده می کنید یا دیگری کارتر مخصوص خود را انتخاب کرده اید.

س: آیا برای نوشتن HTML نیاز به یادآوری کدهای ASCII دارم?

آ. فقط اگر می خواهید بسیار کارآمد باشید.

امروزه اکثر وب سایت ها از طریق سیستمهایی مانند سیستم مدیریت محتوا (CMS) پویا هستند و HTML را برای شما تولید می کنند. اگر برنامه نویس باشید ، احتمالاً علاوه بر HTML از زبان های برنامه نویسی دیگری نیز استفاده خواهید کرد ، و آن زبان ها ممکن است روشهای خاصی برای تولید آن نمادهای ASCII داشته باشند.

سرانجام ، همانطور که در بالا گفته شد ، بسیاری از این کدها به جای اعداد ASCII از اسم کاراکترهای ویژه در HTML استفاده می کنند.

س: آیا رمزگذاری کاراکتر در سیستم عامل های مختلف متفاوت است?

آ. تاحدی.

یونیکد در Windows و Unix / Linux کمی متفاوت است. به عنوان مثال ، ویندوز از UTF-16LE استفاده می کند در حالی که لینوکس معمولاً از UTF-8 استفاده می کند.

البته ، اکنون کدگذاری مورد استفاده سیستم عامل شما ممکن است با کدگذاری در یک صفحه وب متفاوت باشد ، اما سیستم عامل شما و مرورگر وب با هم کار می کنند تا کدهای کاراکتر را به چیزی تبدیل کنید که رایانه شما می تواند نمایش دهد..

بعضی اوقات ، در سیستم عامل های قدیمی ، این تبدیل ممکن است کار نکند و فقط کاراکترهای خالی را مشاهده می کنید. (به عنوان مثال ، این چیزی است که ممکن است بازدید از یک وب سایت خارجی در ویندوز XP را ببینید.)

Q. ASCII هنر بسیار جذاب است! از کجا می توانم خودم را بسازم?

آ. AsciiWorld.com در بخش نرم افزاری خود از گالری ها و ابزارهای بسیار خوبی مانند مبدل ها و “نقاشان” استفاده می کند. خوش بگذره!

موارد جالب دیگر

ما راهنماهای ، آموزش ها و اینفوگرافیک های بیشتری در رابطه با کد نویسی و توسعه وب سایت داریم:

  • CSS3 – معرفی ، راهنماها و منابع: این مکان عالی برای شروع یادگیری چیدمان صفحه وب است.

  • مقدمه و منابع PostScript: درباره زبان نمایش صفحه که دنیا را تغییر داده است ، اطلاعات کسب کنید.

  • Lorem Ipsum: بیاموزید که چگونه قبل از نوشتن مطالب از “متن ساختگی” برای طراحی خود استفاده کنید.

HTML برای مبتدیان – راهنمای نهایی

اگر واقعاً می خواهید HTML را یاد بگیرید ، ما یک مقاله به طول کتاب ، HTML برای مبتدیان ایجاد کردیم – راهنمای نهایی. و این واقعاً راهنمای نهایی است؛ این شما را از همان آغاز به تسلط می برد.

HTML برای مبتدیان - راهنمای نهایی
HTML برای مبتدیان – راهنمای نهایی

روندهای طراحی وب شما هرگز فراموش نخواهید شد

قبل از یونیکد ، بازدید از وب سایت هایی که کلیه متن ها توسط صندوق های خالی نمایش داده می شد ، معمول بود. همه چیز تغییر کرده است. در روند طراحی وب اینفوگرافیک ما هرگز فراموش نخواهیم شد که قبلاً وب را چگونه انجام می دهیم.

روندهای طراحی وب شما هرگز فراموش نخواهید شد
روندهای طراحی وب شما هرگز فراموش نخواهید شد

Jeffrey Wilson Administrator
Sorry! The Author has not filled his profile.
follow me
    Like this post? Please share to your friends:
    Adblock
    detector
    map