ASCII

Матеріал з Словник з інформатики
Перейти до: навігація, пошук

ASCII — це семи-бітний код, а восьмий біт часто використовується для забезпечення відповідності чи додаткових символів. Система широко використовується для зберігання тексту і передачі інформації між комп'ютерами.


Опис ASCII

До ASCII входять числа від 0 до 127 включно поставлені у відповідність літерам, цифрам і символам пунктуації. Наприклад, 45 відповідає знаку переносу, а 65 — літері «А» великій. Перші 32 коди використовуються для керівних функцій, на зразок введення і стирання попереднього символу [1].

Числа — це мова комп’ютерів. Для спілкування з програмами (та з іншими комп’ютерами) комп’ютер перетворює символи в числовий формат.У 1960-х роках необхідність стандартизації спричинила створення Американського стандартного коду обміну інформацією (ASCII - American Standard Code for Information Interchange) (вимовляється як «аск-кі») [2].

Різновиди ASCII

Починаючи з липня 1992 реєстри RFC[3] та та Internet Assigned Numbers Authority[4] таблиць кодування визнають такі еквівалентні назви ASCII незалежно від реєстру для використання в Інтернеті:

  • ANSI_X3.4-1968 (канонічна назва)
  • iso-ir-6
  • ANSI_X3.4-1986
  • ISO_646.irv:1991
  • ASCII (варіанти ASCII-7 та ASCII-8)
  • ISO646-US - US-ASCII (рекомендована назва MIME[5])
  • us
  • IBM367
  • cp367
  • csASCII

З цього переліку, IANA рекомендує використання «US-ASCII» для позначення ASCII в Інтернеті. Це позначення можна часто зустріти в необов'язковому параметрі «charset» (кодування) в заголовку Content-Type (тип вмісту) деяких MIME-повідомлень, у еквівалентних «meta» елементах HTML документів, та в частині визначення кодування прологу деяких XML документів.

міжнародний стандарт ASCII

Для кодування текстової інформації прийнято міжнародний стандарт ASCII (American Standard Code for Information Interchange).

За цим стандартом [6]:

  • Кожен символ займає 1 байт.
  • Всього є 256 символів.
  • Всі символи знаходяться у спеціальній таблиці.
  • Кожен символ має свій внутрішній код, який співпадає з порядковим номером символа у таблиці.
  • Перша половина цієї таблиці (символи з номерами з 0 по 127) стандартна. Вона містить цифри, латинські літери та інші необхідні символи.
  • У другій половині таблиці (символи з номерами з 128 по 255) знаходяться літери національних алфавітів та додаткові символи. Ця частина таблиці різна для різних країн та різних кодових таблиць, встановлених у операційній системі.

Нижче наведений один з декількох варіантів ASCII (Appendix F - ASCII Character Codes). [7]

Як варіант

Юнікод

Юнікод є набагато більшою таблицею, у ній представлено 65 536 знаків, а не 128 символів, як у таблиці ASCII або 256 символів, як у розширеній таблиці ASCII. Такий великий обсяг дає змогу включити до одного набору символів більшість символів різних мов. Отже, забезпечення зворотної сумісності, символи з набору 128 ASCII та 256 ISO-8859-1 (Latin 1) мають такі ж коди Unicode/UCS як і в попередніх стандартах. Таким чином, ASCII можна розглядати як 7-бітну схему кодування дуже малої підмножини Unicode/UCS, і навпаки, UTF-8 сумісний з ASCII для кодів менше 128, із чого випливає, що правильно закодований ASCII файл є водночас і правильним файлом в кодуванні UTF-8 [8].