Определение и основные характеристики

Кодовая таблица представляет собой набор цифровых (двоичных) кодов и их значений.

Электронно-вычислительные машины кодируют любую информацию с помощью двоичного кода, набора единиц и нулей.

Буквы в компьютере кодируются в виде последовательности двух чисел. Каждому буквенному обозначению соотносится определенная комбинация. В кодовых таблицах представлены все последовательности, соответствующие символам.

Кодовая таблица ASCII

В Америке в 1960-х года была разработана первая в своем роде, на основе которой по сей день базируется все остальные - ASCII аббревиатура расшифровывается - американский стандартный код для обмена информацией.

Появление этих унифицированных систем кодирования было крайне необходимо. До этого каждый производитель компьютеров отдельно разрабатывал систему кодирования символов, из-за чего информацию невозможно было воспроизвести на другом компьютере. Только специалисты IBM использовали девять разных кодировок. Создание американского стандартного кода дало возможность взаимодействия разных компьютеров, обмена информацией между ними.

Размер закодированных обозначений в ASCII составляет 7 бит (128 символов; 27=128), а бит №7 служит для избегания ошибок, возникших при передаче данных. Первая версия 60-х годов содержала в себе коды исключительно заглавных букв.

Фрагмент кодовой таблицы:

фрагмент кодовой таблицы

Национальные версии ASCII

В настоящее время разработано достаточно большое количество вариаций кодирования. Например, буквы русского алфавита кодируются с помощью:

  • KOI8

  • Win-1251

  • IBM cp866

Символы в диапазоне 0–127, кодируемые с помощью таблицы ASCII остаются неизменными для всех программ. Кодировки в диапазоне от 128 до 255 в аналогичных таблицах различаются в зависимости от языка.

Unicode

Юникод или Unicode – таблица соответствия текстовых обозначений: буквенных символов всех языков мира, цифр, знаков препинания и других технических знаков, представленных в виде двоичного кода. Один набор символов не мог вместить в себя все знаки, поэтому необходим был универсальный стандарт, который разработали Unicode Consortium в 1991 году.

Самой популярной и повсеместно используемой кодировкой является UTF-8. Кроме нее есть еще две - UTF-16 и UTF-32.