Американський стандартний код для обміну інформацією ASCII.

Існує безліч таблиць кодування. Розглянемо спочатку таблицю кодування ASCII (ASCII – American Standard Code for Information Interchange – Американський стандартний код для обміну інформацією). Це кодування є найбільш відомим. На практиці звичайно не буває проблем з кодуванням англомовних текстів, оскільки перша половина кодування стандартизована, але, на жаль, для кодування російських літер існує мало таблиць кодування, що іноді створює проблеми при роботі з текстами.

Двійкові коди, які застосовуються в комп'ютерних системах для представлення арабських цифр, латинських літер (великих та маленьких), розділових знаків, математичних та деяких графічних і спеціальних символів, закріплені міжнародним погодженням. Ці коди представлені таблицею ASCII (American Standard Code for Information Interchange – американський стандартний код для обміну інформацією). Ця таблиця встановлює 128 кодів для представлення перелічених вище символів. Ще 128 кодів дозволяється використати для подання символів, які застосовуються в країні для внутрішнього обміну інформацією – літер національної мови й інших. Таким чином, встановлено 256-кодову систему для комп'ютерного спілкування. У таблиці ASCII всі коди є восьмизначними, тобто представлені вісьмома двійковими знаками, або вісьмома бітами. Для позначення вісімки бітів використовується спеціальна назва – байт (від англ. byte), тобто, 1 байт = 8 бітів. Таким чином, для кодування 1 символу потрібен 1 байт. Це означає, що кожний символ у системах, які застосовують ASCII коди, подається 1 байтом. У комп'ютерних системах обсяг інформації, яка надійшла в систему, зберігається чи обробляється в ній, визначається за кількістю байтів, якими вона представлена.

Для англійської мови, яка захопила де-факто нішу міжнародного засобу спілкування, протиріччя вже зняті. Інститут стандартизації США ввів у дію систему кодування ASCII (American Standard Code for Information Interchange – стандартний код інформаційного обміну США). У системі ASCII закріплені дві таблиці кодування базова і розширена. Базова таблиця закріплює значення кодів від 0 до 127, а розширена відноситься до символів з номерами від 128 до 255.



Рис.1 Базова міжнародна таблиця ASCII

Перші 32 кодів базової таблиці, починаючи з нульового, віддані виробникам апаратних засобів. У цій області розміщаються керуючі коди, яким не відповідають ні які символи мов. Починаючи з 32 по 127 код розміщені коди символів англійського алфавіту, розділових знаків, арифметичних дій і деяких допоміжних символів.

Кожному символу відповідає свій код у вигляді цілого числа. Один байт як набір восьми біт дозволяє закодувати 256 символів, що цілком достатньо для роботи відразу із двома звичайними мовами, наприклад англійським і російським. При цьому всі коди збираються в спеціальні таблиці кодування. З їхньою допомогою здійснюється перетворення коду символу в його подання на екрані монітора. У результаті будь-який текст у пам'яті комп'ютера представляється як послідовність байтів з кодами символів. Дисплей по кожному коді символу повинен вивести на екран зображення символу - не просто цифровий код, а відповідну йому картинку, тому що кожен символ має свою форму. Опис форми кожного символу зберігається в спеціальній пам'яті дисплея – знакогенераторі. Поява символу на екрані дисплея здійснюється за допомогою крапок, що утворюють символьну матрицю. Кожен піксель у такій матриці є елементом зображення й може бути яскравим або темним. Темна крапка кодується цифрою 0, світла (яскрава) – 1. Якщо зображувати в матричному полі знака темні пікселі крапкою, а світлі – зірочкою, то можна графічно зобразити форму символу.

Для кодування українських літер застосовуються різні системи, з них найбільш розповсюдженими є КОІ8-У та Windows-1251.

Міжнародний стандарт, у якому передбачене кодування символів російської мови, носить назву ISO (International Standard Organization – Міжнародний інститут стандартизації). Кодування ISO-8859-5 було розроблено Комітетом з міжнародних стандартів ISO (International Standards Organization) і застосовується в основному в UNIX-сумісних операційних системах. Оскільки даний набір символів було створено західними фахівцями, які не добре знаються на слов’янських мовах та наявні різноманіття кодувань кирилиці, ISO не набула широкого поширення, проте, достатньо часто зустрічається в Інтернеті і активно підтримується рядом серверів. На практиці дане кодування використовується рідко.


8768261498553656.html
8768327140606162.html
    PR.RU™