Unicode містить 1,114,112 кодових значень; на даний момент часу, для них призначено понад 96,000 символів. Кодовий простір Unicode для символів розділено на 17 рівнів, кожен із яких містить 65,536 кодових знаків.
Unicode резервують 1114112 (220+216) символів коду, в даний час використовуються більше 96000 символів. Перші 256 кодів символів точно відповідають таким ISO 8859-1, найбільш популярною 8-розрядної таблиці символів "західного світу"; в результаті, перші 128 символів також ідентичні таблиці ASCII.
Стандарт UTF–8 офіційно закріплений у документах RFC 3629 та ISO/IEC 10646 Annex D. ibm.com/docs/en/i… (англ.) Кодування UTF–8 зараз є домінуючою у веб-просторі….Алгоритм кодування
Діапазон номерів символів | Необхідна кількість октетів |
---|---|
00010000-0010FFFF | 4 |