Скільки символів кодується у міжнародному стандарті Unicode?Скільки символів кодується у міжнародному стандарті Unicode?

0 Comment

Стандарт кодування символів Unicode Кількість можливих комбінацій дає велику кількість: 231 = 2 147 483 684 (Тобто більше двох мільярдів). Тому Unicode описує алфавіти всіх відомих мов, навіть «мертвих» і вигаданих, включає багато математичних та інших спеціальних символів.

Unicode містить 1,114,112 кодових значень; на даний момент часу, для них призначено понад 96,000 символів. Кодовий простір Unicode для символів розділено на 17 рівнів, кожен із яких містить 65,536 кодових знаків.

Unicode резервують 1114112 (220+216) символів коду, в даний час використовуються більше 96000 символів. Перші 256 кодів символів точно відповідають таким ISO 8859-1, найбільш популярною 8-розрядної таблиці символів "західного світу"; в результаті, перші 128 символів також ідентичні таблиці ASCII.

Стандарт UTF8 офіційно закріплений у документах RFC 3629 та ISO/IEC 10646 Annex D. ibm.com/docs/en/i… (англ.) Кодування UTF8 зараз є домінуючою у веб-просторі….Алгоритм кодування

Діапазон номерів символівНеобхідна кількість октетів
00010000-0010FFFF4