У кодуванні Unicode один символ займає 16 біт пам'яті, що відповідає 2 байтам (1 байт = 8 біт).
UTF–8, порівняно з UTF-16, найбільший виграш у компактності дає для текстів на латиниці, оскільки латинські літери без діакритичних знаків, цифри та найпоширеніші розділові знаки кодуються в UTF–8 лише одним байтом, і коди цих символів відповідають їх кодам ASCII.
к. 256 = 28, то вага 1 символу – 8 біт. Одиниці в 8 біт надали свою назву – байт.