Распечатать страницу

Кодировка UTF-8 в Visual FoxPro

« Назад

UTF-8 – это кодировка с переменной длинной.

Символ с кодом от 0 до 127 (ASCII-символ) кодируется одним байтом, то есть так же, как и в ASCII (UTF-8 и ASCII-коды совпадают).

Символ с кодом от 128 до 2047 (диапазон, покрывающий большинство неидеографических алфавитов) представляется двумя байтами.

Прочие символы (в основном китайского, японского и корейского алфавитов) кодируются тремя байтами.

Если в Unicode появятся символы с кодами большими 65336, они будут записываться на четырех байтах.