Распечатать страницу

Набор символов Unicode в VFP

« Назад

Замечание. Информация для этого и следующего разделов почерпнута из [1].

Unicode – это международный стандартный набор символов, с помощью которого можно создавать документы практически на любом языке.

Версия 3.0.1 Unicode содержит 49194 символа и охватывает, кроме латинского алфавита, производные от греческого алфавита (древний и современный) и кириллицу. Также Unicode содержит несколько идеографических алфавитов, в том числе набор символов Хань, используемый в китайском и японском языках, корейскую слоговую азбуку Хангул и фонетические представления этих языков, в том числе катакану и хирагану. Также Unicode включает арабский и еврейские алфавиты с направлением письма справа налево, различные алфавиты индийского субконтинента, в том числе деванагари, тайский, бенгальский и тибетский.

Перечисленные алфавиты – это менее половины алфавитов Unicode. Потенциально Unicode может содержать более миллиона символов.

Каждому символу Unicode соответствует число – код символа. Эти числа, в свою очередь, могут кодироваться с помощью нескольких схем: UCS-2, UCS-4, UTF-8 и UTF-16.