UTF-1
-
Описание UTF-1
- UTF-1 — метод преобразования ISO/IEC 10646/Unicode в байты, не самосинхронизирующийся.
- Повторно использует ASCII для многобайтовых кодировок, что ограничивает его применение.
- Медленно кодируется и декодируется из-за арифметики, отличной от UTF-8.
- Не получил широкого признания и был заменен на UTF-8.
-
Дизайн и особенности
- UTF-1 совместим с ASCII и имеет переменную ширину кодовых точек.
- Кодовые точки ASCII представлены одним байтом, а другие — последовательностью байтов.
- Не использует управляющие коды C0 и C1, а также пробел в многобайтовых кодах.
- Разработан с учетом требований ISO/IEC 2022 и использует арифметику «по модулю 190».
-
Сравнение с другими кодировками
- UTF-1 и UTF-8 кодируют полный 31 бит исходного универсального набора символов.
- BOCU-1 защищает только необходимый для MIME-совместимости набор символов.
-
Дополнительная информация
- В статье также упоминаются другие аспекты Unicode и рекомендации по цитированию.
Полный текст статьи: