UTF-1

UTF-1 Описание UTF-1 UTF-1 — метод преобразования ISO/IEC 10646/Unicode в байты, не самосинхронизирующийся.  Повторно использует ASCII для многобайтовых кодировок, что […]

UTF-1

  • Описание UTF-1

    • UTF-1 — метод преобразования ISO/IEC 10646/Unicode в байты, не самосинхронизирующийся. 
    • Повторно использует ASCII для многобайтовых кодировок, что ограничивает его применение. 
    • Медленно кодируется и декодируется из-за арифметики, отличной от UTF-8. 
    • Не получил широкого признания и был заменен на UTF-8. 
  • Дизайн и особенности

    • UTF-1 совместим с ASCII и имеет переменную ширину кодовых точек. 
    • Кодовые точки ASCII представлены одним байтом, а другие — последовательностью байтов. 
    • Не использует управляющие коды C0 и C1, а также пробел в многобайтовых кодах. 
    • Разработан с учетом требований ISO/IEC 2022 и использует арифметику «по модулю 190». 
  • Сравнение с другими кодировками

    • UTF-1 и UTF-8 кодируют полный 31 бит исходного универсального набора символов. 
    • BOCU-1 защищает только необходимый для MIME-совместимости набор символов. 
  • Дополнительная информация

    • В статье также упоминаются другие аспекты Unicode и рекомендации по цитированию. 

Полный текст статьи:

UTF-1 — Википедия

Оставьте комментарий

Прокрутить вверх