UTF-EBCDIC — Википедия

Кодировка UTF-EBCDIC Кодировка UTF-EBCDIC Позволяет кодировать все 1 112 064 кодовых точек Unicode в 1-5 байтах.  Разработана для совместимости с […]

Кодировка UTF-EBCDIC

  • Кодировка UTF-EBCDIC

    • Позволяет кодировать все 1 112 064 кодовых точек Unicode в 1-5 байтах. 
    • Разработана для совместимости с EBCDIC, облегчая обработку символов в устаревших приложениях. 
    • Имеет преимущества, аналогичные UTF-8 для систем на основе ASCII. 
  • Процесс кодирования

    • Сначала применяется кодировка UTF-8-Mod, которая позволяет использовать один байт для определенных кодовых точек. 
    • Кодировка UTF-8-Mod отличается от UTF-8 использованием формата 101xxxxxx для конечных байтов. 
    • Преобразование UTF-8-Mod сохраняет данные в формате ASCII, требуя обратимой таблицы поиска для получения UTF-EBCDIC. 
  • Использование и альтернативы

    • UTF-EBCDIC редко используется, даже на мэйнфреймах, для которых он предназначен. 
    • IBM EBCDIC-системы обычно используют UTF-16 для полной поддержки Unicode. 
  • Макет кодовой страницы и Oracle UTFE

    • UTF-EBCDIC содержит 160 однобайтовых символов, аналогично IBM-1047. 
    • Oracle UTFE — это вариант UTF-8 для EBCDIC, где дополнительные символы кодируются в виде двух 4-байтовых символов. 
  • Дополнительные ресурсы

    • Ссылки на внешние ресурсы и рекомендации по теме UTF-EBCDIC. 

Полный текст статьи:

UTF-EBCDIC — Википедия

Оставьте комментарий

Прокрутить вверх