Оглавление [Скрыть]
Кодировка UTF-EBCDIC
-
Кодировка UTF-EBCDIC
- Позволяет кодировать все 1 112 064 кодовых точек Unicode в 1-5 байтах.
- Разработана для совместимости с EBCDIC, облегчая обработку символов в устаревших приложениях.
- Имеет преимущества, аналогичные UTF-8 для систем на основе ASCII.
-
Процесс кодирования
- Сначала применяется кодировка UTF-8-Mod, которая позволяет использовать один байт для определенных кодовых точек.
- Кодировка UTF-8-Mod отличается от UTF-8 использованием формата 101xxxxxx для конечных байтов.
- Преобразование UTF-8-Mod сохраняет данные в формате ASCII, требуя обратимой таблицы поиска для получения UTF-EBCDIC.
-
Использование и альтернативы
- UTF-EBCDIC редко используется, даже на мэйнфреймах, для которых он предназначен.
- IBM EBCDIC-системы обычно используют UTF-16 для полной поддержки Unicode.
-
Макет кодовой страницы и Oracle UTFE
- UTF-EBCDIC содержит 160 однобайтовых символов, аналогично IBM-1047.
- Oracle UTFE – это вариант UTF-8 для EBCDIC, где дополнительные символы кодируются в виде двух 4-байтовых символов.
-
Дополнительные ресурсы
- Ссылки на внешние ресурсы и рекомендации по теме UTF-EBCDIC.
Полный текст статьи: