Оглавление
ТРОН (кодировка)
-
Описание кодировки TRON
- TRON – это многобайтовая кодировка, похожая на Unicode, но без унификации Han.
- Кодировка позволяет смешивать китайские, японские и корейские тексты без двусмысленности.
- В TRON есть место для 150 миллионов кодовых точек, что больше, чем в Unicode 4.1.
-
Структура и кодирование
- Каждый символ кодируется в виде двух байт.
- Кодировка обрабатывает символы из нескольких наборов в рамках одной кодировки, используя управляющие последовательности.
- В кодировку включены символы из Unicode 2.0 и других источников, включая Dai Kan-Wa Jiten.
-
Управляющие коды и символы
- Байты в диапазоне от 0x00 до 0x20 и 0x7F зарезервированы для управляющих кодов.
- Символы в каждой плоскости разделены на четыре зоны, каждая из которых имеет свой номер.
- Кодовые точки TRON обозначаются как “X-YYYY” или “0xNNYYYY”.
-
Текстовый формат и синтаксический анализ
- Текстовый формат “&TNNYYYY;” используется для обозначения кодовой точки TRON в ASCII.
- Для поддержки TRON в стандартных UTF требуется другой синтаксический анализатор.
-
Коды спецификаторов языка и специальные коды
- Коды спецификаторов языка имеют префикс 0xFE, а специальные коды – 0xFF.
-
Уровни и наборы символов
- Плоскости с 11 по 15 были выделены для Модзике, но исключены из-за споров.
- Остальные плоскости зарезервированы для дальнейшего распределения.
-
Ссылки
- В статье есть ссылки на другие ресурсы, связанные с кодировкой TRON.
Полный текст статьи: