Кодовая страница 936 (IBM)
-
История и статус IBM-936
- IBM-936 — кодировка для упрощенного китайского, заменена в 1993 году
- Включает 1880 пользовательских символов, комбинация кодовых страниц 903 и 928
- Не путать с Windows-GBK, IBM называет ее кодовой страницей 1386
- Использовалась в 1980-х и начале 1990-х, IBM 5550 поддерживал языки CJK
- Сопровождалась кодовыми страницами 932, 934 и 938 для японского, корейского и традиционного китайского
- Последняя редакция документирована в 1992 году, заменена кодовыми страницами EUC-CN в 1993
-
Структура IBM-936
- Двухбайтовый компонент содержит 9 355 символов, начинающихся с 0x81 по 0xAC и с 0xF0 по 0xFA
- Диапазон начальных байтов 0x81-AC для символов размером 2312 ГБ, 0x88-9C для hanzi 1-го уровня, 0x9C-AC для hanzi 2-го уровня
- Второй байт в диапазоне 0x40-FC, исключая 0x7F, позволяет кодировать две строки размером 2312 ГБ на начальный байт
- Диапазон начальных байтов от 0xF0 до FA для расширений IBM, включая пользовательские символы и дополнительные символы, отличные от hanzi
Полный текст статьи: