Единый код Хангыля
-
Описание кодовой страницы Windows-949
- Кодовая страница Windows-949 предназначена для корейского языка и является расширением кодовой страницы Вансунг.
- Она включает все 11172 слога хангыля, не являющиеся частичными, и соответствует слогам в Unicode 2.0 и более поздних версиях.
-
Недостатки и решения Wansung Code
- Wansung Code присваивает коды только для 2350 слогов, что требует использования восьмибайтовых последовательностей.
- UHC решает эту проблему, присваивая коды для всех возможных слогов с использованием современного jamo.
-
Терминология и стандартизация
- UHC не зарегистрирован в IANA как стандарт для передачи информации через Интернет, но включен в стандарт кодирования HTML5.
- Microsoft присваивает Windows-949 ярлык «ks_c_5601-1987», который считается взаимозаменяемым с EUC-KR.
- В ICU используются разные обозначения для кодовой страницы IBM и отображения Windows в UHC.
-
Кодовая страница IBM и ее особенности
- IBM-1363 является комбинацией кодовой страницы SBC 1126 и DBCS 1362 и отличается отображением некоторых символов.
- В Windows обратная косая черта отображается как знак победы, в то время как в IBM используется однобайтовое отображение.
-
Однобайтовые коды и сопоставления
- IBM определяет однобайтовую часть кодовой страницы, которая может использоваться как управляющие коды или графические коды.
- Microsoft использует сопоставления ASCII для всех ASCII-байтов, но обратная косая черта может отображаться как знак победы.
Полный текст статьи: