Объединение Ханьцев
-
Унификация китайских иероглифов в Unicode
- Unicode стремится к унификации китайских иероглифов, но сталкивается с политическими и культурными разногласиями.
- Китайские иероглифы имеют множество вариантов, что затрудняет их стандартизацию.
- В Unicode существует несколько подходов к унификации, включая объединение всех вариантов в одну кодовую точку.
- Некоторые варианты имеют разные кодовые точки, но могут быть выражены с помощью тегов метаданных.
- Проблемы с унификацией включают различия в написании, стиле и региональных предпочтениях.
- Альтернативные наборы символов, такие как TRON и CCCII, не получили широкого распространения.
- Unicode сталкивается с проблемами при выборе символов по умолчанию и обеспечении совместимости между различными платформами.
- В базе данных Unihan существуют неоднозначные классификации символов, что приводит к путанице и ошибкам.
- Некоторые символы имеют несколько кодовых точек, что требует использования разных шрифтов для их отображения.
- Unicode включает преднамеренные дубликаты символов для облегчения побитового преобразования.
- Варианты совместимости в Unicode могут быть канонически эквивалентными и объединяться в любой схеме нормализации.
- Пересказана только часть статьи. Для продолжения перейдите к чтению оригинала.
Полный текст статьи: