Оглавление
Символы, совместимые с Юникодом
-
Совместимость символов в Unicode
- Unicode включает символы, которые могут быть разложены на части, что создает проблемы совместимости.
- Некоторые символы имеют визуальное сходство, но имеют разные значения.
- Существует 167 семантически разных, но визуально схожих символов, а также символы на основе ивритских и греческих букв.
-
Рекомендации Unicode
- Unicode не рекомендует использовать символы совместимости в контенте.
- В некоторых специализированных областях символы совместимости важны и имеют аналоги в других системах.
- Блоки совместимости содержат символы, которые однозначно не рекомендуются.
-
Блоки совместимости
- Блоки совместимости включают символы, которые однозначно не рекомендуются, за исключением символа валюты риал.
- Unicode рекомендует использовать эквиваленты декомпозиции совместимости и дополнять их расширенной текстовой разметкой.
-
Проблемы с символами
- В блоках совместимости есть символы, которые не являются символами совместимости и могут ввести в заблуждение.
- Некоторые символы в блоках совместимости предназначены для устаревшей поддержки.
-
Нормализация
- Нормализация – это процесс декомпозиции или композиции символов для сравнения текстовых строк.
-
Ссылки
- Статья содержит ссылки на внешние ресурсы, связанные с нормализацией и совместимостью символов в Unicode.
Полный текст статьи: