Специальные предложения (блок Юникода)
-
Назначение специальных предложений в Юникоде
- Специальные предложения — это символы в конце базовой многоязычной области, U+FFF0-FFFF.
- Пять из 16 кодовых точек были добавлены в Unicode 3.0.
-
Функции специальных предложений
- U+FFF9 используется для привязки подстрочных аннотаций.
- U+FFFA, U+FFFB и U+FFFC обозначают начало и конец блока аннотаций.
- U+FFFD и U+FFFE не являются символами и зарезервированы.
-
Изменения в стандарте Unicode
- В версиях с 3.1.0 по 6.3.0 считалось, что эти символы не должны заменяться друг другом.
- В исправлении № 9 было указано, что использование нехарактерных символов не является незаконным.
-
Символ нулевой ширины без пробела
- U+FEFF используется для обозначения последовательности текста в начале.
- В Unicode 1.0 его название было особенным.
-
Заменяющий символ
- U+FFFD используется для обозначения ошибок в отображении данных.
- Пример: замена байта в ISO 8859-1 на UTF-8.
- Плохо реализованные редакторы могут сохранять заменяющий символ, что приводит к ошибкам в данных.
-
Современные практики
- Большинство систем рендеринга текста используют символ .notdef для ошибок кодирования.
- Некоторые программы преобразуют недопустимые байты в символы Windows-1252.
-
История и рекомендации
- В документации Unicode описаны назначение и процесс определения специальных предложений.
- Ссылки на другие документы и рекомендации по использованию управляющих символов Юникода.
Полный текст статьи: