Мягкий дефис
-
Определение и использование мягкого дефиса
- Мягкий дефис (U+00AD) — это кодовая точка для разбиения слов на строки, невидимая внутри строки.
- Существуют два способа использования мягкого дефиса: для форматирования текста получателем и для предварительно отформатированного текста автором.
-
Применение мягкого дефиса для форматирования текста
- В контексте получателя мягкий дефис служит невидимым маркером для переноса текста через дефис.
- В HTML мягкий дефис становится видимым только при переносе слов в конце строки.
- Семантика мягкого дефиса в HTML схожа с пробелом нулевой ширины, но сохраняет расположение символов.
-
Применение мягкого дефиса для предварительно отформатированного текста
- В контексте автора мягкий дефис используется для визуального отличия от обычного дефиса и повторного использования текста.
- Функция копирования или вставки в эмуляторах терминала может предложить удалить мягкие дефисы.
- Пример приложения, использующего мягкие дефисы, — groff text formatter в Unix/Linux.
-
Кодировки и определения мягкого дефиса
- EBCDIC определил мягкий дефис как «слоговой дефис» в позиции 202.
- ISO 8859-1 унаследовал мягкий дефис от EBCDIC и определил его как «мягкий дефис» в позиции 0xAD.
- Unicode 1.0 и ISO 10646 заняли первые 256 кодовых позиций, что привело к мягкому дефису в позиции U+00AD.
- HTML 2 и HTML 4 переопределили назначение мягкого дефиса как возможность переноса, видимого в виде дефиса в конце строки.
-
Безопасность и другие команды
- Мягкие дефисы могут использоваться для сокрытия вредоносного контента в спаме.
- Существуют другие команды для обозначения возможностей переноса в языках форматирования текста.
-
Рекомендации
- Статья также упоминает твердый дефис, неразрывное пространство, разделитель слов, составитель слов, пространство нулевой ширины, перенос слов и другие связанные понятия.
Полный текст статьи: