Оглавление
Метка порядка байтов
-
Определение и использование спецификации UTF-8
- Спецификация UTF-8 – это последовательность байтов EF BB BF, указывающая на начало текста в кодировке UTF-8.
- Она не является обязательной, но может использоваться для указания на кодировку текста.
- Спецификация может быть полезна для определения порядка следования байтов в тексте.
-
Использование спецификации в других кодировках
- В UTF-16 и UTF-32 спецификация может указывать на порядок следования байтов в кодировке.
- В UTF-16 она может быть представлена как последовательность байтов FE FF или FF FE в зависимости от порядка следования байтов.
- В UTF-32 спецификация также может быть представлена как последовательность байтов, но редко используется для передачи данных.
-
Рекомендации по использованию спецификации
- Стандарт Unicode не рекомендует удалять спецификацию при ее наличии, чтобы сохранить информацию и обеспечить совместимость с программным обеспечением.
- Некоторые протоколы и инструменты могут требовать наличия спецификации для указания кодировки текста.
- В некоторых случаях отсутствие спецификации может указывать на то, что текст является UTF-8.
-
Примеры использования спецификации
- В текстовых редакторах Windows-1252 и каретка для элементов управления C0 могут отображать спецификацию как устаревшую кодировку.
- Спецификация может использоваться для определения кодировки текста, например, в Google Docs и PowerShell.
-
Рекомендации и часто задаваемые вопросы
- В стандарте Unicode есть глава, посвященная спецификациям, а также раздел с часто задаваемыми вопросами по теме.
- В статье также есть ссылки на внешние ресурсы, включая стандарт Unicode и часто задаваемые вопросы.
Полный текст статьи: