Кодировки символов в HTML
- HTML 4.0 — первая стандартизированная версия с обработкой международных символов.
- Указание кодировки символов: HTTP-сервер и декларация в документе.
- В HTML5 рекомендуется использовать кодировку UTF-8.
- Символы, выходящие за пределы ASCII, отображаются неправильно.
- Браузеры позволяют пользователю переопределить неверную кодировку.
- UTF-8 используется чаще, чем UTF-16 и UTF-32 из-за работы с языками программирования и эффективности для текста с высокой частотой ASCII.
- Успешный просмотр страницы не гарантирует правильную кодировку.
- Стандарт кодирования WHATWG определяет список кодировок для поддержки браузерами.
- Кодировки ISO-8859, Windows и GB 18030 являются примерами разрешенных кодировок.
- Стандарт также определяет «заменяющий» декодер для предотвращения атак.
- Символьные ссылки в HTML используются для кодирования символов по их универсальным кодовым точкам Unicode.
- Ссылки на символьные сущности могут быть числовыми или символьными сущностями.
Полный текст статьи: