Стандартная схема сжатия для Unicode
-
Обзор схемы сжатия Unicode (SCSU)
- SCSU — это схема сжатия, разработанная для кодирования символов Unicode.
- Она была создана в 1996 году и использовалась в различных продуктах, включая Microsoft Office и Symbian OS.
- SCSU была отменена в 2004 году, но затем восстановлена в 2006 году.
-
Структура и режимы кодирования
- SCSU использует однобайтовое кодирование с сжатыми окнами.
- Существуют команды для переключения между однобайтовым режимом и режимом UTF-16BE.
- Кодирование окна включает статические и динамические окна, а также специальные символы для управления кодировкой.
-
Сравнение с другими схемами сжатия
- SCSU может эффективно сжимать короткие тексты, но уступает в эффективности для больших объемов данных.
- В HTML использование SCSU запрещено стандартами, так как это может привести к уязвимостям межсайтового скриптинга.
-
Рекомендации и ссылки
- Ссылки на документацию и исходный код SCSU доступны в статье.
Полный текст статьи: