Кодирование пар байтов
-
Кодирование парами байтов
- Алгоритм, описанный в 1994 году, для кодирования текста в табличную форму.
- Модификация для комбинирования токенов, кодирующих отдельные символы и целые слова.
- Процесс начинается с создания словаря из уникальных символов длиной в 1 символ.
- Пара наиболее часто встречающихся соседних символов объединяется в новый токен.
-
Эффективность и восстановление данных
- Алгоритм эффективен и требует низких вычислительных затрат.
- Для восстановления исходного набора данных необходима таблица подстановок.
-
Сравнение с оригинальным алгоритмом
- Оригинальный алгоритм заменяет наиболее распространенные последовательности неиспользуемыми байтами.
- Декомпрессия выполняется путем обращения процесса кодирования с использованием таблицы поиска.
-
Пример использования
- Пара байтов «aa» заменяется на «Z», затем «ab» на «Y».
- Процесс может быть продолжен рекурсивным кодированием, но не приводит к дальнейшему сжатию данных.
-
Распаковка данных
- Для распаковки данных выполняется обратная замена.
-
Дополнительные ресурсы
- Упоминание о повторном сопряжении и алгоритме определения последовательности.
- Рекомендации по использованию алгоритма.
Полный текст статьи: