Отпечаток пальца (вычислительный)
-
Определение и применение дактилоскопии файлов
- Алгоритм снятия отпечатков пальцев сопоставляет данные с короткой битовой строкой для идентификации.
- Используется для дедупликации данных и проверки изменений в удаленных файлах.
- Отпечатки пальцев эффективны для сравнения больших объемов данных.
-
Требования к алгоритмам дактилоскопии
- Алгоритм должен обеспечивать виртуальную уникальность отпечатков, с низкой вероятностью столкновения.
- Отпечатки должны быть достаточно длинными для предотвращения атак на основе дня рождения.
- Алгоритм должен учитывать сложные зависимости между файлами, возникающие в бизнес-сетях.
-
Рецептура и компаундирование
- Алгоритмы позволяют вычислять отпечатки составных файлов на основе отпечатков частей.
- Компаундирование полезно для определения необходимости перекомпиляции программ.
-
Примеры алгоритмов
- Алгоритм Рабина является прототипом и обеспечивает быстрое и простое вычисление отпечатков.
- Криптографические хэш-функции, такие как MD5 и SHA, могут служить высококачественными функциями распознавания отпечатков, но занимают больше времени и не имеют гарантий вероятности столкновения.
-
Применение дактилоскопии
- NIST использует криптографические хэш-функции для сопоставления файлов с программными продуктами.
- База данных HashKeeper хранит отпечатки “хороших” и “плохих” файлов для правоохранительных органов.
- Дактилоскопия широко применяется для выявления сходства контента.
-
Дополнительные сведения
- В статье упоминаются другие области применения дактилоскопии, включая акустическую съемку отпечатков пальцев и автоматическое распознавание контента.