Оглавление
CRAM (формат файла)
-
Обзор формата CRAM
- CRAM – это сжатый формат файла для хранения выровненных последовательностей.
- Разработан для экономии места на диске за счет использования геномной ссылки.
- Файлы CRAM на 30-60% меньше по размеру, чем файлы BAM.
-
Структура файла CRAM
- Файл CRAM состоит из серии контейнеров, содержащих сжатый заголовок SAM и фрагменты выравнивания.
- Каждый контейнер содержит заголовок сжатия, который определяет кодировку и метаданные.
- Разделение данных на блоки улучшает сжатие и позволяет выборочное декодирование.
-
Выборочный доступ и декодирование
- Индекс файла CRAM позволяет выборочно декодировать определенные области данных.
- Заголовок сжатия позволяет пропускать ненужные ряды данных для частичного декодирования.
-
История и развитие
- Версия CRAM 4.0 находится в стадии прототипа и еще не принята в качестве стандарта.
-
Связанные форматы и рекомендации
- CRAM сравнивается с форматами SAM и BAM.
- Упоминаются другие форматы файлов для молекулярной биологии.