Оглавление
SAM (формат файла)
-
История и разработка формата SAM
- SAM разработан для хранения выровненных последовательностей по эталонной последовательности.
- Формат был создан в рамках проекта “1000 геномов” для замены MAQ mapper.
- Название SAM было предложено Габором Мартом, но с другим синтаксисом.
-
Структура и особенности формата SAM
- Формат состоит из заголовка и секции выравнивания.
- SAM поддерживает короткие и длинные последовательности, созданные различными секвенирующими платформами.
- SAM используется для хранения сопоставленных данных и анализа генома.
- Двоичным эквивалентом SAM является BAM, который хранит данные в сжатом виде.
-
Описание разделов файла SAM
- Заголовок начинается с символа “@” и содержит обязательные и необязательные поля.
- Раздел “Выравнивание” содержит 11 обязательных полей и может иметь дополнительные поля.
-
Спецификация формата SAM
- В спецификации описаны поля заголовка, выравнивания и флаги.
- Поля заголовка и выравнивания содержат информацию о шаблоне запроса, контрольной последовательности, позициях отображения и качестве картографирования.
- Флаги представляют собой битовые атрибуты, которые суммируются для получения окончательного значения.
-
Дополнительные поля и форматы
- SAMtags позволяют добавлять дополнительные поля, такие как типы данных и массивы.
- Упомянуты форматы FASTA, FASTQ и GVF, а также рекомендации по использованию форматов.