Оглавление
Другой формат вызова
-
Формат VCF в биоинформатике
- VCF – стандартный формат для хранения вариаций генов, разработанный в 2010 году.
- Используется в крупномасштабных проектах генотипирования и секвенирования ДНК.
- VCFtools и BCFtools – популярные инструменты для редактирования и манипулирования VCF.
- Стандарт VCF находится в версии 4.3, но проект “1000 геномов” имеет собственную спецификацию.
-
Расширения и дополнительные форматы
- gVCF – расширенный формат с дополнительной информацией о “блоках” и их качествах.
-
Структура файла VCF
- Заголовок содержит метаданные и ключевые слова, такие как fileformat и reference.
- Основная часть файла разделена на 8 обязательных и неограниченное количество необязательных столбцов.
-
Информационные и форматные поля
- В VCF допускаются произвольные ключи, но есть зарезервированные поля.
- Поля формата определены в заголовке файла.
-
Связанные форматы
- Упомянуты форматы FASTA, FASTQ, SAM и GVF, а также GA4GH и проект “1000 геномов”.
-
Геном человека и генетическая изменчивость
- Упомянуты однонуклеотидный полиморфизм (SNP) и генетическая изменчивость человека.
-
Рекомендации и ресурсы
- Ссылки на внешние ресурсы и инструменты для работы с VCF.