Оглавление [Скрыть]
База данных последовательностей
-
Определение и использование баз данных последовательностей
- Базы данных последовательностей содержат цифровые версии биологических последовательностей.
- UniProt является примером базы данных белковых последовательностей, содержащей более 40 миллионов записей.
-
История и развитие
- Потребность в базах данных возникла в 1950-х годах с открытием структуры инсулина.
- Маргарет Дейхофф и NBRF опубликовали первый “Атлас последовательности и структуры белков” в 1965 году.
- В 1960-х годах началось автоматизированное секвенирование, а в 1970-х годах оно стало полностью автоматизированным.
- В 1980-х годах была создана первая база данных нуклеотидных последовательностей, а проект “Геном человека” потребовал создания больших баз данных.
-
Современные проблемы и решения
- Хранение и резервирование данных в базах данных последовательности вызывает проблемы из-за различий в качестве и избыточности.
- Алгоритмы подсчета очков в базах данных требуют создания специализированных систем для разных задач.
- Статистика выравнивания часто не имеет биологического значения, и требуются дополнительные методы для интерпретации данных.
-
Дополнительные ресурсы
- В статье упоминаются другие базы данных, форматы файлов и биоинформатические инструменты.
- Ссылки на внешние ресурсы и рекомендации по использованию баз данных также включены в статью.