База данных последовательностей

Оглавление1 База данных последовательностей1.1 Определение и использование баз данных последовательностей1.2 История и развитие1.3 Современные проблемы и решения1.4 Дополнительные ресурсы1.5 Полный […]

База данных последовательностей

  • Определение и использование баз данных последовательностей

    • Базы данных последовательностей содержат цифровые версии биологических последовательностей. 
    • UniProt является примером базы данных белковых последовательностей, содержащей более 40 миллионов записей. 
  • История и развитие

    • Потребность в базах данных возникла в 1950-х годах с открытием структуры инсулина. 
    • Маргарет Дейхофф и NBRF опубликовали первый “Атлас последовательности и структуры белков” в 1965 году. 
    • В 1960-х годах началось автоматизированное секвенирование, а в 1970-х годах оно стало полностью автоматизированным. 
    • В 1980-х годах была создана первая база данных нуклеотидных последовательностей, а проект “Геном человека” потребовал создания больших баз данных. 
  • Современные проблемы и решения

    • Хранение и резервирование данных в базах данных последовательности вызывает проблемы из-за различий в качестве и избыточности. 
    • Алгоритмы подсчета очков в базах данных требуют создания специализированных систем для разных задач. 
    • Статистика выравнивания часто не имеет биологического значения, и требуются дополнительные методы для интерпретации данных. 
  • Дополнительные ресурсы

    • В статье упоминаются другие базы данных, форматы файлов и биоинформатические инструменты. 
    • Ссылки на внешние ресурсы и рекомендации по использованию баз данных также включены в статью. 

Полный текст статьи:

База данных последовательностей

Оставьте комментарий