Европейский архив нуклеотидов

  • История и развитие ENA

    • ENA — это глобальная база данных нуклеотидных последовательностей, созданная в 2008 году. 
    • ENA объединяет данные из различных источников, включая EMBL, GenBank и другие. 
    • ENA содержит полные геномы и данные о последовательностях для более чем 700 000 организмов. 
  • Структура и содержание ENA

    • ENA состоит из трех основных разделов: EMBL-Bank, архив трассировок и архив считываний последовательностей (SRA). 
    • EMBL-Bank содержит высокоуровневые данные о сборке генома и аннотации. 
    • Архив трассировок включает данные о секвенировании и информацию о качестве. 
    • SRA принимает данные о последовательностях от различных платформ секвенирования и предоставляет доступ к анализам и выравниваниям. 
  • Доступ и хранение данных

    • ENA предоставляет доступ к данным через REST API и браузер ENA. 
    • ENA сталкивается с проблемами хранения из-за экспоненциального роста данных. 
    • Для снижения требований к хранилищу используются инструменты сжатия, такие как CRAM. 
  • Финансирование и будущее ENA

    • ENA финансируется Европейской лабораторией молекулярной биологии, Европейской комиссией и Wellcome Trust. 
    • Проект ELIXIR направлен на создание устойчивой финансовой инфраструктуры для поддержки баз данных по биологическим наукам. 

Полный текст статьи:

Европейский архив нуклеотидов

Оставьте комментарий

Прокрутить вверх