Оглавление
Европейский архив нуклеотидов
-
История и развитие ENA
- ENA – это глобальная база данных нуклеотидных последовательностей, созданная в 2008 году.
- ENA объединяет данные из различных источников, включая EMBL, GenBank и другие.
- ENA содержит полные геномы и данные о последовательностях для более чем 700 000 организмов.
-
Структура и содержание ENA
- ENA состоит из трех основных разделов: EMBL-Bank, архив трассировок и архив считываний последовательностей (SRA).
- EMBL-Bank содержит высокоуровневые данные о сборке генома и аннотации.
- Архив трассировок включает данные о секвенировании и информацию о качестве.
- SRA принимает данные о последовательностях от различных платформ секвенирования и предоставляет доступ к анализам и выравниваниям.
-
Доступ и хранение данных
- ENA предоставляет доступ к данным через REST API и браузер ENA.
- ENA сталкивается с проблемами хранения из-за экспоненциального роста данных.
- Для снижения требований к хранилищу используются инструменты сжатия, такие как CRAM.
-
Финансирование и будущее ENA
- ENA финансируется Европейской лабораторией молекулярной биологии, Европейской комиссией и Wellcome Trust.
- Проект ELIXIR направлен на создание устойчивой финансовой инфраструктуры для поддержки баз данных по биологическим наукам.