Проект создания базы данных генома ансамбля
-
Обзор проекта Ensembl
- Ensembl — это научный проект, предоставляющий ресурсы для изучения геномов.
- Проект включает в себя геномные браузеры и базы данных, аналогичные NCBI и UCSC.
-
История и цель проекта
- Геном человека содержит 3 миллиарда пар оснований, но требует идентификации генов.
- Ручное аннотирование генов является трудоемким процессом.
- Ensembl был запущен в 1999 году для автоматического аннотирования генома человека.
-
Процесс аннотирования и доступность данных
- Данные передаются в систему аннотаций, которая создает предсказанные местоположения генов.
- Ensembl предоставляет данные в открытом доступе для мирового сообщества.
- Все данные и код проекта доступны для скачивания и через общедоступный сервер баз данных.
-
Расширение проекта и новые функции
- Ensembl расширился, включив дополнительные виды и геномные данные.
- С 2009 года проект Ensembl Genomes фокусируется на многоклеточных беспозвоночных и растениях.
- В 2020 году Ensembl добавил новые функции, включая Rapid Release и COVID-19.
-
Визуализация геномных данных
- Ensembl позволяет создавать графические представления расположения генов.
- Интерфейс позволяет настраивать отображение и экспортировать данные в различные форматы.
-
Альтернативные методы доступа к данным
- Ensembl предоставляет REST API и Perl API для доступа к данным.
- Пользователи могут использовать SQL-запросы для извлечения данных из базы данных MySQL.
-
Текущие виды в базе данных Ensembl
- Аннотированные геномы включают позвоночных и модельные организмы.
- На 2022 год в базе данных Ensembl зарегистрировано 271 вид.
-
Открытый исходный код и зеркалирование
- Все данные Ensembl находятся в открытом доступе с лицензией CC BY 4.0.
- Веб-сайт Ensembl зеркально отображен в четырех местах для улучшения сервиса.