Проект создания базы данных генома ансамбля

  • Обзор проекта Ensembl

    • Ensembl — это научный проект, предоставляющий ресурсы для изучения геномов. 
    • Проект включает в себя геномные браузеры и базы данных, аналогичные NCBI и UCSC. 
  • История и цель проекта

    • Геном человека содержит 3 миллиарда пар оснований, но требует идентификации генов. 
    • Ручное аннотирование генов является трудоемким процессом. 
    • Ensembl был запущен в 1999 году для автоматического аннотирования генома человека. 
  • Процесс аннотирования и доступность данных

    • Данные передаются в систему аннотаций, которая создает предсказанные местоположения генов. 
    • Ensembl предоставляет данные в открытом доступе для мирового сообщества. 
    • Все данные и код проекта доступны для скачивания и через общедоступный сервер баз данных. 
  • Расширение проекта и новые функции

    • Ensembl расширился, включив дополнительные виды и геномные данные. 
    • С 2009 года проект Ensembl Genomes фокусируется на многоклеточных беспозвоночных и растениях. 
    • В 2020 году Ensembl добавил новые функции, включая Rapid Release и COVID-19. 
  • Визуализация геномных данных

    • Ensembl позволяет создавать графические представления расположения генов. 
    • Интерфейс позволяет настраивать отображение и экспортировать данные в различные форматы. 
  • Альтернативные методы доступа к данным

    • Ensembl предоставляет REST API и Perl API для доступа к данным. 
    • Пользователи могут использовать SQL-запросы для извлечения данных из базы данных MySQL. 
  • Текущие виды в базе данных Ensembl

    • Аннотированные геномы включают позвоночных и модельные организмы. 
    • На 2022 год в базе данных Ensembl зарегистрировано 271 вид. 
  • Открытый исходный код и зеркалирование

    • Все данные Ensembl находятся в открытом доступе с лицензией CC BY 4.0. 
    • Веб-сайт Ensembl зеркально отображен в четырех местах для улучшения сервиса. 

Полный текст статьи:

Проект базы данных генома Ensembl

Оставьте комментарий

Прокрутить вверх