Оглавление [Скрыть]
ГенБанк
-
Обзор базы данных GenBank
- GenBank – это общедоступная база данных нуклеотидных последовательностей и их белковых переводов, поддерживаемая NCBI.
- GenBank содержит более 500 000 описанных видов и удваивается каждые 18 месяцев.
- Версия 250.0 содержит более 17 триллионов оснований в более чем 2,45 миллиардах последовательностей.
-
Процесс подачи и проверки данных
- В GenBank могут быть представлены только оригинальные последовательности, которые проверяются на оригинальность и качество.
- Прямые заявки подаются через BankIt или Sequin, а массовые данные отправляются крупными центрами секвенирования.
-
История и развитие
- GenBank был создан в 1982 году и финансировался различными организациями, включая Национальные институты здравоохранения.
- В середине 1980-х годов проект GenBank был передан NCBI, и с тех пор он активно растет.
-
Проблемы и рекомендации
- В GenBank отсутствуют проверенные экспертами последовательности типовых штаммов и нетиповых штаммов.
- Коммерческие базы данных могут содержать высококачественные данные, но число эталонных последовательностей ограничено.
- В GenBank могут встречаться ошибочные последовательности, включая химеры и записи с ошибками в последовательности.
-
Дополнительные ресурсы
- В статье упоминаются другие базы данных, такие как HPRD, UniProt, RefSeq и Geneious, а также важность открытых научных данных и стандартов.