Вероятностная контекстно-свободная грамматика
-
Основы PCFG
- PCFG — это вероятностные контекстно-свободные грамматики, которые используются для предсказания структуры РНК.
- Они основаны на теории формального языка и используются для моделирования структуры РНК.
-
Применение PCFG
- PCFG применяются для предсказания вторичной структуры РНК и используются в биоинформатике и биоинформатике.
- Они используются для предсказания структуры белков, но их применение ограничено из-за сложности белковых структур.
-
Алгоритм CYK
- Алгоритм CYK используется для вычисления наиболее вероятного дерева синтаксического анализа и оценки вероятности структуры.
- Он основан на максимизации математического ожидания и использует значения α и β.
-
Память и сложность
- Объем памяти и временная сложность для общих алгоритмов PCFG составляют O(L2M) и O(L3M3) соответственно.
- Ограничения PCFG могут изменить эти требования, как и в случае с методами поиска в базе данных.
-
PCFG в поиске гомологии
- Ковариационные модели (CMS) используются для поиска гомологов в базах данных и классификации РНК.
- Они основаны на консенсусной структуре РНК и позволяют учитывать вставки неограниченной длины.
-
Пример использования эволюционной информации
- Алгоритм KH-99 использует эволюционную информацию для прогнозирования структуры РНК.
- Он включает в себя оценку вероятностей столбцов, мутаций и выравнивание.
-
Улучшения в Pfold
- Pfold устраняет ограничения KH-99, такие как масштабируемость, пропуски, скорость и точность.
- Он рассматривает пробелы как неизвестные и использует объединение соседей для вычисления дерева T.
-
Анализ белковых последовательностей
- PCFG ограничены в применении к анализу белковых последовательностей из-за сложности и разнообразия взаимодействий.
- Они могут моделировать некоторые зависимости, но не все белковые структуры.