Распределение патинко
-
Основы распределения пачинко
- Распределение пачинко (PAM) — это тематическая модель в машинном обучении и обработке естественного языка.
- PAM улучшает модели, такие как скрытое распределение Дирихле, путем учета корреляций между темами и словами.
- Алгоритм обеспечивает большую гибкость и выразительность по сравнению с LDA.
-
История и реализация
- Распределение пачинко было описано Вэй Ли и Эндрю Маккаллумом в 2006 году.
- В 2007 году была предложена иерархическая версия PAM, а также непараметрический байесовский априор.
- Реализация PAM была выполнена в программном пакете MALLET, разработанном группой Маккаллума.
-
Модель PAM
- PAM использует ациклический граф для соединения слов и тем.
- Вероятность создания корпуса равна произведению вероятностей документов.
-
Сравнение с другими моделями
- PAM сравнивается с вероятностным латентным семантическим индексированием (PLSI) и скрытым распределением Дирихле (LDA).
-
Дополнительные ресурсы
- MALLET — это открытая Java-библиотека для реализации PAM.
- Статья содержит ссылки на видео и рекомендации по расширению Википедии.