Тематическая модель
- Тематическая модель – статистическая модель для обнаружения абстрактных тем в документах.
- Тематическое моделирование – инструмент интеллектуального анализа текста для обнаружения скрытых семантических структур.
- Темы, созданные с помощью методов тематического моделирования, представляют собой группы похожих слов.
- Тематические модели отражают интуицию в математической форме и позволяют исследовать набор документов.
- Тематические модели используются для упорядочивания и представления больших коллекций неструктурированных текстов.
- Тематические модели применяются в различных областях, включая биоинформатику и компьютерное зрение.
- Ранние тематические модели были разработаны Пападимитриу, Рагхаваном, Тамаки и Вемпалой (1998) и Томасом Хофманом (1999).
- Наиболее распространенная тематическая модель – латентное распределение Дирихле (LDA), разработанное Дэвидом Блеем, Эндрю Нг и Майклом Иорданией в 2002 году.
Полный текст статьи: