Индукция смысла слова
-
Проблема индукции смысла слова
- Индукция смысла слова (WSI) — это задача автоматической идентификации значений слова.
- WSI связана с задачей устранения неоднозначности смысла слова (WSD).
-
Подходы и методы
- Контекстная кластеризация: слова схожи, если встречаются в похожих контекстах.
- Кластеризация слов: слова сгруппированы по семантическому сходству.
- Графики совпадений: семантика слова представлена через совпадения и отношения совпадений.
-
Контекстная кластеризация
- Алгоритм распознавания контекстных групп использует большие матрицы для кластеризации.
-
Кластеризация слов
- Алгоритм Лина основан на статистике синтаксических зависимостей.
- CBC использует синтаксические контексты и матрицу сходства для вывода значений.
-
Графики совпадений
- HyperLex — успешный подход к графовому алгоритму.
- SquaT++ и B-MST — алгоритмы на основе простых графических шаблонов.
- Китайский шепот — рандомизированный алгоритм для разбиения вершин графа.
-
Приложения
- Улучшение результатов поиска в Интернете и обогащение лексических ресурсов.
-
Программное обеспечение
- SenseClusters — программный пакет с открытым исходным кодом для контекстной кластеризации и кластеризации слов.