Консорциум лингвистических данных
Консорциум лингвистических данных Консорциум лингвистических данных Открытый консорциум, объединяющий университеты, компании и исследовательские лаборатории. Создает и распространяет базы данных, лексиконы […]
Консорциум лингвистических данных Консорциум лингвистических данных Открытый консорциум, объединяющий университеты, компании и исследовательские лаборатории. Создает и распространяет базы данных, лексиконы […]
Согласующий Определение и применение согласующего устройства Согласующее устройство автоматически создает соответствие между данными. Выходные данные согласующего устройства используются для машинного
Берег деревьев Определение и история древовидных банков Древовидный банк – это анализируемый текст, комментирующий синтаксическую или семантическую структуру предложений. Революция
Параллельный текст Определение и примеры параллельных текстов Параллельный текст – текст на двух языках, расположенный рядом. Примеры: классические библиотеки, библии
Извлечение словосочетаний Извлечение словосочетаний Извлечение словосочетаний – задача автоматического выделения словосочетаний из корпуса. Традиционный метод основан на статистических оценках, таких
Маркировка частей речи Основы разметки частей речи Разметка частей речи (POS) – это процесс определения частей речи в тексте. POS-тегирование
Одновременное возникновение Определение совпадения в лингвистике Совпадение – это частота, превышающая вероятность случайного появления двух терминов рядом. Совпадение может указывать
Программа просмотра Ngram в Google Книгах Обзор Google Books Ngram Viewer Онлайн-инструмент для анализа частоты использования поисковых фраз в печатных
Текстовый корпус Определение и использование корпусов Корпусы – это наборы данных, состоящие из языковых ресурсов, включая аннотированные и неаннотированные. Они
Тематическая модель Тематическая модель – статистическая модель для обнаружения абстрактных тем в документах. Тематическое моделирование – инструмент интеллектуального анализа текста
Корпусная лингвистика Корпусная лингвистика – эмпирический метод изучения языка с использованием текстовых корпусов. Корпусы – сбалансированные, часто стратифицированные коллекции аутентичных
Словосочетание Словосочетания в корпусной лингвистике – это набор слов или терминов, встречающихся чаще, чем можно было бы ожидать. Во фразеологии