Извлечение взаимосвязи
-
Основы извлечения связей
- Извлечение связей включает обнаружение и классификацию семантических связей в текстах и XML-документах.
- Задача похожа на извлечение информации, но требует устранения неоднозначности и извлечения множества связей.
-
Концепция и применение
- Концепция была представлена в 1998 году и фокусируется на бинарных отношениях.
- Применение включает извлечение связей между генами и заболеваниями, взаимодействие белок-белок и другие области.
-
Современные подходы
- Используются технологии машинного обучения для классификации связей.
- Never-Ending Language Learning — система семантического машинного обучения для извлечения связей из открытых сетей.
-
Методы извлечения связей
- Включают извлечение связей на основе текста и изучение структуры для выявления отношений.
- Использование онтологий предметной области и визуальное обнаружение связей в таблицах данных.
-
Ограничения и новые подходы
- Структурированные ресурсы, такие как словари и онтологии, породили новые подходы, основанные на знаниях из Интернета.
- ARCHILES использует Википедию и поисковые системы для построения облегченных онтологий.
-
Форматы представления данных
- Отношения могут быть представлены в различных формализмах, включая RDF.
-
Наборы данных и сравнительный анализ
- Созданы наборы данных для сравнительного анализа методов извлечения связей, включая DocRED на английском языке.
-
Дополнительные области
- Упоминаются смежные области, такие как текстовая аналитика, семантическая аналитика и извлечение информации.