Извлечение знаний
- Извлечение знаний — создание знаний из структурированных и неструктурированных источников.
- Полученное знание должно быть представлено в машиночитаемом формате для облегчения логического вывода.
- Извлечение знаний отличается от извлечения информации (NLP) и ETL тем, что результат выходит за рамки структурированной информации.
- RDB2RDF W3C стандартизирует язык для извлечения фреймворков описания ресурсов (RDF) из реляционных баз данных.
- Примеры извлечения знаний: связывание сущностей, преобразование реляционных баз данных в RDF, извлечение из структурированных источников в RDF.
- Извлечение из источников на естественном языке требует более сложных методов из-за неструктурированности данных.
- NLP включает лингвистическую аннотацию, традиционное извлечение информации, извлечение информации на основе онтологий, изучение онтологий, семантическую аннотацию и семантическую аннотацию.
- Инструменты для извлечения знаний включают NLP-инструменты, инструменты для извлечения информации из реляционных баз данных, инструменты для извлечения знаний из существующих программных систем и инструменты для обнаружения знаний.
Полный текст статьи: