Классификация документов
-
Классификация документов
- Проблема классификации документов в библиотечном деле, информатике и вычислительной технике
- Классификация может быть ручной, интеллектуальной или алгоритмической
- Интеллектуальная классификация в основном используется в библиотечном деле, в то время как алгоритмическая — в информатике и вычислительной технике
-
Типы документов для классификации
- Включают тексты, изображения, музыку и другие
- Каждый тип имеет свои особенности классификации
-
Концепции тематической классификации
- Классификация на основе содержания и на основе запросов
- Классификация на основе контента основана на количестве разделов документа, соответствующих классу
- Классификация на основе запросов учитывает ожидаемые запросы пользователей
-
Классификация и индексация
- Различие между классификацией и предметной индексацией считается неэффективным
- Система классификации может быть преобразована в тезаурус
-
Автоматическая классификация документов
- Задачи включают контролируемую классификацию, неконтролируемую классификацию и полуавтоматическую классификацию
- Существуют различные программные продукты с различными моделями лицензий
-
Методы автоматической классификации
- Включают искусственные нейронные сети, деревья принятия решений, максимизацию ожиданий и другие
- Методы применяются для фильтрации спама, маршрутизации электронной почты, идентификации языка и других задач
-
Приложения автоматической классификации
- Используются для фильтрации спама, маршрутизации электронной почты, определения языка и других задач