Поиск мультимедийной информации
-
Определение и методология MMIR
- MMIR — это дисциплина для извлечения семантической информации из мультимедийных данных.
- Источники данных включают аудио, изображения, видео, текст, биосигналы и другие.
-
Методы обобщения медиаконтента
- Извлечение признаков из медиаконтента для его обобщения.
- Примеры признаков: кепстральные коэффициенты, частота пересечений нуля, цветовая гистограмма.
-
Методы фильтрации описаний
- Объединение описаний разных каналов в одно описание.
- Примеры методов: факторный анализ, разложение по сингулярным значениям, фильтр Калмана.
-
Методы категоризации медиаописаний
- Использование машинного обучения для классификации описаний.
- Примеры классификаторов: метрические подходы, методы ближайшего соседа, минимизация рисков, методы на основе плотности, нейронные сети, эвристика.
-
Открытые проблемы MMIR
- Качество систем MMIR зависит от качества обучающих данных.
- Создание меток классов для больших баз данных требует усилий.
- Ежегодный конкурс TRECVID является источником высококачественной информации.
-
Смежные области MMIR
- Методы MMIR применяются в анализе биоинформации, обработке биосигналов, распознавании лиц и других областях.
- Международный журнал мультимедийного информационного поиска документирует развитие MMIR.
-
Рекомендации
- Для получения полного обзора MMIR рекомендуется руководство по мультимедийному поиску информации.