Information retrieval techniques

Вики

Тезаурус (поиск информации)

Тезаурус (поиск информации) Определение и роль тезауруса Тезаурус — это форма словаря, которая используется для определения семантических метаданных при индексировании […]

Вики

Стоп-слово

Стоп-слово Определение стоп-слов Стоп-слова — это слова, которые удаляются из текста до его обработки.  Нет единого универсального списка стоп-слов, и

Вики

Стемминг

Вытекающий Определение и использование стемминга Стемминг — это процесс удаления суффиксов и окончаний из слов для упрощения их анализа.  Используется

Вики

Понимание запроса

Понимание запроса Основы понимания запросов Понимание запросов — это процесс определения намерений пользователя через семантическое значение ключевых слов.  Методы понимания

Вики

Контролируемая лексика

Контролируемый словарный запас Определение и использование контролируемых словарей Контролируемые словари — это системы, которые определяют и классифицируют термины для улучшения

Вики

Термин дискриминация

Термин «дискриминация» Основы распознавания ключевых слов Распознавание ключевых слов используется для ранжирования их по полезности для поиска информации.  Метод аналогичен

Вики

Модель отклонения от случайности

Модель отклонения от случайности Обзор модели отклонения от случайности Модель отклонения от случайности (DFR) используется для улучшения эффективности поиска информации. 

Вики

Неопределенный вывод

Неопределенный вывод Определение неопределенного вывода Неопределенный вывод — это формальное определение взаимосвязи между запросом и документом при поиске информации.  Запрос

Вики

Вероятностная модель релевантности

Вероятностная модель релевантности Основы вероятностной модели релевантности Разработана Стивеном Э. Робертсоном и Карен Спарк Джонс для ранжирования документов.  Оценивает вероятность

Вики

Бинарная модель независимости

Бинарная модель независимости Основы бинарной модели независимости Бинарная модель независимости используется для классификации документов по релевантности.  Модель основана на предположении,

Вики

Нечеткий поиск

Нечеткий поиск Основы поиска информации Поиск информации включает в себя извлечение релевантных данных из большого объема информации.  Существуют различные модели

Вики

Расширенная булева модель

Расширенная логическая модель Основы расширенной логической модели Расширенная логическая модель (ELM) — это метод поиска информации, основанный на булевой алгебре. 

Вики

Сложная обработка

Долгосрочная обработка Обработка сложных терминов в информационно-поисковых системах Сложные термины создаются путем объединения простых терминов, например, «тройное шунтирование сердца».  Цель

Вики

Совместная фильтрация

Совместная фильтрация Основы рекомендательных систем Рекомендательные системы помогают пользователям находить релевантный контент.  Они основаны на анализе предпочтений пользователей и взаимодействии

Вики

Учимся ранжировать

Учимся ранжировать Основы машинного обучения ранжированию Машинное обучение ранжированию (MLR) — это процесс обучения алгоритмов для ранжирования результатов поиска.  MLR

Вики

Тематическое индексирование

Предметная индексация Основы индексирования Индексация — это процесс создания системы классификации документов для облегчения поиска информации.  Индексация включает в себя

Вики

Семантическая технология

Семантическая технология Основы семантической технологии Семантическая технология помогает машинам понимать данные.  Используются RDF и OWL для формального представления значений данных. 

Прокрутить вверх