Оптическое распознавание символов

Оптическое распознавание символов (OCR) – технология, используемая для преобразования текста в цифровой формат.
OCR включает распознавание печатных и рукописных символов, а также распознавание текста на изображениях.
Современные программы OCR включают Google Docs OCR, ABBYY FineReader и Transym.
Итеративное распознавание текста автоматически разбивает документ на разделы и выполняет распознавание индивидуально.
Точность распознавания может быть повышена с помощью постобработки, включая использование лексики и анализ ближайших соседей.
Крупнейшие поставщики технологий распознавания текста совершенствуют системы для более эффективной обработки определенных типов входных данных.
Обходные пути для распознавания символов включают принуждение к более качественному вводу данных, использование полей с гребенками и распознавание на основе зон.
Краудсорсинг используется для быстрого распознавания изображений с более высокой точностью, чем при использовании компьютеров.

Полный текст статьи:

Оптическое распознавание символов — Википедия

Оптическое распознавание символов

Оптическое распознавание символов

Оптическое распознавание символов — Википедия

Оставьте комментарий Отменить ответ