Оптическое распознавание символов
- Оптическое распознавание символов (OCR) — технология, используемая для преобразования текста в цифровой формат.
- OCR включает распознавание печатных и рукописных символов, а также распознавание текста на изображениях.
- Современные программы OCR включают Google Docs OCR, ABBYY FineReader и Transym.
- Итеративное распознавание текста автоматически разбивает документ на разделы и выполняет распознавание индивидуально.
- Точность распознавания может быть повышена с помощью постобработки, включая использование лексики и анализ ближайших соседей.
- Крупнейшие поставщики технологий распознавания текста совершенствуют системы для более эффективной обработки определенных типов входных данных.
- Обходные пути для распознавания символов включают принуждение к более качественному вводу данных, использование полей с гребенками и распознавание на основе зон.
- Краудсорсинг используется для быстрого распознавания изображений с более высокой точностью, чем при использовании компьютеров.
Полный текст статьи: