Оптическое распознавание символов

  • Оптическое распознавание символов (OCR) — технология, используемая для преобразования текста в цифровой формат. 
  • OCR включает распознавание печатных и рукописных символов, а также распознавание текста на изображениях. 
  • Современные программы OCR включают Google Docs OCR, ABBYY FineReader и Transym. 
  • Итеративное распознавание текста автоматически разбивает документ на разделы и выполняет распознавание индивидуально. 
  • Точность распознавания может быть повышена с помощью постобработки, включая использование лексики и анализ ближайших соседей. 
  • Крупнейшие поставщики технологий распознавания текста совершенствуют системы для более эффективной обработки определенных типов входных данных. 
  • Обходные пути для распознавания символов включают принуждение к более качественному вводу данных, использование полей с гребенками и распознавание на основе зон. 
  • Краудсорсинг используется для быстрого распознавания изображений с более высокой точностью, чем при использовании компьютеров. 

Полный текст статьи:

Оптическое распознавание символов — Википедия

Оставьте комментарий

Прокрутить вверх