Тессеракт (программное обеспечение)

  • История и разработка Tesseract

    • Tesseract был разработан в HP в 1980-х, выпущен с открытым исходным кодом в 2005, спонсирован Google в 2006. 
    • Изначально был проприетарным, но в 1995 стал одним из самых точных открытых движков распознавания текста. 
    • В 2006 году был одним из самых точных открытых движков распознавания текста. 
  • Особенности и поддержка языков

    • Tesseract поддерживает множество языков и скриптов, включая 116 языков и 37 скриптов. 
    • В версии 4 добавлен движок распознавания текста на основе LSTM. 
    • В версии 5 добавлена поддержка новых графических форматов и улучшена обработка текста справа налево. 
  • Пользовательские интерфейсы и прием

    • Tesseract запускается из командной строки, но есть графические интерфейсы, такие как OCRFeeder. 
    • В 2007 году Linux Journal назвал Tesseract “необычным инструментом командной строки”. 
    • В 2020 году Internet Archive похвалил Tesseract за улучшение точности. 
  • Рекомендации и внешние ссылки

    • Ссылки на официальный веб-сайт и другие ресурсы доступны в статье. 

Полный текст статьи:

Тессеракт (программное обеспечение) — Википедия

Оставьте комментарий

Прокрутить вверх