Оглавление
Тессеракт (программное обеспечение)
-
История и разработка Tesseract
- Tesseract был разработан в HP в 1980-х, выпущен с открытым исходным кодом в 2005, спонсирован Google в 2006.
- Изначально был проприетарным, но в 1995 стал одним из самых точных открытых движков распознавания текста.
- В 2006 году был одним из самых точных открытых движков распознавания текста.
-
Особенности и поддержка языков
- Tesseract поддерживает множество языков и скриптов, включая 116 языков и 37 скриптов.
- В версии 4 добавлен движок распознавания текста на основе LSTM.
- В версии 5 добавлена поддержка новых графических форматов и улучшена обработка текста справа налево.
-
Пользовательские интерфейсы и прием
- Tesseract запускается из командной строки, но есть графические интерфейсы, такие как OCRFeeder.
- В 2007 году Linux Journal назвал Tesseract “необычным инструментом командной строки”.
- В 2020 году Internet Archive похвалил Tesseract за улучшение точности.
-
Рекомендации и внешние ссылки
- Ссылки на официальный веб-сайт и другие ресурсы доступны в статье.
Полный текст статьи: