ambiguous_words - генерировать наборы слов, которые Tesseract может счесть неоднозначными
ambiguous_words [-l lang] TESSDATADIR WORDLIST AMBIGUOUSFILE
ambiguous_words(1) запускает Tesseract в специальном режиме и для каждого слова в списке слов создает набор слов, которые, по мнению Tesseract, могут быть двусмысленными. В качестве TESSDATADIR должен быть задан абсолютный путь к каталогу, содержащему tessdata/lang.traineddata.
tesseract(1)
Copyright (C) Google, Inc., 2012 г. Лицензия Apache License, версия 2.0
Механизм Tesseract OCR был написан Рэем Смитом и его исследовательскими группами в Hewlett Packard (1985–1995) и Google (с 2006 г. по настоящее время).