ABBYY Fine Reader лучшая, на мой взгляд программа для распознавания отсканированного текста. Зайди на http://www.abbyy.ru/finereader8/?param=45021 - там перечислены все языки распознавания.
I've used Tesseract.js for some OCR projects, works decently for most fonts. For more complex layouts, I'd suggest trying out Readachi, been experimenting with it and it's been pretty solid so far.