Я однажды нарыл свободно распространяемую экспериментальную прогу по распознаванию деванагари, но мало того, что у неё интерфейс был из начала 90-х - совершенно недружественный, процент распознавания чётко отсканированной страницы составлял всего 25-30%. Того, кто привык пользоваться FineReader'ом, где процент распознавания чётко напечатанной страницы в достаточном разрешении приближается к 100%, а если есть проблемы (нечёткая печать, недостаточное разрешение, и т.п.) - всё равно процент разпознавания, обычно, в районе 80-90%, такой результат, естественно, не удвлетворит. Да и никого, наверное, не удовлетворит - если 3/4 текста всё равно приходится набивать по новой, а остальное - капитально править, то суммарный объём работы, скорее всего, превысит тот, который будет затрачен на набивание текста "с нуля". Если бы автору удалось кардинально доработать движок - чтобы процент распознавания поднялся хотя бы к 75-80% - я бы, тем не менее, пользовался бы той прогой, на безрыбье. К сожалению,
тот проект, вроде, заглох... Хотя, я сейчас сделал быстрый поиск -
вот здесь автор программы (Oliver Hellwig) пишет, что надеется к концу года выпустить новую версию, с процентом распознавания 99,5% на хороших документах. До конца года осталось совсем немного, поживём - увидим. Следите за сайтом, ссылку на который я дал выше - наверняка, новая версия появится там.