Чисто академический интерес-а существует ли OCR для китайского языка?
хм, встречный интерес: а для арабской вязи есть OCR? особенно если учесть что там много вариантов оформления
распознавание китайского видел, но там ессно не все иероглифы =)
У них есть "образующие", "каркас" - я в этих делах не компетентен - пусть меня поправят специалисты/носители языка
Ты видел китайский словарь? Там иероглифы упорядочены специальным образом - по "образующим"-"несущим" - вертикальная черта, например, штрих в одну сторону, штрих в другую - знаки (characters) разбиваются на группы.. и т.п..
более того, зачастую некоторые иероглифы являются частью других.
В математике примерно тоже самое.
например, программа умеет распознавать корень из чего-нибудь и дробь чего-нибудь.
Алгоритм (механизм распознавания) должен быть устроен таким образом, чтобы программа умела распознавать и "корень от корня", "многоэтажные дроби", и т.д. без необходимости вбивать в неё всевозможные комбинации вроде пятикратного вложенного радикала с дробями в перемежку:
недавно видел на каком-то из сайтов американских университетов (Буффало, вроде бы) то, что они изобрели ОЦР для арабской вязи.
Скорее всего распознавалки математических формул нетэто ложки нет, а суслик есть
http://www.inftyproject.org/index-e.html
О! спасибо за ссылку
Оставить комментарий
yolki
Вопрос встал в связи с (не)существованием распознавалки для математических формул.Языки "образно" похожи - во всяком случае есть мнение, что для этих целей нужно будет использовать схожие алгоритмы.
Скорее всего распознавалки математических формул нет - потому как это весьма трудоёмкое предприятие и у него мало потребителей - от силы миллион математиков в мире. в то время как у китайского/японского OCR миллиард потенциальных потребителей..