Вопрос про нужность распознавания рукописного текста и образов.

zrab

Про необходимость (читай - полезность) распознавания образов в будущем у меня ка-то нет сомнений. Первое, что бросается в голову - применение этого всего в робототехнике.
А распознавание рукописных текстов, мне кажется, уже не будет актуальным, поскольку уже сейчас все документы печатаются на компах. Разве что - школьные тетради проверять вместо учителей.
У кого какие мысли на этот счет?

nikita270601

Рукописный ввод в маленьких компьютерах (PDA, телефоны, коммуникаторы).

kokoc88

У кого какие мысли на этот счет?
Приходишь ты в банк, там тебе дают бланк и просят заполнить Ф.И.О... Твои действия? Достать ручной принтер и напечтатать? :grin:

nikita270601

Приходишь ты в банк, там тебе дают бланк и просят заполнить Ф.И.О... Твои действия? Достать ручной принтер и напечтатать? :grin:
Я бы предпочел провести скретч-картой через считыватель, чем заполнять анкету. :D
Или чтобы сотрудники банка сами все заполнили, а я им просто документы предоставил.

kokoc88

Я бы предпочел провести скретч-картой через считыватель, чем заполнять анкету.
А цели кредита, например? :)

nikita270601

А цели кредита, например? :)
Вслух продиктую, они заполнят, а я подпишу!

nikita270601

Кстати, распознавание речи было бы в тему. :D

kokoc88

Вслух продиктую, они заполнят, а я подпишу!
Так с каждым цацкаться по пол часа будут.

Alexander08

а я подпишу!
проведу картой через считыватель... :cool:

Werdna

Да, нужная, очень плохо изученная тема, и почти не реализованная.
Страшно, что почти весь софт — проприетарный. Никто ещё не взялся сделать что-то вменяемое и свободное. :mad:

Dasar

> А цели кредита, например?
в идеале проще и дешевле: клаву с монитором поставить для ввода, чем разбирать рукописный текст - хотя бы проблема описки по ходу ввода намного проще решается

kokoc88

в идеале проще и дешевле: клаву с монитором поставить для ввода, чем разбирать рукописный текст - хотя бы проблема описки по ходу ввода намного проще решается
Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.

kruzer25

Но детям писать от руки нужно, чтобы моск развивался.

uncle17

Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.
бугага

nikita270601

А почему ты смеёшься?

kruzer25

Большинство людей быстрее напишут, чем напечатают.
Через двадцать лет повторишь?

kokoc88

Через двадцать лет повторишь?
Через двадцать спокойно повторю.

Oper

Никто ещё не взялся сделать что-то вменяемое и свободное
А это потому, что задача еще плохо изучена и стандартных алгоритмов решения пока нет. Через пяток-другой диссертаций по этой теме может и появится что-то.

nikita270601

Через двадцать лет повторишь?
Я знаю довольно много людей, профессионально использующих компьютерную клавиатуру уже 5-6 лет (в т.ч. программистов которые пишут быстрее, чем набирают. О том, как набирают люди, которые не используют клавиатуру профессионально, даже говорить не имеет смысла.
Что изменится через 20 лет?

kruzer25

Что изменится через 20 лет?
То, что нынешние дети в большинстве случаев уже вполне прилично владеют клавиатурой.
А через 20 лет людей, у которых в детстве не было компьютера, будет уже довольно мало.

Helga87

Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.
Быстрее ошибутся и заново все перепишут? Мне на днях пришлось заполнять некую анкету, в ней как всегда ряд пунктов была неочевидна. В результате мне пришлось несколько раз заново заполнять. Было бы на компе - исправил бы только то, где ошибся.
Даже если я печатаю не очень быстро, мне выгодно, если я не боюсь не то написать - цена ошибки сильно снижается.

nikita270601

нынешние дети в большинстве случаев уже вполне прилично владеют клавиатурой
Где статистика?

kruzer25

Быстрее ошибутся и заново все перепишут?
О да, помню, как я в своей госконторе писал анкету сберовскую на карточку... заполнил - "а у вас тут ошибка в одной букве, исправить нельзя, переписывайте"... несколько часов на заполнение одного листа этой анкеты ушло :crazy:
Кстати, в итоге меня пожалели, и написали все данные сами.

kruzer25

первое, что нашёл в яндексе по запросу "степень компьютеризации"
Блин, это же очевидно - пятнадцать лет назад компы были в основном только у семей гиков; а сейчас комп (хотя бы для гам) - практически у каждого школьника (в москве, по крайней мере).
UPD: и ещё - по крайней мере, динамика ясна; а эта "степень компьютеризации" - она довольно сильно растёт с уменьшением возраста (в разумных пределах).

nikita270601

Где там написано, что люди хорошо умеют набирать? Быстрее, чем писать ручкой?

uncle17

конечно, быстрее
Это аксиома для человека, знакомого с компьютером. Набираешь ты 10 пальцами (пусть и не вслепую а пишешь одной рукой

kruzer25

Ты так говоришь, как будто никогда дела с компьютером не имел.
Если с детства с ним работать, пусть даже практически только гамать - то по крайней мере не сильно медленнее будет.

nikita270601

Про это я уже писал выше.

Alexander08

Где статистика?
+1, если москву в рассмотрение не брать, то в россии очень маленький процент знакомых с компом, в том числе и детей
Из республик бывшего СССР лучше всего дело с компьютеризированностью обстоит в Прибалтике – Эстония, Латвия и Литва занимают соответственно 35,38 и 66 места списка. Россия в этом рейтинге занимает 78 строчку – ровно между Ямайкой и Фиджи. У нас на каждую тысячу жителей приходится по 43,59 компьютера. Из других стран СНГ в список попали только Грузия и Украина – на 95 и 100 местах соответственно с показателями в 22 и 18 компьютеров на 1000 жителей.Примечательно, что по общему количеству используемых персональных ПК Россия находится в списке достаточно высоко, на 13 месте, правда и при этом этих самых компьютеров у нас все равно в 26 раз меньше, чем в США.

http://rating.rbc.ru/article.shtml?2004/09/20/774971

kokoc88

Быстрее ошибутся и заново все перепишут?
С компом тоже будут свои проблемы. Вон в налоговой бумажки пишут параллельно до 50 человек. Ждать компьютера в таком случае придётся ну очччень долго, потому что их будет от силы 2-3, а разобраться с тем, что хочет от нас бюрократия, порой, просто нереально.

kruzer25

Заодно и автоматическую проверку полей по мере ввода прикрутят.
Чтобы не "заполнил бумажку, отнёс - тебе сказали, где жопа, переписал бумажку", а "заполняешь анкету, заполнил поле - тебе говорят, что неправильно поле заполнил".

kruzer25

1) "2004/09/20".
2) Сколько там у нас городского населения, 50%?
3) Если в семье из 4 человек есть комп - значти, оба ребёнка в этой семье с ним знакомы.
Получается, что три года назад в среднем в каждой третьей городской семье был комп. А сейчас - гораздо больше.

kokoc88

заполнил бумажку, отнёс - тебе сказали, где жопа, переписал бумажку", а "заполняешь анкету, заполнил поле - тебе говорят, что неправильно поле заполнил
Такой ИИ сделать тяжелее, чем распознавание текста.

kruzer25

Ну почему же?
У нас же всё забюрократизировано до предела, наверняка есть толстенный свод формальных требований к этой конкретной анкете.

feliks28

А как это распределение компов по семьям считают, интересно?

Alexander08

1) "2004/09/20".
2) Сколько там у нас городского населения, 50%?
3) Если в семье из 4 человек есть комп - значти, оба ребёнка в этой семье с ним знакомы.
Получается, что три года назад в среднем в каждой третьей городской семье был комп. А сейчас - гораздо больше.
ты считал тут процент "недомашних" компов?

kruzer25

Нет.
Они там тоже учитывались? :crazy:

Alexander08

Они там тоже учитывались?
думаю, да

Marinavo_0507

> Большинство людей быстрее напишут, чем напечатают.
Это ненадолго. Нынешние дети с клавой и мышой обращаться учатся раньше, чем говорить.

Reves2

При потоковой обработки все же быстрее если все будут писать, так как на всех компов не наставишь, не все умеют пользоваться. А если один человек в пол часа, то удобнее и дешевле наверно поставить комп или посадить девочку, которой все диктовать будут.

kruzer25

так как на всех компов не наставишь
Почему?
Там, где сейчас столы - будут компы.

Reves2

И дороже это дело и места больше занимает, где уместится один комп, там может сесть 2-3 человека.

kruzer25

И дороже это дело
Не так уж и дороже, хламкомпы сейчас можно по тысяче рублей купить, хламмониторы - столько же.
где уместится один комп, там может сесть 2-3 человека
Эти люди, они же не просто сидеть должны.

Dasar

Ждать компьютера в таком случае придётся ну очччень долго
так комп и не нужен, нужен только мон + клава, или просто сенсорный мон.

uncle17

во-во
тем паче - комп один на стол, а по периметру народ сидит и каждый в своем экране со своей клавой уже творит

kruzer25

или просто сенсорный мон
Заипутся набирать.

Helga87

По большому счету, надо не клавиатуры в такие места ставить, а систему чуть-чуть изменить: дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь. Потом нажимаешь "отправить форму". Приходишь к ним и только подпись ставишь на заботливо распечатанном ими листе. Очередей не будет совсем (поставить подпись - минута ручная проверка сведется к минимуму и тот, кто проверяет сидит в хороших условиях, а не в комнате, куда ломятся 100 человек, если тебе нахамили - это сразу видно по логам.

kruzer25

дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь
Это - ещё через 20 лет, когда в каждом доме будет не только комп, но и нормальный интернет.

Helga87

в Швейцарии уже местами так. Плюс, никто не говорит, что надо отменять классический способ. Просто сделать способ для тех, кто дружит с компами, выделить одно окошечко и дело заспорится - очереди даже из других, ручных окошек сильно уменьшится, т.к. в основном много времени на написание бумажек тратят именно компьютерно-грамотные.

apl13

По большому счету, надо не клавиатуры в такие места ставить, а систему чуть-чуть изменить: дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь. Потом нажимаешь "отправить форму". Приходишь к ним и только подпись ставишь на заботливо распечатанном ими листе. Очередей не будет совсем (поставить подпись - минута ручная проверка сведется к минимуму и тот, кто проверяет сидит в хороших условиях, а не в комнате, куда ломятся 100 человек, если тебе нахамили - это сразу видно по логам.
Отказать.
1. Когда все сразу могут заполнять что хотят - это же беспредел! Так никаких формуляров не хватит. А куда все это складывать, как разбирать? А кто будет принимать сразу столько решений по стольким бумагам?
2. К тому же, необходимо подумать о душевном равновесии работников. В данный момент они могут искусственно снизить бумажно-приемную способность своих ведомств (как то: в кабинет входить по одному, оформляться не менее двадцати минут, и вообще, с одиннадцати до четырех обеденный перерыв). Тем самым они дают понять посетителям, кто именно тут хозяин и сколько эти посетители стоят, в некотором роде компенсируют себе чувство собственной неполноценности, возникающее от бесполезности и неважности собственной работы.
Ввиду таких важных причин, отказ от традиционных форм документооборота в ближайшее время представляется нецелесообразным.

stream2008

О да, помню, как я в своей госконторе писал анкету сберовскую на карточку... заполнил - "а у вас тут ошибка в одной букве, исправить нельзя, переписывайте"... несколько часов на заполнение одного листа этой анкеты ушло
Кстати, в итоге меня пожалели, и написали все данные сами.
Охренеть можно! Написать листок текста, не сделав ни одной ошибки - уже слабо. :crazy:

SCIF32

1. Когда все сразу могут заполнять что хотят - это же беспредел! Так никаких формуляров не хватит. А куда все это складывать, как разбирать? А кто будет принимать сразу столько решений по стольким бумагам?
2. К тому же, необходимо подумать о душевном равновесии работников. В данный момент они могут искусственно снизить бумажно-приемную способность своих ведомств (как то: в кабинет входить по одному, оформляться не менее двадцати минут, и вообще, с одиннадцати до четырех обеденный перерыв). Тем самым они дают понять посетителям, кто именно тут хозяин и сколько эти посетители стоят, в некотором роде компенсируют себе чувство собственной неполноценности, возникающее от бесполезности и неважности собственной работы.
Ввиду таких важных причин, отказ от традиционных форм документооборота в ближайшее время представляется нецелесообразным.
:grin:
написано, войдя в роль сотрудников нашего УО?

feliks28

Учитывая полнейшее отсутствие манов и факов по этим листам, а так же встречаемые без пояснений "адрес 1", "адрес 2", то нормальному человеку, которому все эти тонкости только раз в 20 лет нужны, слабо, да.
"Забавно" еще бывает, когда пытаешься чего-нибудь уточнить по этим листкам, а "тетенька" из окошка к заведующей бежит уточнить.

apl13

Товарищ, у вас есть возражения? :p
Написано по мотивам десяти (начиная с военкомата) лет всяких посещений.

kruzer25

"Забавно" еще бывает, когда пытаешься чего-нибудь уточнить по этим листкам, а "тетенька" из окошка к заведующей бежит уточнить.
Ну, в моей ситуации такого не было, я собственно с заведующей и имел дело :)
На самом деле, большая часть косяков в том случае была из-за оечпяток.

Dasar

> Заипутся набирать.
даже если внизу такого экрана будет нарисована стандартная клава со стандартными размерами?
и монитор будет в виде столешницы наклоненной на 30 градусов.

kruzer25

Да.
Тактильные ощущения от клавы всё-таки пока что очень важны.

Vladislav177Rus

Надо в приемной комиссии МГУ ввести подобную систему. Заполняешь все в спокойной домашней обстановке. А потом тебе по приходу анкету распечатывают, ты ее подписываешь и не надо стоять в очереди.

pilot

Никто ещё не взялся сделать что-то вменяемое и свободное

http://citcity.ru/17265/

Ivan826

А теперь давайте посчитаемся :)
Сколько из нас пишет от руки печатными буквами? :) :) :) :)

feliks28

Я пишу.

fufa58

я обычно печатными анкеты заполняю, ибо письменный почерк даже большинство людей распознаёт с проблемами :D

kruzer25

Я.
Но у меня и печатные буквы страшно выглядят, а в том, что прописью написано, и я сам потом не разберусь на следующий день :crazy:

pilot

+1

rosali

> Рукописный ввод в маленьких компьютерах
специалисты в этой области говорят, что распознавание текста при написании - на порядок проще, чем после. потому что есть не только информация "где" провели ручкой, а "когда-где". и поэтому такая задача уже более менее решена.

Geddi-S

Да, потому что по сути работаем с временным сигналом, который кодируется тройками (t, x, y для которого можно легко применить гауссовы смеси и\или динамическое программирование (по крайней мере, так было так, когда я этим занимался)

tolval58

>А распознавание рукописных текстов, мне кажется, уже не будет актуальным
Да, в некотором далеком будущем будет неактуальным.
По прогнозам рынок распознавания адресов (на письмах, посылках и т.п.) и чеков (это которые из чековой книжки выдирают) должен был сократиться за последние годы. Но пока этого не происходит. Объясняется двумя причинами - консервативностью людей и тем, что в некоторых случаях пока не придумали способа удобней, чем писать бумажные письма и выписывать бумажные чеки.
Я попробую порассуждать про чеки, благо участвовал в разработке распознавателей американских, французских и индийских чеков в качестве менеджера проекта.
Интересна следующая тенденция. Кол-во чеков в мире тихонечко падает. Но большая их часть обрабатывается вручную. В крупный банк приходят десятки тысяч чеков в день. Это различные коммунальные платежи, расчеты за предоставленные услуги и т.п. У банка есть специальное отделение, которое занимается обработкой этих чеков.
Так вот доля автоматической обработки растет. Например, в Индии сейчас ни один из банков не использует автоматическую обработку чеков.
А скоро часть их будет пробовать нашу программу.
В целом рынок автоматической обработки чеков даже растет :) Хотя потенциал и падает.
Да, все, что я пишу, не относится к России.
Про удобство расплачиванием чеком в некоторых ситуациях (конечно, в большинстве случаев проще кредитной картой в инете).
-Врач присылает мне счет, но не говорит своих реквизитов, так как не хочет разглашать никакую информацию о себе. Я ему в ответ посылаю письмо с его счетом и моим чеком.
-Некоторые рабочие (мигранты в основном) не имеют банковского счета и нет другого способа им заплатить, как выписать чек.

tolval58

Начинание интересное, но сетование, что букву о и ноль пока не отличают - это лол. Как можно отличить рукописный ноль от рукописной 'о'?
Наверное, это шутка :-)
Буквы е и с отличать - тоже задача странная. Многие люди при быстром письме пишут их одинаково.
оказывает тип и размер шрифта отсканированного оригинала
Хотя тут речь про машинописные символы. Это не по теме :-)
Про заполнение форм из дома - так заполняется анкета в американское посольство - http://evisaforms.state.gov/ds156.asp
Организация процесса рулит. Жалко, что оптимизации работы с формами мешает консервативность и недалекость чиновников.
Будем надеяться, что поколение чиновников, с детства знакомых с компьютерами, поменяет ситуацию.
 
специалисты в этой области говорят, что распознавание текста при написании - на порядок проще, чем после. потому что есть не только информация "где" провели ручкой, а "когда-где". и поэтому такая задача уже более менее решена.
Да, распознать запись от руки на таблетке, - уже реальность. По крайней мере, ими хвастаются сотрудники из микрософт рисеч на конференциях. Правда, я не в курсе кто, зачем и сколько покупает программы для он-лайн распознавания рукописного текста.
Также дочка нашей компании - http://www.evernote.com использует он-лайн распознавание. Но я не думаю, что их программы покупают для этого.
Еще близко к распознаванию рукописного текста - верификация подлинности подписи. Как он-лайн (в магазине при расплате по кредитной карте так и офф-лайн (на отсканированном чеке). Тут коммерческий интерес понятен.

Oper

А распознавание рукописных текстов, мне кажется, уже не будет актуальным, поскольку уже сейчас все документы печатаются на компах.
:otk:

kruzer25

Как можно отличить рукописный ноль от рукописной 'о'?
По контексту.
Если ты видишь "1000" - вряд ли один из этих нулей - на самом деле буква "о".
А если видишь "лол" - то совершенно точно второй символ - именно "о", а не ноль.

Helga87

это уже не задача распознавания. Это задача постобработки, которая может быть различной в зависимости от того, какую цель мы преследуем и какой документ хотим распознать.

Dasar

> это уже не задача распознавания. Это задача постобработки,
задачу распознавания и задачу постобработки почти невозможно разделить, по крайней мере, даже у человека так не получается.

Helga87

1. Распознаем по букве (0 = О = O и пр).
2. Зная язык документа, типа документа угадываем, что именно за буквы у нас стоят.

kruzer25

Просто у тебя закостенелое мышление, и ты не можешь себе представить никакого возможного способа распознавания, кроме как "распознавать каждую букву по-новой, не обращая внимания на то, что уже распознано".
В общем-то, твои две стадии - это просто распознавание в два прохода, а не в один.

Dasar

> 1. Распознаем по букве (0 = О = O и пр).
есть уже проблема с этим, т.к. не зная контекста бывает сложно сказать - это одна буква, две или вообще мусор
> 2. Зная язык документа, типа документа угадываем, что именно за буквы у нас стоят.
это может сработать только если первый модуль будет передавать инфу вида: первая буква: о(русская) - 90%, о(английская) - 90%, 0 - 70%, c - 40%, u - 30% и т.д, а не просто - первая буква 'o'. т.к. во втором случае мы теряем довольно существенный объем информации.
кстати, если последить за человеком - то человек как раз при распознавании двигается от наиболее однозначных букв к наименнее однозначным.

tolval58

Я не внимательно прочитал описание гугловского распознавателя, но мне показалось, что речь идет именно о символьном распознавателе (распознаватель отдельных символов). Так что пример, с "1000" и "лол" хорош, но не относится к обсуждению качества символьного распознавателя.
Если символы довольно хорошо отделяются или слова короткие (а, значит, потенциальных разбиений немного то посимвольное распознавание с последующим наложением на контекст рулит. Если символы отделяют плохо, слова длинные и более того, разбиение на слова - сложная задача, то рулит распознавание без деление на символы и соответственно без символьного распознавания. Например, скрытые марковские модели (HMM).
Если начинать писать распознаватель, то, конечно, нужно начинать с простого - символьного.

Helga87

гугловского распознавателя
Скорее сказать, HP-шного. Гугл его только тупо купил и выложил в open source

tolval58

Да, человек чистит, сегментирует, распознает и накладывает на контекст одновременно. К сожалению, это довольно трудно симитировать в программе.
На деле, если контекст очень большой или сегментация простая, то проще распознать посимвольно, а потом уже отсеить варианты, не укладывающиеся в контекст.
Оставить комментарий
Имя или ник:
Комментарий: