Вопрос про нужность распознавания рукописного текста и образов.

zrab

Про необходимость (читай - полезность) распознавания образов в будущем у меня ка-то нет сомнений. Первое, что бросается в голову - применение этого всего в робототехнике.
А распознавание рукописных текстов, мне кажется, уже не будет актуальным, поскольку уже сейчас все документы печатаются на компах. Разве что - школьные тетради проверять вместо учителей.
У кого какие мысли на этот счет?

nikita270601

Рукописный ввод в маленьких компьютерах (PDA, телефоны, коммуникаторы).

kokoc88

У кого какие мысли на этот счет?

Приходишь ты в банк, там тебе дают бланк и просят заполнить Ф.И.О... Твои действия? Достать ручной принтер и напечтатать? :grin:

nikita270601

Приходишь ты в банк, там тебе дают бланк и просят заполнить Ф.И.О... Твои действия? Достать ручной принтер и напечтатать?

Я бы предпочел провести скретч-картой через считыватель, чем заполнять анкету.

Или чтобы сотрудники банка сами все заполнили, а я им просто документы предоставил.

kokoc88

Я бы предпочел провести скретч-картой через считыватель, чем заполнять анкету.

А цели кредита, например?

nikita270601

А цели кредита, например?

Вслух продиктую, они заполнят, а я подпишу!

nikita270601

Кстати, распознавание речи было бы в тему.

kokoc88

Вслух продиктую, они заполнят, а я подпишу!

Так с каждым цацкаться по пол часа будут.

Alexander08

а я подпишу!

проведу картой через считыватель... :cool:

Werdna

Да, нужная, очень плохо изученная тема, и почти не реализованная.
Страшно, что почти весь софт — проприетарный. Никто ещё не взялся сделать что-то вменяемое и свободное. :mad:

Dasar

> А цели кредита, например?
в идеале проще и дешевле: клаву с монитором поставить для ввода, чем разбирать рукописный текст - хотя бы проблема описки по ходу ввода намного проще решается

kokoc88

в идеале проще и дешевле: клаву с монитором поставить для ввода, чем разбирать рукописный текст - хотя бы проблема описки по ходу ввода намного проще решается

Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.

kruzer25

Но детям писать от руки нужно, чтобы моск развивался.

uncle17

Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.

бугага

nikita270601

А почему ты смеёшься?

kruzer25

Большинство людей быстрее напишут, чем напечатают.

Через двадцать лет повторишь?

kokoc88

Через двадцать лет повторишь?

Через двадцать спокойно повторю.

Oper

Никто ещё не взялся сделать что-то вменяемое и свободное

А это потому, что задача еще плохо изучена и стандартных алгоритмов решения пока нет. Через пяток-другой диссертаций по этой теме может и появится что-то.

nikita270601

Через двадцать лет повторишь?

Я знаю довольно много людей, профессионально использующих компьютерную клавиатуру уже 5-6 лет (в т.ч. программистов которые пишут быстрее, чем набирают. О том, как набирают люди, которые не используют клавиатуру профессионально, даже говорить не имеет смысла.
Что изменится через 20 лет?

kruzer25

Что изменится через 20 лет?

То, что нынешние дети в большинстве случаев уже вполне прилично владеют клавиатурой.
А через 20 лет людей, у которых в детстве не было компьютера, будет уже довольно мало.

Helga87

Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.

Быстрее ошибутся и заново все перепишут? Мне на днях пришлось заполнять некую анкету, в ней как всегда ряд пунктов была неочевидна. В результате мне пришлось несколько раз заново заполнять. Было бы на компе - исправил бы только то, где ошибся.
Даже если я печатаю не очень быстро, мне выгодно, если я не боюсь не то написать - цена ошибки сильно снижается.

nikita270601

нынешние дети в большинстве случаев уже вполне прилично владеют клавиатурой

Где статистика?

kruzer25

Быстрее ошибутся и заново все перепишут?

О да, помню, как я в своей госконторе писал анкету сберовскую на карточку... заполнил - "а у вас тут ошибка в одной букве, исправить нельзя, переписывайте"... несколько часов на заполнение одного листа этой анкеты ушло :crazy:

Кстати, в итоге меня пожалели, и написали все данные сами.

kruzer25

первое, что нашёл в яндексе по запросу "степень компьютеризации"
Блин, это же очевидно - пятнадцать лет назад компы были в основном только у семей гиков; а сейчас комп (хотя бы для гам) - практически у каждого школьника (в москве, по крайней мере).
UPD: и ещё - по крайней мере, динамика ясна; а эта "степень компьютеризации" - она довольно сильно растёт с уменьшением возраста (в разумных пределах).

nikita270601

Где там написано, что люди хорошо умеют набирать? Быстрее, чем писать ручкой?

uncle17

конечно, быстрее
Это аксиома для человека, знакомого с компьютером. Набираешь ты 10 пальцами (пусть и не вслепую а пишешь одной рукой

kruzer25

Ты так говоришь, как будто никогда дела с компьютером не имел.
Если с детства с ним работать, пусть даже практически только гамать - то по крайней мере не сильно медленнее будет.

nikita270601

Про это я уже писал выше.

Alexander08

Где статистика?

+1, если москву в рассмотрение не брать, то в россии очень маленький процент знакомых с компом, в том числе и детей

Из республик бывшего СССР лучше всего дело с компьютеризированностью обстоит в Прибалтике – Эстония, Латвия и Литва занимают соответственно 35,38 и 66 места списка. Россия в этом рейтинге занимает 78 строчку – ровно между Ямайкой и Фиджи. У нас на каждую тысячу жителей приходится по 43,59 компьютера. Из других стран СНГ в список попали только Грузия и Украина – на 95 и 100 местах соответственно с показателями в 22 и 18 компьютеров на 1000 жителей.Примечательно, что по общему количеству используемых персональных ПК Россия находится в списке достаточно высоко, на 13 месте, правда и при этом этих самых компьютеров у нас все равно в 26 раз меньше, чем в США.

http://rating.rbc.ru/article.shtml?2004/09/20/774971

kokoc88

Быстрее ошибутся и заново все перепишут?

С компом тоже будут свои проблемы. Вон в налоговой бумажки пишут параллельно до 50 человек. Ждать компьютера в таком случае придётся ну очччень долго, потому что их будет от силы 2-3, а разобраться с тем, что хочет от нас бюрократия, порой, просто нереально.

kruzer25

Заодно и автоматическую проверку полей по мере ввода прикрутят.
Чтобы не "заполнил бумажку, отнёс - тебе сказали, где жопа, переписал бумажку", а "заполняешь анкету, заполнил поле - тебе говорят, что неправильно поле заполнил".

kruzer25

1) "2004/09/20".
2) Сколько там у нас городского населения, 50%?
3) Если в семье из 4 человек есть комп - значти, оба ребёнка в этой семье с ним знакомы.
Получается, что три года назад в среднем в каждой третьей городской семье был комп. А сейчас - гораздо больше.

kokoc88

заполнил бумажку, отнёс - тебе сказали, где жопа, переписал бумажку", а "заполняешь анкету, заполнил поле - тебе говорят, что неправильно поле заполнил

Такой ИИ сделать тяжелее, чем распознавание текста.

kruzer25

Ну почему же?
У нас же всё забюрократизировано до предела, наверняка есть толстенный свод формальных требований к этой конкретной анкете.

feliks28

А как это распределение компов по семьям считают, интересно?

Alexander08

1) "2004/09/20".
2) Сколько там у нас городского населения, 50%?
3) Если в семье из 4 человек есть комп - значти, оба ребёнка в этой семье с ним знакомы.
Получается, что три года назад в среднем в каждой третьей городской семье был комп. А сейчас - гораздо больше.

ты считал тут процент "недомашних" компов?

kruzer25

Нет.
Они там тоже учитывались? :crazy:

Alexander08

Они там тоже учитывались?

думаю, да

Marinavo_0507

> Большинство людей быстрее напишут, чем напечатают.
Это ненадолго. Нынешние дети с клавой и мышой обращаться учатся раньше, чем говорить.

Reves2

При потоковой обработки все же быстрее если все будут писать, так как на всех компов не наставишь, не все умеют пользоваться. А если один человек в пол часа, то удобнее и дешевле наверно поставить комп или посадить девочку, которой все диктовать будут.

kruzer25

так как на всех компов не наставишь

Почему?
Там, где сейчас столы - будут компы.

Reves2

И дороже это дело и места больше занимает, где уместится один комп, там может сесть 2-3 человека.

kruzer25

И дороже это дело

Не так уж и дороже, хламкомпы сейчас можно по тысяче рублей купить, хламмониторы - столько же.

где уместится один комп, там может сесть 2-3 человека

Эти люди, они же не просто сидеть должны.

Dasar

Ждать компьютера в таком случае придётся ну очччень долго

так комп и не нужен, нужен только мон + клава, или просто сенсорный мон.

uncle17

во-во
тем паче - комп один на стол, а по периметру народ сидит и каждый в своем экране со своей клавой уже творит

kruzer25

или просто сенсорный мон

Заипутся набирать.

Helga87

По большому счету, надо не клавиатуры в такие места ставить, а систему чуть-чуть изменить: дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь. Потом нажимаешь "отправить форму". Приходишь к ним и только подпись ставишь на заботливо распечатанном ими листе. Очередей не будет совсем (поставить подпись - минута ручная проверка сведется к минимуму и тот, кто проверяет сидит в хороших условиях, а не в комнате, куда ломятся 100 человек, если тебе нахамили - это сразу видно по логам.

kruzer25

дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь

Это - ещё через 20 лет, когда в каждом доме будет не только комп, но и нормальный интернет.

Helga87

в Швейцарии уже местами так. Плюс, никто не говорит, что надо отменять классический способ. Просто сделать способ для тех, кто дружит с компами, выделить одно окошечко и дело заспорится - очереди даже из других, ручных окошек сильно уменьшится, т.к. в основном много времени на написание бумажек тратят именно компьютерно-грамотные.

apl13

По большому счету, надо не клавиатуры в такие места ставить, а систему чуть-чуть изменить: дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь. Потом нажимаешь "отправить форму". Приходишь к ним и только подпись ставишь на заботливо распечатанном ими листе. Очередей не будет совсем (поставить подпись - минута ручная проверка сведется к минимуму и тот, кто проверяет сидит в хороших условиях, а не в комнате, куда ломятся 100 человек, если тебе нахамили - это сразу видно по логам.

Отказать.
1. Когда все сразу могут заполнять что хотят - это же беспредел! Так никаких формуляров не хватит. А куда все это складывать, как разбирать? А кто будет принимать сразу столько решений по стольким бумагам?
2. К тому же, необходимо подумать о душевном равновесии работников. В данный момент они могут искусственно снизить бумажно-приемную способность своих ведомств (как то: в кабинет входить по одному, оформляться не менее двадцати минут, и вообще, с одиннадцати до четырех обеденный перерыв). Тем самым они дают понять посетителям, кто именно тут хозяин и сколько эти посетители стоят, в некотором роде компенсируют себе чувство собственной неполноценности, возникающее от бесполезности и неважности собственной работы.
Ввиду таких важных причин, отказ от традиционных форм документооборота в ближайшее время представляется нецелесообразным.

stream2008

О да, помню, как я в своей госконторе писал анкету сберовскую на карточку... заполнил - "а у вас тут ошибка в одной букве, исправить нельзя, переписывайте"... несколько часов на заполнение одного листа этой анкеты ушло
Кстати, в итоге меня пожалели, и написали все данные сами.

Охренеть можно! Написать листок текста, не сделав ни одной ошибки - уже слабо. :crazy:

SCIF32

1. Когда все сразу могут заполнять что хотят - это же беспредел! Так никаких формуляров не хватит. А куда все это складывать, как разбирать? А кто будет принимать сразу столько решений по стольким бумагам?
2. К тому же, необходимо подумать о душевном равновесии работников. В данный момент они могут искусственно снизить бумажно-приемную способность своих ведомств (как то: в кабинет входить по одному, оформляться не менее двадцати минут, и вообще, с одиннадцати до четырех обеденный перерыв). Тем самым они дают понять посетителям, кто именно тут хозяин и сколько эти посетители стоят, в некотором роде компенсируют себе чувство собственной неполноценности, возникающее от бесполезности и неважности собственной работы.
Ввиду таких важных причин, отказ от традиционных форм документооборота в ближайшее время представляется нецелесообразным.

написано, войдя в роль сотрудников нашего УО?

feliks28

Учитывая полнейшее отсутствие манов и факов по этим листам, а так же встречаемые без пояснений "адрес 1", "адрес 2", то нормальному человеку, которому все эти тонкости только раз в 20 лет нужны, слабо, да.
"Забавно" еще бывает, когда пытаешься чего-нибудь уточнить по этим листкам, а "тетенька" из окошка к заведующей бежит уточнить.

apl13

Товарищ, у вас есть возражения?

Написано по мотивам десяти (начиная с военкомата) лет всяких посещений.

kruzer25

"Забавно" еще бывает, когда пытаешься чего-нибудь уточнить по этим листкам, а "тетенька" из окошка к заведующей бежит уточнить.

Ну, в моей ситуации такого не было, я собственно с заведующей и имел дело

На самом деле, большая часть косяков в том случае была из-за оечпяток.

Dasar

> Заипутся набирать.
даже если внизу такого экрана будет нарисована стандартная клава со стандартными размерами?
и монитор будет в виде столешницы наклоненной на 30 градусов.

kruzer25

Да.
Тактильные ощущения от клавы всё-таки пока что очень важны.

Vladislav177Rus

Надо в приемной комиссии МГУ ввести подобную систему. Заполняешь все в спокойной домашней обстановке. А потом тебе по приходу анкету распечатывают, ты ее подписываешь и не надо стоять в очереди.

pilot

Никто ещё не взялся сделать что-то вменяемое и свободное

http://citcity.ru/17265/

Ivan826

А теперь давайте посчитаемся

Сколько из нас пишет от руки печатными буквами?

feliks28

Я пишу.

fufa58

я обычно печатными анкеты заполняю, ибо письменный почерк даже большинство людей распознаёт с проблемами

kruzer25

Я.
Но у меня и печатные буквы страшно выглядят, а в том, что прописью написано, и я сам потом не разберусь на следующий день :crazy:

pilot

rosali

> Рукописный ввод в маленьких компьютерах
специалисты в этой области говорят, что распознавание текста при написании - на порядок проще, чем после. потому что есть не только информация "где" провели ручкой, а "когда-где". и поэтому такая задача уже более менее решена.

Geddi-S

Да, потому что по сути работаем с временным сигналом, который кодируется тройками (t, x, y для которого можно легко применить гауссовы смеси и\или динамическое программирование (по крайней мере, так было так, когда я этим занимался)

tolval58

>А распознавание рукописных текстов, мне кажется, уже не будет актуальным
Да, в некотором далеком будущем будет неактуальным.
По прогнозам рынок распознавания адресов (на письмах, посылках и т.п.) и чеков (это которые из чековой книжки выдирают) должен был сократиться за последние годы. Но пока этого не происходит. Объясняется двумя причинами - консервативностью людей и тем, что в некоторых случаях пока не придумали способа удобней, чем писать бумажные письма и выписывать бумажные чеки.
Я попробую порассуждать про чеки, благо участвовал в разработке распознавателей американских, французских и индийских чеков в качестве менеджера проекта.
Интересна следующая тенденция. Кол-во чеков в мире тихонечко падает. Но большая их часть обрабатывается вручную. В крупный банк приходят десятки тысяч чеков в день. Это различные коммунальные платежи, расчеты за предоставленные услуги и т.п. У банка есть специальное отделение, которое занимается обработкой этих чеков.
Так вот доля автоматической обработки растет. Например, в Индии сейчас ни один из банков не использует автоматическую обработку чеков.
А скоро часть их будет пробовать нашу программу.
В целом рынок автоматической обработки чеков даже растет

Хотя потенциал и падает.
Да, все, что я пишу, не относится к России.
Про удобство расплачиванием чеком в некоторых ситуациях (конечно, в большинстве случаев проще кредитной картой в инете).
-Врач присылает мне счет, но не говорит своих реквизитов, так как не хочет разглашать никакую информацию о себе. Я ему в ответ посылаю письмо с его счетом и моим чеком.
-Некоторые рабочие (мигранты в основном) не имеют банковского счета и нет другого способа им заплатить, как выписать чек.

tolval58

Начинание интересное, но сетование, что букву о и ноль пока не отличают - это лол. Как можно отличить рукописный ноль от рукописной 'о'?
Наверное, это шутка :-)
Буквы е и с отличать - тоже задача странная. Многие люди при быстром письме пишут их одинаково.

оказывает тип и размер шрифта отсканированного оригинала

Хотя тут речь про машинописные символы. Это не по теме :-)
Про заполнение форм из дома - так заполняется анкета в американское посольство - http://evisaforms.state.gov/ds156.asp
Организация процесса рулит. Жалко, что оптимизации работы с формами мешает консервативность и недалекость чиновников.
Будем надеяться, что поколение чиновников, с детства знакомых с компьютерами, поменяет ситуацию.

специалисты в этой области говорят, что распознавание текста при написании - на порядок проще, чем после. потому что есть не только информация "где" провели ручкой, а "когда-где". и поэтому такая задача уже более менее решена.

Да, распознать запись от руки на таблетке, - уже реальность. По крайней мере, ими хвастаются сотрудники из микрософт рисеч на конференциях. Правда, я не в курсе кто, зачем и сколько покупает программы для он-лайн распознавания рукописного текста.
Также дочка нашей компании - http://www.evernote.com использует он-лайн распознавание. Но я не думаю, что их программы покупают для этого.
Еще близко к распознаванию рукописного текста - верификация подлинности подписи. Как он-лайн (в магазине при расплате по кредитной карте так и офф-лайн (на отсканированном чеке). Тут коммерческий интерес понятен.

Oper

А распознавание рукописных текстов, мне кажется, уже не будет актуальным, поскольку уже сейчас все документы печатаются на компах.

kruzer25

Как можно отличить рукописный ноль от рукописной 'о'?

По контексту.
Если ты видишь "1000" - вряд ли один из этих нулей - на самом деле буква "о".
А если видишь "лол" - то совершенно точно второй символ - именно "о", а не ноль.

Helga87

это уже не задача распознавания. Это задача постобработки, которая может быть различной в зависимости от того, какую цель мы преследуем и какой документ хотим распознать.

Dasar

> это уже не задача распознавания. Это задача постобработки,
задачу распознавания и задачу постобработки почти невозможно разделить, по крайней мере, даже у человека так не получается.

Helga87

1. Распознаем по букве (0 = О = O и пр).
2. Зная язык документа, типа документа угадываем, что именно за буквы у нас стоят.

kruzer25

Просто у тебя закостенелое мышление, и ты не можешь себе представить никакого возможного способа распознавания, кроме как "распознавать каждую букву по-новой, не обращая внимания на то, что уже распознано".
В общем-то, твои две стадии - это просто распознавание в два прохода, а не в один.

Dasar

> 1. Распознаем по букве (0 = О = O и пр).
есть уже проблема с этим, т.к. не зная контекста бывает сложно сказать - это одна буква, две или вообще мусор
> 2. Зная язык документа, типа документа угадываем, что именно за буквы у нас стоят.
это может сработать только если первый модуль будет передавать инфу вида: первая буква: о(русская) - 90%, о(английская) - 90%, 0 - 70%, c - 40%, u - 30% и т.д, а не просто - первая буква 'o'. т.к. во втором случае мы теряем довольно существенный объем информации.
кстати, если последить за человеком - то человек как раз при распознавании двигается от наиболее однозначных букв к наименнее однозначным.

tolval58

Я не внимательно прочитал описание гугловского распознавателя, но мне показалось, что речь идет именно о символьном распознавателе (распознаватель отдельных символов). Так что пример, с "1000" и "лол" хорош, но не относится к обсуждению качества символьного распознавателя.
Если символы довольно хорошо отделяются или слова короткие (а, значит, потенциальных разбиений немного то посимвольное распознавание с последующим наложением на контекст рулит. Если символы отделяют плохо, слова длинные и более того, разбиение на слова - сложная задача, то рулит распознавание без деление на символы и соответственно без символьного распознавания. Например, скрытые марковские модели (HMM).
Если начинать писать распознаватель, то, конечно, нужно начинать с простого - символьного.

Helga87

гугловского распознавателя

Скорее сказать, HP-шного. Гугл его только тупо купил и выложил в open source

tolval58

Да, человек чистит, сегментирует, распознает и накладывает на контекст одновременно. К сожалению, это довольно трудно симитировать в программе.
На деле, если контекст очень большой или сегментация простая, то проще распознать посимвольно, а потом уже отсеить варианты, не укладывающиеся в контекст.

Оставить комментарий