Вопрос про нужность распознавания рукописного текста и образов.
Рукописный ввод в маленьких компьютерах (PDA, телефоны, коммуникаторы).
У кого какие мысли на этот счет?Приходишь ты в банк, там тебе дают бланк и просят заполнить Ф.И.О... Твои действия? Достать ручной принтер и напечтатать?
Приходишь ты в банк, там тебе дают бланк и просят заполнить Ф.И.О... Твои действия? Достать ручной принтер и напечтатать?Я бы предпочел провести скретч-картой через считыватель, чем заполнять анкету.
Или чтобы сотрудники банка сами все заполнили, а я им просто документы предоставил.
Я бы предпочел провести скретч-картой через считыватель, чем заполнять анкету.А цели кредита, например?
А цели кредита, например?Вслух продиктую, они заполнят, а я подпишу!
Кстати, распознавание речи было бы в тему.
Вслух продиктую, они заполнят, а я подпишу!Так с каждым цацкаться по пол часа будут.
а я подпишу!проведу картой через считыватель...
Страшно, что почти весь софт — проприетарный. Никто ещё не взялся сделать что-то вменяемое и свободное.
в идеале проще и дешевле: клаву с монитором поставить для ввода, чем разбирать рукописный текст - хотя бы проблема описки по ходу ввода намного проще решается
в идеале проще и дешевле: клаву с монитором поставить для ввода, чем разбирать рукописный текст - хотя бы проблема описки по ходу ввода намного проще решаетсяЭто если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.
Но детям писать от руки нужно, чтобы моск развивался.
Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.бугага
А почему ты смеёшься?
Большинство людей быстрее напишут, чем напечатают.Через двадцать лет повторишь?
Через двадцать лет повторишь?Через двадцать спокойно повторю.
Никто ещё не взялся сделать что-то вменяемое и свободноеА это потому, что задача еще плохо изучена и стандартных алгоритмов решения пока нет. Через пяток-другой диссертаций по этой теме может и появится что-то.
Через двадцать лет повторишь?Я знаю довольно много людей, профессионально использующих компьютерную клавиатуру уже 5-6 лет (в т.ч. программистов которые пишут быстрее, чем набирают. О том, как набирают люди, которые не используют клавиатуру профессионально, даже говорить не имеет смысла.
Что изменится через 20 лет?
Что изменится через 20 лет?То, что нынешние дети в большинстве случаев уже вполне прилично владеют клавиатурой.
А через 20 лет людей, у которых в детстве не было компьютера, будет уже довольно мало.
Это если ты там будешь что-то набивать. Большинство людей быстрее напишут, чем напечатают.Быстрее ошибутся и заново все перепишут? Мне на днях пришлось заполнять некую анкету, в ней как всегда ряд пунктов была неочевидна. В результате мне пришлось несколько раз заново заполнять. Было бы на компе - исправил бы только то, где ошибся.
Даже если я печатаю не очень быстро, мне выгодно, если я не боюсь не то написать - цена ошибки сильно снижается.
нынешние дети в большинстве случаев уже вполне прилично владеют клавиатуройГде статистика?
Быстрее ошибутся и заново все перепишут?О да, помню, как я в своей госконторе писал анкету сберовскую на карточку... заполнил - "а у вас тут ошибка в одной букве, исправить нельзя, переписывайте"... несколько часов на заполнение одного листа этой анкеты ушло
Кстати, в итоге меня пожалели, и написали все данные сами.
первое, что нашёл в яндексе по запросу "степень компьютеризации"
Блин, это же очевидно - пятнадцать лет назад компы были в основном только у семей гиков; а сейчас комп (хотя бы для гам) - практически у каждого школьника (в москве, по крайней мере).
UPD: и ещё - по крайней мере, динамика ясна; а эта "степень компьютеризации" - она довольно сильно растёт с уменьшением возраста (в разумных пределах).
Блин, это же очевидно - пятнадцать лет назад компы были в основном только у семей гиков; а сейчас комп (хотя бы для гам) - практически у каждого школьника (в москве, по крайней мере).
UPD: и ещё - по крайней мере, динамика ясна; а эта "степень компьютеризации" - она довольно сильно растёт с уменьшением возраста (в разумных пределах).
Где там написано, что люди хорошо умеют набирать? Быстрее, чем писать ручкой?
Это аксиома для человека, знакомого с компьютером. Набираешь ты 10 пальцами (пусть и не вслепую а пишешь одной рукой
Если с детства с ним работать, пусть даже практически только гамать - то по крайней мере не сильно медленнее будет.
Про это я уже писал выше.
Где статистика?+1, если москву в рассмотрение не брать, то в россии очень маленький процент знакомых с компом, в том числе и детей
Из республик бывшего СССР лучше всего дело с компьютеризированностью обстоит в Прибалтике – Эстония, Латвия и Литва занимают соответственно 35,38 и 66 места списка. Россия в этом рейтинге занимает 78 строчку – ровно между Ямайкой и Фиджи. У нас на каждую тысячу жителей приходится по 43,59 компьютера. Из других стран СНГ в список попали только Грузия и Украина – на 95 и 100 местах соответственно с показателями в 22 и 18 компьютеров на 1000 жителей.Примечательно, что по общему количеству используемых персональных ПК Россия находится в списке достаточно высоко, на 13 месте, правда и при этом этих самых компьютеров у нас все равно в 26 раз меньше, чем в США.
http://rating.rbc.ru/article.shtml?2004/09/20/774971
Быстрее ошибутся и заново все перепишут?С компом тоже будут свои проблемы. Вон в налоговой бумажки пишут параллельно до 50 человек. Ждать компьютера в таком случае придётся ну очччень долго, потому что их будет от силы 2-3, а разобраться с тем, что хочет от нас бюрократия, порой, просто нереально.
Чтобы не "заполнил бумажку, отнёс - тебе сказали, где жопа, переписал бумажку", а "заполняешь анкету, заполнил поле - тебе говорят, что неправильно поле заполнил".
2) Сколько там у нас городского населения, 50%?
3) Если в семье из 4 человек есть комп - значти, оба ребёнка в этой семье с ним знакомы.
Получается, что три года назад в среднем в каждой третьей городской семье был комп. А сейчас - гораздо больше.
заполнил бумажку, отнёс - тебе сказали, где жопа, переписал бумажку", а "заполняешь анкету, заполнил поле - тебе говорят, что неправильно поле заполнилТакой ИИ сделать тяжелее, чем распознавание текста.
У нас же всё забюрократизировано до предела, наверняка есть толстенный свод формальных требований к этой конкретной анкете.
А как это распределение компов по семьям считают, интересно?
1) "2004/09/20".ты считал тут процент "недомашних" компов?
2) Сколько там у нас городского населения, 50%?
3) Если в семье из 4 человек есть комп - значти, оба ребёнка в этой семье с ним знакомы.
Получается, что три года назад в среднем в каждой третьей городской семье был комп. А сейчас - гораздо больше.
Они там тоже учитывались?
Они там тоже учитывались?думаю, да
Это ненадолго. Нынешние дети с клавой и мышой обращаться учатся раньше, чем говорить.
При потоковой обработки все же быстрее если все будут писать, так как на всех компов не наставишь, не все умеют пользоваться. А если один человек в пол часа, то удобнее и дешевле наверно поставить комп или посадить девочку, которой все диктовать будут.
так как на всех компов не наставишьПочему?
Там, где сейчас столы - будут компы.
И дороже это дело и места больше занимает, где уместится один комп, там может сесть 2-3 человека.
И дороже это делоНе так уж и дороже, хламкомпы сейчас можно по тысяче рублей купить, хламмониторы - столько же.
где уместится один комп, там может сесть 2-3 человекаЭти люди, они же не просто сидеть должны.
Ждать компьютера в таком случае придётся ну очччень долготак комп и не нужен, нужен только мон + клава, или просто сенсорный мон.
тем паче - комп один на стол, а по периметру народ сидит и каждый в своем экране со своей клавой уже творит
или просто сенсорный монЗаипутся набирать.
По большому счету, надо не клавиатуры в такие места ставить, а систему чуть-чуть изменить: дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь. Потом нажимаешь "отправить форму". Приходишь к ним и только подпись ставишь на заботливо распечатанном ими листе. Очередей не будет совсем (поставить подпись - минута ручная проверка сведется к минимуму и тот, кто проверяет сидит в хороших условиях, а не в комнате, куда ломятся 100 человек, если тебе нахамили - это сразу видно по логам.
дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришьЭто - ещё через 20 лет, когда в каждом доме будет не только комп, но и нормальный интернет.
в Швейцарии уже местами так. Плюс, никто не говорит, что надо отменять классический способ. Просто сделать способ для тех, кто дружит с компами, выделить одно окошечко и дело заспорится - очереди даже из других, ручных окошек сильно уменьшится, т.к. в основном много времени на написание бумажек тратят именно компьютерно-грамотные.
По большому счету, надо не клавиатуры в такие места ставить, а систему чуть-чуть изменить: дома заполняешь анкету, если чо непонятно - по аське с тетенькой базаришь. Потом нажимаешь "отправить форму". Приходишь к ним и только подпись ставишь на заботливо распечатанном ими листе. Очередей не будет совсем (поставить подпись - минута ручная проверка сведется к минимуму и тот, кто проверяет сидит в хороших условиях, а не в комнате, куда ломятся 100 человек, если тебе нахамили - это сразу видно по логам.Отказать.
1. Когда все сразу могут заполнять что хотят - это же беспредел! Так никаких формуляров не хватит. А куда все это складывать, как разбирать? А кто будет принимать сразу столько решений по стольким бумагам?
2. К тому же, необходимо подумать о душевном равновесии работников. В данный момент они могут искусственно снизить бумажно-приемную способность своих ведомств (как то: в кабинет входить по одному, оформляться не менее двадцати минут, и вообще, с одиннадцати до четырех обеденный перерыв). Тем самым они дают понять посетителям, кто именно тут хозяин и сколько эти посетители стоят, в некотором роде компенсируют себе чувство собственной неполноценности, возникающее от бесполезности и неважности собственной работы.
Ввиду таких важных причин, отказ от традиционных форм документооборота в ближайшее время представляется нецелесообразным.
О да, помню, как я в своей госконторе писал анкету сберовскую на карточку... заполнил - "а у вас тут ошибка в одной букве, исправить нельзя, переписывайте"... несколько часов на заполнение одного листа этой анкеты ушлоОхренеть можно! Написать листок текста, не сделав ни одной ошибки - уже слабо.
Кстати, в итоге меня пожалели, и написали все данные сами.
1. Когда все сразу могут заполнять что хотят - это же беспредел! Так никаких формуляров не хватит. А куда все это складывать, как разбирать? А кто будет принимать сразу столько решений по стольким бумагам?
2. К тому же, необходимо подумать о душевном равновесии работников. В данный момент они могут искусственно снизить бумажно-приемную способность своих ведомств (как то: в кабинет входить по одному, оформляться не менее двадцати минут, и вообще, с одиннадцати до четырех обеденный перерыв). Тем самым они дают понять посетителям, кто именно тут хозяин и сколько эти посетители стоят, в некотором роде компенсируют себе чувство собственной неполноценности, возникающее от бесполезности и неважности собственной работы.
Ввиду таких важных причин, отказ от традиционных форм документооборота в ближайшее время представляется нецелесообразным.
написано, войдя в роль сотрудников нашего УО?
"Забавно" еще бывает, когда пытаешься чего-нибудь уточнить по этим листкам, а "тетенька" из окошка к заведующей бежит уточнить.
Написано по мотивам десяти (начиная с военкомата) лет всяких посещений.
"Забавно" еще бывает, когда пытаешься чего-нибудь уточнить по этим листкам, а "тетенька" из окошка к заведующей бежит уточнить.Ну, в моей ситуации такого не было, я собственно с заведующей и имел дело
На самом деле, большая часть косяков в том случае была из-за оечпяток.
даже если внизу такого экрана будет нарисована стандартная клава со стандартными размерами?
и монитор будет в виде столешницы наклоненной на 30 градусов.
Тактильные ощущения от клавы всё-таки пока что очень важны.
Надо в приемной комиссии МГУ ввести подобную систему. Заполняешь все в спокойной домашней обстановке. А потом тебе по приходу анкету распечатывают, ты ее подписываешь и не надо стоять в очереди.
Сколько из нас пишет от руки печатными буквами?
Я пишу.
я обычно печатными анкеты заполняю, ибо письменный почерк даже большинство людей распознаёт с проблемами
Но у меня и печатные буквы страшно выглядят, а в том, что прописью написано, и я сам потом не разберусь на следующий день
+1
специалисты в этой области говорят, что распознавание текста при написании - на порядок проще, чем после. потому что есть не только информация "где" провели ручкой, а "когда-где". и поэтому такая задача уже более менее решена.
Да, потому что по сути работаем с временным сигналом, который кодируется тройками (t, x, y для которого можно легко применить гауссовы смеси и\или динамическое программирование (по крайней мере, так было так, когда я этим занимался)
Да, в некотором далеком будущем будет неактуальным.
По прогнозам рынок распознавания адресов (на письмах, посылках и т.п.) и чеков (это которые из чековой книжки выдирают) должен был сократиться за последние годы. Но пока этого не происходит. Объясняется двумя причинами - консервативностью людей и тем, что в некоторых случаях пока не придумали способа удобней, чем писать бумажные письма и выписывать бумажные чеки.
Я попробую порассуждать про чеки, благо участвовал в разработке распознавателей американских, французских и индийских чеков в качестве менеджера проекта.
Интересна следующая тенденция. Кол-во чеков в мире тихонечко падает. Но большая их часть обрабатывается вручную. В крупный банк приходят десятки тысяч чеков в день. Это различные коммунальные платежи, расчеты за предоставленные услуги и т.п. У банка есть специальное отделение, которое занимается обработкой этих чеков.
Так вот доля автоматической обработки растет. Например, в Индии сейчас ни один из банков не использует автоматическую обработку чеков.
А скоро часть их будет пробовать нашу программу.
В целом рынок автоматической обработки чеков даже растет Хотя потенциал и падает.
Да, все, что я пишу, не относится к России.
Про удобство расплачиванием чеком в некоторых ситуациях (конечно, в большинстве случаев проще кредитной картой в инете).
-Врач присылает мне счет, но не говорит своих реквизитов, так как не хочет разглашать никакую информацию о себе. Я ему в ответ посылаю письмо с его счетом и моим чеком.
-Некоторые рабочие (мигранты в основном) не имеют банковского счета и нет другого способа им заплатить, как выписать чек.
Наверное, это шутка :-)
Буквы е и с отличать - тоже задача странная. Многие люди при быстром письме пишут их одинаково.
оказывает тип и размер шрифта отсканированного оригиналаХотя тут речь про машинописные символы. Это не по теме :-)
Про заполнение форм из дома - так заполняется анкета в американское посольство - http://evisaforms.state.gov/ds156.asp
Организация процесса рулит. Жалко, что оптимизации работы с формами мешает консервативность и недалекость чиновников.
Будем надеяться, что поколение чиновников, с детства знакомых с компьютерами, поменяет ситуацию.
специалисты в этой области говорят, что распознавание текста при написании - на порядок проще, чем после. потому что есть не только информация "где" провели ручкой, а "когда-где". и поэтому такая задача уже более менее решена.Да, распознать запись от руки на таблетке, - уже реальность. По крайней мере, ими хвастаются сотрудники из микрософт рисеч на конференциях. Правда, я не в курсе кто, зачем и сколько покупает программы для он-лайн распознавания рукописного текста.
Также дочка нашей компании - http://www.evernote.com использует он-лайн распознавание. Но я не думаю, что их программы покупают для этого.
Еще близко к распознаванию рукописного текста - верификация подлинности подписи. Как он-лайн (в магазине при расплате по кредитной карте так и офф-лайн (на отсканированном чеке). Тут коммерческий интерес понятен.
А распознавание рукописных текстов, мне кажется, уже не будет актуальным, поскольку уже сейчас все документы печатаются на компах.
Как можно отличить рукописный ноль от рукописной 'о'?По контексту.
Если ты видишь "1000" - вряд ли один из этих нулей - на самом деле буква "о".
А если видишь "лол" - то совершенно точно второй символ - именно "о", а не ноль.
это уже не задача распознавания. Это задача постобработки, которая может быть различной в зависимости от того, какую цель мы преследуем и какой документ хотим распознать.
задачу распознавания и задачу постобработки почти невозможно разделить, по крайней мере, даже у человека так не получается.
2. Зная язык документа, типа документа угадываем, что именно за буквы у нас стоят.
В общем-то, твои две стадии - это просто распознавание в два прохода, а не в один.
есть уже проблема с этим, т.к. не зная контекста бывает сложно сказать - это одна буква, две или вообще мусор
> 2. Зная язык документа, типа документа угадываем, что именно за буквы у нас стоят.
это может сработать только если первый модуль будет передавать инфу вида: первая буква: о(русская) - 90%, о(английская) - 90%, 0 - 70%, c - 40%, u - 30% и т.д, а не просто - первая буква 'o'. т.к. во втором случае мы теряем довольно существенный объем информации.
кстати, если последить за человеком - то человек как раз при распознавании двигается от наиболее однозначных букв к наименнее однозначным.
Если символы довольно хорошо отделяются или слова короткие (а, значит, потенциальных разбиений немного то посимвольное распознавание с последующим наложением на контекст рулит. Если символы отделяют плохо, слова длинные и более того, разбиение на слова - сложная задача, то рулит распознавание без деление на символы и соответственно без символьного распознавания. Например, скрытые марковские модели (HMM).
Если начинать писать распознаватель, то, конечно, нужно начинать с простого - символьного.
гугловского распознавателяСкорее сказать, HP-шного. Гугл его только тупо купил и выложил в open source
На деле, если контекст очень большой или сегментация простая, то проще распознать посимвольно, а потом уже отсеить варианты, не укладывающиеся в контекст.
Оставить комментарий
zrab
Про необходимость (читай - полезность) распознавания образов в будущем у меня ка-то нет сомнений. Первое, что бросается в голову - применение этого всего в робототехнике.А распознавание рукописных текстов, мне кажется, уже не будет актуальным, поскольку уже сейчас все документы печатаются на компах. Разве что - школьные тетради проверять вместо учителей.
У кого какие мысли на этот счет?