Re: Студенты ВМК, разрешите спор (Программа по распознаванию текста)

erasurecom

Сразу говорю, что тред может показаться глупым, но тем не менее:
Дана картинка с цифрами и буквами, цифры и буквы разных размеров и цветов, более того, различные части этой цифры (буквы) состоят из различных перемешанных пикселей. Человеческий глаз такую картинку различает легко.
У нас со знакомым зашел спор. Он говорит, что процентов 10 студентов (не выпускников!) ВМК со страрших курсов смогли бы написать программу по распознаванию такой картинки. А я говорю, что вряд ли.
Ваши комментарии .

qsk78

Сразу возникают вопросы:
1. За какое время нужно написать программу?
2. Надо ли ее писать с нуля или можно использовать уже имеющиеся чужие наработки?

erasurecom

Сразу возникают вопросы:
1. За какое время нужно написать программу?
2. Надо ли ее писать с нуля или можно использовать уже имеющиеся чужие наработки?
1) Предпооложим, за месяц. (хотя можете писать и свои, допустимые для Вас даты)
2) С нуля. В Вашем распоряжении только стандартные команды языка программирования (допустим, С++ в т.ч. и команды, работающие с рисунками, разумеется.

tashka

если ну очень будет нужно, и будет описание всех алгоритмов и времени будет достаточно, то 10 процентов 3го потока напишут.

erasurecom

и будет описание всех алгоритмов
Что под этим понимается?
и времени будет достаточно

А под этим что понимается?

Sebasten

В ответ на:
и будет описание всех алгоритмов
Что под этим понимается?
Что 3-ий поток не знает алгоритмов

qsk78

Если картинка наподобие тех, которые ставятся при регистрации на сайте и т. д. (небольшая картинка, 3-5 искаженных символов то есть если есть какие-то дополнительные сведения о свойствах изображения, думаю 7% напишут так, что распознаваться будет с вероятностью 0.95. И вовсе необязательно это будут люди с третьего потока. По-моему тут лучше тем, у кого есть курс "Распознавание образов", это вроде на МФ проходят.
Если нужно, чтобы работало как FineReader, то напишут 0%.

koly

конечно, тут напрямую всё зависит от качества входных данных.
Если известен шрифт и количество шумов небольшое, то задача сводится к последовательному применению определенных фильтров и маски. Пишется это за день.
А если требуется правой рукой левое ухо почесать через затылок, то тут уже сложнее...

Helga87

Он говорит, что процентов 10 студентов (не выпускников!) ВМК со страрших курсов смогли бы написать программу по распознаванию такой картинки.
Для конкретного генератора картинок — почти наверняка да. Для произвольного текста — нет.

erasurecom

конечно, тут напрямую всё зависит от качества входных данных.
Если известен шрифт и количество шумов небольшое, то задача сводится к последовательному применению определенных фильтров и маски. Пишется это за день.
Думаю, если я понял правильно, никакой шрифт неизвестен, картинка- любая из ряда тех, которые предстают перед нами, когда мы, скажем, регистрируемся в форуме или где- либо в другом месте.
Для конкретного генератора картинок — почти наверняка да. Для произвольного текста — нет.
Да-да, именно для произвольного генератора картинок, который поставляет ЛЮБЫЕ буквенно- цифровые картинки, легко различимые для человеческого глаза, но которые на мой взгляд, сложно распознать с помощью компа: разная высота символов, разный их цвет, разный цвет их пикселей (пикселей, из которых состоят символы) и произвольное их расположение, которое, однако(повторюсь дает четкую и однозначную картинку для человека.
Ни о какой последовательности и закономерности в действиях генератора студенту неизвестно, разве что он сам ее случайно или намеренно нашел.

sinet

>Для произвольного текста — нет.
Ага. Заюзают какую-нибудь OCR-библиотеку.

Helga87

В задании сказано, что
2) С нуля. В Вашем распоряжении только стандартные команды языка программирования (допустим, С++ в т.ч. и команды, работающие с рисунками, разумеется.

Кроме того, покажи мне OCR библиотеку, которая одновременно сумеет распознать картинки на yandex.ru, mail.ru и gmail.com

sinet

Я к тому, что писать такое с нуля никто не будет.

Helga87

В жизни — конечно. А тут человека интересует какая-то абстрактная истина.

qsk78

Кроме того, покажи мне OCR библиотеку, которая одновременно сумеет распознать картинки на yandex.ru, mail.ru и gmail.com
Если долго мучаться, то gocr может помочь (не уверен).

erasurecom

OCR-библиотеку
А что это за библиотека такая? Аж интересно стало.

erasurecom

OCR-библиотеку
А что это за библиотека такая? Аж интересно стало.
gocr

а это что за зверь?
P.S. Ссылки можете дать? Интересно почитать, что это такое в принципе.

qsk78

OCR — Optical Character Recognition.
Из OpenSource-проектов наиболее развитый — gocr (как оказалось, это старое название. Теперь они называются jocr, т. к. существует другой проект с таким же названием).
http://jocr.sourceforge.net

Peace123

+1
Если задачу серьезно не формализовать в том смысле какая допустимая погрешность и т.п. то думаю половина людей, кто нормально слушал курсы по Распознаванию образов сможет за неделю написать. И не важно какой поток, особых программистких навыков тут не надо.
Я вот не давно для проекта делал сравнение алгоритмов распознавания - на простейшие методы уходит пару часов (правда мне пару месяцев назад это читали но тем не менее. На нормальных тренировочных данных почти все алгоритмы для такой задачи будут работать хорошо (KNN, Neural Networks, Logistic Regression etc.)

Marusetta

да уж, сказанул
нейронные сети привлекать для такой задачи.
да не каждый человек может прочитать что там рапида сгенерила. а если NN научится такое делать, это скайнет будет какой-то.

Dimon89

NN это делать давным-давно умеют, причем работают с картинками, где зашумленность повыше, чем на рапиде...

erasurecom

слушал курсы по Распознаванию образов сможет за неделю написать
А их на ВМК читают разве? Если да, то расшарьте в элктронном виде, пожалуйста, интересно ознакомиться. Или подскажите, что можно прочитать.

Peace123

к сожалению на ВМК мне не читали этот курс, не моя кафедра была. А в Канаде вот прослушал такой курс по базовым алгоритмам, могу дать ссылку, если интересно.

Peace123

во-первых, я не сказал что это оптимально, во-вторых, применять их очень даже можно, на таких данных с хорошей обучающей выборкой и регуляризацией все будет ок.

Anna74

Пипец, скоро на форумах на слух будем регистрироваться.

erasurecom

к сожалению на ВМК мне не читали этот курс, не моя кафедра была. А в Канаде вот прослушал такой курс по базовым алгоритмам, могу дать ссылку, если интересно.
А дайте, если не тяжело . Особенно здорово будет, если там все по-русски, но можно и по-английски .
Пипец, скоро на форумах на слух будем регистрироваться.

Шо вы имели этим сказать ?

Peace123

ессно по английски
лекции

erasurecom

Спасибо!

Maurog

уже есть такие.
там тыкаешь, а тебе буквы говорят в наушники

Maurog

Пишется это за день.
мегареспект и низкий поклон

poi1981

NN это делать давным-давно умеют, причем работают с картинками, где зашумленность повыше, чем на рапиде...
если бы всё было так замечательно, никто бы не парился с "методом порносайтов" для взламывания CAPTCHA

karkar

Когда я учился на ВМК, у нас на втором курсе было задание по машграфу - на сильно зашумленной картинке распознать монеты. Делали все. Но там, конечно, проще было.
PS. На самом ВМК капчи посложнее:
http://forum.cmc-msu.ru/profile.php?mode=register&agreed...

evgen5555

чё там сложного?
для решения нужно тупо распознать коэффициенты

tipnote

Если брать общую задачу
то сначала распознать что это текст
потом распознать что это мат выражение
потом распознать что это за мат выражение
потом решить
несколько сложнее, не так ли

Helga87

ч0?
там уже известно, что это квадратное уравнение, известен шрифт и порядок в котором идут коэффициенты. достаточно порезать на цифры, распознать их и ввести ответ.
на cmc-msu, насколько я понял, это защита не от программ, а от совсем левых людей. Хотя таких, что не умеют решать квадратное уравнение, все же немного.

evgen5555

Вообще-то, тут даже и распознавать ничего не надо, "прикладываешь трафарет", и всё выражение можно зараз слопать
Если не квадратичное уравнение, обновляем

nikita270601

Там не нужно решать квадратное уравнение.
Там нужно прочитать подсказку и найти в гугле теорему Виета.

Helga87

Там _можно_ не решать квадратное уравнение — если знаешь теорему Виета. Если не знаешь, то _достаточно_ решить квадратное уравнение. Т.е. пролетают те, кто либо не знает ни теоремы Виета, ни как решать квадратное уравнение, либо тех, кого ваще заломало чо-то делать.

tipnote

Не тупи
Я сказал "более общая задача"
Это значит, что мы пишем ломалку под любой текст на картинке

nikita270601

Там _можно_ не решать квадратное уравнение — если знаешь теорему Виета. Если не знаешь, то _достаточно_ решить квадратное уравнение. Т.е. пролетают те, кто либо не знает ни теоремы Виета, ни как решать квадратное уравнение, либо тех, кого ваще заломало чо-то делать.
Найти теорему Виета в гугле, даже если не знаешь её, проще, чем решить квадратное уравнение. Там же коэффициенты совершенно ебанутые!

Helga87

В реальной жизни достаточно написать/иметь более-менее универсальный ocr и для каждого сервиса, где при регистрации что-то надо распознавать, немного обрабатывать напильником. При таком подходе регистрация на cmc-msu — совсем не проблема.

tipnote

Ладно, меня никто не понял
Буду контрить

nikita270601

А зачем нам более общая задача?

evgen5555

Так ты ж решаешь задачу тьюринга уже.

nikita270601

>> Ладно, меня никто не понял
>> Буду контрить
Наглая ложь.
---
"Аллах бла-бла-бла".

Helga87

Ладно, меня никто не понял
И наоборот! Ты никого не понял.

sbs-66

А можно пример, что ли?

tipnote

Ванек
У тебя есть OCR которая автоматически обработает себя напильником для каждой новой задачи?
Слава роботам!

tipnote

Чтоб жить стало интересней! Жить стало веселей!

Helga87

Найти теорему Виета в гугле, даже если не знаешь её, проще, чем решить квадратное уравнение. Там же коэффициенты совершенно ебанутые!
а =)
да, тогда пролетают те, кто:
1. не знают теоремы Виета
2. не умеют гуглить
3. не умеют решать квадратные уравнения

Helga87

Ванек
У тебя есть OCR которая автоматически обработает себя напильником для каждой новой задачи?
Неа. Есть OCR, которую я (или кто-то другой) может обработать напильником, подготовив входные данные. Подключение нового сервиса — это относительно редкая операция по сравнению с созданием учетных записей. Автоматизировать подключение не обязательно.

tipnote

Я просто сказал
Что решаем уже две задачи
А не одну
Поэтому решение сложнее, так как сложнее предположить что нам подсунули
Впрочем, оно и так сложнее, если уравнение надо решать автоматически и мат выражение может быть любым
Но так как всего этого нет - то я буду контрить

Helga87

т.е. ты сам себе усложнил жизнь, сформулировав более общую задачу, решение которой тебе почти ничего не даст?

evgen5555



Я просто сказал
Что решаем уже две задачи

Про более общую задачу вроде бы твои слова

tipnote

Да! Но меня никто не понял и я опустился до обобщения только на два класса задач, а не на все

ava3443

а =)
да, тогда пролетают те, кто:
1. не знают теоремы Виета
2. не умеют гуглить
3. не умеют решать квадратные уравнения
а я знаю людей, которые вроде бы умеют гуглить, но, найдя теорему Виета, всё-таки не поймут что с ней делать

Helga87

на этом месте надо сделать многозначительное лицо и протянуть: да-а-а, жизнь — сложная штука.
еще есть категории: знают теорему Виета, не умеют применять; умеют решать кв. уравнения, не умеют складывать корни уравнения; все в математике знают, не умеют читать по-русски и другие не менее важные категории граждан

karkar

Главное, чтобы пролетали спам-роботы, заточенные под phpBB.

Helga87

Тут согласен

Anna74

Лет через надцать логическим завершением этой гонки снаряд-броня будет ситуация, когда никто из людей не сможет зарегистрироваться. Только роботы. И тогда кто смог - тот и робот. И его не пущать.
Фантастика была про андроида на борту космического корабля. Андроид тест проходил на запуск в серию, поэтому он проинтуичил что ему надо ситуацию создать хреновую и потом типа всех спасти, кто остался в живых. Они его вычислили по смерельному манёвру - андроид жить захотел, самосохранение, а людям было пофиг.

Andbar

Фантастика была про андроида на борту космического корабля. Андроид тест проходил на запуск в серию, поэтому он проинтуичил что ему надо ситуацию создать хреновую и потом типа всех спасти, кто остался в живых. Они его вычислили по смерельному манёвру - андроид жить захотел, самосохранение, а людям было пофиг.
Как потерялся робот?
хотя не, там были просто роботы

Anna74

Там его на космический корабль спецом посадили, чтобы проверить. Экипажу кто есть who не сказали, тесты все у него как у людей. Летели они к Юпитеру что ли куда то. И стал им робот подстраивать одну подлянку за другой. Когда бы все умерли - он бы один бы там выжил и или всю экспедицию спасёт.Или наоборот НАСА увидит, что он неувязался, и в серию не запустит - тогда он будет один такой уникальный на белом свете, его не собирались уничтожить. По дороге там благодаря ему да частично специально так в поясе астероидов неувязались (там астероиды прямо кишмя кишели ) ну и поставили 10-13g что ли, вобщем у всех кровь пошла и прочее. И робот не выдержал, вскочил и побежал к здоровому РУБИЛЬНИКУ который движок отключает, это у них так корабль был устроен. А они ещё прибавили газу, ну он и не дотянулся - руки оторвались - нефиг было за поручень держаться.
Смешной фильмец, в меру дебильный как весь Голливуд. Но кое о чём поразмышлять даёт пищу. Например, если как говорят закон Мура будет продолжать действовать ещё 20 лет, то комп за $1000 будет умнее человека. Как мы тогда на форумах-мейлах регистриться будем? Очевидно кто тупой и не решил задачку распознавания образов, тот и нормальный человек, а кто пытается прогу написать и всё тут выпытывает (о, прикол, три ы в слове) - тот злобный хакер и спамер. Достали своим мусором в майле. Одному держателю порносайта недавно пожизненное что ли дали. Может и до спамеров руки дойдут.

Andbar

По дороге там благодаря ему да частично специально так в поясе астероидов неувязались (там астероиды прямо кишмя кишели ) ну и поставили 10-13g что ли, вобщем у всех кровь пошла и прочее. И робот не выдержал, вскочил и побежал к здоровому РУБИЛЬНИКУ который движок отключает, это у них так корабль был устроен. А они ещё прибавили газу, ну он и не дотянулся - руки оторвались - нефиг было за поручень держаться.
Смешной фильмец, в меру дебильный как весь Голливуд.
Эмм... Я вроде подобный советский фильм видел.

elenangel

можно поподробнее про распознавание квадратных уравнений - это реально где-то используется для регистрации? дайте сцылку - посмотреть хочу

bleyman

Лет через надцать логическим завершением этой гонки снаряд-броня будет ситуация, когда никто из людей не сможет зарегистрироваться.
Могу предложить ещё вариант, забавный причём.
Недавно один чувак писал, что приделал к своему стандалон блогу изумительную каптчу: юзеру нужно просто скопировать данное число в поле ввода. Фишка в том, что конкретно такой каптчи он, автор, нигде не видел, а вероятность того, что кому-то захочется писать Специальный Скрипт чтобы спамить его конкретный блог, стремится к нулю.
Поэтому вариант такой: человечество придумывает и использует несколько миллионов разных каптчей (причём они меняются при первом подозрении на спам придумывание каптчей становится чем-то вроде приятного вечернего времяпрепровождения/популярного искусства, код спамботов перестаёт влезать в память среднестатистического компа, ура, победа Разума над Интеллектом!

slonishka

Поэтому вариант такой: человечество придумывает и использует несколько миллионов разных каптчей (причём они меняются при первом подозрении на спам придумывание каптчей становится чем-то вроде приятного вечернего времяпрепровождения/популярного искусства, код спамботов перестаёт влезать в память среднестатистического компа, ура, победа Разума над Интеллектом!
ну да, я вот недавно просто надпись перевернул в каптче от phpBB2 и спамеры исчезли.

Anna74

код спамботов перестаёт влезать в память среднестатистического компа

Ага, ага. Билл Гейтс тоже как-то говорил лет надцать назад, что трудно себе представить кому может понадобится оперативка больше 128 Kb.
Его лавры лучшего прогнозиста в области ИТ покоя не дают?

evgen5555

Билл Гейтс тоже как-то говорил лет надцать назад, что трудно себе представить кому может понадобится оперативка больше 128 Kb.

"Лет надцать назад" уже NT разрабатывали, между прочим.

Anna74

Значит это было лет два-надцать назад. Он серьёзно такое говорил, они ведь не просто так на 16 разрядную архитектуру заложились в MS-DOS. Всякие там проблемы 2000 из всяких таких непродуманных решений принятых офигеть как много лет назад и вылезают.
Я так слышал, что как-то в начале 1960 начали по Трансибу вторую колею тянуть, и встала проблема рядом с действующей жд на реках мосты ставить. Так оказалось фундамент под второй путь царские инженеры поставили еще в то время. Нехилая была страна, не на ближайшие выборы и не о своём кармане ребята думали. Не то что нынешнее плямя-семя-вымя-бремя.
Вот я например не против бы 2 жены иметь. А фиг. В Киеве 1000 лет назад кто-то решил, что мы христиане.
Где-то на анекдот ру хохма была весьма правдоподобная, про размер баков Шатла равный ширине двух лошадиных задниц в древнем Риме. Найди и порадуйся.

bleyman

Во-первых, не 128к, а 640к.
Во-вторых, если я всё правильно понимаю, Гейтс там вообще ничего не решал, это ж специфика real mode, который как бы от процессора зависит, причём до 386 никакой особой альтернативы вроде и не было. Более того, даже весь этот безумный геморрой с верхней памятью (из-за которого доступно именно 640к, а не метр) тоже вовсе не Гейтс организовал, а какой-то хитрожопый инженер из IBM, который замапил видеопамять на адрес A000:0000 (железно на системной плате).
Так что говорить-то он, может, и говорил, но это уже постфактум было.
Во-третьих, многие приличные люди думали, что уж четырёх-то гигов памяти точно всем хватит, ан нет =)
> они ведь не просто так на 16 разрядную архитектуру заложились в MS-DOS
А на что ещё им было закладываться, интересно?

Ivan8209

>> они ведь не просто так на 16 разрядную архитектуру заложились в MS-DOS
> А на что ещё им было закладываться, интересно?
У мотороллеров, наверное, уже была 24-разрядная шина адреса,
но надо проверить, "as is".
---
...Я работаю антинаучным аферистом...

bleyman

У мотороллеров, наверное, уже была 24-разрядная шина адреаса,
Ыыыы. Чувак, M$ разрабатывала дос эксклюзивно для IBM, по крайней мере сначала. Они им деньги платили. Какие мотороллеры, о чём ты?
Кстате я немножко нагнал, какой-то защищённый режим появился уже в 286, но real-mode программы в нём не работали, ибо для перехода обратно требовалась перезагрузка =)
И вообще, нужно понимать, что ДОС - это не операционная система в современном понимании, это драйвер файловой системы плюс командный интерпретатор, упрощённо говоря. Довольно большую часть всяких штук можно (а иногда и нужно) было делать напрямую через биос и порты.

Ivan8209

> И вообще, нужно понимать, что ДОС - это не операционная
> система в современном понимании, это драйвер файловой
> системы плюс командный интерпретатор, упрощённо говоря.
А что такое файл?
Можно --- в современном понимании.
---
...Я работаю антинаучным аферистом...

Anna74

Файл - папка для бумаг, дело. Изобрёл Юлий Цезарь в своих посланиях Сенату, когда придавал своим посланиям вид книжечки со страничками, до него все писали просто отдельные листочки. Источник - Светоний, Жизнь 12 цезарей.
А вообще вот из словаря англо-русского. 1-й смысл напильник, 5-й - ловкач. Насильники-напильники, я их всё время путаю. А тебе какой смысл больше нравится?
 
file I 1. noun 1) tech. напильник 2) пилочка (для ногтей) 3) отделка, поли-
ровка - need the file 4) оглобля, дышло 5) sl. ловкач - close file - old file
- deep file 2. v. 1) пилить, подпиливать 2) отделывать (стиль и т. п.) - file
away - file down - file for - file out II 1. noun 1) скоросшиватель (для бу-
маг); шпилька (для накалывания бумаг) 2) подшитые бумаги, дело; досье 3) под-
шивка (газет) 4) картотека 2. v. 1) регистрировать и хранить (документы) в ка-
ком-л. определенном порядке; подшивать к делу (тж. file away) 2) сдавать в ар-
хив 3) amer. представлять, подавать какой-л. документ to file resignation -
подать заявление об отставке 4) принять заказ к исполнению III 1. noun; mil.
1) ряд, шеренга; колонна (людей) a file of men - два бойца blank (full) file -
неполный (полный) ряд to march in file - идти (в колонне) по два in single/in
Indian file - гуськом, по одному 2) chess вертикаль 3) очередь, хвост 4) attr.
- file leader - file closer 2. v. идти гуськом; передвигать(ся) колонной -
file in
file away запоминать I'll file his name away for future use.
file cabinet = file II 1. 4)
file closer замыкающий
file down спиливать, обрабатывать, отшлифовывать The door won't fit, you'll
have to file it down.
file for а) начинать судебный процесс The actor's wife has filed for
divorce again. б) amer. предлагать свои услуги (официально) How many people
have filed for this office?
file in входить шеренгой
file leader головной ряда, головной колонны по одному
file off I v. спиливать, обрабатывать, отшлифовывать II v. уходить гуськом,
по одному, по два
file out идти друг за другом When there is a fire, it is important that
people file out of the building in an orderly way.
file-cutter noun насекальщик напильников
Оставить комментарий
Имя или ник:
Комментарий: