Re: Студенты ВМК, разрешите спор (Программа по распознаванию текста)
1. За какое время нужно написать программу?
2. Надо ли ее писать с нуля или можно использовать уже имеющиеся чужие наработки?
Сразу возникают вопросы:1) Предпооложим, за месяц. (хотя можете писать и свои, допустимые для Вас даты)
1. За какое время нужно написать программу?
2. Надо ли ее писать с нуля или можно использовать уже имеющиеся чужие наработки?
2) С нуля. В Вашем распоряжении только стандартные команды языка программирования (допустим, С++ в т.ч. и команды, работающие с рисунками, разумеется.
если ну очень будет нужно, и будет описание всех алгоритмов и времени будет достаточно, то 10 процентов 3го потока напишут.
и будет описание всех алгоритмовЧто под этим понимается?
и времени будет достаточно
А под этим что понимается?
В ответ на:Что 3-ий поток не знает алгоритмов
и будет описание всех алгоритмов
Что под этим понимается?
Если нужно, чтобы работало как FineReader, то напишут 0%.
Если известен шрифт и количество шумов небольшое, то задача сводится к последовательному применению определенных фильтров и маски. Пишется это за день.
А если требуется правой рукой левое ухо почесать через затылок, то тут уже сложнее...
Он говорит, что процентов 10 студентов (не выпускников!) ВМК со страрших курсов смогли бы написать программу по распознаванию такой картинки.Для конкретного генератора картинок — почти наверняка да. Для произвольного текста — нет.
конечно, тут напрямую всё зависит от качества входных данных.Думаю, если я понял правильно, никакой шрифт неизвестен, картинка- любая из ряда тех, которые предстают перед нами, когда мы, скажем, регистрируемся в форуме или где- либо в другом месте.
Если известен шрифт и количество шумов небольшое, то задача сводится к последовательному применению определенных фильтров и маски. Пишется это за день.
Для конкретного генератора картинок — почти наверняка да. Для произвольного текста — нет.Да-да, именно для произвольного генератора картинок, который поставляет ЛЮБЫЕ буквенно- цифровые картинки, легко различимые для человеческого глаза, но которые на мой взгляд, сложно распознать с помощью компа: разная высота символов, разный их цвет, разный цвет их пикселей (пикселей, из которых состоят символы) и произвольное их расположение, которое, однако(повторюсь дает четкую и однозначную картинку для человека.
Ни о какой последовательности и закономерности в действиях генератора студенту неизвестно, разве что он сам ее случайно или намеренно нашел.
Ага. Заюзают какую-нибудь OCR-библиотеку.
2) С нуля. В Вашем распоряжении только стандартные команды языка программирования (допустим, С++ в т.ч. и команды, работающие с рисунками, разумеется.
Кроме того, покажи мне OCR библиотеку, которая одновременно сумеет распознать картинки на yandex.ru, mail.ru и gmail.com
Я к тому, что писать такое с нуля никто не будет.
В жизни — конечно. А тут человека интересует какая-то абстрактная истина.
Кроме того, покажи мне OCR библиотеку, которая одновременно сумеет распознать картинки на yandex.ru, mail.ru и gmail.comЕсли долго мучаться, то gocr может помочь (не уверен).
OCR-библиотекуА что это за библиотека такая? Аж интересно стало.
OCR-библиотекуА что это за библиотека такая? Аж интересно стало.
gocr
а это что за зверь?
P.S. Ссылки можете дать? Интересно почитать, что это такое в принципе.
Из OpenSource-проектов наиболее развитый — gocr (как оказалось, это старое название. Теперь они называются jocr, т. к. существует другой проект с таким же названием).
http://jocr.sourceforge.net
Если задачу серьезно не формализовать в том смысле какая допустимая погрешность и т.п. то думаю половина людей, кто нормально слушал курсы по Распознаванию образов сможет за неделю написать. И не важно какой поток, особых программистких навыков тут не надо.
Я вот не давно для проекта делал сравнение алгоритмов распознавания - на простейшие методы уходит пару часов (правда мне пару месяцев назад это читали но тем не менее. На нормальных тренировочных данных почти все алгоритмы для такой задачи будут работать хорошо (KNN, Neural Networks, Logistic Regression etc.)
нейронные сети привлекать для такой задачи.
да не каждый человек может прочитать что там рапида сгенерила. а если NN научится такое делать, это скайнет будет какой-то.
NN это делать давным-давно умеют, причем работают с картинками, где зашумленность повыше, чем на рапиде...
слушал курсы по Распознаванию образов сможет за неделю написатьА их на ВМК читают разве? Если да, то расшарьте в элктронном виде, пожалуйста, интересно ознакомиться. Или подскажите, что можно прочитать.
к сожалению на ВМК мне не читали этот курс, не моя кафедра была. А в Канаде вот прослушал такой курс по базовым алгоритмам, могу дать ссылку, если интересно.
во-первых, я не сказал что это оптимально, во-вторых, применять их очень даже можно, на таких данных с хорошей обучающей выборкой и регуляризацией все будет ок.
Пипец, скоро на форумах на слух будем регистрироваться.
к сожалению на ВМК мне не читали этот курс, не моя кафедра была. А в Канаде вот прослушал такой курс по базовым алгоритмам, могу дать ссылку, если интересно.А дайте, если не тяжело . Особенно здорово будет, если там все по-русски, но можно и по-английски .
Пипец, скоро на форумах на слух будем регистрироваться.
Шо вы имели этим сказать ?
Спасибо!
там тыкаешь, а тебе буквы говорят в наушники
Пишется это за день.мегареспект и низкий поклон
NN это делать давным-давно умеют, причем работают с картинками, где зашумленность повыше, чем на рапиде...если бы всё было так замечательно, никто бы не парился с "методом порносайтов" для взламывания CAPTCHA
для решения нужно тупо распознать коэффициенты
то сначала распознать что это текст
потом распознать что это мат выражение
потом распознать что это за мат выражение
потом решить
несколько сложнее, не так ли
там уже известно, что это квадратное уравнение, известен шрифт и порядок в котором идут коэффициенты. достаточно порезать на цифры, распознать их и ввести ответ.
на cmc-msu, насколько я понял, это защита не от программ, а от совсем левых людей. Хотя таких, что не умеют решать квадратное уравнение, все же немного.
Если не квадратичное уравнение, обновляем
Там нужно прочитать подсказку и найти в гугле теорему Виета.
Там _можно_ не решать квадратное уравнение — если знаешь теорему Виета. Если не знаешь, то _достаточно_ решить квадратное уравнение. Т.е. пролетают те, кто либо не знает ни теоремы Виета, ни как решать квадратное уравнение, либо тех, кого ваще заломало чо-то делать.
Я сказал "более общая задача"
Это значит, что мы пишем ломалку под любой текст на картинке
Там _можно_ не решать квадратное уравнение — если знаешь теорему Виета. Если не знаешь, то _достаточно_ решить квадратное уравнение. Т.е. пролетают те, кто либо не знает ни теоремы Виета, ни как решать квадратное уравнение, либо тех, кого ваще заломало чо-то делать.Найти теорему Виета в гугле, даже если не знаешь её, проще, чем решить квадратное уравнение. Там же коэффициенты совершенно ебанутые!
В реальной жизни достаточно написать/иметь более-менее универсальный ocr и для каждого сервиса, где при регистрации что-то надо распознавать, немного обрабатывать напильником. При таком подходе регистрация на cmc-msu — совсем не проблема.
Буду контрить
А зачем нам более общая задача?
Так ты ж решаешь задачу тьюринга уже.
>> Буду контрить
Наглая ложь.
---
"Аллах бла-бла-бла".
Ладно, меня никто не понялИ наоборот! Ты никого не понял.
А можно пример, что ли?
У тебя есть OCR которая автоматически обработает себя напильником для каждой новой задачи?
Слава роботам!
Чтоб жить стало интересней! Жить стало веселей!
Найти теорему Виета в гугле, даже если не знаешь её, проще, чем решить квадратное уравнение. Там же коэффициенты совершенно ебанутые!а =)
да, тогда пролетают те, кто:
1. не знают теоремы Виета
2. не умеют гуглить
3. не умеют решать квадратные уравнения
ВанекНеа. Есть OCR, которую я (или кто-то другой) может обработать напильником, подготовив входные данные. Подключение нового сервиса — это относительно редкая операция по сравнению с созданием учетных записей. Автоматизировать подключение не обязательно.
У тебя есть OCR которая автоматически обработает себя напильником для каждой новой задачи?
Что решаем уже две задачи
А не одну
Поэтому решение сложнее, так как сложнее предположить что нам подсунули
Впрочем, оно и так сложнее, если уравнение надо решать автоматически и мат выражение может быть любым
Но так как всего этого нет - то я буду контрить
т.е. ты сам себе усложнил жизнь, сформулировав более общую задачу, решение которой тебе почти ничего не даст?
Я просто сказал
Что решаем уже две задачи
Про более общую задачу вроде бы твои слова
Да! Но меня никто не понял и я опустился до обобщения только на два класса задач, а не на все
а =)а я знаю людей, которые вроде бы умеют гуглить, но, найдя теорему Виета, всё-таки не поймут что с ней делать
да, тогда пролетают те, кто:
1. не знают теоремы Виета
2. не умеют гуглить
3. не умеют решать квадратные уравнения
еще есть категории: знают теорему Виета, не умеют применять; умеют решать кв. уравнения, не умеют складывать корни уравнения; все в математике знают, не умеют читать по-русски и другие не менее важные категории граждан
Главное, чтобы пролетали спам-роботы, заточенные под phpBB.
Тут согласен
Фантастика была про андроида на борту космического корабля. Андроид тест проходил на запуск в серию, поэтому он проинтуичил что ему надо ситуацию создать хреновую и потом типа всех спасти, кто остался в живых. Они его вычислили по смерельному манёвру - андроид жить захотел, самосохранение, а людям было пофиг.
Фантастика была про андроида на борту космического корабля. Андроид тест проходил на запуск в серию, поэтому он проинтуичил что ему надо ситуацию создать хреновую и потом типа всех спасти, кто остался в живых. Они его вычислили по смерельному манёвру - андроид жить захотел, самосохранение, а людям было пофиг.Как потерялся робот?
хотя не, там были просто роботы
Смешной фильмец, в меру дебильный как весь Голливуд. Но кое о чём поразмышлять даёт пищу. Например, если как говорят закон Мура будет продолжать действовать ещё 20 лет, то комп за $1000 будет умнее человека. Как мы тогда на форумах-мейлах регистриться будем? Очевидно кто тупой и не решил задачку распознавания образов, тот и нормальный человек, а кто пытается прогу написать и всё тут выпытывает (о, прикол, три ы в слове) - тот злобный хакер и спамер. Достали своим мусором в майле. Одному держателю порносайта недавно пожизненное что ли дали. Может и до спамеров руки дойдут.
По дороге там благодаря ему да частично специально так в поясе астероидов неувязались (там астероиды прямо кишмя кишели ) ну и поставили 10-13g что ли, вобщем у всех кровь пошла и прочее. И робот не выдержал, вскочил и побежал к здоровому РУБИЛЬНИКУ который движок отключает, это у них так корабль был устроен. А они ещё прибавили газу, ну он и не дотянулся - руки оторвались - нефиг было за поручень держаться.Эмм... Я вроде подобный советский фильм видел.
Смешной фильмец, в меру дебильный как весь Голливуд.
можно поподробнее про распознавание квадратных уравнений - это реально где-то используется для регистрации? дайте сцылку - посмотреть хочу
Лет через надцать логическим завершением этой гонки снаряд-броня будет ситуация, когда никто из людей не сможет зарегистрироваться.Могу предложить ещё вариант, забавный причём.
Недавно один чувак писал, что приделал к своему стандалон блогу изумительную каптчу: юзеру нужно просто скопировать данное число в поле ввода. Фишка в том, что конкретно такой каптчи он, автор, нигде не видел, а вероятность того, что кому-то захочется писать Специальный Скрипт чтобы спамить его конкретный блог, стремится к нулю.
Поэтому вариант такой: человечество придумывает и использует несколько миллионов разных каптчей (причём они меняются при первом подозрении на спам придумывание каптчей становится чем-то вроде приятного вечернего времяпрепровождения/популярного искусства, код спамботов перестаёт влезать в память среднестатистического компа, ура, победа Разума над Интеллектом!
Поэтому вариант такой: человечество придумывает и использует несколько миллионов разных каптчей (причём они меняются при первом подозрении на спам придумывание каптчей становится чем-то вроде приятного вечернего времяпрепровождения/популярного искусства, код спамботов перестаёт влезать в память среднестатистического компа, ура, победа Разума над Интеллектом!ну да, я вот недавно просто надпись перевернул в каптче от phpBB2 и спамеры исчезли.
код спамботов перестаёт влезать в память среднестатистического компа
Ага, ага. Билл Гейтс тоже как-то говорил лет надцать назад, что трудно себе представить кому может понадобится оперативка больше 128 Kb.
Его лавры лучшего прогнозиста в области ИТ покоя не дают?
Билл Гейтс тоже как-то говорил лет надцать назад, что трудно себе представить кому может понадобится оперативка больше 128 Kb.
"Лет надцать назад" уже NT разрабатывали, между прочим.
Я так слышал, что как-то в начале 1960 начали по Трансибу вторую колею тянуть, и встала проблема рядом с действующей жд на реках мосты ставить. Так оказалось фундамент под второй путь царские инженеры поставили еще в то время. Нехилая была страна, не на ближайшие выборы и не о своём кармане ребята думали. Не то что нынешнее плямя-семя-вымя-бремя.
Вот я например не против бы 2 жены иметь. А фиг. В Киеве 1000 лет назад кто-то решил, что мы христиане.
Где-то на анекдот ру хохма была весьма правдоподобная, про размер баков Шатла равный ширине двух лошадиных задниц в древнем Риме. Найди и порадуйся.
Во-вторых, если я всё правильно понимаю, Гейтс там вообще ничего не решал, это ж специфика real mode, который как бы от процессора зависит, причём до 386 никакой особой альтернативы вроде и не было. Более того, даже весь этот безумный геморрой с верхней памятью (из-за которого доступно именно 640к, а не метр) тоже вовсе не Гейтс организовал, а какой-то хитрожопый инженер из IBM, который замапил видеопамять на адрес A000:0000 (железно на системной плате).
Так что говорить-то он, может, и говорил, но это уже постфактум было.
Во-третьих, многие приличные люди думали, что уж четырёх-то гигов памяти точно всем хватит, ан нет =)
> они ведь не просто так на 16 разрядную архитектуру заложились в MS-DOS
А на что ещё им было закладываться, интересно?
> А на что ещё им было закладываться, интересно?
У мотороллеров, наверное, уже была 24-разрядная шина адреса,
но надо проверить, "as is".
---
...Я работаю антинаучным аферистом...
У мотороллеров, наверное, уже была 24-разрядная шина адреаса,Ыыыы. Чувак, M$ разрабатывала дос эксклюзивно для IBM, по крайней мере сначала. Они им деньги платили. Какие мотороллеры, о чём ты?
Кстате я немножко нагнал, какой-то защищённый режим появился уже в 286, но real-mode программы в нём не работали, ибо для перехода обратно требовалась перезагрузка =)
И вообще, нужно понимать, что ДОС - это не операционная система в современном понимании, это драйвер файловой системы плюс командный интерпретатор, упрощённо говоря. Довольно большую часть всяких штук можно (а иногда и нужно) было делать напрямую через биос и порты.
> система в современном понимании, это драйвер файловой
> системы плюс командный интерпретатор, упрощённо говоря.
А что такое файл?
Можно --- в современном понимании.
---
...Я работаю антинаучным аферистом...
А вообще вот из словаря англо-русского. 1-й смысл напильник, 5-й - ловкач. Насильники-напильники, я их всё время путаю. А тебе какой смысл больше нравится?
file I 1. noun 1) tech. напильник 2) пилочка (для ногтей) 3) отделка, поли-
ровка - need the file 4) оглобля, дышло 5) sl. ловкач - close file - old file
- deep file 2. v. 1) пилить, подпиливать 2) отделывать (стиль и т. п.) - file
away - file down - file for - file out II 1. noun 1) скоросшиватель (для бу-
маг); шпилька (для накалывания бумаг) 2) подшитые бумаги, дело; досье 3) под-
шивка (газет) 4) картотека 2. v. 1) регистрировать и хранить (документы) в ка-
ком-л. определенном порядке; подшивать к делу (тж. file away) 2) сдавать в ар-
хив 3) amer. представлять, подавать какой-л. документ to file resignation -
подать заявление об отставке 4) принять заказ к исполнению III 1. noun; mil.
1) ряд, шеренга; колонна (людей) a file of men - два бойца blank (full) file -
неполный (полный) ряд to march in file - идти (в колонне) по два in single/in
Indian file - гуськом, по одному 2) chess вертикаль 3) очередь, хвост 4) attr.
- file leader - file closer 2. v. идти гуськом; передвигать(ся) колонной -
file in
file away запоминать I'll file his name away for future use.
file cabinet = file II 1. 4)
file closer замыкающий
file down спиливать, обрабатывать, отшлифовывать The door won't fit, you'll
have to file it down.
file for а) начинать судебный процесс The actor's wife has filed for
divorce again. б) amer. предлагать свои услуги (официально) How many people
have filed for this office?
file in входить шеренгой
file leader головной ряда, головной колонны по одному
file off I v. спиливать, обрабатывать, отшлифовывать II v. уходить гуськом,
по одному, по два
file out идти друг за другом When there is a fire, it is important that
people file out of the building in an orderly way.
file-cutter noun насекальщик напильников
Оставить комментарий
erasurecom
Сразу говорю, что тред может показаться глупым, но тем не менее:Дана картинка с цифрами и буквами, цифры и буквы разных размеров и цветов, более того, различные части этой цифры (буквы) состоят из различных перемешанных пикселей. Человеческий глаз такую картинку различает легко.
У нас со знакомым зашел спор. Он говорит, что процентов 10 студентов (не выпускников!) ВМК со страрших курсов смогли бы написать программу по распознаванию такой картинки. А я говорю, что вряд ли.
Ваши комментарии .