Поиск лица на видео изображении

tatius100

Надо написать програмную систему которая будет отслеживать лица на видео изображении и сохранять их в базу данных.
О цене договоримся.
тел. 89265896887
ICQ 145746295

Helga87

Задача какая — разработать такую технологию, чтобы можно было потом продавать другим или просто написать ПО, решающее эту задачу, заюзав по лицензии существующие технологии?
Видео высокого или низкого качества?
Задачу надо выполнять в реальном времени или "потом"?

tatius100

Задача:
Есть видео файл (формат впринципе любой доступный, может быть сжатый, это обсуждается)
Надо определить имеется ли изображение лица или нет в этом видео.
Если меется - выделить несколько кадров с изображением лица или само лицо и записать в удобоваримом формате.
Видео низкого качества, цветное. 640-480 или 320-240.
Можно пользоваться только опен сорс библиотеками. Возможны на начальном этапе ограничения (поиск только лиц без очков, усов, бород)
Программа не должна работать реал тайм, покрайней мере на данный момент.
Подробнее в аське.

amiantos

А стоит ли изобретать велосипед? Новая разработка будет стоить кучу денег! Есть уже готовые!
Когда был на CeBIT видел следующее:

tatius100

Нужны исходники и вменяемый код для дальнейшего развития системы.
Должен быть просто движок со многими ограничениями даже, это не сильно важно

Andbar

Нужны исходники и вменяемый код для дальнейшего развития системы.
не очень понял смысла предлога "и", но в любом случае это, скорее всего, будет весьма дорого стоить, если требуются все исходники, а не только заголовки к готовому движку.

Helga87

почему не купить библиотеку, которая умеет распознавать лица, и на ее основе строить уже нужную вам прикладную систему?
чем самодельная лучше покупной? или у вас много денег?

tatius100

Вобщем программа будет носить больше не прикладной, а исследовательский характер.
Желательно реализовать алгоритм поиска с использованием технологий нееросетей.
Времени разбираться самому в этом нет поэтому обратился может, кто уже занимался...
Меня не интересуют покупные варианты с закрытым кодом. Меня интересуют даже самый глючно работающий, но с кодом и вменяемыми пояснениями )

Helga87

Вобщем программа будет носить больше не прикладной, а исследовательский характер.
в смысле, учебный характер? диплом что ли на носу?

Alexander08

кароче чуваку надо диплом защитить. он решил на это пару папиных штук скинуть(на остальные забухать)

tatius100

Диплом к этому отношения не имеет, мне не интересуют домыслы для чего это нужно, интересует кто этим занимался и у кого есть конструктивные предложения, чесать языком можно и в других разделах. Если кто может помоч пишите в ПМ или звоните или в аську.

Kalya777

О цене договоримся.
у тебя денех не хватит

sbs-66

Прототип, работающий на нескольких подобранных демо-роликах обойдется в пару сотен тысяч долларов, думаю. Законченный, устойчиво работающий движок - несколько миллионов зелени. Это на мой дилетантский взгляд расценки. Сам я распознаванием объектов на изображениях не занимался.

Helga87

у тебя денех не хватит
если он работает в Нанотехе, может и хватит.

sbs-66

Но если ты это серьёзно и у тебя есть такие деньги, то могу набрать нужных людей и поруководить разработкой. :)

freezer

Прототип, работающий на нескольких подобранных демо-роликах обойдется в пару сотен тысяч долларов, думаю.

Да ну загнул! :) Гораздо дешевле.
Законченный, устойчиво работающий движок - несколько миллионов зелени.
ИМХО, в России можно и в несколько сот тысяч зелени уложиться. Но в любом случае это месяцы работы целой команды.

sbs-66

Тут, в общем-то, правило 20/80 работает. Всё зависит от допустимого процента ошибок первого и второго рода. Можно ведь тупо все фрагменты телесного цвета определённых размеров считать лицами. А можно выделять объекты и отслеживать динамику их движения, накладывать на них шаблоны и т.д. Понятно, что цена в зависимости от процента допустимых ошибок меняется от 0 до стоимости проекта по расшифровке принципов функционирования человеческого мозга.
Я под прототипом понимаю нечто, что в целом на некотором широком классе входных данных работает предсказуемо, но имеет какие-то систематические ошибки и в целом процент ошибок ощутимый. Ну, то есть мы сможем из настроечных примеров подобрать несколько, на которых ни одна из систематических ошибок не проявится, чтоб инвесторам продемонстрировать.
А готовый движок - это когда мы устранили все систематические ошибки (в частности, находим лица негров :) ) и боремся за понижение процента ошибок. Ну и уже достигли в этой борьбе каких-то результатов, когда уменьшение процента ошибок на 10% (типа, 0.45% вместо 0.5%) требует заметных усилий. Чтобы до этого этапа добраться, надо много денег вбухать.

freezer

> Понятно, что цена в зависимости от процента допустимых ошибок меняется от 0 до стоимости проекта по расшифровке принципов функционирования человеческого мозга.
На самом деле цена от процента ошибок вообще мало зависит. К сожалению, в таких вопросах маркетинг забарывает всё остальное, и проценты ошибок (днем/ночью/на неграх и т.д.) рисуют от балды.
> Я под прототипом понимаю нечто, что в целом на некотором широком классе входных данных работает предсказуемо, но имеет какие-то систематические ошибки и в целом процент ошибок ощутимый.
у чуваков, у которых стоит заказывать подобный продукт, скорее всего уже есть некий прототип, либо инструментарий, позволяющий его сделать в считанные недели. Так что 200к - это слишком много ;)

Kalya777

Не ну я готов себе представить, как искать лицо на статичной фотке. Типа применить фильтр высоких частот, добавить цветовые критерии и тд.
Но обрабатывать в реалтайме видео, отслеживая динамику, да еще и низкокачественное.... Есть мнение, что компьютер может заебаться

Boris1980

Все же свои многолетние наработки никто задешево не отдаст.
уже есть некий прототип, либо инструментарий, позволяющий его сделать в считанные недели

freezer

Все же свои многолетние наработки никто задешево не отдаст.
"многолетние наработки" - это не софтина, которая умеет хреново выделять морды лица, а набор функций или классов, с помощью которых можно решать подобные задачи, набор утилит для настройки, обучения, тестирования и т.д., а самое главное - набор людей, которые умеют решать подобные задачки с помощью всего этого инструментария. В комплект с прототипом это обычно не идёт.

freezer

Но обрабатывать в реалтайме видео, отслеживая динамику, да еще и низкокачественное....
да вот как раз с низкокачественным всё просто - там пикселей мало, а значит операций требуется меньше :) Другое дело, что хороший результат работы алгоритма никто не гарантирует.
Кстати, в подобных задачах нередко и используют даунсэмплинг: типа "ухудшают" цветной CIF4 до ч.б. 320*200, там что-то грубо ищут, а потом по оригиналу уточняют.

Kalya777

В том то и дело, что если оригинал хуевый, то с ним уже не поиграешься
А искать скорее всего надо не только на самом грубом, но и еще парочке разрешений, и уже рез-т сопоставлять. Хотя для динамики возможно хватит и одного оптимального разрешения

freezer

если оригинал хуевый
то даунсэмплинг не нужен :grin: Экономим на ippiResize ;)

Kalya777

Прелесть задачи заключается в том, что положительный результат не гарантирован
Можно потратить месяц на реализацию какого-то одного критерия поиска, который потом нифига не будет находить
Потратить еще месяц на реализацию другого критерия поиска, который опять же не будет работать
Сопоставимость этих критериев я даже не обсуждаю
И только спустя год, перепробовав кучу методов, можно стать гуру и находить в изображении не только глаза и рот, но и рога

freezer

так надо сразу нанимать гуру, которые ещё в 80-ых крылатые ракеты по камере наводили :) а не тех, кто на реализацию одного критерия месяц тратит

chirrsen

Алгоритмов для поиска лиц на изображении оч. много, поэтому придумывать особо много не нужно. Самым крутым на данный момент считается алгоритм Виолы и Джонса, который имеется в OpenCV. Который детектит негров и работает на черно-белых изображениях. Тут только проблемы с лицензиями и отсутствием исходного кода. Ну а вообще этот алгоритм можно реализовать и настроить за пару месяцев самому, статей по этой теме очень много...

sbs-66

На самом деле цена от процента ошибок вообще мало зависит. К сожалению, в таких вопросах маркетинг забарывает всё остальное, и проценты ошибок (днем/ночью/на неграх и т.д.) рисуют от балды.
Я говорю про цену разработки, а не цену лицензии конечного продукта.
у чуваков, у которых стоит заказывать подобный продукт, скорее всего уже есть некий прототип, либо инструментарий, позволяющий его сделать в считанные недели. Так что 200к - это слишком много
Я чё-то тебя не понял. Ты вот думаешь, что люди, которые имеют наработки в области распознавания лиц на видео, так просто за сотню тысяч отдадут тебе свои исходники и права на них? 100к - это примерно год работы одного более-менее хорошего программиста в России (включая налоги и содержание офиса). Это очень мало. Разработка таких интеллектуальных систем во-первых, довольно индивидуальна и под каждую задачу надо всё писать и обучать заново, накапливается только понимание, какие методы в той или иной ситуации использовать, а какие вероятно не дадут результата, да и то не всегда. А это понимание переиспользовать не очень эффективно получается. Серебряной пули под названием "общий механизм расспознавания всего и вся" не существует и таких наработок ни у кого нет. Все нейронные сети, про которые любят писать в статьях и рассказывать в университетах дают очень плохие результаты, которые принципиально нельзя улучшить (по крайней мере на многих классах задач; может где-то их и используют, но это точно не "серебрянная пуля").

tipnote

100к - это примерно год работы одного более-менее хорошего программиста в России (включая налоги и содержание офиса)
Имхо, промахнулся раза в два в большую сторону для "более-менее хорошего". Но сути не меняет.

evgen5555

Имхо, промахнулся раза в два в большую сторону для "более-менее хорошего".
Дык, офес-то содержать тоже надо :)

tipnote

12*3000*1,3+10*1000
И это я выделил достаточно много места прогеру не самого плохого офиса и определил бол-мен хорошего как "нормального" :D

freezer

Имхо, промахнулся раза в два в большую сторону для "более-менее хорошего".
а что, налоги не платим? ;)

freezer

Вот оно и сгодится в качестве прототипа. На то чтобы поискать и почитать статьи, закодить пример и т.д. 200к - это слишком большая наглость.

tipnote

Все учтено. :p

freezer

а какие щас зарплаты у хорошего программиста со знаниями в довольно узкой области?.. :o

freezer

Просто дело в том, что прототип особой практической ценности не представляет, даже если его передали с исходниками. Да и не будет там ничего особо интересного, кроме последовательности вызовов OpenCV или IPP, которые большинство разработчиков со стороны и не смогут улучшить и довести до ума.

tipnote

а какие щас зарплаты у хорошего программиста со знаниями в довольно узкой области
Это зависит от безумного количества факторов. Хор прогера с хор знаниями в области распознавания образов можно тупо не найти вообще. Максимум, чел в универе занимался. Все имхо, конечно.

freezer

Хор прогера с хор знаниями в области распознавания образов можно тупо не найти вообще.
ну вот в это не верю. Тупо, берёшь сотрудника из любой конторы, которая занимается распознаванием, и предлагаешь на треть больше, а лучше - на половину :) Ближайшая к ГЗ - это наверное ИСС. Тупо встаёшь, где народ курит, и вербуешь :grin:

tipnote

Тупо, берёшь сотрудника из любой конторы, которая занимается распознаванием
И много контор у нас тут серьезно занимаются распознаванием образов? Разработкой собственных технологий?

FRider

ВМК.

freezer

тебе сюда сходить надо: http://www.mips.ru

tipnote

В смысле препод контору замутил?

tipnote

И много там из участников в России работают (это я список участников проглядел)? И много из тех, что работают, действительно свои алгоритмы разрабатывают или реально улучшают существующие?

freezer

И много там из участников в России работают (это я список участников проглядел)?
не в курсе. Но несколько сотен программеров наберётся

tipnote

Хотелось бы цифр все же поточнее. Каков рынок таких прогеров в России. Мне окромя эбби и самсунга ничего в голову не приходит. Я, конечно же, могу ошибаться.

chirrsen

yuvsoft.com :)

karkar

yuvsoft.com :)
yuvsoft - это просто одно из лиц видеогруппы лаборатории маш.графики ВМК.
a.k.a. http://compression.ru/video
Когда через универ продавать слишком дорого, продают через yuvsoft.
Там студенты и аспиранты, работающие в стенах факультета без зарплаты и соцпакетов (а по контрактам, которые бывают иногда). Получается намного дешевле озвученных тут сумм.

lurgi48

Знаю место где лежат открытые исходники (GPL лицензия) библиотеки распознавания лиц.
Оставить комментарий
Имя или ник:
Комментарий: