Правомерно ли парсить html-страницы?

artimon

А кто-нибудь из тех, кто посоветовал выкусывать данные с других сайтов задумывался над тем, что это незаконно?
Я конечно понимаю, что для странички Васи Пупкина это пофигу, но для интернет-магазина это может оказаться важно.

psm-home

Какие законы нарушает такой подход? Можешь привести ссылки какие-нибудь про это?

freezer

здрасьте! Информация выкладывается для публичного доступа. Чего тут незаконного?
Посмотреть на сайте и на калькуляторе посчитать цену - это законно, а отпарсить сайт - нет?

artimon

Насколько я понимаю, он нарушает стандартное объявление, что всё содержимое этого сайта является собственностью владельцев сайта и его использование возможно только с письменного разрешения и т.д.
Не знаю, в общем-то. Я не юрист.
upd: typo.

artimon

Отпарсить и смотреть у себя на компе можно, а выкладывать в сеть... ну не знаю...

Tasha2201

можно баннер СБ нафигарить, типа "Powered by SberBank"
тогда сб еще и спасибо скажет за рекламу

freezer

да-а... и тег <html> тоже является собственностью сайта?..
Все это может касаться только статей, аналитики, фотографий и т.д. Наконец, на дизайн таблички с курсами. А на сам курс доллара авторские права не могут распространяться.

psm-home

тогда сб еще и спасибо скажет за рекламу
Вряд ли СБ нужна такая говнореклама. А вообще альтруисты оне:
Пожалуйста, ознакомьтесь с правилами использования веб-сервисов:
Использование данной системы является бесплатным и общедоступным в полном объеме сервисом.
Банк России не несет ответственности за использование Вами данных, полученных при использовании данной системы, а так же не гарантирует наличие, актуальность, и достоверность передаваемой в рамках данной системы информации.
Банк России оставляет за собой право прекратить оказание данной услуги любому из ее пользователей без указания причин.
Банк России не оказывает консультационной и технической поддержки по данной системе в устном, письменном или ином виде.

freezer

не СБ, а ЦБ.
Две большие разницы

Tasha2201

Да, точно, что-то меня с утра переглючило
ЦБ РФ - говнобанк, ему необходима реклама

psm-home

Точно. Был невнимателен. Слажал.

Dasar

> Насколько я понимаю, он нарушает стандартное объявление, что всё содержимое этого сайта является
> собственностью владельцев сайта и его использование возможно только с письменного разрешения и т.д.
Это объявление справедливо ровно до тех границ, в рамках которых нет нарушения других соглашений, законов и т.д.
Пример:
если на сайте в виде html-я выложен gnu-шный код, то вышеприведенная оговорка никакого права по отношению к этому коду иметь не будет.

maggi14

согласен. Можно подумать, эта инфа принадлежит рбк.

vini

факты и идеи не охраняются ЗоАП

skvoria

Да, это незаконно но обычно "атакуемые" ресурсы предпочитают не связываться, поскольку это геморройно - доказать, что эта информация была украдена именно у них, а не у кого-либо еще (логи сервера в данном случае не являются доказательством).
Обычно делают проще: приделывают агализатор логов, и, если видят, что с определенных адресов явно приходит робот, закрывают доступ. Вот и приходится писать всякие рандомайзеры, которые каждый раз меняют время, "браузер" и прочие параметры соединения

vini

Ссылки на выдержки из закона или его коментарии специалистами.
"Не верю!" ©

skvoria

Итак.
Допустим, мы рассматриваем парсинг контента абстрактного сайта с последующим размещением результата на своем ресурсе.
"Закон об авторском праве и смежных правах".
Статья 5. Сфера действия авторского права.
1. В соответствии с настоящим Законом авторское право распространяется:
на произведения, обнародованные либо необнародованные, но находящиеся в какой-либо объективной форме на территории Российской Федерации, независимо от гражданства авторов и их правопреемников;
на произведения, обнародованные либо необнародованные, но находящиеся в какой-либо объективной форме за пределами Российской Федерации, и признается за авторами - гражданами Российской Федерации и их правопреемниками;
на произведения, обнародованные либо необнародованные, но находящиеся в какой-либо объективной форме за пределами Российской Федерации, и признается за авторами (их правопреемниками) гражданами других государств в соответствии с международными договорами Российской Федерации.
Здесь, я думаю, все ясно. Материал объективно лежит где-нибудь на серваке, и кто-то его написал
Статья 6. Объект авторского права. Общие положения.
1. Авторское право распространяется на произведения науки, литературы и искусства, являющиеся результатом творческой деятельности, независимо от назначения и достоинства произведения, также способа его выражения.
Тоже вроде все в порядке. Раз кто-то написал - значит "литература". Если бы воняло - была бы химия.
Статья 9. Возникновение авторского права. Презумпция авторства
1. Авторское право на произведение науки, литературы и искусства возникает в силу факта его создания. Для возникновения и осуществления авторского права не требуется регистрации произведения, иного специального оформления произведения или соблюдения каких-либо формальностей.
Обладатель исключительных авторских прав для оповещения о своих правах вправе использовать знак охраны авторского права, который помещается на каждом экземпляре произведения и состоит из трех элементов:
латинской буквы "С" в окружности: "©";
имени (наименования) обладателя исключительных авторских прав;
года первого опубликования произведения.
2. При отсутствии доказательств иного автором произведения считается лицо, указанное в качестве автора на оригинале или экземпляре произведения.
По русски говоря, права выставляются по умолчанию. И с этим ничего не поделаешь.
И если чел пишет, что перепечатка только с разрешения автора - смирись с этим. Иначе он подаст на тебя в суд.
Теперь самое интересное Законы иногда полезно перечитывать
Статья 8. Произведения, не являющиеся объектами авторского права
Не являются объектами авторского права:
...
сообщения о событиях и фактах, имеющие информационный характер.
То есть, новостную ленту с курсами валют тырить можно ЛЕГКО
Далее, gnuтый код.
Формально, авторское право принадлежит только его автору. Сайт, выложивший этот код на обозрение, сделал это совершенно корректно с точки зрения лицензии. А поскольку, опубликовав код, он не стал правообладателем на него - формально ты можешь парсить страницу без особых проблем.
ОДНАКО: к примеру, на сайте код был оформлен как-нибудь хитро, всякие там завиточки-закорючки-форматирование, а ты при парсинге решил оставить оформление. В этом случае, подозреваю, к тебе могут привязаться и сказать, что ты не прав, поскольку (к примеру) код был html-форматрован, а дальше 25я статья и капец. Html, знаете ли, тоже программный код по крайней мере, для юристов.
Ну в общем, все остальное является частными случаями применения закона, надо более детально говорить, что откуда тырится.
Ну и напоследок - пара небольших случаев из практики.
1. Некие ребята организовали ресурс xxxxxxxxx.h10.ru, по функциям, контенту и названию совпадающим с нашим ресурсом xxxxxxxxx.ru. На письма не отвечают. Обидно, знаете ли
Написал а агаву письмо, вкратце обрисовал ситуевину. Через три дня сайт исчез. Просто, знаете ли, испарился. Видимо, агавцы не стали разгребать технические и юридические тонкости.
2. Один козлик притырил два десятка фоток с сайта моих друзей, и разместил из на своем ресурсе на "народе" .Причем не хватило мозгов даже на то, чтобы убрать пририсованный к фоткам логотип сайта. На предложение убрать по-хорошему не реагировал или реагировал вяло. Окрыленный случаем с агавой, написал в техподдержку яндекса. Ответили уже из юридического отдела сказали, чтобы попробовал разрулить по-хорошему, потому что судиться - геморрой. Снова написал козлику, на сей раз указал, что "типа тока что базарил с пацанами из яндекса". На следующий день фотки сняли.
Реально до суда ни разу не доходило
Вообще тема авторского права довольно увлекательная штука. Предлагаю вынести ее в отдельную ветку (или продолжить эту и делиться случаями из жизни.

mysha

2. При отсутствии доказательств иного автором произведения считается лицо, указанное в качестве автора на оригинале или экземпляре произведения.
ты вот лучше расскажи, как вы в суде собирались доказывать свое авторство?
помнится пробегала инфа, что все японские ученые под конец рабочего дня визируют все написанные за день
документы у нотариуса. Чтобы потом можно было доказать свое первенство, вы я так понимаю такого не делали.

vini

Это понятно.
Не понятно следующее - распространяется ли указанные статьи на программный код (а именно его здесь рассмотривают)
Недавно кстати столкнулся с интересной уловкой адвоката бесплатных библиотек по делу с КМ-онлайн. Говорилось о том, что бонародование - это выпуск в печать или регистрация у нотариуса и опубликовании не в СМИ, а на своей страничке в интернете не является обнародованием.

skvoria

ты вот лучше расскажи, как вы в суде собирались доказывать свое авторство?
Это является чуть ли не самой большой проблемой при рассмотрении подобных судебных исков.
Насколько я понимаю, тут работает статья 9, п.3:
При опубликовании произведения анонимно или под псевдонимом (за исключением случая, когда псевдоним автора не оставляет сомнения в его личности) издатель, имя или наименование которого обозначено на произведении, при отсутствии доказательств иного считается представителем автора в соответствии с настоящим Законом и в этом качестве имеет право защищать права автора и обеспечивать их осуществление. Это положение действует до тех пор, пока автор такого произведения не раскроет свою личность и не заявит о своем авторстве.
То есть, кто первый - того и тапки, до тех пор, пока не найдется какой-нить урод, который объявит, что он был первым, кто создал объект разбирательства. В этом случае, насколько я помню, подключают авторитетов в области ИТ, которые начинают разгребать логи, смотреть на даты создания и т.д.
Вообще, я думаю, все понимают, что поскольку электронную информацию можно подделать легче, чем, скажем, "бумажную", проблем с этим законом больше на порядок. Увы

Flack_bfsp

ЦБ РФ - говнобанк, ему необходима реклама
ЛОЛ

skvoria

Дык а что,
Статья 18. Воспроизведение произведения в личных целях без согласия автора и без выплаты авторского вознаграждения
1. Допускается без согласия автора и без выплаты авторского вознаграждения воспроизведение правомерно обнародованного произведения исключительно в личных целях, за исключением случаев, предусмотренных статьей 26 настоящего Закона.
2. Положение пункта 1 настоящей статьи не применяется в отношении:
...
воспроизведения программ для ЭВМ, за исключением случаев, предусмотренных статьей 25 настоящего Закона
Соответственно, 25я статья (такие большие куски цитирую для тех, у кого нет инета. Тема-то в принципе жизненная)
Статья 25. Свободное воспроизведение программ для ЭВМ и баз данных. Декомпилирование программ для ЭВМ
1. Лицо, правомерно владеющее экземпляром программы для ЭВМ или базы данных, вправе без получения разрешения автора или иного обладателя исключительных прав на использование произведения и без выплаты дополнительного вознаграждения:
1) внести в программу для ЭВМ или базу данных изменения, осуществляемые исключительно в целях ее функционирования на технических средствах пользователя, осуществлять любые действия, связанные с функционированием программы для ЭВМ или базы данных в соответствии с ее назначением, в том числе запись и хранение в памяти ЭВМ (одной ЭВМ или одного пользователя сети а также исправление явных ошибок, если иное не предусмотрено договором с автором;
2) изготовить копию программы для ЭВМ или базы данных при условии, что эта копия предназначена только для архивных целей и для замены правомерно приобретенного экземпляра в случаях, когда оригинал программы для ЭВМ или базы данных утерян, уничтожен или стал непригоден для использования. При этом копия программы для ЭВМ или базы данных не может быть использована для иных целей, чем указано в подпункте 1 настоящего пункта, и должна быть уничтожена в случае, если владение экземпляром этой программы для ЭВМ или базы данных перестает быть правомерным.
2. Лицо, правомерно владеющее экземпляром программы для ЭВМ, вправе без согласия автора или иного обладателя исключительных прав и без выплаты дополнительного вознаграждения воспроизвести и преобразовать объектный код в исходный текст (декомпилировать программу для ЭВМ) или поручить иным лицам осуществить эти действия, если они необходимы для достижения способности к взаимодействию независимо разработанной этим лицом программы для ЭВМ с другими программами, которые могут взаимодействовать с декомпилируемой программой, при соблюдении следующих условий:
1) информация, необходимая для достижения способности к взаимодействию, ранее не была доступна этому лицу из других источников;
2) указанные действия осуществляются в отношении только тех частей декомпилируемой программы для ЭВМ, которые необходимы для достижения способности к взаимодействию;
3) информация, полученная в результате декомпилирования, может использоваться лишь для достижения способности к взаимодействию независимо разработанной программы для ЭВМ с другими программами, не может передаваться иным лицам, за исключением случаев, если это необходимо для достижения способности к взаимодействию независимо разработанной программы для ЭВМ с другими программами, а также не может использоваться для разработки программы для ЭВМ, по своему виду существенно схожей с декомпилируемой программой для ЭВМ, или для осуществления любого другого действия, нарушающего авторское право.
3. Применение положений настоящей статьи не должно наносить неоправданного ущерба нормальному использованию программы для ЭВМ или базы данных и не должно ущемлять необоснованным образом законные интересы автора или иного обладателя исключительных прав на программу для ЭВМ или базу данных
Полез было в словарь за определениями слов "обнародование" и "опубликование", и случайно натолкнулся на нехилый тред:
http://www.internet-law.ru/forum/index.php?board=1;action=display;threadid=71;start=0
(особенно 3я страница)
Фсем фтыкать. И вообще форум полезный.

bleyman

Слышьте, о чём вообще спор? Что, по-вашему делают гугл и яндекс? Подсказка: а не парсят ли они хтмл чтобы выделить из него определённые виды контента, после чего предоставляют пользователям услуги по обработке этого контента? Причём гугл вообще почти все странички кеширует и позволяет на них смотреть. Так что по идее можно его использовать в качестве "миррора интернета" =)
Так что спор бессмысленен - в любом суде тыкаете пальцем в яндекс и говорите "Вот!".

yaskov2006

Есть такое учреждение, как ФИПС(Федеральный Институт Промышленной Собственности). http://www.fips.ru/
Так вот, если на сайте внизу написано много всего про копирайты и т.д., но на самом деле оно не зарегистрировано как интеллектуальная собственность, то тяжело будет судебно что-либо доказывать.
То же самое касается и программных продуктов, и товарных знаков, и всего остального.

skvoria

Нет, не совсем верно.
Статья 19:
1. Допускается без согласия автора и без выплаты авторского вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и источника заимствования:
(в редакции Федерального закона от 20 июля 2004 г. N 72-ФЗ)
1) цитирование в оригинале и в переводе в научных, исследовательских, полемических, критических и информационных целях из правомерно обнародованных произведений В ОБЪЕМЕ, ОПРАВДАННОМ ЦЕЛЬЮ ЦИТИРОВАНИЯ, включая воспроизведение отрывков из газетных и журнальных статей в форме обзоров печати;
Я думаю, никто не будет спорить, что для поисковиков объем цитирования оправдан целью?

olegusmaximus

а зачем ему реклама ведь
он не работает с физич лицами
а только с др банками и гос-вом?

Flack_bfsp

И я о том же.
Оставить комментарий
Имя или ник:
Комментарий: