[Ajax] Взломать сайт www.litportal.ru

yolki

Тупизм той системы защиты от копирования, которую наваяли аффтары сего сайта, уже тут обсуждался, по-моему.
смысл в том, что контент книжки разбивается на страницы, каждая подгружается аджаксом в див.
в контент вставляется рандомный текст <span class="h">бла-бла-бла</span> (это тупо можно sed-ом отсеить).
при этом джаваскрипт портит selection на странице. т.е. выделить и скопировать нельзя.
столкнулся с проблемой - не могу понять, откуда джаваскрипт выкачивает собственно контент.
пока проблему решил тупо - в Firefox есть замечательный firebug, который позволяет скопировать innerHTML любого элемента, благо "защищаемый" текст в один <div> впихивается.
Я заколебался одну книжку так копипэйстить 22 страницы. :( хочется автоматизировать.
пример - Лукьяненко - Черновик

AlexV769

Ну собсно текст вот:
<iframe src='http://www.litportal.ru/getpage/1/1/7db0a16fd67c63798d7cd32e007287ed' frameborder='0' vspace='0' \
hspace='0' width='1' height='1' marginwidth='0' marginheight='0' scrolling='no'></iframe>

URL судя по всему генерится автоматически и рандомно. Скачать без проблем у тебя должно получиться, если подсунуть Referer и (возможно) куки.
Ещё можно так:
Opera, галочка "Включить JavaSctipt" на панели инструментов. Включаешь, скачиваешь страницу, выключаешь, копируешь, включаешь - скачиваешь след страницу.

yolki

по этому урлу:

http://www.litportal.ru/getpage/1/1/7db0a16fd67c63798d7cd32e007287ed

возвращается javascript, который запрашивает

http://www.litportal.ru/getpage/1/2/7db0a16fd67c63798d7cd32e007287ed

в котором снова запрашивается .../2/...
куки она не хочет. про реферер - спасибо, посмотрю.
про оперу - спасибо! ею пользуюсь, но всех фич не знаю.

yolki

ага, дело было в реферере. вопрос закрыт. ща качалку сделаю :)

Helga87

Вот моя качалка: (7 Kb)
Вот примеры скачанных ею книг: http://imkrasin.googlepages.com/Books.zip
Для запуска качалки требуется .net framework версии не ниже 2.0. Ну, или Windows Vista, т.к. там .net стоит сразу.

Dimon89

А мы как-то по старинке работали. Сначала открывали все страницы книги, потом отключали яваскрипт, потом сохраняли все страницы. Недолго, только читать приходится с отключенным яваскриптом ;)

yolki

спасибо, я уже :)
но мне сей продукт лениво доводить до вида, когда им может пользоваться любой, посему выкладывать не буду ;)
так что пусть народ твоей качалкой пользуется

agaaaa

А почему не распарсить один из форматов, в которых там книги качать можно?

yolki

какой формат?
дай прямую ссылку на Черновик в каком-нибудь формате :mad:

laki

слышь че. а нафига она двойные кавычки экранирует ?

Helga87

слышь че. а нафига она двойные кавычки экранирует ?
ты про чо?

laki

про то что
" превращается в \"

Helga87

Кинь ссылку, на которой это воспроизводится

Helga87

— поправил

Dimon89

дай прямую ссылку на Черновик в каком-нибудь формате
Ну хотя бы вот локальная:
lukyanenko_chernovik.fb2.zip

yolki

это не то.
Мне показалось, что именно эту книгу в каком-то мифическом формате, распарсить его и радоваться.
На самом деле литпортал не даёт скачивать некоторые вещи (по сути - все книги, размещённые после определённого времени Ч).
или я где-то лоста не допонял?

agaaaa

Видимо кто не успел, тот опоздал (я скачал в своё время) ;)
Могу залить на какой-нибудь локальный сервак или по почте послать в fb2

yolki

мне пофиг - я уже умею обходить их защиту
Оставить комментарий
Имя или ник:
Комментарий: