[kick me] покритикуйте вебсервис делания pdf

pilot

Наваяли вот сервис:
http://blogpaper.com/wiki2pdf — берет книжку с wikibooks.org, делает из нее pdf A4/Letter или подходящий для Sony Reader pdf.
Сам я так читаю книжку про Haskell & Erlang — на Sony Reader'е.
книжки:
http://en.wikibooks.org/wiki/Main_Page
Дизайна как такового нет, и если вы знаете как нам помочь — welcome.
Конструктивная критика и идеи очень приветствуются.
PS: там еще можно глянуть http://blogpaper.com/blogpaper — блоги в pdf перегонять, но там пока багов больше, русский еще не поддерживается (а в trunk уже есть).
upd: нормальный заголовок сделал.

Helga87

1. битая ссылка "preformatted books" - http://blogpaper.com/wiki2pdf/pdf/
2. не уверен, что я очень доволен тем, что мне валится output из консольной программы. Скорее, как пользователь, я хочу видеть прогресс бар, пусть и не слишком точный и кнопочку "подробнее", которая может открыть полностью.
Как вариант, кроме этого показывать несколько последних строчек из вывода консоли. Чтобы понимание, что происходит осталось, но растерянности "а что это мне тут на экран валится" не было.
3. книжка когда сформировалась, сколько времени доступна по ссылке? докачка поддерживается?

pilot

:o Чорт, я тоже уже нашел, спасибо, поправил :)

kill-still

    (generate [XEPOUT]
(generate [PostScript][1][1][2][2][3][3][4][4][5][5][6][6][7][7][8][8][9][9][10][10][11][11]
[12][12][13][13][14][14][15][15][16][16][17][17][18][18][19][19][20][20][21][21][22][22][23][23][24]
[24][25][25][26][26][27][27][28][28][29][29][30][30][31][31][32][32][33][33][34][34][35][35][36][36]
[37][37][38][38][39][39][40][40][41][41][42][42][43][43][44][44][45][45][46][46][47][47][48][48][49]
[49][50][50][51][51][52][52][53][53][54][54][55][55][56][56][57][57][58][58][59][59][60][60][61][61]
[62][62][63][63][64][64][65][65][66][66][67][67][68][68][69][69][70][70][71][71][72][72][73][73][74]
[74][75][75][76][76][77][77][78][78][79][79][80][80][81][81][82][82][83][83][84][84][85][85][86][86]
[87][87][88][88][89][89][90][90][91][91][92][92][93][93][94][94][95][95][96][96][97][97][98][98][99]
[99][100][100][101][101][102][102][103][103][104][104][105][105][106][106][107][107][108][108][109]
[109][110][110][111][111][112][112][113][113][114][114][115][115][116][116][117][117][118][118][119]
[119][120][120][121][121][122][122][123][123][124][124][125][125][126][126][127][127][128][128][129]
[129][130][130][131][131][132][132][133][133][134][134][135][135][136][136][137][137][138][138][139]
[139][140][140][141][141][142][142][143][143][144][144][145][145][146][146][147][147]
(generate [PDF]
!external transformation in the component Pdf-backend from postscript to pdf failed with exit-code 139ERROR:<Fault -32603: 'The condition #<PDF-BACKEND::PS2PDF-ERROR 32080734> occurred'>

kick тебя! :D :grin:

kill-still

кормил убунтой

pilot

2. не уверен, что я очень доволен тем, что мне валится output из консольной программы. Скорее, как пользователь, я хочу видеть прогресс бар, пусть и не слишком точный и кнопочку "подробнее", которая может открыть полностью.

(Это совсем не output консольной программы, но это неважно — я согласен, что они интересны только мне, потому как я знаю что они означают)
Пользователя развлекать надо? Большие книжки долго генерируются... Как развлекать? Последним куском лога?
3. книжка когда сформировалась, сколько времени доступна по ссылке? докачка поддерживается?

Доступна пока не сгенерирована новая.
Докачки сейчас нет, книжки небольшие, нужна? Пока не знаю как это делать правильно.

pilot

Спасибо, и вообще книжка интересная :)
Быстро не починю, со шрифтами и ghostscript'ом надо возиться :(

Helga87

Докачки сейчас нет, книжки небольшие, нужна? Пока не знаю как это делать правильно.
Небольшие — это сколько? Не забывай про людей с dial-up. За пределами Москвы такие очень часто встречаются пока.

Helga87

Доступна пока не сгенерирована новая.
Что будет, если я качаю книжку, в этот момент кто-то другой закончил генерить книжку. Мне пришлют наполовину первую книжку, наполовину вторую?

pilot

Что будет, если я качаю книжку, в этот момент кто-то другой закончил генерить книжку. Мне пришлют наполовину первую книжку, наполовину вторую?

Нет, конечно.
Пользователь уникален и мечен кукой, идентификатором сессии — ему выдают его книжку.

sbs-66

Доступна пока не сгенерирована новая.Докачки сейчас нет, книжки небольшие, нужна? Пока не знаю как это делать правильно.
Правильно складывать сгенерированные книжки в папочку и перенаправлять пользователя прямой ссылкой на файл, веб-сервер сам докачку огранизует.

Helga87

о, крута

Helga87

Правильно складывать сгенерированные книжки в папочку и перенаправлять пользователя прямой ссылкой на файл, веб-сервер сам докачку огранизует.
тут возникает проблема, что может пойти большой трафик со стороны людей, которые даже не знают о ресурсе. Т.е. одну-то книжку они скачают, но где скачать следующую знать не будут.

pilot

Небольшие — хорошая книжка, которых там единицы — Haskell тот же — занимает 4-5 Мб.
Не забывай про людей с dial-up. За пределами Москвы такие очень часто встречаются пока.

Русскоязычных книжек там кот наплакал, поэтому смысл в основном в англоязычных, которые читать будут (?) европейцы/американцы.

Helga87

ну хз. Английский язык у нас в стране довольно активно ботают. Но вообще, да, люди с диалапом — не самая целевая аудитория, не стоит на них уделять внимание прям сразу.

pilot

Правильно складывать сгенерированные книжки в папочку и перенаправлять пользователя прямой ссылкой на файл, веб-сервер сам докачку огранизует.

Конечно про это я думал. Но просто выкладывать статическую книжку нехорошо — надо в зависимости от пользователя.
Пользователь идентифицируется кукой, mod_rewrite куки даже умеет смотреть, но файл пользователя должен называться как книжка — "Haskell.pdf".
Как задать соответствие не придумал.

sbs-66

Ну тогда перенаправляй на скрипт, который положит в куку разрешение скачать файл и выведет инфу о ресурсе и ссылку на сам файл. А кто пришёл по прямой ссыле на файл (и в куке у него разрешения нет, ну, или можно ещё по реффереру смотреть того перенаправлять на скрипт через mod_rewrite на этот скрипт.

Helga87

вариант

pitrik2

кука плохо
надо похитерее как-то
у меня вот при нажатии на ссылку скачки открывается флешгет и там куки то уже не будет

Helga87

flashget умеет подцеплять кукис. По крайней мере, он чуть ли не единственный умел скачивать с gzgate, пока я там авторизовывал только по кукам.
Но ряд других качалок — нет, поэтому замечание правильное.

sbs-66

Ну, ещё можно к IP привязываться. Ну и про реферрер я уже писал, правда не знаю, цепляют ли его качалки...

sanek300509

если хочешь линчивания запость на хабре пройдет первая реклама и сервис досконально протестят 2000-3000 уникумов первое время получишь ;) и по делу напишут

pilot

досконально протестят 2000-3000 уникумов первое время получишь и по делу напишут

Сомневаюсь.
Просто посещаемость вида "2000-3000 уникумов" не нужна, солить их что ли? В теории нужны пользователи, которые не прибегут, кликнут и убегут, а станут этой штукой пользоваться и писать чего не работает.
Большинство из хабрапользователей напишет одно и то же: "рюшечки некрасивые"(=дизайна нет).
То есть до момента, когда пользователь станет обращать внимание на продукт (pdf дело еще не дошло — легко найти то на чем падает, легко сказать "нет дизайна", больше уникум ничем не поможет.
P.S. Лично я от Хабра не в восторге :crazy:

slonishka

да, на хабре большая часть комментаторов — роботы.

kruzer25

Конструктивная критика и идеи очень приветствуются.
У меня не критика, у меня вопрос - в чём смысл создания ещё одного такого сервиса, если их и без того хоть жопой ешь?
ЗЫ: ПДФ руками делаешь, или чем-то готовым?

kruzer25

Сейчас посмотрел - что, в этом wikibooks.org не предусмотрена возможность выгрузки книг? Они что, рассчитывают, что эти книги будут читать только с компьютера и при наличии высокоскоростного неограниченного подключения к интернету?

kill-still

А в чём проблема? :confused:
ХТМЛ сохранять не умеешь?

kruzer25

ХТМЛ с огромной кучей служебной информации, да ещё и одну главу на документ?

pilot

в этом wikibooks.org не предусмотрена возможность выгрузки книг?

Так их "хоть жопой ешь" или все-таки "не предусмотрено"?

kruzer25

"Хоть жопой ешь" - из нормальных форматов в pdf. Если проблема состоит в том, чтобы всё-таки забрать текст из этого wikibooks и преобразовать его в нормальный формат, то этот тред следовало озаглавить не "веб-сервис делания pdf", а "прога по выдёргиванию текстов из говносайта wikibooks.org и преобразования их в нормальный формат", pdf тут абсолютно ни при чём.

pilot

 
этот тред следовало озаглавить не "веб-сервис делания pdf"

Хз чо я делаю, но сижу читаю на Sony Reader спеки xslt и xsl, сгенерированные одним из сервисов.
Upd: ах, да, спеки в формате pdf.

kill-still

ХТМЛ с огромной кучей служебной информации, да ещё и одну главу на документ?
а) Все те книги, которые я видел одной страницей сделаны
б) почти любой компилер chm умеет локальные паки сайтов делать многостраничные.

pilot

а) Все те книги, которые я видел одной страницей сделаны

Ты видел очень мало книг. На странице сервиса в примерах полно многостраничных. Одностраничная вроде только Open_Source.

kruzer25

почти любой компилер chm умеет локальные паки сайтов делать многостраничные.
И что, такой chm с кучей служебной информацией про википедию (шапка, колонка слева, подвал, перекрёстные ссылки) можно будет читать на кпк, распечатать на бумаге, отдать синтезатору речи?

kill-still

И что, такой chm с кучей служебной информацией про википедию (шапка, колонка слева, подвал, перекрёстные ссылки) можно будет читать на кпк, распечатать на бумаге, отдать синтезатору речи?
Ну, умеючи недолго сделать чтобы инклюды он не копировал. :)

kruzer25

Да уж, заебись "бесплатный сервис свободных книг", а возни с тем, чтобы извлечь из этого сервиса собственно книги - столько же, как и с выдиранием из платных. Им для полноты счастья не хватает только рекламу везде развесить, чтобы ещё и зарабатывать на этом.
Вот и выходит - викибукс - говно, книги предназначены только для чтения с большого экрана компьютера при наличии подключения к интернету, выгрузка книг не предусмотрена, остаётся только выдирать из этих викикниг главы, а из глав - полезную информацию, и потом как-то через жопу приводить это к нормальному виду.
Знаете, я уж лучше бумажную книгу куплю, отсканирую и распознаю. Геморроя меньше.

pilot

я уж лучше бумажную книгу куплю, отсканирую и распознаю. Геморроя меньше.

Угу, только в нормальной стране будут проблемы с законом. :)

kruzer25

То есть, за распознавание бумажной книги в личных целях (никакого распространения!) будут проблемы с законом, а за скачивание той же самой книги с викибукс и выдирание собственно книги из рекламыинтерфейса викибукс - ничего не будет?

pilot

за распознавание бумажной книги в личных целях (никакого распространения!) будут проблемы с законом

Честно говоря хз, я не готов сканировать и распознавать понравившиеся мне книжки вручную, поэтому не интересовался. Но, имхо, должно быть незаконно, можно начинать плясать от DRM
а скачивание той же самой книги с викибукс и выдирание собственно книги из рекламыинтерфейса викибукс - ничего не будет?

Вообще-то там в футере написано и ссылка дается на copyright
Оставить комментарий
Имя или ник:
Комментарий: