Open-source : выделение шаблонов с web страниц сайта

Yulka-MOl

Подскажите, может кто-нибудь использовал какую-нибудь open-source библиотеку для этих целей.
(Язык C/C++, Python, Java, Perl, по фиг)
В интернете сейчас читаю "научную" статью на эту тему.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.93....
Имеет ли смысл изобретать велосипед? Поделитесь опытом.
Заранее спасибо.

doublemother

Я не очень понял, что ты хочешь. Судя по заголовку поста — шаблонизатор, а судя по ссылке на статью — извлечение данных.
В первом случае велосипедов тысячи и хороших. Во втором случае лично я писал бы велосипед сам. В теории и всяких научных исследованиях возможно и можно сделать что-то общее и формальное. На практике пишется под конкретную задачу, с использованием пресловутой теории, магии и регулярок.

okis

Есть книжка web data mining некоего Liu, в ней рассматривается этот вопрос. Коллега решал аналогичную задачу названными ранее способами, получился metafind.ru. Библиотек не знаю, но не исключаю, что они есть.
Оставить комментарий
Имя или ник:
Комментарий: