Open-source : выделение шаблонов с web страниц сайта
В первом случае велосипедов тысячи и хороших. Во втором случае лично я писал бы велосипед сам. В теории и всяких научных исследованиях возможно и можно сделать что-то общее и формальное. На практике пишется под конкретную задачу, с использованием пресловутой теории, магии и регулярок.
Есть книжка web data mining некоего Liu, в ней рассматривается этот вопрос. Коллега решал аналогичную задачу названными ранее способами, получился metafind.ru. Библиотек не знаю, но не исключаю, что они есть.
Оставить комментарий
Yulka-MOl
Подскажите, может кто-нибудь использовал какую-нибудь open-source библиотеку для этих целей.(Язык C/C++, Python, Java, Perl, по фиг)
В интернете сейчас читаю "научную" статью на эту тему.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.93....
Имеет ли смысл изобретать велосипед? Поделитесь опытом.
Заранее спасибо.