разбор хтмл документа

666VAMPIRE666

Такой вопросик :-)
Есть страничка в и-нете, где требуется регистрация, и потом можно просмотреть некоторые документы(в виде хтмл страничек)....можно ли как нить подконнектиться и залогиниться программно к данному узлу и загрузать страничку для разбора...все программно....

Helga87

Можно.

666VAMPIRE666

а как не подскажешь? желательно на с\с++... яву я плохо знаю...
там есть какие то библиотечки?

Helga87

Про С/С++ не ко мне вопрос =)

666VAMPIRE666

а на чем ты можешь объяснить?

Helga87

Так, чтобы из кеша знания доставать: .net, ruby. Остальными вещами уже довольно давно не пользовался, а вспоминать лень.

666VAMPIRE666

net как я понимаю,это платформа...а языки там могут быть разные( или я что то путаю :-( )
а вот про ruby вообще ничего не слышал :-(

Alexander08

можно

666VAMPIRE666

а как?:-)

Realist

можно просмотреть некоторые документы(в виде хтмл страничек)....можно ли как нить подконнектиться и залогиниться программно к данному узлу и загрузать страничку для разбора...все программно....
C/C++ — слишком низкий уровень. Это все равно, что писать решение системы уравнений на ассемблере. Скорей какие-то скриптовые языки типа Perl, Python и прочего. Плюс готовые программы. Вот wget не спасет отца русской демократии?

Alexander08

я писал подобную программу, но только на с#.net.
там есть удобные классы как для создания запросов, так и для разбора страниц.

durka82

Ты писал на версии 1 или на версии 2 .нет?
Какие библиотеки использовал?

666VAMPIRE666

а на яве? или только скриптовые языки.... скриптовых вообще не знаю(

buka

кажется, изучение того же перла окупится за счет пропасти в геморе делать на нем и на с++

666VAMPIRE666

ок... слушай, а на перле тоже можно делать полнофункциональные приложения( например exe файл) или он "заточен" именно под интеренет.? ( сорри, если вопрос глупый, со скриптовыми языками вообще никогда не сталкивался:( ).. а ты не можешь тогда подсказать какую нить хорошую книжку по перлу и среду разработки..

buka

на перле тоже можно делать полнофункциональные приложения
а как же
( например exe файл)

в принципе можно в ехе засунуть, но зачем?
или он "заточен" именно под интеренет.?
«заточен» он, по-моему, под быструю и ленивую разработку
какую нить хорошую книжку по перлу
Programming Perl by Larry Wall — книжка создателя языка
среду разработки
не критично, мне всегда хватало обычного текстового редактора

666VAMPIRE666

спасибо, почитаю...

kokoc88

подконнектиться и залогиниться программно к данному узлу и загрузать страничку для разбора...все программно
Тебе под какую ОС программу надо?

666VAMPIRE666

под винды...

kokoc88

под винды...
Почитай про MSXML, IXmlHttpRequest, MSHTML, reusing MSHTML
ms-help://MS.MSDNQTR.v80.en/MS.MSDN.v80/MS.WEBDEV.v10.en/progie/workshop/browser/hosting/hosting.htm

Alexander08

Ты писал на версии 1 или на версии 2 .нет?
Какие библиотеки использовал?
версия не имеет значения.
использовал System.Net и System.Text.RegularExpressions.

Helga87

Также вместо регулярок, удобно с помощью SgmlReader сделать с hmtl-я xhtml и делать к нему XPath запросы.

Alexander08

Также вместо регулярок, удобно с помощью SgmlReader сделать с hmtl-я xhtml и делать к нему XPath запросы.

2:
Спасибо за идею и всяческий респект!
Как раз нужна была парсилка сайтов, воспользовался этим методом - получилось легкая и простая реализация, работает шустро!
Оставить комментарий
Имя или ник:
Комментарий: