Распарсить web-страницу(.NET)

Ivan99

Помогите please распарсить yandex - надо получить 10 топ-ссылок по определенному запросу, используя С# или ASP. Перерыл весь MSDN, ниче не нашел, даже непонятно, есть ли такая возможность. Подскажите хоть в каком направлении копать?

yolki

там же разметка тривиальная - простым поиском строки в подстроке решается.
по-моему яндекс умеет в xml отдавать результаты, разве нет?

Ivan99

Весь вопрос в том, КАК эту строку получить. Яндекс здесь неважен - важен принцип.

manusakina

регулярные выражения тебе помогут )

yolki

чё-то я не понял. вопрос "КАК?" - это как у яндекса программно спросить и считать программно его ответ без браузера?
Делаем сокет, открываем 80 порт у www.yandex.ru, пишем туда чё-нить типа

GET /yandsearch?rpt=rad&text=%EF%E5%EB%FC%EC%E5%ED%E8

получаем ответ - HTML, парсим...

Ivan99

О, пасиб, а с RegEx'ами уже разберемся

laki

Яндекс умеет отдавать ХМЛ, зачем изобретать велосипед?

skvoria

На всякий случай м.б. стоит предупредить... Эта штука по-хорошему является платным сервисом, и если будешь слишком настойчивым (повесишь на крон к примеру) - тебя забанят.

stm7884696

200 запросов в сутки с одного ip
Оставить комментарий
Имя или ник:
Комментарий: