Хочу сдампить содержимое веб-странички

Anna551

Чем лучше воспользоваться?
пример странички
Хочу на выходе получить уже должным образом сериализованный объект рецепта. Например, в формате JSON.

kill-still

xpath

Anna551

библиотеки, умеющие xpath есть и под мой ObjC - но просто стало интересно, вдруг на каком-нибудь Руби есть более изящные инструменты?

Kira

для дотнета есть Html Agility Pack, оно DOM умеет строить и уже к нему обращаться.

kill-still

ну можешь сразу из xslt строить жсон, но нафига?

SergeRRRRRR

сразу из xslt строить жсон
wat?

bofa

распарси рэгэкспами просто

margadon

kill-still

http://www.w3schools.com/xsl/tryxslt.asp?xmlfile=cdcatalog&a...

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="/">
<html>
<body>
<h2>My CD Collection</h2>
var myJson = { "catalog" : [<br/>
<xsl:for-each select="catalog/cd">
{
"title":"<xsl:value-of select="title" />",
"artist": "<xsl:value-of select="artist" />"
}<xsl:if test="position != last">,<br/></xsl:if>
</xsl:for-each>
]
};
</body>
</html>
</xsl:template>
</xsl:stylesheet>

мало ли на свете извращенцев...

SergeRRRRRR

ну это то ясно, я просто на счет xslt в json, а не xml в json. Так то есть xslt шаблоны для перегона xml в json.

bleyman

распарси рэгэкспами просто
http://stackoverflow.com/questions/1732348/regex-match-open-...

Anna551

Сдампил xpathом. HTML оказался весьма формальным, нерукописным, поэтому распарсилось все хорошо, спасибо за рекомендации, теперь у меня есть база рецептов.

sutulin

http://stackoverflow.com/questions/1732348/regex-match-open-...
Вообще-то исходная задача - сдампить текст, а не распарсить HTML, как у тебя по ссылке, так что, в общем-то, регэкспами её решать можно. Но есть и более удобные способы.
Оставить комментарий
Имя или ник:
Комментарий: