Хочу сдампить содержимое веб-странички
xpath
библиотеки, умеющие xpath есть и под мой ObjC - но просто стало интересно, вдруг на каком-нибудь Руби есть более изящные инструменты?
для дотнета есть Html Agility Pack, оно DOM умеет строить и уже к нему обращаться.
ну можешь сразу из xslt строить жсон, но нафига?
сразу из xslt строить жсонwat?
распарси рэгэкспами просто
http://www.w3schools.com/xsl/tryxslt.asp?xmlfile=cdcatalog&a...
мало ли на свете извращенцев...
<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="/">
<html>
<body>
<h2>My CD Collection</h2>
var myJson = { "catalog" : [<br/>
<xsl:for-each select="catalog/cd">
{
"title":"<xsl:value-of select="title" />",
"artist": "<xsl:value-of select="artist" />"
}<xsl:if test="position != last">,<br/></xsl:if>
</xsl:for-each>
]
};
</body>
</html>
</xsl:template>
</xsl:stylesheet>
мало ли на свете извращенцев...
ну это то ясно, я просто на счет xslt в json, а не xml в json. Так то есть xslt шаблоны для перегона xml в json.
распарси рэгэкспами простоhttp://stackoverflow.com/questions/1732348/regex-match-open-...
Сдампил xpathом. HTML оказался весьма формальным, нерукописным, поэтому распарсилось все хорошо, спасибо за рекомендации, теперь у меня есть база рецептов.
http://stackoverflow.com/questions/1732348/regex-match-open-...Вообще-то исходная задача - сдампить текст, а не распарсить HTML, как у тебя по ссылке, так что, в общем-то, регэкспами её решать можно. Но есть и более удобные способы.
Оставить комментарий
Anna551
Чем лучше воспользоваться?пример странички
Хочу на выходе получить уже должным образом сериализованный объект рецепта. Например, в формате JSON.