туплю... Perl - удалить теги из строки

uncle17

если имеется строчка $1, как из нее получить $str, равную $1 без html-тегов?

uncle17

а регэкспами никак? Нету этого модуля

artimon

Учись пользоваться гуглом и головой.
http://www.google.com/search?q=perl+strip+html+tags
http://www.perl.com/doc/FAQs/cgi/perl-cgi-faq.html#Q4.6

uncle17

читал... не помогает...

artimon

Охрененное описание проблемы. Дайте две!

sergey_m

Попробуй

s/<[^>]*?>//g

uncle17

неа

sergey_m

Можно еще undef $/; s/<[^<>]*?>//g и таким образом прогонять нескольк раз. Но всё равно с помощью регулярных выражений это не возможно.

Barbie29

тогда проблема в ДНК исключительно... регекспами можно практически все сделать, если уметь конешно...

kokoc88

Здесь в идеале надо парсить html, т.к. <> могут быть засунуты в коментарии и т.п.

Barbie29

угу, но это предусмотреть можно, хотя, есть w3c.org, который проверяет валидность html текста страницы на предмет стандарта, т.е. стандарт описать регекспами монжно... а какиеннить теги вида
<a href="test.shtml"><img src="xxx_mega_group_porno.jpg" alt=">>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> super porno <<<<<<<<" border="0"></a>
не валидны увы по w3c.org, тут уж ничо не сделаешь... хотя можно ипопытацца в принципе...

vall

хм
sed -re 's/<([^<>"]*|"[^"]*")*>//g'

Barbie29

дык ты то чо пишешь? это федечка должен писать, а он в кусты сбежал... хехехе...

vall

просто я не понял в чём проблема.
Оставить комментарий
Имя или ник:
Комментарий: