2017-08-29 69 views
1

我有一個字符串變量,其中包含混合的人類語言和HTML。我想刪除嵌入在「<」和「>」中的所有HTML部分。我試過如下:如何逃脫「<" ">」以及其間的所有內容?

gsub("\\<[^\\<]*\\>", "", subject, perl=TRUE); 

但有人告訴我,\ <無效逃逸。任何人都可以幫我解決這個問題嗎?非常感謝!

+0

完成與婚前良好的醇Sallie Mae的我在institushin learnin。」這是一個觀察的樣子。我怎麼才能讓它變得「只需要付錢給Sallie Mae就可以在institushin中學習」。 – xinyuanliu

+0

這是什麼評論? – Masoud

+1

編輯您的問題,以包含輸入和期望輸出的[可重現示例](https://stackoverflow.com/questions/5963269/how-to-make-a-great-r-reproducible-example)。 – MrFlick

回答

2

gsub可代替<tags>並輸出<tags>之間的內容。

> str 
[1] "<font size=6>Done with payin good ol Sallie Mae for my learnin at the institushin.</font>" 

> gsub("<.*?>","", str) 
[1] "Done with payin good ol Sallie Mae for my learnin at the institushin." 
+0

謝謝!我只是覺得這個問題有多愚蠢。 「<" and ">」根本不需要逃脫。 – xinyuanliu

+1

真正的訣竅是問號,而不僅僅是逃逸字符...... –