我有一個Rails 4應用程序。我添加了一個功能,以便用戶可以提供文檔並在該文檔中搜索某些單詞。我希望這可以處理文本和HTML。爲了使HTML正常工作,我想知道是否有提供HTML字符串的解析輸出的Ruby或Rails函數。Ruby/Rails:如何獲取HTML文件的解析內容?
例如,如果我有字符串<strong>Here</strong> is some <em>HTML</em>
,我需要一個函數返回Here is some HTML
。原因是,如果我正在搜索字符串「some HTML」,由於<em>標籤,它不會在<strong>Here</strong> is some <em>HTML</em>
中找到它。但是,如果您在瀏覽器中查看HTML,則會出現「some HTML」(儘管有一些格式 - 我不關心格式)。
只是刪除尖括號中的標籤將無法正常工作,因爲如果有輸入像here are lots of spaces
?我需要該函數返回here are lots of spaces
以及解析的HTML實體。
爲此,我使用了Nokogiri的.inner_text方法,然後對結果運行Rails的.squish方法以獲取可以執行搜索的字符串。 – user1002119 2014-09-29 20:22:39