nokogiri

    0熱度

    1回答

    我的特殊用例是構建具有佔位符值的HTML電子郵件模板,這些模板稍後將替換爲實際數據。 例子: hello <span class='placeholder' data-slug='contact.name'>contact.name</span> ...變成 「你好,約翰的」 佔位符被替換時。 我有這些佔位符的50+,並正在使用引入nokogiri更換使用實時數據的佔位符: placehold

    0熱度

    1回答

    我想解析這個頁面只有https://en.wikipedia.org/wiki/Morgan_Freeman的電影攝影部分。 我試過到目前爲止 actor = "Morgan_Freeman" html = Nokogiri::HTML(open("http://en.wikipedia.org/wiki/" + actor)) output = File.new(actor + ".tx

    0熱度

    1回答

    我搜索了整個網絡尋找解決此錯誤的方法。但它不會讓步。根據我的知識,我安裝了所有的庫和依賴項,甚至卸載了ruby和nokogiri並重新安裝。但是這個錯誤仍然存​​在。 Gem files will remain installed in /home/$User/.rbenv/versions/2.4.2/lib/ruby/gems/2.4.0/gems/nokogiri-1.4.7 for ins

    0熱度

    1回答

    有沒有辦法讓根標籤名稱的名稱爲Nokogiri::XML::Element?在參考How do I get the root element name of an XML document using Nokogiri?之後,我嘗試使用Nokogiri::XML::Element.xpath('/*').first.name,這似乎只適用於Nokogiri::XML::Document。有沒有直接

    0熱度

    2回答

    我使用Ruby 2.4和Nokogiri。如何從不屬於另一個子元素的節點中提取文本?也就是說,如果我有節點 <a>Text 1<b>Text 2</b></a> 我想提取「文本1」而不是「文本2」。如果節點 <c>Hello</c> 我可以簡單地調用 node.text 但「node.text」不爲我上面描述的更復雜的情況下工作(這將同時返回「文本1」和「文本2」

    1熱度

    2回答

    我使用這個頁面的所有類: https://www.google.com/search?q=ford+fusion+msrp&oq=ford+fusion+msrp&aqs=chrome.0.0l6.2942j0j7&sourceid=chrome&ie=UTF-8 我試圖讓這個元素:類=「_ XWK」 page = HTTParty.get('https://www.google.com/sear

    0熱度

    2回答

    回車(在Windows新的生產線使用)被引入nokogiri xml = Nokogiri::XML "<?xml version=\"1.0\" encoding=\"UTF-8\"?>\n<a>ABC</a>\n" xml.xpath('a').first.content = "testing\r\nnewlines" > "testing\r\nnewlines" xml.t

    0熱度

    1回答

    我是nokogiri的新手,並且無法使用xpath訪問具有特定xmlns的xml文檔的嵌套元素。 考慮下面的代碼 #!/opt/chef/embedded/bin/ruby require 'nokogiri' doc = Nokogiri::XML.parse <<-XML <?xml version="1.0" encoding="UTF-8" ?> <domain xmln

    0熱度

    1回答

    我在抓這頁https://www.library.uq.edu.au/uqlsm/availablepcsembed.php?branch=Duhig和每個tr我正在收集並返回可用的計算機名稱和數量。 問題在於它迭代了太多次。只有4個tr標籤,但循環經過5次迭代。這會導致額外的nil被追加到返回數組。爲什麼是這樣? 刮科: <table class="chart"> <tr valign

    0熱度

    3回答

    選擇的變化,我刮這兩個網站: https://www.library.uq.edu.au/uqlsm/availablepcsembed.php?branch=Law https://www.library.uq.edu.au/uqlsm/availablepcsembed.php?branch=BSL。 不幸的是,它們有變化。其中一個在href標記內具有級別名稱(例如級別2),而另一個只是純文本