2016-01-21 31 views
1

由於某種原因,我無法再訪問Chrome內置的pdf查看器中的PDF文本。Watir-Webdriver如何使用Watir瀏覽器在Chrome中獲取嵌入式pdf文本

@browser.text 
=> "" 

的PDF內嵌,我一直無法輕鬆地與Net/HTTP獲取或curbhttparty得到它。但它在瀏覽器中顯示爲白天...

我需要做些什麼與@browser.driver#some_method?或者可能在Watir::Browser.new :chrome之前更改功能散列?

現在人們在做什麼來檢查Web應用程序中的PDF文本,以及最近Chrome和Chromedriver的變化?

回答

1

Watir非常適合處理html,但不能處理pdf等格式。如果你想解析PDF文件,你可以嘗試像pdf-reader

require 'pdf-reader' 
require 'open-uri' 

io = open(@browser.url) 
reader = PDF::Reader.new(io) 
reader.pages.first.text 
相關問題