2015-10-20 96 views
-3

我有一個網頁,需要廢棄以查找某些文本。問題在於它不是真正的webscrapping,我試圖實現。該網站是由一個單獨的過程打開。我特別談論一個網頁,但實際上,它更像是一個通用屏幕報廢問題。從概念上講,這更像是我在瀏覽器而不是頁面本身。有沒有一個程序可以掃描任何打開的程序並查找和匹配文本?換句話說,就像從瀏覽器內置的ctrl + f find函數中獲取一個單獨的程序。我只需要一個簡單的實用程序來告訴我一個給定的文本是否以布爾類型的方式存在。我意識到這是一個非常廣泛的問題,但我一直無法找到任何有關它的信息。也許我不太清楚如何在Google搜索中表達它,因爲我的研究一直在空白。需要屏幕刮屏瀏覽器,而不是網頁

回答

0

如果您已經知道該頁面的結構,例如Google搜索結果,或者始終是亞馬遜產品,則可以查看Selenium或Chrome屏幕抓取附加組件之一。

如果你想在不知道格式的情況下從任何頁面抓取數據,我不知道一種方法。