2016-08-24 30 views
-1

我是新來的網頁抓取,到目前爲止我只知道如何使用python美麗的湯刮基本的html頁面。我想要的是提取關於這個page的信息。具體來說,我想擺脫所有的同伴以下數據(其中約700)如何用javascript效果刮一個頁面

  • 背景
  • 洞察項目
  • 當前僱主

然而,頁面由javascript呈現,當鼠標事件在每個同伴圖片上觸發時,所需信息僅顯示爲一個單獨的框。

如何在這種情況下提取文本?任何信息(書籍,網絡資源)表示讚賞。如果可能,Python解決方案是首選。非常感謝。

+0

我禁用了網站上的JavaScript,並且工具提示仍然顯示。內容在那裏,它只是通過CSS隱藏。 –

回答

0

檢查網站的頁面源。

該信息已經存在於DOM中,只是隱藏在CSS中。乍看之下,似乎JavaScript邏輯只是在進行CSS操作。

信息被CSS隱藏的事實不會阻止你使用網絡抓取工具從源頭上抓取它。