2017-04-06 238 views
-1

我是java編程新手,所以我的問題可能很愚蠢! 我正在python中通過Django構建一個網站。我需要從另一個站點下載一些內容並實時顯示它們。我可以通過下載該頁面的HTML代碼並將它們(用bs4 & ...)提取數據來做到這一點,但問題是我的目標站點使用JavaScript的交互行爲,當我嘗試下載其內容(使用Python的urllib的或要求),它只是給我一些Java腳本,例如: 我期待的內容是這樣的:如何下載網頁數據庫提供的內容?

<td><a>data to scrape 1</a></td> 
<td><a>data to scrape 2</a></td> 
<td><a>data to scrape 3</a></td> 
... 

但好比:

<tr ng-repeat="toy in letter.list | filter:symbol_srch"> 
<td><a>{{toy.s}}</a></td> 
<td>{{toy.n}}</td> 
</tr> 

它似乎是「玩具」變量是由後端數據庫提供。

當然我可以使用瀏覽器或包(例如selenium)來渲染該網站之前,但我沒有任何瀏覽器在我的服務器上,我不允許安裝或使用便攜式版本!

我認爲,因爲該網站的後端發送變量到我的瀏覽器,我的瀏覽器可以讀取和渲染它們,所以我可以抓住這些變量並在沒有任何瀏覽器的情況下閱讀它們。 任何人有任何想法?或者有沒有辦法使用python渲染網站內容而無需任何外部軟件?

回答

0

當您瀏覽到該頁面時,檢查Chrome Developer工具的「網絡」選項卡上從瀏覽器進行的API調用。然後你可以檢查交通和你需要的所有東西