2017-04-09 41 views
0

我試圖編寫一個代碼,通過網頁源代碼讀取並獲取數據。Chrome通過代碼檢查元素內容

網頁源代碼是受保護的。我可以通過Chrome inspect元素獲取數據,並將其作爲元素複製並保存爲html文件。然後,我可以得到我想要的數據,而不會有任何問題。

我無法管理的唯一代碼是如何通過代碼獲取檢查元素的內容。

+0

爲什麼'java'標籤? –

+0

不清楚你應該如何通過代碼來閱讀它....正在閱讀頁面內容的代碼在哪裏運行? – epascarello

+0

*「網頁源代碼是受保護的。」*如何?如果網頁在線,那麼源代碼根本就沒有得到保護..實際上只是一個HTTP請求。 – JCOC611

回答

1

所以..我真的不明白你的意思,但也許捲曲是你在找什麼?

類似:

curl https://en.wikipedia.org/wiki/Main_Page > test.html 

會給你像一個文件:

<!DOCTYPE html> 
<html class="client-nojs" lang="en" dir="ltr"> 
<head> 
<meta charset="UTF-8"/> 
<title>Wikipedia, the free encyclopedia</title> 
<script>document.documentElement.className... 

然後,你可以做任何你想要它。 希望這有助於嗎?

如果您使用不具有捲曲機器: https://curl.haxx.se/

//with chocolatey 
choco install curl 

//with apt 
apt install curl 
+0

curl命令給出沒有我想要的信息的網頁源代碼。我需要的只有當我通過Chrome檢查元素並將元素複製爲元素時纔可訪問,然後將其保存爲html文件。 – user3188039

+0

您認爲inspect元素讓您不在頁面的源代碼中究竟發生了什麼? – Scheme

相關問題