我試圖編寫一個代碼,通過網頁源代碼讀取並獲取數據。Chrome通過代碼檢查元素內容
網頁源代碼是受保護的。我可以通過Chrome inspect元素獲取數據,並將其作爲元素複製並保存爲html文件。然後,我可以得到我想要的數據,而不會有任何問題。
我無法管理的唯一代碼是如何通過代碼獲取檢查元素的內容。
我試圖編寫一個代碼,通過網頁源代碼讀取並獲取數據。Chrome通過代碼檢查元素內容
網頁源代碼是受保護的。我可以通過Chrome inspect元素獲取數據,並將其作爲元素複製並保存爲html文件。然後,我可以得到我想要的數據,而不會有任何問題。
我無法管理的唯一代碼是如何通過代碼獲取檢查元素的內容。
所以..我真的不明白你的意思,但也許捲曲是你在找什麼?
類似:
curl https://en.wikipedia.org/wiki/Main_Page > test.html
會給你像一個文件:
<!DOCTYPE html>
<html class="client-nojs" lang="en" dir="ltr">
<head>
<meta charset="UTF-8"/>
<title>Wikipedia, the free encyclopedia</title>
<script>document.documentElement.className...
然後,你可以做任何你想要它。 希望這有助於嗎?
如果您使用不具有捲曲機器: https://curl.haxx.se/
//with chocolatey
choco install curl
//with apt
apt install curl
curl命令給出沒有我想要的信息的網頁源代碼。我需要的只有當我通過Chrome檢查元素並將元素複製爲元素時纔可訪問,然後將其保存爲html文件。 – user3188039
您認爲inspect元素讓您不在頁面的源代碼中究竟發生了什麼? – Scheme
爲什麼'java'標籤? –
不清楚你應該如何通過代碼來閱讀它....正在閱讀頁面內容的代碼在哪裏運行? – epascarello
*「網頁源代碼是受保護的。」*如何?如果網頁在線,那麼源代碼根本就沒有得到保護..實際上只是一個HTTP請求。 – JCOC611