web-scraping

0熱度

1回答

public void Imagesaver(string url) { string result = Filename(url); string SourceCode = worker.GetSourceCode(url); List<string> names1 = new List<string>(); MatchCollection data

0熱度

2回答

Selenium python：如何在頭部/標題加載時停止頁面加載？

想要一個腳本來刪除URL列表的標題，但是如果我們需要等待整個頁面加載，它可能會超級慢。標題是我正在尋找的唯一的東西。標題被加載時，我們可以停止頁面加載嗎？也許有像EC.title_contains之類的東西。

0熱度

2回答

推特通過Jsoup Java登錄Android

我想使用Jsoup登錄到Twitter，因爲我想刮我的推文，並通過短信發送給我，我知道如何處理它們從HTML，我知道如何通過發送它們通過短信，我需要幫助登錄步驟，我無法登錄到twitter 我試過的是，在後臺處理webview（沒有任何用戶界面）（注意：沒有應用程序的用戶界面），但失敗了，因爲它可以「T在不UI處理，與Jsoup我嘗試使用此代碼 final String usernameKey =

1熱度

2回答

如何爲python3中的循環創建的每一行添加一個靜態值？

district_name= [[li.getText() for li in data_rows[i].findAll('li')] for i in range(len(data_rows))] 上面的代碼給出了一個州比哈爾邦的地區名稱列表。像下面的表一樣。 [['1', 'Nalanda'], ['2', 'Patna'], ['3', 'Gaya'], ['4',

0熱度

1回答

如何在瀏覽器打開時彈出「廣告」？

我已經在python中編寫了一個腳本，並結合selenium來解析網頁中的一些公司名稱。我定義的選擇器是完美無瑕的。然而，一旦網頁開啓了一個令人討厭的ad彈出隱藏數據，並且我無法到達那裏。我怎樣才能解決我想要的數據。我試過在網頁上切換幾個iframes，但沒有一個可以工作。我在腳本中使用的現有內容會引發錯誤，顯示Message: no such element: Unable to locate

-1熱度

2回答

在python

使用正則表達式剝離標籤我怎麼能去剝離標籤關閉此列表： ['</span>A walk in the park<span class="html-tag"] 我設法利用(r'(?<=</span>)[^>]+')刪除的第一個標籤，但無法弄清楚如何刪除第二。我知道正則表達式不是處理標籤的方法，而只是想知道這一點。

0熱度

2回答

如何在rvest提交表單中傳遞多個值

這是a prior thread的後續操作。代碼對於單個值來說工作得很好，但是當我試圖傳遞超過1個值時出現以下錯誤，我根據函數的長度得到一個錯誤。錯誤vapply（元件，編碼，字符（1））：值必須是長度爲1，但 FUN（X [1]）結果是長度爲3 下面是代碼的樣本。在大多數情況下，我只能用這種方式命名對象並進行刮擦。 library(httr) library(rvest) library

1熱度

1回答

控制使用jsoup抓取網頁的輸出

我試圖抓取產品的價格banggood。問題是我用jsoup得到的貨幣是從列表中隨機選擇的貨幣。我一直在尋找html文件來查找是否有東西可以幫助我，但我沒有找到任何東西。如何控制貨幣類型？

0熱度

3回答

的Python：在列表中替換\ n \ r \噸不包括起始\ n \ n和與\ n \ r \ n \噸結束

個人清單： ['\n\r\n\tThis article is about sweet bananas. For the genus to which banana plants belong, see Musa (genus).\n\r\n\tFor starchier bananas used in cooking, see Cooking banana. For other uses, se

1熱度

4回答

創建來自特定網站的URL列表

這是我第一次嘗試使用編程來獲得有用的東西，所以請耐心等待。建設性的反饋是非常感謝:) 我正在建立一個數據庫與歐洲議會的所有新聞稿。到現在爲止，我已經構建了一個可以從一個特定URL檢索我想要的數據的刮板。但是，在閱讀了幾篇教程之後，我仍然無法弄清楚如何創建一個包含來自這個特定站點的所有新聞稿的URL列表。也許這是關係到網站的構建方式，或者我（可能）只是缺少一些明顯的事情，一個有經驗的項目將實現向右