web-scraping

    0熱度

    1回答

    public void Imagesaver(string url) { string result = Filename(url); string SourceCode = worker.GetSourceCode(url); List<string> names1 = new List<string>(); MatchCollection data

    0熱度

    2回答

    想要一個腳本來刪除URL列表的標題,但是如果我們需要等待整個頁面加載,它可能會超級慢。標題是我正在尋找的唯一的東西。 標題被加載時,我們可以停止頁面加載嗎?也許有像EC.title_contains之類的東西。

    0熱度

    2回答

    我想使用Jsoup登錄到Twitter,因爲我想刮我的推文,並通過短信發送給我,我知道如何處理它們從HTML,我知道如何通過發送它們通過短信,我需要幫助登錄步驟,我無法登錄到twitter 我試過的是,在後臺處理webview(沒有任何用戶界面)(注意:沒有應用程序的用戶界面),但失敗了,因爲它可以「T在不UI處理,與Jsoup我嘗試使用此代碼 final String usernameKey =

    1熱度

    2回答

    district_name= [[li.getText() for li in data_rows[i].findAll('li')] for i in range(len(data_rows))] 上面的代碼給出了一個州比哈爾邦的地區名稱列表。像下面的表一樣。 [['1', 'Nalanda'], ['2', 'Patna'], ['3', 'Gaya'], ['4',

    0熱度

    1回答

    我已經在python中編寫了一個腳本,並結合selenium來解析網頁中的一些公司名稱。我定義的選擇器是完美無瑕的。然而,一旦網頁開啓了一個令人討厭的ad彈出隱藏數據,並且我無法到達那裏。我怎樣才能解決我想要的數據。我試過在網頁上切換幾個iframes,但沒有一個可以工作。我在腳本中使用的現有內容會引發錯誤,顯示Message: no such element: Unable to locate

    -1熱度

    2回答

    使用正則表達式剝離標籤我怎麼能去剝離標籤關閉此列表: ['</span>A walk in the park<span class="html-tag"] 我設法利用(r'(?<=</span>)[^>]+')刪除的第一個標籤,但無法弄清楚如何刪除第二。我知道正則表達式不是處理標籤的方法,而只是想知道這一點。

    0熱度

    2回答

    這是a prior thread的後續操作。代碼對於單個值來說工作得很好,但是當我試圖傳遞超過1個值時出現以下錯誤,我根據函數的長度得到一個錯誤。 錯誤vapply(元件,編碼,字符(1)): 值必須是長度爲1,但 FUN(X [1])結果是長度爲3 下面是代碼的樣本。在大多數情況下,我只能用這種方式命名對象並進行刮擦。 library(httr) library(rvest) library

    1熱度

    1回答

    我試圖抓取產品的價格banggood。 問題是我用jsoup得到的貨幣是從列表中隨機選擇的貨幣。我一直在尋找html文件來查找是否有東西可以幫助我,但我沒有找到任何東西。 如何控制貨幣類型?

    0熱度

    3回答

    個人清單: ['\n\r\n\tThis article is about sweet bananas. For the genus to which banana plants belong, see Musa (genus).\n\r\n\tFor starchier bananas used in cooking, see Cooking banana. For other uses, se

    1熱度

    4回答

    這是我第一次嘗試使用編程來獲得有用的東西,所以請耐心等待。建設性的反饋是非常感謝:) 我正在建立一個數據庫與歐洲議會的所有新聞稿。到現在爲止,我已經構建了一個可以從一個特定URL檢索我想要的數據的刮板。但是,在閱讀了幾篇教程之後,我仍然無法弄清楚如何創建一個包含來自這個特定站點的所有新聞稿的URL列表。 也許這是關係到網站的構建方式,或者我(可能)只是缺少一些明顯的事情,一個有經驗的項目將實現向右