2017-05-26 71 views
-2

我有產品名稱列表,我想在以下給定的URL中搜索產品名稱,我只需要獲取價格。 例如我想搜索「TOMMEE TIPPEE一次性乳墊 - 1×50包」 這個URL http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps 如果我得到了全成匹配,那麼我怎樣才能得到的價格即€8.49 通過刮。 這是演示URL的一個同樣地,我有URL列表正則表達式搜索產品名稱並獲得價格

請幫我提供任何實例或正則表達式來做好這項工作

+1

的StackOverflow是不是免費的代碼服務。顯示您嘗試過的內容以及您的代碼中卡在哪裏。並指出你的問題到那個特定的問題。 –

+2

此外,我建議發佈數據的摘錄而不是鏈接到網站。您可能將該網站與好意聯繫起來,但它可能會被濫用於廣告或惡意軟件傳播,這會使我保持警惕,並且不太可能回答您的問題。 – Aaron

回答

0

幾個示例代碼,可以幫助您開始這個項目。

import re 
from bs4 import BeautifulSoup 

url = 'http://www.boots.ie/baby-child/babyfeeding/breastfeeding-pumps' 
soup = BeautifulSoup(url, 'html.parser') 
product_name_regex = 'Tommee Tippee Disposable Breast Pads - 1 x 50 Pack' 
product_tag = soup.find('div', text=re.compile(product_name_regex)) 
price_tag = product_tag.find_next('div', { "class" : "product_price" }) 
price = price_tag.text 

這個簡短的代碼試圖首先解析HTML頁面,然後通過使用文本/類名查找標籤提取該頁面的信息。

幾個環節,可以幫助你: BeautifulSoup DocHow to find elements by class

+0

Hi @Flames 這是正確的答案。我認爲這個庫是爲Python,但我需要在C#。有沒有在C#或Java腳本中可用的lib。 –

+0

感謝您給我想法在HtmlAgilityPack的解決方案 –

+0

@AdeelNazir沒問題。 – Flames