2017-10-17 190 views
0

我打算從網絡資源(網絡報廢)中做數據提取作爲我工作的一部分。我想提取我公司10公里範圍內的信息。從網上提取數據

我想提取的信息,如公寓,其地址,單位數量和每平方英尺的價格。其他事情如該地區的多所學校和幼兒園以及酒店。

我知道我需要從幾個來源/網頁中提取。我也將使用Python。

我想知道應該使用哪個庫或多個庫。網絡報廢是唯一的手段嗎?我們可以從Google地圖提取信息嗎?

此外,如果任何人有任何經驗,我將非常感激,如果你能指導我這一點。

非常感謝,夥計們。

回答

0

對於Google地圖,請嘗試API。谷歌TOS非常沮喪地使用Google地圖數據提取的網絡抓取工具。

如果您使用的是Python,它具有非常好的庫BeautifulSoup和Scrapy用於此目的。

其他意思?您可以從OSM數據中提取POI,嘗試使用開源工具。物業信息?可以從政府辦公室爲您的縣/州提供,試試看。

+0

謝謝!嘗試Google API和BeautifulSoup! – arshyMA