2013-06-29 49 views
1

我必須以很多網站的文本格式提取聯繫人信息。我如何提取?我們來看一個例子:如何從多個網站提取數據特定數據

Document doc=Jsoup.connect("http://www.genesyslab.com/").get(); 

在這裏我連接到網站。我想提取本網站的產品信息。

+1

您必須瞭解HTML元素是什麼以及它們在您試圖訪問的頁面中如何scruturec。我們現在可以爲您提供該網站的產品列表,但如果您不明白,只要他們改變了一點,整個程序就會停止工作。你應該首先閱讀一個基本的HTML教程。 – acdcjunior

+1

你曾經使用過'Jsoup'嗎?請在這裏查看示例:http://jsoup.org/cookbook/extracting-data/。你將能夠回答你自己的問題。 – Niranjan

+0

其實我是jsoup的新手,現在我可以從單個網站獲取數據,但是讓我們來舉個例子,我必須從任何網站解析所有關於我們的數據,然後我可以寫什麼? – Chintamani

回答

0

你應該把你需要的所有URL放在一個文件中,然後加載文件並在循環中提取信息。例如:

//Load file with urls into array 
for (url : array) { 
    //connect to url 
    //extract data 
    //send data to file 
}