2012-07-30 68 views
-1

我正在研究一些網頁挖掘的東西,並試圖找到某些特定實體的網頁URL(例如,維基百科頁面和主頁)。由實體我的意思是一些球員的名字,位置等。例如,如果我的輸入是貝克漢姆,我想以下的輸出:如何爲任何給定實體找到網址和圖片?

網址結果:

http://www.davidbeckham.com/

http://en.wikipedia.org/wiki/David_Beckham

和圖像結果如:

http://upload.wikimedia.org/wikipedia/commons/2/21/WikiBex.jpg

可有人請點出任何方法來實現這一目標?

回答

0

我認爲這可能對他人有幫助。幾種語義Web實現在查找關於實體的信息時非常有用。我發現dbpedia(這是維基百科的語義網表示)非常有用,雖然有一些陡峭的學習曲線,如SPARQL,RDF,但它是值得的和令人興奮的。

0

是的,這是相當容易:

你只需要實現一個搜索引擎如谷歌。然後你可以搜索這個名字,它會給你你想要的結果!

+0

不用編寫搜索引擎,dbpedia spotlight就可以用來解決這個問題。 – Skandh 2012-08-03 04:09:15