2011-05-20 58 views
0

我正在研究將Wikipedia集成到node.js應用程序中的最簡單方法。 要求是能夠搜索條目並在每個條目中查找實體。如何使用Node.js訪問Wikipedia

任何已知的現有庫/方法?

感謝

+2

你應該說出你想要做什麼。從Wikipedia.org簡單地刮取和顯示HTML應該是一件簡單的事情。 – mikl 2011-05-20 12:22:05

回答

2

有對維基文本(http://sweble.org/)如果你滾你自己的解決方案,可能對你有用的新的開源解析器。當然,這需要您下載維基百科數據轉儲,解析和存儲數據庫中的實體。

你也可以看看dbpedia(http://dbpedia.org/About),雖然這需要將rdf堆棧集成到你的應用程序中(運行本地rdf存儲庫或通過sparql與通常片狀的在線版本進行通信)。

一個簡單的方法是使用搜索引擎的API和限制網站:wikipedia.org - e.g:

http://www.google.com/search?q=node.js+site%3Awikipedia.org

我發現可以工作得很好。

0

蜘蛛爲使用jQuery刮更是別出心裁:

https://github.com/mikeal/spider

Mikeal是男人

想必你會使用這個對於方(個人)的項目,雖然。不知道它是如何猶太教在維基百科與刮刀野生。