2010-08-09 55 views
7

我目前在基於arc90可讀性代碼的Ruby中編寫了一個算法,用於從網頁中提取文章。任何比Ruby提煉關鍵詞更好的方法嗎?

現在,我有一篇文章,我想從它(名稱,作者等)

聽說鍊金是這樣做的一個很大的紅寶石的寶石,雖然它消耗了大量的資源提取關鍵詞和具體信息。有沒有更好的寶石可以用來做這件事?

+0

我認爲'鍊金術'關鍵字是指Adobe的Alchemy項目,而不是Ruby Gem。查看常見問題解答:http://stackoverflow.com/tags/alchemy/info – paleozogt 2010-09-01 17:16:17

回答

2

有一個OpenCalais gem它提供了類似的功能。除了實體提取之外,它還可以檢測實體之間的事件和關係。這不是輕量級的,雖然我不知道是否比鍊金術更好或更差,因爲我沒有使用鍊金寶石。希望這可以幫助。

+0

我已經寫下了自己的OpenCalais創業寶:https://github.com/RedFred7/dover_to_calais – RedFred 2013-12-30 13:11:53

9

快,leightweight和易於使用的寶石從較長的內容提取關鍵詞:

https://rubygems.org/gems/highscore

我用它在生產,就像​​一個魅力。

問題是有點老,但我會留在這裏爲其他誰來自谷歌看到這個問題。