2009-08-22 75 views
0

我愛Ruby和它的框架,但我不認爲Ruby On Rails是開發Feed-parser和Indexer的最佳選擇。蜘蛛和索引器的好語言

也許Python或Java是更好的選擇。你建議什麼語言?

回答

1

Feed(RSS?)通常結構良好(至少與常規網頁相比)。查看Web Harvest,一個基於Java/bean的基於shell的DOM解析器(等等)。您可以使用它來自動從互聯網上獲取數據。有一個領域特定的語言(用XML定義),你必須學習。它的學習曲線可能有點陡峭,但我覺得這是值得的努力。

0

我對Java並不是很熟悉,但我可以說Python非常適合這項工作。

有一個名爲BeautifulStoneSoup的非常快速的XML解析器模塊,您可以使用它。它是BeautifulSoup圖書館的一部分。如果你只是在尋找一個簡單的索引器,Python有一個內置的sqlite引擎,它也是輕量級且非常快速的。