2011-05-16 93 views
4

我打算在Linux上使用apache poi或python xlrd來讀取Linux上的程序中的電子表格。我偏向於python xlrd,但是apache poi對我來說似乎是一個更完整的項目(可能是因爲它受到apache基金會的支持)。什麼會是更好的選擇(我偏向於python,但仍然......)?我希望能夠閱讀大多數的Excel版本和讀取宏。apache poi vs python xlrd

回答

2

根據您的需求的複雜性,您可能只需使用CLI即可。 Tika處理與POI(和其他圖書館)的交談,並會爲您提供該文檔的XHTML或純文本版本。如果你只是想要一個簡單的linux命令,那可能就足夠了。

否則,它可能取決於你的Java技能是什麼樣子。 POI應該做你需要的一切,但是你需要編寫一些代碼來抓取你感興趣的部分。看看quick guide讓你開始。

(我不知道xlrd,抱歉)

+0

我基本上想要在網絡服務器上運行它。如果它的Java,我認爲我將不得不寫jsps讓人們擊中它。然而,我確實需要更多的功能 - 比如提取公式等,而不僅僅是純文本。我猜,Apache POI會很好嗎? – 2011-05-16 18:46:44

+0

與Tika一起玩,因爲您可能會發現它確實提供了您需要的WRT公式等,而Tika與SOLR的集成可能有助於在網絡上發揮作用。否則,有很多漂亮的Java Web框架可以讓您從POI中提取數據,而無需觸摸JSP! – Gagravarr 2011-05-16 21:43:23

0

一個選擇可能給兩全其美將利用通過Jython的Apache的POI(與Java互操作Python語法)。

Here是一個日期jython的例子...我相信這將需要改變與新版本的POI。