2010-07-07 169 views
39

我使用Google搜索(沒有任何運氣)open source software that can convert doc, ppt, and pdf to HTML5.(究竟是什麼Scribd)是否存在與Scribd類型的轉換類似的開源代碼?將pdf,doc,ppt轉換爲html5

如果有人知道付費服務,那也可以。 Scribd有一個API,但這是用於Flash查看器。此外,我想主辦我自己的內容,因爲我需要進一步控制轉換後的html文檔

+0

你好!這有什麼好運? – 2011-01-29 19:48:11

回答

1

http://wvware.sourceforge.net/

wvHtml:轉換的Word文檔 到HTML4.0。

可能: http://www.abisource.com/ 但在這種情況下,它看起來像「開放文檔」>「導出HTML」手動,也許插件的幫助。不知道,你是什麼意思:「可以轉換的源代碼軟件」。

或者這樣: http://www.zope.org/Members/sf/NuxDocument

另外,pdftohtml會給你的HTML頁面output.But你將不得不在它的圖形interface.Since工作並不似乎是非常互動。

15

你不可能找到一個能夠完成這一切的產品,特別是在開源世界。更可能的是,你最終會依賴於混雜的東西,甚至可能需要鏈接一些轉換器才能獲得HTML。 (例如PDF - > ps - > HTML)

OpenOffice支持轉換爲HTML,並且可以從命令行調用。

http://pdftohtml.sourceforge.net/看起來非常適合將PDF轉換爲html。

對於Word是Word ML或OpenXML格式的文檔,可以想象使用XSLT轉換,因爲輸入和輸出格式都是XML。我已經看到了一些樣式表在網上漂浮,但是YMMV。

順便說一下,爲什麼對開源有特殊要求?例如,MS Powerpoint已支持以HTML格式保存。

+1

適用於OpenOffice的+1 – vladr 2010-09-06 21:20:55

+0

舊版本的powerpoint用於導出一系列內容,如PDF到html的圖像。這可能已經改變,因爲我還沒有嘗試過一段時間。 – 2011-03-25 15:42:45

+0

Pdftohtml只是給出一個單一的HTML頁面輸出,但看起來不是很好。複雜的輸出給出了很好的html輸出,但它爲pdf中的每個頁面創建單獨的html文檔。對於大量的pdf文件可能不可行。 – Daenarys 2013-07-12 04:50:35

5

Open Office將PDF轉換爲html,但您會打中設計質量。

我建議要麼:Crocodoc作爲收費服務(它提供了不同的平臺,如Python和Ruby,Java的不同口味,PHP開發人員可以在他們的API的工作。)或等待官方的Adobe工具(它在工作中)。

+3

Crocodoc現在免費:) – Viral 2012-04-01 01:06:45

+0

感謝您的更新 – 2012-04-01 19:19:21

-1

我知道這個問題是有點老叫flaxpaper http://flexpaper.devaldi.com/

+0

好吧它現在開源,他們收取服務費。事情多年來一直在改變 – 2017-02-22 16:34:08