我使用Google搜索(沒有任何運氣)open source software that can convert doc, ppt, and pdf to HTML5.
(究竟是什麼Scribd)是否存在與Scribd類型的轉換類似的開源代碼?將pdf,doc,ppt轉換爲html5
如果有人知道付費服務,那也可以。 Scribd有一個API,但這是用於Flash查看器。此外,我想主辦我自己的內容,因爲我需要進一步控制轉換後的html文檔。
我使用Google搜索(沒有任何運氣)open source software that can convert doc, ppt, and pdf to HTML5.
(究竟是什麼Scribd)是否存在與Scribd類型的轉換類似的開源代碼?將pdf,doc,ppt轉換爲html5
如果有人知道付費服務,那也可以。 Scribd有一個API,但這是用於Flash查看器。此外,我想主辦我自己的內容,因爲我需要進一步控制轉換後的html文檔。
http://wvware.sourceforge.net/
wvHtml:轉換的Word文檔 到HTML4.0。
可能: http://www.abisource.com/ 但在這種情況下,它看起來像「開放文檔」>「導出HTML」手動,也許插件的幫助。不知道,你是什麼意思:「可以轉換的源代碼軟件」。
或者這樣: http://www.zope.org/Members/sf/NuxDocument
另外,pdftohtml會給你的HTML頁面output.But你將不得不在它的圖形interface.Since工作並不似乎是非常互動。
你不可能找到一個能夠完成這一切的產品,特別是在開源世界。更可能的是,你最終會依賴於混雜的東西,甚至可能需要鏈接一些轉換器才能獲得HTML。 (例如PDF - > ps - > HTML)
OpenOffice支持轉換爲HTML,並且可以從命令行調用。
http://pdftohtml.sourceforge.net/看起來非常適合將PDF轉換爲html。
對於Word是Word ML或OpenXML格式的文檔,可以想象使用XSLT轉換,因爲輸入和輸出格式都是XML。我已經看到了一些樣式表在網上漂浮,但是YMMV。
順便說一下,爲什麼對開源有特殊要求?例如,MS Powerpoint已支持以HTML格式保存。
對PDF有由Mozilla啓動了一個開源項目,這是非常好的:https://github.com/mozilla/pdf.js/
你可以看到一個Hello World例子:https://github.com/mozilla/pdf.js/tree/master/examples/helloworld
對於文檔類型的其餘部分,我認爲LibreOffice的說,是計劃在html5中構建一些東西,但到目前爲止,還沒有做任何事情。
我知道這個問題是有點老叫flaxpaper http://flexpaper.devaldi.com/
好吧它現在開源,他們收取服務費。事情多年來一直在改變 – 2017-02-22 16:34:08
對於PDF到HTML的轉換,但是我已經找到了新的開源工具,pdf2htmlEX似乎是一個非常好的工具(看着所有的例子/樣本):
你好!這有什麼好運? – 2011-01-29 19:48:11