2011-12-19 39 views
1

我一直在這一段時間DOM轉換和所有我能發現是這樣的pdf2dom解析器和可能的this一個逆向工程的版本。無論如何,這是我的問題。對於任何渲染引擎,其輸入應該是一個數據流(在我的情況下,PDF內容),其輸出應該是一個選定的格式(在我的情況下,DOM,HTML & CSS)。PDF到使用javascript

  1. 但是,而不是使用Java或C++,是有可能,我得到「的PDF數據」流(這是我有關於不知道)從服務器和存儲到一個JavaScript變量和使用JavaScript來呈現它並將其附加到DOM?

  2. 如何原始「的PDF數據」的出現(有沒有什麼特別的格式..等)?

歡迎各位參加。

注:應該是IE兼容。

回答

5

已經完成。結果是pdf.js。請注意,它通過將PDF渲染到畫布上來工作。結果可以保證這種方式; PDF的某些功能目前不能在畫布之外進行。

+0

嘿,這真的很好,沒有關於這個項目的線索。 – Graham 2011-12-19 10:21:57

+0

對不起。我的錯。我遇到過這種情況,但畫布不適合我,因爲我必須支持6,7,8太X-D,因此我必須自己做渲染。生病更新我的問題。 +1,因爲這是次佳事。 – 2011-12-19 10:24:05

+1

@Astroth:你可以嘗試使用[ExplorerCanvas](http://code.google.com/p/explorercanvas/)。這不會是完美的,但我認爲它可能會做一個普遍通行的工作。就像你不用畫布一樣好,無論如何,我想象。 – 2011-12-19 11:16:12

2

PDF一般後記+選項嵌入Flash,JavaScript和其他各種東西的一個子集。

翻譯PDF平凡到HTML(/ DOM),並且有它在一個正確的上下的方式呈現幾乎是不可能的。例如,PDF使用JPEG圖像,但在這裏和那裏有微妙的變化,這意味着您必須在使用其他地方之前將其轉換。嘗試閱讀PDF.js-guys中的一些演示文稿,您會發現很長的WTF列表。但是,如果您只有簡單的PDF(純文本;無圖像等),並且不關心保留除最簡單的佈局之外的任何內容,則應該能夠從PDF中提取字符串數據並將其放入它進入DOM。但我個人認爲,強制用戶使用插件(flash/acrobat/...)或呈現PDF的服務器端並將它們作爲圖像提供給瀏覽器會更簡單。