pdf-conversion

    4熱度

    1回答

    我試圖從PDF中提取文本。 PDF包含印地文(Unicode)文本。我正在使用的提取實用程序是Apache PDFBox(http://pdfbox.apache.org/)。提取器提取文本,但文本不可識別。我嘗試在許多編碼和字體之間進行更改,但預期的文本仍然無法識別。 這裏有一個例子:在PDF 說文字是:पवार 什麼樣子後提取:̄Ö3/4ÖÖü 有什麼建議嗎?

    80熱度

    2回答

    我正在考慮使用pdf.js(允許在網頁中嵌入pdf的開源工具)。沒有關於如何使用它的任何文檔。 我假設我所做的是在頭文件中引用的腳本創建一個html頁面,然後在正文中,我使用文件名和位置的數組進行某種函數調用。有人可以幫我從這裏出去嗎?

    0熱度

    2回答

    我需要將xlsx文檔轉換爲pdf格式。 我知道iText可以保存pdf文檔和Docx4j可以讀寫xslx。實際上,我們的應用程序既用於構建報告。 但是我們有非常困難的模板,所以我不能只讀取xslx(docx4j)並將其寫入pdf(iText)。格式化會丟失,所以我需要另一個轉換庫。 我也聽說過像商業圖書館(Jxcell)但想使用開源解決方案。 任何人都可以幫助我嗎?

    1熱度

    2回答

    我們正嘗試在我們自己的服務器上快速安裝.Net PDF創建器。有沒有可以嵌入到網站的應用程序,並允許用戶生成該網址或其他網址的PDF?免費或付費並不重要,要爲客戶打造,因此我們正在努力尋找一個高質量的PDF渲染太多,謝謝 PS或可以有人建立這個?

    2熱度

    2回答

    我一直在使用ConversionJob在SharePoint 2010中到的docx文件轉換爲PDF,它需要很長的時間,大約10分鐘。 這真的很慢嗎,還是因爲我服務器上的資源有點慢?因爲我的開發服務器需要10分鐘,我擔心通過互聯網所花的時間。 有什麼方法可以讓SharePoint更快速地使用SharePoint 2010嗎? 我使用C#,Open XML來操作和創建docx,然後使用SharePo

    0熱度

    1回答

    我們的數據庫中有一個二進制PDF文件。我將它流出並保存爲PDF文件,並用兩種來源進行測試,最後得到相同的結果:PdfTextExtractor拼寫錯誤。 例如,在PDF中有一個單詞「確認」。在PdfTextExtractor轉換它之後,它被拼寫爲「confrmed」。 我在調試過程中逐步完成了這個過程,並且它在被PdfTextExtractor轉換後立即拼錯,所以我確定它不是不準確的,因爲我正在做

    1熱度

    1回答

    我對使用carrierwave很新穎。目前,我可以上傳圖片並對其執行簡單操作,例如resize_to_fit。 現在我需要更改我的name-uploader.rb文件,因此當我上傳PDF文件時,它會自動將PDF轉換爲多個圖像文件(PNG/JPEG)。我想了解的一個主要問題是如何檢查上傳文件的類型?我知道我可以設置要接受的文件類型列表,我已經設置了可接受的文件類型列表。 現在,當上傳pdf時,我希望

    1熱度

    2回答

    我一直在這一段時間DOM轉換和所有我能發現是這樣的pdf2dom解析器和可能的this一個逆向工程的版本。無論如何,這是我的問題。對於任何渲染引擎,其輸入應該是一個數據流(在我的情況下,PDF內容),其輸出應該是一個選定的格式(在我的情況下,DOM,HTML & CSS)。 但是,而不是使用Java或C++,是有可能,我得到「的PDF數據」流(這是我有關於不知道)從服務器和存儲到一個JavaScr

    2熱度

    3回答

    我正在構建一個應用程序,通過瀏覽器查看pdf,而不需要移動設備上的插件。我試過ImageMagick和ghostscript將頁面轉換爲圖像,但它們太大而文字變得不清晰。我看到網站提供了將PDF轉換爲html並執行下降工作的服務,但是我找不到如何完成這個工作的例子。任何幫助深表感謝。謝謝!

    2熱度

    3回答

    我一直在尋找一段時間,但是我找不到太多的幫助。我希望有人能幫我解決這個問題,因爲我真的很難過。我正在使用Office 2010和C#4.如何才能將Word文檔的第一頁轉換爲PDF?這site幫助我開始,但它只顯示我如何將整個文檔保存爲PDF。 有沒有辦法: 只保存第一頁爲PDF? (最理想的選擇) 刪除所有剩餘的頁面,然後另存爲PDF? 我該如何去做呢?