2017-07-12 66 views
2

我使用node.js和pdf2json解析器來解析pdf文件。 目前它正在使用本地的pdf文件。 但我試圖通過node.js的URL/HTTP模塊獲取pdf文件,我想打開這個文件來解析它。node.js如何使用URL作爲pdf-path與pdf2json一起使用

有沒有可能解析/使用在線pdf?

let query = url.parse(req.url, true).query; 
let pdfLink = query.pdf; 
... 
pdfParser.loadPDF(pdfLink + ""); 

所以該網址應通過如URL給出:https://localhost:8080/?pdf=http://whale-cms.de/pdf.pdf

有什麼辦法給在線PDF /鏈路中解析呢?

在此先感謝。

+1

爲什麼不下載它,並用它作爲一個本地文件的工作? – LEQADA

+0

由於這些pdf正在工作,每小時更新一次,因此通過url進行更容易 –

+0

是的,只需每次下載並像本地文件一樣工作 – LEQADA

回答

-1

我只是面臨着同樣的問題,找到了一個解決方案:從

 var request = require('request'); 
     var PDFParser = require("pdf2json"); 
     var pdfUrl = "http://localhost:3000/cdn/storage/PDFFiles/sk87bAfiXxPre428b/original/sk87bAfiXxPre428b" 
     var pdfParser = new PDFParser(); 

     var pdfPipe = request({url: pdfUrl, encoding:null}).pipe(pdfParser); 

     pdfPipe.on("pdfParser_dataError", err => console.error(err)); 
     pdfPipe.on("pdfParser_dataReady", pdf => { 
      let usedFieldsInTheDocument = pdfParser.getAllFieldsTypes(); 
      console.log(usedFieldsInTheDocument) 
     }); 

來源: https://github.com/modesty/pdf2json/issues/65
乾杯

+0

請在這裏發佈您的答案,而不只是一個鏈接。 –

+0

雖然這個鏈接可能回答這個問題,但最好在這裏包含答案的重要部分,並提供供參考的鏈接。如果鏈接頁面更改,則僅鏈接答案可能會失效。 - [來自評論](/ review/low-quality-posts/18415289) – Liam

相關問題