0
我正在尋找處理PDF文件(或使用直接鏈接)的方法。R Studio:使用PDF文件或HTML文件提取信息
我必須處理文件PDF文件以提取有關公司財務報表的信息,並且我希望直接處理文件。可能嗎?我是否將PDF轉換爲文本文件?之後,是否可以搜索該文件的特定信息?
我在問所有這些東西是否可行以及如何去做。
感謝
我正在尋找處理PDF文件(或使用直接鏈接)的方法。R Studio:使用PDF文件或HTML文件提取信息
我必須處理文件PDF文件以提取有關公司財務報表的信息,並且我希望直接處理文件。可能嗎?我是否將PDF轉換爲文本文件?之後,是否可以搜索該文件的特定信息?
我在問所有這些東西是否可行以及如何去做。
感謝
好像有一個叫pdftools包PDF工作。但是你需要將它解析爲JSON。有小教程: http://ropensci.org/blog/2016/03/01/pdftools-and-jeroen