0
因此,我安裝PDF解析器(http://www.pdfparser.org/)。我檢查了他們的網站並使用了演示。這給了我想要的結果。經過幾個小時的搜索如何使用作曲家,我終於設法讓它工作。現在我遇到了下一個如何從演示中獲得結果的問題。「Smalot PDF解析器」結果是:文字不在同一行
我使用了文檔頁面上給出的示例代碼。它確實提取了文本,但所有文本都在同一行上。當我使用演示時,每個新頁面都以一個新段落開始,每段文本都放在一個單獨的行中。代碼:
<?php
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
// Retrieve all pages from the pdf file.
$pages = $pdf->getPages();
// Loop over each page to extract text.
foreach ($pages as $page) {
echo $page->getText();
}
?>
正如我說過,當我使用上面的代碼時,我得到了所有文本在一行上。我的問題是如何獲得與演示頁面上的腳本相同的結果?