2017-01-09 67 views
0

因此,我安裝PDF解析器(http://www.pdfparser.org/)。我檢查了他們的網站並使用了演示。這給了我想要的結果。經過幾個小時的搜索如何使用作曲家,我終於設法讓它工作。現在我遇到了下一個如何從演示中獲得結果的問題。「Smalot PDF解析器」結果是:文字不在同一行

我使用了文檔頁面上給出的示例代碼。它確實提取了文本,但所有文本都在同一行上。當我使用演示時,每個新頁面都以一個新段落開始,每段文本都放在一個單獨的行中。代碼:

<?php 

// Include Composer autoloader if not already done. 
include 'vendor/autoload.php'; 

// Parse pdf file and build necessary objects. 
$parser = new \Smalot\PdfParser\Parser(); 
$pdf = $parser->parseFile('document.pdf'); 

// Retrieve all pages from the pdf file. 
$pages = $pdf->getPages(); 

// Loop over each page to extract text. 
foreach ($pages as $page) { 
    echo $page->getText(); 
} 

?> 

正如我說過,當我使用上面的代碼時,我得到了所有文本在一行上。我的問題是如何獲得與演示頁面上的腳本相同的結果?

回答

0

我有同樣的問題。循環這種方式與nl2br

// Loop over each page to extract text. 
foreach ($pages as $page) { 
echo nl2br($page->getText()); 
}