2013-03-20 72 views
2

我知道如何使用Apache POI這樣如何從ppt,pptx文件中提取文本除了頁腳,使用apache poi幻燈片編號?

 InputStream fis=new FileInputStream("abcd.ppt"); 
     HSLFSlideShow show=new HSLFSlideShow(fis); 
     SlideShow ss=new SlideShow(show); 
     Slide[] slides=ss.getSlides(); 
     StringBuilder builder = new StringBuilder(); 
     for(int x=0; x < slides.length; x++) 
     { 
      TextRun[] runs = slides[x].getTextRuns(); 
      for(int j=0; j<runs.length; j++) { 
       TextRun run = runs[j]; 
       if(run != null) { 
        String text = run.getText(); 
        builder.append(text); 
       } 
      } 
     } 

來提取PPT文件中的文本,但它提取所有頁腳,幻燈片編號,我不想

那麼如何提取除頁腳和幻燈片文本號碼

在此先感謝

+0

爲什麼不跳過你不感興趣的文本? – Gagravarr 2013-06-24 10:55:04

+0

@Gagravarr不是關於如何以編程方式確定他們想跳過哪些的問題?我也有同樣的問題。 – Trejkaz 2015-07-16 01:36:59

回答

-1

我會建議你看看JPresentation。其中一個示例顯示瞭如何從所有幻燈片中提取所有圖像和文本:http://www.independentsoft.de/jpresentation/tutorial/exportallslides.html

API接縫非常容易。

+0

我不明白這是如何省略頁眉和頁腳文本,但形狀和文本運行都是在POI中,所以大概有一種方法可以做到這一點,而不訴諸有問題的商業軟件? – Trejkaz 2015-07-16 01:47:42

相關問題