2014-09-26 182 views
0

我有一個pdf文件,並希望執行經典的adobe查找功能(ctrl + f)。我的問題是,事實證明,它從來沒有找到任何匹配,而我可以選擇文本並完美地複製/粘貼,所以我不認爲這是一種字體編碼問題。PDF查找功能不起作用

僅供參考這是一個PDF,我從互聯網上下載(不是由我自己創建的),當打開文檔屬性時,它沒有一個單一的描述。文檔限制摘要選項全部設置爲「允許」,但文檔裝配,頁面抽取和簽名設置爲「不允許」。

在此先感謝

+0

請分享問題的PDF。 – mkl 2014-09-26 10:18:55

+0

我該如何上傳? – chiva 2014-09-26 10:20:22

+0

除非你自己創建了PDF(你說你沒有創建PDF),或者你編寫了Adobe Acrobat Reader(你可能沒有這麼做),但是這個問題與SO沒有關係。 ..說:你能把這個PDF文本複製到一個純文本文件嗎?如果不是,文本是不可讀的。 – usr2564301 2014-09-26 10:29:32

回答

1

基礎問題是信息字典的PDF被打破:

1270 0 obj<</Taylor and Francis()/CreationDate(D:20140519140437-07'00')/k¨¯©ßÄ8Ü¥[¦H- 
×58O®¬tB!jŽi¿²©–ý³¿4)'Šóå:ÞcàG·Ñ•[H oÆv²O»Nj°=løvO+ 
`µÃrü}›y`,WÂ%Ü¿ d†/Title/Author(Joe, Harry)/Unknown/ModDate/Creator(TeX)/{¥¶¿‘É.’¶ZàQ'6XÎ/?Féû i 
uŽp„¬L/Trapped/Keywords/PTEX#2eFullbanner/펿–Ê#ˆ¦」Qarmæ qq»ã 
h 
W<:Ê+Úã 
¤ÑFĦ²¤.y.‹í¦TxÉ!©´‘Ê~s‹E;³/EBX#5fPUBLISHER/{úôêΙ{Êçñ*yj 
「kaî¼Y:/Producer>>endobj 

它看起來完全是亂碼。

我修補的文件有這個對象僅包含一個空的字典:

1270 0 obj<<>>endobj 
nd Francis()/CreationDate(D:20140519140437-07'00')/k¨¯©ßÄ8Ü¥[¦H- 
×58O®¬tB!jŽi¿²©–ý³¿4)'Šóå:ÞcàG·Ñ•[H oÆv²O»Nj°=løvO+ 
`µÃrü}›y`,WÂ%Ü¿ d†/Title/Author(Joe, Harry)/Unknown/ModDate/Creator(TeX)/{¥¶¿‘É.’¶ZàQ'6XÎ/?Féû i 
uŽp„¬L/Trapped/Keywords/PTEX#2eFullbanner/펿–Ê#ˆ¦」Qarmæ qq»ã 
h 
W<:Ê+Úã 
¤ÑFĦ²¤.y.‹í¦TxÉ!©´‘Ê~s‹E;³/EBX#5fPUBLISHER/{úôêΙ{Êçñ*yj 
「kaî¼Y:/Producer>>endobj 

現在的Adobe Reader允許我適當地搜索PDF。

很有趣的是看到了這樣的問題,其中一個破碎的PDF允許多少ADOBE READER代碼工作的,並導致只有特定的,看似無關,功能失效

+0

如果PDF結構的其餘部分是正確的,則* * *建議在創建它的軟件中出現某種錯誤。但是..沒有'/ Info'字段,我們不知道它是什麼! – usr2564301 2014-09-29 10:35:11

+1

*如果PDF結構的其餘部分是正確的* - 至少iText在修補程序後成功解析它(實際上我最初嘗試使用iText解析原始PDF文本,並且生成的'InvalidPdfException'指向我指向已損壞的** Info * * 間接賓語)。 *創建它的軟件中的錯誤* - 也可能是一個軟件*操縱*由其他軟件創建的中間PDF。 – mkl 2014-09-29 14:25:18

+0

謝謝mkl!但是,我怎樣才能應用這個補丁?我如何訪問這個信息詞典文件? – chiva 2014-09-30 07:12:20