2011-02-02 51 views
2

我有一個pdf文檔,我想從該pdf中提取一些隨機單詞並保存(索引/標記)。然後,我將這些單詞用作該pdf文檔的可搜索標籤。請注意,我不能直接使用pdf文檔來搜索單詞,我必須轉發爲該文檔創建的標籤。 是否有任何圖書館可以從pdf中獲取這些詞語?這是我的Mac應用程序所需要的。如何在可可中編制索引pdf文檔

謝謝。

回答

0

你可以試試Spotlight Query或打開PDF文件PDFKitsearch manually

注意:我並不完全清楚您的意思是「我想從該PDF中提取......」和「我無法直接使用pdf文檔搜索一個詞」......兩個似乎是相互排斥的。

更新

你一直說「隨機單詞」 ......你從字面上的意思是你想a)在文件隨機選擇詞作爲標籤使用,b)檢查,看是否有來自已有列表的單詞在文檔中,或者c)查找「任何重要和有趣的單詞」?

如果您的意思是「c」,則使用SearchKit to build the index in memory

+0

我必須從pdf中提取一些隨機單詞並將它們用作該文檔的標籤。我會將這些文字作爲pdf的標籤發送給服務器。接下來,當客戶想要搜索文檔時,當他輸入一個單詞時,我必須將該單詞發送到服務器,該服務器將在所有pdf文檔的標籤中搜索該單詞。這是要求。但我很困惑如何從PDF文檔中獲取隨機單詞。有沒有什麼可以做到這一點,或者我有寫我自己的算法來做到這一點。 – 2011-07-07 06:14:19