2010-09-28 49 views
1

我需要定期刷新索引。這意味着 索引將隨着文檔的添加而定期更新。您認爲是什麼解決方案?我需要一個示例源代碼爲 能夠刷新索引。定期使用lucene將新文檔刷新到索引

確定就像下面的源代碼。

public class SimpleFileIndexer { 
    public static void main(String[] args) throws Exception { 
      File indexDir = new File("C:/Users/Raden/Documents/lucene/LuceneHibernate/adi"); 
      File dataDir = new File("C:/Users/Raden/Documents/lucene/LuceneHibernate/adi"); 
      String suffix = "txt"; 

      SimpleFileIndexer indexer = new SimpleFileIndexer(); 

      int numIndex = indexer.index(indexDir, dataDir, suffix); 

      System.out.println("Total files indexed " + numIndex); 
    } 

    private int index(File indexDir, File dataDir, String suffix) throws Exception { 
      IndexWriter indexWriter = new IndexWriter(
          FSDirectory.open(indexDir), 
          new SimpleAnalyzer(), 
          true, 
          IndexWriter.MaxFieldLength.LIMITED); 
      indexWriter.setUseCompoundFile(false); 

      indexDirectory(indexWriter, dataDir, suffix); 

      int numIndexed = indexWriter.maxDoc(); 
      indexWriter.optimize(); 
      indexWriter.close(); 

      return numIndexed; 
    } 

    private void indexDirectory(IndexWriter indexWriter, File dataDir, String suffix) throws IOException { 
      File[] files = dataDir.listFiles(); 
      for (int i = 0; i < files.length; i++) { 
        File f = files[i]; 
        if (f.isDirectory()) { 
          indexDirectory(indexWriter, f, suffix); 
        } 
        else { 
          indexFileWithIndexWriter(indexWriter, f, suffix); 
        } 
      } 
    } 

    private void indexFileWithIndexWriter(IndexWriter indexWriter, File f, String suffix) throws IOException { 
      if (f.isHidden() || f.isDirectory() || !f.canRead() || !f.exists()) { 
        return; 
      } 
      if (suffix!=null && !f.getName().endsWith(suffix)) { 
        return; 
      } 
      System.out.println("Indexing file " + f.getCanonicalPath()); 

      Document doc = new Document(); 
      doc.add(new Field("contents", new FileReader(f))); 
      doc.add(new Field("filename", f.getCanonicalPath(), Field.Store.YES, Field.Index.ANALYZED)); 

      indexWriter.addDocument(doc); 
    } 
} 

上面的源代碼,可以在給定的索引文件的 文本文件的目錄。現在我所問的是如何讓代碼連續運行 ?我應該使用什麼類?所以每當有新的 文件添加到該目錄,那麼lucene將自動索引這些 文件,你能幫我解決這個問題。我真的 需要知道什麼是最好的解決方案。

+0

我看不到'沖洗'在哪裏。 – EJP 2010-09-28 08:11:14

+3

只需刪除您在此處發佈的所有代碼,並將其替換爲「我可以看一個目錄並使用Lucene定期索引它,而無需重新索引所有內容?」。 – 2010-09-28 08:13:54

回答

1

Lucene不能單獨做到這一點。你需要爲此監視文件系統。

看看How to detect filesystem has changed in java

+0

你能告訴我如何使用Jnotify?我發現擁有一個能夠監控任何我想要的目錄的類是一個好主意,可以添加,刪除和刪除目錄中的文檔。我的意思是我如何在上面包含的代碼中包含Jnotify。謝謝 – jacobian 2010-09-28 08:23:51

+0

如果你不是程序員,你可能不應該在SO上。無論如何,這裏是片段:http://jnotify.sourceforge.net/sample.html – 2010-09-28 14:54:45