2013-03-04 63 views
3

我對lucene非常陌生。我有一個文本文件,其中包含100行記錄,每行包含兩列。第一列是用戶標識,第二列是url_list(我想這些將是我的文檔字段)java lucene索引和搜索每行創建一個文檔的示例代碼

我需要提供一個使用lucene的搜索功能,它將給包含輸入的url或userid的文檔。爲此,我需要爲每行文本文件創建一個lucene文檔。

請建議我該一些示例代碼..

我米使用Lucene版本3.6.2

回答

2

這裏是Lucene的一個短暫而奇妙的教程初學者。

Lucene in 5 minutes


步驟

1)我認爲你是預解析的文本文件,以獲得用戶ID的舉行,相應的URL列表。你必須這樣做。 Lucene不會幫助。 Lucene不會破壞屬於單個字段的文本,但不會破壞文本並將用戶標識添加到用戶標識字段和網址字段中。

2)閱讀上面的教程。我強烈建議你使用目前爲4.1的Lucene的latest version

3)請注意以下事項特定於您的使用情況

  • 對每個文檔兩個字段:USER_ID,URL(當然你可以改變這些名字)

  • 不要ANALYZE(分解爲令牌)USER_ID字段的內容。

  • 我不知道如何存儲URL字段。您可能不希望對其進行分析或使用可識別URL而無需標記的StandardAnalyzer。

4)您可以在本教程中找到用於索引,查詢,搜索和檢索結果的示例代碼。

+0

嗨,感謝您的幫助..但我沒有得到任何源代碼創建每行1個文件..我應該用什麼?另外我有一個文本文件,如 - > useripaddress url ...我只需要爲這樣的行創建和索引文檔。 – sm21 2013-03-07 05:30:50

+0

你的意思是解析你的文本文件?這不屬於Lucene ..代碼可以寫成只有你可以提供你在該文件中的文本樣本,並清楚地解釋你希望它被索引的方式。 – phani 2013-03-07 14:00:11