lucene

    2熱度

    1回答

    我有一個包含一個XML文件,我試圖找到這種匹配的文本字段: <Payer> [...] bic=\"123456789\" [...] </Payer> 用下面的查詢: { "query": { "span_near" : { "clauses" : [ { "span_term" : { "field" : "payer" }},

    2熱度

    1回答

    我在Apache Lucene中出現OutOfMemory錯誤。 這裏的問題是代碼: DirectoryReader oldReader = directoryReader; DirectoryReader newReader = DirectoryReader.openIfChanged(directoryReader); if ((newReader != null) & (oldRead

    1熱度

    1回答

    我想計算通過Lucene找到的各種文檔的字段COMBINED_FIELD中的每個術語的TF-IDF分數,這些分數通過字段規範進行了標準化。正如你在下面的代碼中看到的那樣,我可以獲得文檔字段中每個術語的術語頻率,也可以獲得文檔頻率,但是我無法找到一種方法來獲得該字段的標準查詢時間。到目前爲止,我發現的所有方法都依賴於只存在於較舊的Lucene版本中的方法,但不適用於Lucene 6.要走的路可能是使

    0熱度

    1回答

    我想索引同一個Solr ID的多個pdf文件。對於我們的項目之一,我們有代表這樣一些對象: {"id" : "object:1234", "authors" : ["me", "you", ...], "keywords": ["key1", "key3", ...], "files" : [ "/tmp/file1.pdf", "/tmp/file2.pdf",

    0熱度

    1回答

    我使用Lucene爲科學文章編制索引。我正在使用以下配置: EnglishAnalyzer analyzer = new EnglishAnalyzer(Version.LUCENE_43, EnglishAnalyzer.getDefaultStopSet()); IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_

    0熱度

    1回答

    elasticsearch更新是否實時?我知道更新文件可用於搜索前,刷新間隔爲1秒。 但是,如果我在1秒內多次更新(增加一個計數器)文件多少次呢?每個更新請求是否適用於上次更新的文檔或上次「刷新」文檔?

    0熱度

    1回答

    5.1以下solrconfig.xml中 <lst name="defaults"> <str name="wt">json</str> <str name="indent">true</str> <str name="fl">name,id,CITY,countryCode</str> <str name="rows">50</str> <str

    0熱度

    1回答

    我想從Apache的Nifi執行以下查詢: GET /myindex/_search { "size": 0, "aggs": { "range": { "date_range": { "field": "Datetime", "ranges": [ { "from": "2017-02-17

    1熱度

    1回答

    我使用與Kentico CMS打包在一起的Lucene.Net實現。我們索引的網站上有各種語言的文章。如果用戶正在查看該網站的日語版本(例如)並運行「VPN」搜索,我們希望他們首先查看有關VPN的日文報道,但也要查看結果中的其他語言文章。 我試圖通過_culture字段的查詢時間提升來實現此目的。由於我們使用的是標準分析器(實際上不想改變它),並且標準分析器將連字符視爲空格,所以我認爲我會嘗試在用

    0熱度

    1回答

    5.1我需要更改json響應的提交值我該怎麼辦? 下面 { responseHeader: { status: 0, QTime: 2 }, response: { numFound: 1, start: 0, docs: [ { Id: "111445", name: "TEST", } ] } } 我需要改變響應studentList和文檔,學生喜歡下面 {