solr

    0熱度

    1回答

    我在eclipse中配置了apache nutch 1.13和solr 5.5.0和hbase 0.90.6。現在,我可以從注入器運行這些作業,但在運行索引作業時會拋出錯誤「Missing elastic.cluster and elastic.host ....」。我在nutch-site.xml文件中的plugin.includes下設置了indexer-solr。但仍然得到這些錯誤。有人可以

    0熱度

    1回答

    我習慣Solr的6.1 現在我設置了比分, 但我對成績有些問題 我只是搜索GCS的QF集:標題^ 100 ^內容文本70^50, 這三個字段中鍵入都是text_general, 我得到的第一個結果得分爲1050.8486,另一個是853.08655, 但第一個內容是在內容領域如此之短,另外一個是在內容領域這麼多, 我只是不知道爲什麼第一次得分會有很多 兩個結果debugquery以下內容: 100

    0熱度

    1回答

    我正在Solr 6.5,我注意到的一件事是我的索引文件大小不斷增加與內容。我使用了一個停用詞文件,並且沒有任何常見單詞被編入索引。 我在索引中看到很多HTML標籤,我不想索引,也不應該在索引內容中添加註釋。我怎樣才能找到這些並更新我的stopword txt來處理它們? 我只索引了英文內容,索引文件已經是30 GB,只有900萬份文檔。

    0熱度

    1回答

    solr/lucene中的結果在給定一組靜態索引的情況下是可再現的嗎? 如果我在不同的時間運行相同的查詢兩次,或者如果我在兩個不同的實例上使用完全相同的索引運行相同的查詢,我是否會獲得相同的結果,或者緩存和其他因素是否會影響排名?

    0熱度

    1回答

    的DataStax網站說: 不能創建一個Solr的核心,除非你先上載架構和配置文件。如果您要創建一個基於定製列表,Solr的核心,該表必須在卡桑德拉創建核心」之前就已存在。 有沒有一種方法來創建一個非基於CQL Solr的核心,可能使用Solr的HTTP API?

    0熱度

    1回答

    我讓自己熟悉Apache Nutch和Solr的抓取,但是意識到儘管HTTP和HTTPS鏈接可用於Solr查詢結果中,但content字段磁鏈接不是。我調整conf/regex-urlfilter.txt是 -^(file|ftp|mailto): # skip image and other suffixes we can't yet parse # for a more extensiv

    0熱度

    1回答

    我已經通過遵循其參考指南部署了具有基本身份驗證的Apache Solr 6.6.1。最後他們討論瞭如何在安全性方面使用捲曲。對於我的情況,我正在使用REST API來查詢SOLR。 由於基本身份驗證我正在使用此查詢。 https://user:[email protected]/solr/ ... 這樣我的用戶& paswd會暴露。我想知道最安全的方法使用REST API的基本身份驗證,這將不會暴

    0熱度

    1回答

    我在Solr(版本6.5)中索引大型文本段落。 我需要索引僅其長度大於3個字符(隻字符)的那些單詞。但索引需要的數字。例如 - '問'和'as'不需要,但需要'10'和'101'。實現這一 的一種方法是,採取一切可能的組合在stopWords.txt中的文件。 可有人請建議我一個更好的方式來實現這一目標?

    0熱度

    1回答

    我有一個MySQL表,所有用戶可以插入到。表格中的一個字段是該行匹配的solr文檔的總數,稱之爲total results。 在插入的REST api代碼中,我使用solr客戶端來查找新行匹配的文檔的總數。我更新該字段,然後返回已完成的資源。很簡單,雖然我寧願以某種方式通過MySQL自動觸發此更新。 更大的問題是,在向solr插入新文檔或刪除舊文檔時,現在沒有比執行與REST api代碼具有相同邏

    0熱度

    1回答

    找不到域我接手維持一個CMS系統。該網站在乘客和nginx上運行,並有一個單獨的solr服務器。我做了修改。例如,我禁用了索引索引,因爲它造成了放緩。 用戶報告說,該網站內的鏈接開始重定向到網域無效。重定向似乎是用於測試的舊域。我無法重現任何這些錯誤,也找不到這些域的任何痕跡。 是否有人在追捕這種類型的bug有什麼建議?任何與舊域名鏈接可能出現並隨機導致人們被重定向的地方?或者任何可能有幫助的工具