solr

0熱度

1回答

在eclipse中運行索引器作業時出現錯誤「Missing elastic.cluster and elastic.host ....」

我在eclipse中配置了apache nutch 1.13和solr 5.5.0和hbase 0.90.6。現在，我可以從注入器運行這些作業，但在運行索引作業時會拋出錯誤「Missing elastic.cluster and elastic.host ....」。我在nutch-site.xml文件中的plugin.includes下設置了indexer-solr。但仍然得到這些錯誤。有人可以

0熱度

1回答

Solr的得分關鍵詞檢測率

我習慣Solr的6.1 現在我設置了比分，但我對成績有些問題我只是搜索GCS的QF集：標題^ 100 ^內容文本70^50，這三個字段中鍵入都是text_general，我得到的第一個結果得分爲1050.8486，另一個是853.08655，但第一個內容是在內容領域如此之短，另外一個是在內容領域這麼多，我只是不知道爲什麼第一次得分會有很多兩個結果debugquery以下內容： 100

0熱度

1回答

Solr索引文件刪除html標籤和垃圾內容形式索引

我正在Solr 6.5，我注意到的一件事是我的索引文件大小不斷增加與內容。我使用了一個停用詞文件，並且沒有任何常見單詞被編入索引。我在索引中看到很多HTML標籤，我不想索引，也不應該在索引內容中添加註釋。我怎樣才能找到這些並更新我的stopword txt來處理它們？我只索引了英文內容，索引文件已經是30 GB，只有900萬份文檔。

0熱度

1回答

Solr/Lucene的結果重現性

solr/lucene中的結果在給定一組靜態索引的情況下是可再現的嗎？如果我在不同的時間運行相同的查詢兩次，或者如果我在兩個不同的實例上使用完全相同的索引運行相同的查詢，我是否會獲得相同的結果，或者緩存和其他因素是否會影響排名？

0熱度

1回答

是否可以在DataStax Enterprise中創建基於非CQL的Solr內核？

的DataStax網站說：不能創建一個Solr的核心，除非你先上載架構和配置文件。如果您要創建一個基於定製列表，Solr的核心，該表必須在卡桑德拉創建核心」之前就已存在。有沒有一種方法來創建一個非基於CQL Solr的核心，可能使用Solr的HTTP API？

0熱度

1回答

如何使用Apache Nutch和Solr抓取磁鏈接，以便它們在Solr查詢結果中可用？

我讓自己熟悉Apache Nutch和Solr的抓取，但是意識到儘管HTTP和HTTPS鏈接可用於Solr查詢結果中，但content字段磁鏈接不是。我調整conf/regex-urlfilter.txt是 -^(file|ftp|mailto): # skip image and other suffixes we can't yet parse # for a more extensiv

0熱度

1回答

在Solr中使用REST進行基本身份驗證6.6.1

我已經通過遵循其參考指南部署了具有基本身份驗證的Apache Solr 6.6.1。最後他們討論瞭如何在安全性方面使用捲曲。對於我的情況，我正在使用REST API來查詢SOLR。由於基本身份驗證我正在使用此查詢。 https://user:[email protected]/solr/ ... 這樣我的用戶& paswd會暴露。我想知道最安全的方法使用REST API的基本身份驗證，這將不會暴

0熱度

1回答

Solr中長度大於3的索引字

我在Solr（版本6.5）中索引大型文本段落。我需要索引僅其長度大於3個字符（隻字符）的那些單詞。但索引需要的數字。例如 - '問'和'as'不需要，但需要'10'和'101'。實現這一的一種方法是，採取一切可能的組合在stopWords.txt中的文件。可有人請建議我一個更好的方式來實現這一目標？

0熱度

1回答

MySQL和Solr的一致性，插入到任一

我有一個MySQL表，所有用戶可以插入到。表格中的一個字段是該行匹配的solr文檔的總數，稱之爲total results。在插入的REST api代碼中，我使用solr客戶端來查找新行匹配的文檔的總數。我更新該字段，然後返回已完成的資源。很簡單，雖然我寧願以某種方式通過MySQL自動觸發此更新。更大的問題是，在向solr插入新文檔或刪除舊文檔時，現在沒有比執行與REST api代碼具有相同邏

0熱度

1回答

重定向到內部代碼

找不到域我接手維持一個CMS系統。該網站在乘客和nginx上運行，並有一個單獨的solr服務器。我做了修改。例如，我禁用了索引索引，因爲它造成了放緩。用戶報告說，該網站內的鏈接開始重定向到網域無效。重定向似乎是用於測試的舊域。我無法重現任何這些錯誤，也找不到這些域的任何痕跡。是否有人在追捕這種類型的bug有什麼建議？任何與舊域名鏈接可能出現並隨機導致人們被重定向的地方？或者任何可能有幫助的工具