information-retrieval

0熱度

2回答

給定查詢列表並給出一個文檔，我想根據它們與給定文檔的相關程度對查詢進行排名。對於每個查詢，我計算了查詢中每個單詞的詞頻。（術語頻率定義爲單詞在文檔中出現的次數除以文檔中的單詞總數）現在，我總結了查詢中每個術語的術語頻率。例如： search query: "Hello World" document: "It is a beautiful world" tf for 'Hello':

-3熱度

3回答

是否有必要創建一個數據庫來收集用戶在html，css和JS靜態網站中的信息？

也許這不是最好的論壇來問這個問題，因爲我知道這更適合於特定的編碼問題。但是，我不知道在哪裏問這個問題，如果它揭示了話題，我會立即刪除它。因此，我正在爲我的父母餐廳建立一個網站，而且前端目前已經完成。但是，現在我想獲得用戶請求，食品訂單，並且如果可能將其發送到我的計算機或電子郵件，所以我可以創建一個將此訂單發送給我父母gmail的python腳本。有沒有人有消解解決這個問題？是否需要創建一個

-2熱度

1回答

信息檢索以圖像形式獲取地名

我開始開發一個軟件，通過旅遊景點的圖像（例如：聖彼得大教堂，鬥獸場等）我應該檢索哪個是現貨（加上相關信息）。除了圖像之外，我還將與圖像座標（嵌入爲元數據）一起使用。我知道我可以通過使用反向搜索的Google Images API來支持我，在該搜索中，我將圖像作爲輸入，並且我將以響應形式提供一大組圖像。但是，我對你的建議要求是，現在有了所有相似的圖像，我可以使用哪種方法來檢索照片中的正確地點名稱。

1熱度

1回答

用於學習排名算法的好查詢 - 文檔數據集？

最近我開始研究排名算法，其中涉及特徵提取以及排名。我在微軟研究網站上發現的着名學習排名算法數據集具有從文檔中提取的查詢ID和特徵的數據集。有人建議我好好學習，以便將具有查詢 - 文檔對的數據集按其原始形式進行排序並具有良好的相關性判斷。

0熱度

1回答

Informatica映射創建主機文件佈局的目標文件

我在尋找建議，瞭解如何處理此要求。我必須用Informatica映射創建下面的目標文件。源文件 Key-1 Key-2 ACCOUNT-1 Key-1 Key-2 ACCOUNT-2 Key-1 Key-2 CC-ACC-1 Key-1 Key-2 CC-ACC-2 Key-1 Key-2 CC-ACC-3 對於上述輸入源的佈局，我需要具有低於目標文件基於一個輸出記錄。基本

0熱度

1回答

TF-IDF和Rocchio在信息檢索概論中的分類

我在查看信息檢索簡介中的Vector Space Classification（鏈接章節）中的表14.1，其中示例14.1所述「顯示了五個文檔的tf-idf向量表示。使用公式(1 + log tf) * log(4/df)如果tf > 0表13.1然而，當我看着表14.1，它不會出現，這TF-IDF公式適用於文獻向量從表13.1文件： 1: Chinese Beijing Chinese

1熱度

1回答

通過不同的字符串鍵比較哈希表

我有兩個哈希地圖，並希望儘可能快地比較它，但問題是，mapA的字符串由兩個字與空間連接組成。 mapB的字符串只有一個字。我不想算OCCURENCES，即已經完成，我想比較兩個diferent字符串 mapA: key: hello world, value: 10 key: earth hi, value: 20 mapB: key: hello, value: 5 key: wo

1熱度

1回答

如何獲得處理器代號

我想獲得處理器代號（例如「的Ivy Bridge」，「的Sandy Bridge」）像Windows，但在C＃代碼CPU-Z工具。

0熱度

4回答

如何在分佈式計算機上分割非常大的單詞列表以便快速回答

這更多的是一個架構問題，您將如何在規模上解決此問題。假設您有一個數以百萬計的單詞列表，並且您需要搜索這些數以百萬計的單詞是否存在於數萬億字的語料庫中。例如： Word_List = ["This", "a", "test", "of", "two", "words","what","words"] The_corpus = ["This", "a", "test", "of", "tw

0熱度

1回答

如何計算髮佈列表的可變字節編碼？

可以說我有一個6個數字的發佈列表21992 23523 27822 28002 31010 33122.將它們轉換爲可變字節編碼的過程是什麼？