0

據我所知,散列/倒排索引分別將值/字映射到記錄/文檔。 然而,散列索引中的插入複雜度較低(因爲它在溢出的情況下添加了一個新的存儲區),但倒數索引更多(由於保留了排序的文檔ID列表)。 這是否意味着它們本質上是相同的,除了實現?散列索引vs倒排索引

+0

看來你談一些具體的技術,但沒有命名,並把標籤 – leventov 2015-04-03 17:54:41

+0

我說的是使用散列關係數據庫中的索引以及Web文檔搜索中的倒排索引。讓我看看我是否可以添加他們的標籤。 – 2015-04-05 21:49:13

回答

1

據我所知,與倒排索引相比,散列索引用於完全不同的用例/場景。散列索引只是從索引鍵到內存中給定行的確切位置的映射(主要用於關係數據庫中的內存優化表),而倒排索引實際上是從單詞到其所在文檔的映射遏制。

所以,如果我們看一下,一個單詞可能包含在許多文檔中,並且文檔將被許多這樣的單詞共享。因此,在倒排索引的情況下,許多鍵指向在很多這樣的鍵上通用的文檔id,而在散列索引的情況下,鍵指向的數據,即行數據可能彼此完全不相關。

因此,它們與解決完全無關的情況並不相同,並且實施方式非常不同。

有關倒排索引更多的信息,你可能指的是張貼在這裏:BigData: Inverted Index