2
A
回答
1
由於反轉的指標是所有存儲在文檔中的單詞和他們的位置之間的關係,我不知道這的確是一個不錯的用例的NoSQL。傳統的SQL在這裏會更好。例如,嘗試的數據結構是這樣的:
Documents (DocumentID primary key, DocumentText text)
Words (WordID primary key, Word text)
Instances (InstanceID primary key, WordID foreign key, DocumentID foreign key, WordIndex integer)
採用這種結構,當你插入文檔到Documents
表,你分析出每個單詞,並把它添加到Words
表,如果它是新的或檢索現有如果它已經存在,則將其添加到Instances
表中。
如果您打算使用NoSQL,您可以將它用於MongoDB之類的東西,並將所有文檔放在一個集合中,並將所有文檔放在另一個集合中。在每個Word
文檔中,包含一個Instances
數組,該數組可以是關聯文檔的ObjectID
和該文檔中的單詞索引的對象數組。但是,我不確定MongoDB是否針對文檔中的大型數組進行了優化。常見單詞如'a'和'the'最終可能超過4MB文檔限制,具體取決於您擁有的數據量。
0
- 分佈式,可擴展性和高可用性
- 實時搜索和分析能力
- 複雜的RESTful API
相關問題
- 1. 搜索引擎中的倒排索引
- 2. Java - 倒排索引
- 3. 什麼是在.NET中使用的好的倒排索引庫?
- 4. 散列索引vs倒排索引
- 5. Python倒排索引效率
- 6. 高效的方式使用倒排索引排名最高的搜索結果
- 7. MongoDB中的位置倒排索引
- 8. 如何製作倒排索引?
- 9. MySQL索引:倒排或正向
- 10. 幫助建立倒排索引
- 11. 僅將Lucene用作倒排索引
- 12. Hadoop倒排索引程序錯誤
- 13. Lucene倒排索引訪問計數
- 14. 在倒排文件索引上查詢
- 15. 索引和倒排索引在solr中如何工作?
- 16. 把倒排引號圍繞使用索引的字符串,python
- 17. 在倒排索引中搜索一個正常的查詢
- 18. 在Java中創建倒排索引的最佳數據結構是什麼?
- 19. 搜索引擎如何合併來自倒排索引的結果?
- 20. lucene是否在搜索時遍歷整個倒排索引?
- 21. 如何在倒排索引結構中搜索短語查詢?
- 22. 需要倒排索引的文件格式
- 23. 簡單的內存位置倒排索引python
- 24. 倒排索引執行的不同數據結構
- 25. Lucene的倒排索引是否存儲在內存中?
- 26. 如何打印出由elasticsearch創建的倒排索引?
- 27. 任何方式來看SOLR中文檔的倒排索引
- 28. ElasticSearch:在每次更新後創建新的倒排索引
- 29. 選擇排序 - 最小/最大索引
- 30. 顯示相同'CurrentRow'索引的最後和倒數第二行