2010-10-07 76 views

回答

0

香草tf-idf是經常使用的。如果你想了解這些事情,最好的開始是this book

1

BM25是基於術語的排名算法之一。現在還有基於概念的算法。

BM25如果基於術語的信息檢索的最新技術;然而,基於詞的無法克服的一些挑戰例如涉及同義詞,匹配縮寫或識別同音異義詞。 下面是例子:

同義詞: 「買」 和 「購買」

反義詞: 「教授」 和 「教授」

homonym

  • 弓 - 長木棍與用於播放某些絃樂器,如小提琴
  • 弓馬毛 - 關於向前俯在腰間(如「弓向下「)

爲了解決這些問題,有些是使用基於概念的車型,如this articlethis article

基於概念的模型主要使用字典或外部術語來識別概念,並且每個概念模型都有自己的概念或加權算法表示。

相關問題