回答

5

他們documentation規定:相關性能檢測每個唯一實體的重要性,並在指定0-1(1爲最相關和最重要的)範圍內的相關性得分。

雖然他們沒有解釋什麼「相關性」意味着什麼,但人們會期望它能夠量化該實體對文檔話語的中心性。它可能受諸如本文件中實體提及頻率與隨機文件中的預期頻率(參考TF-IDF)等因素的影響,但也可能涉及更復雜的話語分析。

+0

謝謝約翰。你認爲這是一個概率得分?正如他們以百分比的形式表達的,我想知道它是否可能是一個概率得分,但我有一種強烈的感覺,它不是。你對此有什麼看法?我的應用程序將文本文檔映射到其中的重要實體。你認爲什麼樣的分數範圍表明它足夠重要以便映射到文檔?我會感謝你的迴應。 – Ninja 2011-01-09 10:47:54