通常計算方式的精確度和召回率(這是我在論文中使用的)是衡量實體對方。假設基礎事實具有以下(沒有任何differentiaton因爲他們是什麼類型的實體)
[Microsoft Corp.] CEO [Steve Ballmer] announced the release of [Windows 7] today
這有3個實體。
假設您的實際提取具有CEO
和today
,爲Windows 7
假陰性和Steve
子字符串匹配以下
[Microsoft Corp.] [CEO] [Steve] Ballmer announced the release of Windows 7 [today]
你必須精確匹配爲Microsoft Corp
,誤報我們通過首先定義匹配標準來計算精度和召回率。例如,他們是否必須完全匹配?如果它們重疊,它是否匹配?實體類型是否重要?通常我們想爲這些標準中的幾個提供精確度和召回率。
完全匹配:真陽性= 1(Microsoft Corp.
,唯一的精確匹配),假陽性= 3(CEO
,today
,和Steve
,這是不完全匹配),假陰性= 2(Steve Ballmer
和Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 1/(1+3) = 0.25
Recall = True Positives/(True Positives + False Negatives) = 1/(1+2) = 0.33
任何重疊OK:真陽性= 2(Microsoft Corp.
,和Steve
重疊Steve Ballmer
),假陽性= 2(CEO
,並且today
),假陰性= 1(Windows 7
)
Precision = True Positives/(True Positives + False Positives) = 2/(2+2) = 0.55
Recall = True Positives/(True Positives + False Negatives) = 2/(2+1) = 0.66
讀者然後離開來推斷「真實性能」(精確度和記得,當允許使用人的無偏人類檢查會給判斷哪些重疊差異是重要的,哪些不重要)是在兩者之間的某處。
通常報告測量是精確度和召回率的調和平均值,並且當您必須在精確度與回想率之間進行權衡時,會提供一些「性能」的概念。
+1全面! – KillBill 2012-08-22 15:56:59
很棒的回答。問題:在這種情況下,「真正的否定」是什麼意思?我相信,需要計算準確性。 – 2016-01-19 19:42:32
假設我根據第二個策略評估(重疊是OK)。如何處理[史蒂夫] [鮑爾默]等情況?兩個(部分)匹配都是正確的,真正的正數是如何計算的? – 2017-11-21 11:44:33