我想了解有助於識別重疊數據集之間的共性和差異的算法信息。什麼算法計算一組集合中常見元素的頻率?
使用計算器的標籤系統爲例:
比方說,這個問題已經給出了5個標籤。假設有1000個其他問題至少有一個這樣的標籤。在這1000個問題中,有多少這些問題的標籤有共同點,我的原始帖子沒有?
描述此的另一種更簡單的方法是自動提示標籤系統:
「你用[5個標籤我選擇]標記了你的問題的其他similiar問題都標有[標籤可能是名單感興趣。其中的標籤可能會感興趣]經常存在的不在我的原單列表標籤。
代碼示例在C#如果可能的話:)