基於任意分類和相似性度量的匹配

我有客戶數據庫，他們具有某些屬性和客戶類型。屬性的集合可能會有所不同（它們確實來自有限集合），而當我查看未知類型的新客戶並給定屬性時，我想確定他/他屬於哪種類型。例如，假設我在DB有這些客戶已經，基於任意分類和相似性度量的匹配

Customer | Type | Attributes 

1   A  44,32,5,'X' 
2   A  3,32,66,'A' 
3   B  6,32,'A', 'B'   
4   C  47,31,2,'H'   
5   C  14,32,2,'O' 
6   C  2,'C' 
7   A  44

當我收到一個新的客戶誰擁有的屬性，例如，3,32,2，我想確定這個客戶屬於哪個類型，並且代碼應該報告其匹配的信心（以百分比表示）。

什麼是最好的方法在這裏使用？統計的東西，還是基於某種親和度矩陣的方法，還是推薦引擎風格的基於Pearson相關係數的方法？示例中，pseude代碼將是最受歡迎的，但任何所有想法都很好。

感謝，

來源

2011-04-06 user423805

來解決這個問題是使用樸素貝葉斯的方式。

來源

2011-04-06 12:55:48 user423805

基於任意分類和相似性度量的匹配

回答

相關問題