2011-04-06 93 views
0

我有客戶數據庫,他們具有某些屬性和客戶類型。屬性的集合可能會有所不同(它們確實來自有限集合),而當我查看未知類型的新客戶並給定屬性時,我想確定他/他屬於哪種類型。例如,假設我在DB有這些客戶已經,基於任意分類和相似性度量的匹配

Customer | Type | Attributes 

1   A  44,32,5,'X' 
2   A  3,32,66,'A' 
3   B  6,32,'A', 'B'   
4   C  47,31,2,'H'   
5   C  14,32,2,'O' 
6   C  2,'C' 
7   A  44 

當我收到一個新的客戶誰擁有的屬性,例如,3,32,2,我想確定這個客戶屬於哪個類型,並且代碼應該報告其匹配的信心(以百分比表示)。

什麼是最好的方法在這裏使用?統計的東西,還是基於某種親和度矩陣的方法,還是推薦引擎風格的基於Pearson相關係數的方法?示例中,pseude代碼將是最受歡迎的,但任何所有想法都很好。

感謝,

回答

0

來解決這個問題是使用樸素貝葉斯的方式。