我不是標準化的名單最頻繁的詞,例如:獲取列表
'one Bull', 'A Horse', 'Horse', 'Dog', 'Black dog', 'Brown dog', 'Bird', 'I'm a horse', 'I'm not a dog'
我想要得到的是最常見的值的列表,這將是很容易使用SQL如果數據清白的,但具有不歸一化數據,我不知道我怎麼能得到類似的名單如下:
'Dog' - 4
'Horse' - 3
'A' - 3
...
我已經看到了Python有一個計數器模塊可幫助,但它會將一個字符串計爲一個"One bull"
,而不是混合字"One", "Bull".
以前可能會拆分字符串嗎?
修改初始列表使用''split''如'x = [y.split()for y in list]',然後將其平坦化,然後「count」。 –