我有一個字符串列表,例如['Apple', 'Appl','Elephnt', 'Elephant']
。我需要將這個字符串列表合併成不同的組,即['Apple', 'Elephnt']
。Python - 摺疊字符串組
我應該在同一組中的字符串標準基於80%以上的百分比匹配。即Apple和Appl分享88%的比賽,而Elephnt和Elephant分享93%的比賽。
def similar(a, b):
return SequenceMatcher(None, a, b).ratio()
函數similar
用於計算兩個字符串的百分比匹配。 如何使用上述函數計算此摺疊分組?
這與'pandas'有什麼關係? –
你如何選擇小組代表,它是否始終是最初列表中小組的第一個單詞? – randomir