2012-03-26 132 views
1

Levenshtein距離支持其實施還有哪些其他語言?非英語語言的Levenshtein距離

我知道的語言需要有基於單字符表示(而不是兩個或多個字符在荷蘭被視爲一個單一實體一樣?),想知道哪些語言秋/不屬於這一類。

由於 阿布舍克巴克小號

+0

這是明確地脫離主題,這是一個關於自然語言的問題。 – 2012-03-26 09:17:27

回答

0

Levenshtein距離被限定在任意的字符串,在數學意義上;它不是語言特定的。你應該確保你在正確的表示水平上計算它,明智的默認值是在一些normalization之後的Unicode代碼點的水平。如果你正在處理的語言總是需要兩個符號來表示任何有意義的東西,那麼就在成對的符號上計算Levenshtein距離。

[我不知道你所說的多個字符是在荷蘭「一個單一的實體」的意思,但如果你的意思是ij ligature,從未阻止我申請萊文斯坦荷蘭文:)]