可能重複:
Measure the pronounceability of a word?尋找一種方法來檢查,如果一個詞是拼讀
有很多拼讀的隨機密碼生成器。 我正在尋找相反的。 我想知道給定的單詞是否可讀。
目的: 我正在尋找一個新的域名,你可能已經走了,雖然這也是。
可能重複:
Measure the pronounceability of a word?尋找一種方法來檢查,如果一個詞是拼讀
有很多拼讀的隨機密碼生成器。 我正在尋找相反的。 我想知道給定的單詞是否可讀。
目的: 我正在尋找一個新的域名,你可能已經走了,雖然這也是。
我會使用功能levenstein對字典。
額外的正則表達式模式檢查過度使用的元音或重複的輔音後,也會有很大的幫助。 PS:這不是levenstein的真正用途,但我相信它可能對此很有用。
只是我的想法。
有很多方法可以解決這個一很多,但這裏是我會用什麼:
1)得到像/usr/share/dict/words
2字典)寫一個程序,着眼於每個字母和數字排除其後任何字母的可能性。例如,它可能會發現E有1%的機會被A跟隨,或者X有5%的機會被跟隨在單詞的後面。
這應該讓你生成類似於文字的東西,而不是自己的文字。
我認爲語言模型的概率可以幫助你。 http://en.wikipedia.org/wiki/Language_model
我去終端(mac)並輸入說。
如
說你好世界!
哪種語言? – 2011-05-19 21:30:09
我不認爲'word'標籤是用於這個:) – shevski 2011-05-19 21:30:53