2016-04-21 42 views
0

我正在嘗試使用ffi-aspell gem拼寫檢查文本。爲了做到這一點,我似乎必須自己提取這些詞。我試圖通過使用正則表達式將String#scan應用於文本,但看起來並不簡單。ffi-aspell中使用的字符類

定義某種語言的ffi-aspell字典中可能出現的字符類的最簡單方法是什麼?我想讓它不僅適用於英語,所以對於字符/[a-zA-Z']/(或/[a-zA-Z']+/這個詞)不起作用。 /[[:word:]]/似乎捕捉不在字典中的字符,例如數字,並且進一步與單詞中經常使用的撇號(單引號)不匹配。是否有一些文檔定義了ffi-aspell字典中使用的字符集?

+1

首先掃描條目是否會更容易掃描'ffi_aspell' _dictionary_並且僅僅是''Regexp#union'之後不唯一? – mudasobwa

+0

@mudasobwa我認爲這將提供一個完美的解決方案。這將是靈活的,並給出我想要的確切集合。你能把它變成答案嗎? – sawa

回答

1

我想這會更容易掃描ffi_aspell字典第一個條目,只是有點Regexp#union之後唯一。