這是我第一次進入UTF-8領域。我是IIS管理員,所以我從來沒有專門去觸摸這個。我試圖幫助一位將聖經翻譯成非洲語言的傳教士,現在需要對大型UTF-8文件進行全球匹配。我們特別爲重音字符進行匹配。推薦內置WinXP語言支持UTF-8正則表達式
我們在這裏使用的是較舊的XP計算機,所以我在VBS中拼湊了一個快速腳本,知道語言已經安裝在他們的盒子上了。玩了幾分鐘後,VBS正則表達式將每個字符分成2個字符,從而處理UTF-8。要匹配單個â,我的模式是\ u00c3 \ u00a2。這不應該是\ u00e2?
由於我不在我的深處,我以爲我會尋求一點指導。它幾乎看起來像UTF-8只需要這種雙重匹配(並且需要UTF-8)。有人可以告訴我在編碼哪個峽谷嗎? :-)
下載和安裝Perl或Java可能不在此項目的帶寬和技術知識範圍之內。該工具應該內置。MS Office已安裝,因此如果某個庫提供特定的支持,VBA是一個選項。 JavaScript也被安裝,雖然我不知道什麼版本。
感謝
你需要做的是加載UTF-8編碼的文件。正則表達式引擎不太可能知道任何有關UTF-8的信息。 – Gabe 2010-12-19 04:22:25
我已驗證我可以打開,讀取和寫入文件。完成後Word將它們打開爲UTF-8文件,就像原始文件一樣。我非常有信心以UTF-8格式處理它們。我正在使用TristateUseDefault。我嘗試強制TristateTrue,但這導致了垃圾。 – codepoke 2010-12-19 04:37:40