2012-04-23 96 views
0

我有幾百個.docx文檔,我將其轉換爲降價。我使用textutil將.docx轉換爲html和Pandoc以將html轉換爲Markdown。使用正則表達式在文本文件中查找和替換

我遇到的問題是原始.docx文件包含dropcaps。在文本文件中,我現在有第一個字母(這是dropcap)與換行符分開。它看起來像這樣:

T 

he following five basic pre-conditions are essential... 

我正在使用mac(10.6.8)和textmate。 Textmate允許使用正則表達式進行查找和替換。

如何刪除換行符並將其與段落的其餘部分重新加入分隔的字母?

+0

你或許應該做的「其子文件夾的文件夾,批量處理」一個單獨的問題,因爲它不是真的與Textmate中的搜索/替換相關。 – alan 2012-04-23 19:22:51

+0

非常感謝,會做 – rev 2012-04-23 19:28:24

回答

0

對於搜索,試試這個:

^([A-Z])[\r\n]+(\w+)\b 

對於替換:

$1$2 
+0

多謝,出色工作。 – rev 2012-04-23 19:31:32

相關問題