我必須從file1中基本去掉一段文本。該文件1是巨大的數千行(〜3GB大小)。塊看起來如下,使用python從文件中剝離一段文本
line 1
line 2
<pattern1> {
...
...
...
}
<pattern2> {
...
...
...
}
我基本上是想在大括號之間寫出線的塊「{}」中的文件,我試圖模式匹配的每個條目(模式1, pattern2)讀取該行時。我通過另一個文件(file2)給出了一個模式列表。 所以我想到了我的邏輯(不是代碼,但想法)下面的東西,但沒有信心。有人可以澄清什麼是解決這個問題的最好方法嗎?
- 打開file2並獲取要匹配的字符串模式。
- 打開file1並開始搜索file2中每個字符串模式的行。
- 一旦找到,啓用該標誌並開始將大括號之間的行寫入輸出文件(比如file3)。
- 一旦遇到大括號,取消設置標誌並停止寫入文件(file3)。
file2中只有一個模式嗎? – Prune
是否有嵌套的大括號? – dawg
不是在file2中有多個模式,這就是爲什麼我把它稱爲pattern1/pattern2(例如,像100個這樣的模式),是的,我試圖寫出的塊內嵌套大括號。 – Sreeder