我在Windows 7中使用Python 2.7。我有一個大文本文件,我想要分成幾個較小的文件。該文件的格式目前看起來像這樣。 。 。使用雙回車將大文本文件分解成單獨的文件返回
Double carriage return
Header line
Body (consisting of several lines)
Double carriage return
Header line
Body (consisting of several lines)
我想創建單獨的文本文件使用標題行作爲文件名和身體作爲文件內容。 Double回車標識一個新文件的開始。
我已經搜索堆棧溢出,但還沒有找到我在找什麼。我對Python很陌生,所以任何幫助都會很感激。
我到目前爲止的代碼是。 。 。
fh = open(path/file.txt)
data = fh.read()
doc = re.split(r'[\r\n\r\n]',data)
for para in doc:
header = re.search('^[1-9].+Chapter', para)
filename = str(header) + ".txt"
fwrite = open(filename,"w")
fwrite.write(para)
fwrite.close()
我想使用第一行作爲文本文件標題。
哪部分是你在掙扎?告訴我們你在哪裏。 – ergonaut
當我使用此代碼時,我得到一個IOError:無效模式('w')或文件名 –
在那裏添加您的代碼。 – ergonaut