我想按字符讀取一個30 MB字符的大文件。我發現了一篇關於如何閱讀大文件的有趣文章。 Fast Method to Stream Big files 問題:輸出打印代替實際人類可讀的文本二進制數據 代碼: def getRow(filepath):
offsets = get_offsets(filepath)
random.shuffle(offsets)
with
我想對12GB文本文件中的字符串執行4000多次搜索。 目前,我使用mmap來將文件加載到內存中,這是很好的作品(大約需要5秒鐘): with open('my_file.txt', 'rb') as f:
m = mmap.mmap(f.fileno(), 0, prot=mmap.PROT_READ)
data = m.read(-1)
不幸的是,搜索是永遠走: for