readlines

0熱度

1回答

我正在處理的文本和PDF文件等於或小於5KB。如果該文件是一個文本文件，我從形式的文件，並獲得字符串中所需的輸入來概括： file = file.readlines() file = ''.join(file) result = summarize(file, num_sentences) 它是很容易做到，但對於PDF文件，事實證明它不是那麼容易的。有沒有辦法將pdf文件的句子作爲一個字符

3熱度

5回答

閱讀，直到一個點的Python

我有一個文本文件的完整數據與 #Name #main 然後啓動它，然後許多數字，然後將該文件與 #extra !side 所以這裏有一個結束小片段 #Name #main 60258960 33031674 72302403 #extra !side 我想只讀取數字。但是，這是一腳，我希望他們每個人都是他們自己的單獨的字符串。所以我知道如何讀頭後開始 read=f.r

5熱度

1回答

如何避免在Python文件輸入庫中緩衝

我在這裏看到過這個問題，但給出的答案在我的情況下不起作用，並被標記爲重複。 python -u does not work for stdin in Python 3. sys.stdin = sys.stdin.detach()拋出一個ValueError: underlying buffer has been detached。這些都不適用於非stdin輸入和其他文件被用作流。 Adding

0熱度

1回答

只讀包含某些特定字符串的行，並在其上應用正則表達式

這是我的代碼：我有一個腳本讀取文件，但在我的文件中，並非所有行都相似，我只想從行中提取信息有I DOC O:。我試過用if條件，但它仍然在有些情況下正則表達式不配套線路不工作： #!/usr/bin/env python # -*- coding: utf-8 -*- import re def extraire(data): ms = re.match(r'(\S+).*

1熱度

4回答

如何在Python中以相反的順序將輸入文件中的行寫入輸出文件3

我想要做的是從一個文本文檔中取一系列行，並在一秒鐘內將它們反過來。例如文本文檔中包含： hi there people 因此，因此我希望寫這些同樣的思路，以文本文檔B，只是這樣的： people there hi 到目前爲止，我有： def write_matching_lines(input_filename, output_filename): infile = op

0熱度

1回答

不同索引的行讀取

下面是我放在一起搜索文本文件中的數字的一些代碼。這對我想要做的事很好。現在它找到7個位置，我需要讀取7個不同索引處的行。什麼可能是開始這個最好的方法。謝謝，這是用C＃編寫的。 private void button1_Click(object sender, EventArgs e) { richTextBox1.Text = ""; using (Open

1熱度

3回答

python從文件讀取特定行並繼續

我想從文件中讀取特定行，並在結束每個塊的過程後繼續讀取。假設我在文件中有19000行。每次我將提取前19行，使用這些行進行一些計算並將輸出寫入另一個文件。然後，我將再次提取接下來的19行，並執行相同的處理。所以，我試圖用以下方式提取行： n=19 x = defaultdict(list) i=0 fp = open("file") for next_n_lines in izip_l

-1熱度

1回答

Python 2.7：將一行轉換爲260個字符的行，並在每行中刪除'_'之前的所有字符

我必須將infile轉換爲260個字符的行，並且除去之前的所有內容（包括字符）'_' 我一直在找幾個小時，並找到一種方法來轉換爲260個字符。 lines = infile.readlines() [line[i:i+n] for i in lines(0, len(line), 640)] 並發現了很多例子，在字符串或所有字符後刪除字符後的參數。請幫我在這裏...

2熱度

1回答

用Python中的連續字符讀取文件

我正在尋找一種很好的pythonic讀取文件的方式，並且連接上面那些邏輯連續的任何行，如線連續字符所示。例如。 Here is a normal line. This line continues over \ two lines. This line continues over\ three \ lines. 我在這裏找到了一個解決方案：http://code.activesta

2熱度

2回答

Python islice正在讀取相同的行

我有一個大的日誌文件（> 1GB）應該被分析，所以我寫了一個python程序。我已經使用islice，所以我可以讀取文件塊（10,000行），這樣我的服務器不會用完內存。我查閱了一些關於stackoverflow的islice解決方案並實現了一個，但程序無法按預期工作，因爲isclice每次都讀取相同的行（但在讀完整個文件後正確停止...）。我不能使用with open因爲它與Python 2.