readlines

    0熱度

    1回答

    我正在處理的文本和PDF文件等於或小於5KB。如果該文件是一個文本文件,我從形式的文件,並獲得字符串中所需的輸入來概括: file = file.readlines() file = ''.join(file) result = summarize(file, num_sentences) 它是很容易做到,但對於PDF文件,事實證明它不是那麼容易的。有沒有辦法將pdf文件的句子作爲一個字符

    3熱度

    5回答

    我有一個文本文件的完整數據與 #Name #main 然後啓動它,然後許多數字,然後將該文件與 #extra !side 所以這裏有一個結束小片段 #Name #main 60258960 33031674 72302403 #extra !side 我想只讀取數字。但是,這是一腳,我希望他們每個人都是他們自己的單獨的字符串。 所以我知道如何讀頭後開始 read=f.r

    5熱度

    1回答

    我在這裏看到過這個問題,但給出的答案在我的情況下不起作用,並被標記爲重複。 python -u does not work for stdin in Python 3. sys.stdin = sys.stdin.detach()拋出一個ValueError: underlying buffer has been detached。 這些都不適用於非stdin輸入和其他文件被用作流。 Adding

    0熱度

    1回答

    這是我的代碼:我有一個腳本讀取文件,但在我的文件中,並非所有行都相似,我只想從行中提取信息有I DOC O:。 我試過用if條件,但它仍然在有些情況下正則表達式不配套線路不工作: #!/usr/bin/env python # -*- coding: utf-8 -*- import re def extraire(data): ms = re.match(r'(\S+).*

    1熱度

    4回答

    我想要做的是從一個文本文檔中取一系列行,並在一秒鐘內將它們反過來。例如文本文檔中包含: hi there people 因此,因此我希望寫這些同樣的思路,以文本文檔B,只是這樣的: people there hi 到目前爲止,我有: def write_matching_lines(input_filename, output_filename): infile = op

    0熱度

    1回答

    下面是我放在一起搜索文本文件中的數字的一些代碼。這對我想要做的事很好。現在它找到7個位置,我需要讀取7個不同索引處的行。什麼可能是開始這個​​最好的方法。謝謝,這是用C#編寫的。 private void button1_Click(object sender, EventArgs e) { richTextBox1.Text = ""; using (Open

    1熱度

    3回答

    我想從文件中讀取特定行,並在結束每個塊的過程後繼續讀取。假設我在文件中有19000行。每次我將提取前19行,使用這些行進行一些計算並將輸出寫入另一個文件。然後,我將再次提取接下來的19行,並執行相同的處理。所以,我試圖用以下方式提取行: n=19 x = defaultdict(list) i=0 fp = open("file") for next_n_lines in izip_l

    -1熱度

    1回答

    我必須將infile轉換爲260個字符的行,並且除去之前的所有內容(包括字符)'_' 我一直在找幾個小時,並找到一種方法來轉換爲260個字符。 lines = infile.readlines() [line[i:i+n] for i in lines(0, len(line), 640)] 並發現了很多例子,在字符串或所有字符後刪除字符後的參數。 請幫我在這裏...

    2熱度

    1回答

    我正在尋找一種很好的pythonic讀取文件的方式,並且連接上面那些邏輯連續的任何行,如線連續字符所示。例如。 Here is a normal line. This line continues over \ two lines. This line continues over\ three \ lines. 我在這裏找到了一個解決方案:http://code.activesta

    2熱度

    2回答

    我有一個大的日誌文件(> 1GB)應該被分析,所以我寫了一個python程序。我已經使用islice,所以我可以讀取文件塊(10,000行),這樣我的服務器不會用完內存。 我查閱了一些關於stackoverflow的islice解決方案並實現了一個,但程序無法按預期工作,因爲isclice每次都讀取相同的行(但在讀完整個文件後正確停止...)。我不能使用with open因爲它與Python 2.