如何刪除在文件中多次出現的單詞,只保留第一個單詞並刪除克隆。刪除在文件中多次出現的單詞
0
A
回答
3
一個簡單的算法就是迭代輸入中的所有單詞,將每個單詞添加到之前看到的一組單詞中。如果該單詞已經在該集合中,請將其刪除。
下面是一個例子:
seen_words = set()
for word in words:
if word not in seen_words:
print word
seen_words.add(word)
0
您也可以使用這樣的字典:
mydict = {}
mylist = [1, 2, 2, 3, 4, 5, 5]
for item in mylist:
mydict[item] = ""
for item in mydict:
print item
輸出:
1
2
3
4
5
但是,當然,你需要的是融入文件讀/寫。
0
您可以使用一組:
集( '這是所有單詞的詞都是these'.split())
輸出: '這些', '的',' 所有」, '是', '話'
+1
設置不保存順序! – 2011-04-26 23:27:15
0
fileText = "some words with duplicate words"
fileWords = fileText.split(" ")
output = fileWords[0]
words = [output]
for word in fileWords:
if word not in words:
output += " "+word
words.append(word)
+0
「output + =」「+ word''的每次執行包括創建一個具有輸出值」「和單詞連接的新對象。如果文件很大,這對於解釋器來說代表了很多工作。而且,根據「」進行分割會給出可能在其中有換行符的字符串。所以'sun \ nsea'將是一個詞,當'sun'或'sea'出現在一行中間時,它不會被刪除。 – eyquem 2011-04-26 23:44:43
0
如果你的文件是不是非常大,
word='word'
data=open("file").read()
ind = data.find(word)
print data[:ind+len(word)] + data[ind:].replace(word,"")
相關問題
- 1. 列出文本文件中出現次數的所有單詞?
- 2. 計算單詞在txt文件中出現的次數Java
- 3. 刪除文件中的特定單詞
- 4. Python - 單詞出現次數
- 5. VS2008 C#:刪除多次出現
- 6. Lucene刪除文件再次出現在搜索中
- 7. 統計單個單詞中的單詞出現次數
- 8. 如何刪除file1中出現一次或多次在python中file2的行?
- 9. 刪除重複多次,但留下第一次出現的ID
- 10. 單詞出現次數的計數
- 11. aiml - 最後一次出現的單詞
- 12. 查找只出現一次的單詞
- 13. 替換第n次出現的單詞
- 14. 使用映射計算每個單詞在文件中出現的次數。 (C++)
- 15. 計算單詞的列表出現在文本文件中
- 16. 計算大文本文件中特定詞的出現次數
- 17. 如何在文本文件中插入/刪除單詞?
- 18. 如何顯示文字中出現超過'x'次的單詞?
- 19. Python:如何刪除CSV文件中單獨出現的時段?
- 20. 刪除包含多個單詞的行
- 21. 如何在UNIX中從文件中刪除單詞?
- 22. Perl腳本從一個文件中刪除單詞到輸出文件
- 23. 從文本中刪除單詞/數字
- 24. 如何顯示同一單詞出現多行的行一次?
- 25. 使用Python計算出現在列表中的單詞的出現次數
- 26. 從NSString中刪除單詞
- 27. 如何在ArrayList中出現單詞的次數?
- 28. 計算單詞出現在字符串中的次數?
- 29. 如何計算單詞在一列中出現的次數,python
- 30. 如何從一個字符串中刪除指定的詞第一次出現
你能搜索/一個普通expressio更換N + – Ethan 2011-04-26 23:09:55
該算法取決於文件的性質:非常非常大或合理的大小,允許加載內存中的內容? – eyquem 2011-04-26 23:32:29