0
Q
如何刪除蟒蛇
A
回答
1
不,你並不需要刪除的文件的非相關部分讓BeautifulSoup
解析完整的文件是,找到你所需要的標籤:?!
from urllib2 import urlopen
from bs4 import BeautifulSoup
url = 'http://www.sec.gov/Archives/edgar/data/70858/000119312507058027/0001193125-07-058027.txt'
soup = BeautifulSoup(urlopen(url))
print(soup.document)
+0
非常感謝,alecxe。這真的幫助我! – 2015-02-06 18:54:30
相關問題
- 1. 刪除在蟒蛇
- 2. 如何刪除上述蟒蛇
- 3. 刪除空行蟒蛇
- 4. 刪除蟒蛇的邊數
- 5. 如何消除蟒蛇
- 6. 刪除目錄,是不是在蟒蛇
- 7. 刪除蟒蛇HTTP服務器緩存
- 8. 蟒蛇更新和刪除數據
- 9. 部隊從蟒蛇刪除Windows目錄
- 10. 蟒蛇 - 刪除日期和時間
- 11. 刪除從文本文件蟒蛇
- 12. 蟒蛇NamedTemporaryFile刪除而不關閉它
- 13. 蟒蛇:刪除基於分數
- 14. 刪除特殊逃生蟒蛇
- 15. 蟒蛇刪除開頭寫着 '\ü......'
- 16. 刪除多個目錄中的蟒蛇
- 17. 刪除從文本文件線,蟒蛇
- 18. 如何蟒蛇
- 19. 如何蟒蛇
- 20. 如何刪除蟒蛇屏幕上的標籤Tk GUI
- 21. 如何從文件中的蟒蛇刪除線
- 22. 如何刪除特定文件的消息?蟒蛇
- 23. 如何從列表中刪除括號蟒蛇
- 24. 如何刪除使用蟒蛇模塊在Python
- 25. 如何在蟒蛇
- 26. 如何從蟒蛇
- 27. 你如何蟒蛇
- 28. 如何從蟒蛇
- 29. 如何從蟒蛇
- 30. 如何使蟒蛇
@AJ:請不要建議使用正則表達式解析HTML。請閱讀http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags(和l給一個標籤上墨只是沒用。) – geoffspear 2015-02-06 17:10:52