我有一個非常長和複雜的單詞文檔(200多頁),並且想要提取所有使用某種樣式格式化的內容,同時跳過文檔的其餘部分。只要你只需要找到一種風格就很容易 - 但我正在尋找一種可以提取各種風格(即所有標題和所有格式爲style2的文本)的解決方案。如何從word文檔中提取使用特定樣式格式的文本?
2
A
回答
1
如果您可以設法將所有測試複製到另一個文檔,然後運行這個很好,但這是一個很好的開始 - 這是如何循環並刪除所有不是您想要保留的樣式的所有內容。
你可以做一些if語句,而不是檢查每個樣式,但是使用所有OK樣式的字符串並使用instr是很好的。
Sub DeleteUnwatedFormats()
Dim para As Paragraph
Dim okStyles As String
okStyles = "Normal, Heading1, Heading2" 'list up ok styles
For Each para In ActiveDocument.Paragraphs
If InStr(1, okStyles, para.Style) = 0 Then
para.Range.Delete
End If
Next
End Sub
0
我試圖運行上面給出的代碼,但它刪除了一切 - 我認爲在行:
If InStr(1, okStyles, para.Style) = 0 Then
okStyles和para.Style周圍應換給:
If InStr(1, para.Style, okStyles,) = 0 Then
當我這樣做,它工作得很好。
相關問題
- 1. 如何使用VBA從MS-Word文檔中提取特定表?
- 2. 如何使用Novacode.Docx從現有Word文檔中獲取樣式?
- 3. 如何使用Apache POI提取word文檔的格式信息?
- 4. 提取特定格式的文本-perl
- 5. 如何從大型Word文檔中提取特定URL
- 6. 如何從特定的二進制文件格式中提取文本?
- 7. 如何從樣式表類中提取特定樣式HTML
- 8. 使用Python從word文檔中提取圖像和文本
- 9. 如何從Word文檔中提取RTF/HTML文本?
- 10. 使用c#interop從word文檔獲取格式
- 11. 如何寫word文檔(特定格式)從C#Windows窗體應用程序
- 12. C#Word文檔 - 如何清除格式?
- 13. 如何從使用C#的Word文件中提取文本?
- 14. 如何在excel中導入word文檔保持相同的格式樣式?
- 15. 如何使用javascript從文本區域提取文本的樣式,包括值?
- 16. 如何使用JavaScript從Word文檔中提取圖像?
- 17. 如何使用Apache POI從MS Word文檔的文本框中獲取文本?
- 18. rmarkdown word文檔中的HTML格式表
- 19. 從Word文檔中提取宏到c#文本文件#
- 20. 使用jQuery從特定的文本中提取文本
- 21. 如何使用mongoexport獲取.csv文件中的特定格式?
- 22. 使用Matlab將word文檔的樣式複製到另一個文檔中
- 23. 用於從文本文件中提取特定模式信息的腳本
- 24. 在Word文檔中更新並應用自定義樣式
- 25. 從樣式中定義的文本塊中獲取文本
- 26. 如何使用代碼將表格樣式分配給一個word文檔
- 27. 從Word文檔的所有空格中刪除格式
- 28. 合併VB文檔中保存格式的word文檔
- 29. 從Ruby on Rails中獲取各種文檔格式的文本
- 30. 如何在特定的矩形區域內從pdf文檔中提取文本?
就像+1 :)一樣簡單:) – JMax