2009-08-19 57 views
0

我真的需要使用WordPerfect 12文件中包含的信息,而不使用WordPerfect的緩慢的可視化界面,但我找不到有關文件格式或用於讀取/寫入文件的任何Python模塊的詳細文檔。我在網上發現了一篇文章,似乎解釋瞭如何將WordPerfect轉換爲文本,但我對它的工作原理並不瞭解。用Python讀取WordPerfect文件?

http://mail.python.org/pipermail/python-list/2000-February/023093.html

如何做到這一點?

回答

1

好的,這是我做的。我以二進制模式讀取文件,將數據轉換爲十六進制值的字符串表示形式,並使用非官方的WordPerfect文檔創建正則表達式來替換表示非文本格式代碼和元數據的所有十六進制字符串,然後轉換所有內容回到文本。

一塊骯髒的黑客,但它完成了工作。

+0

拉姆接受我自己的答案,我知道。 – twneale 2009-09-17 03:01:55

+1

你會介意在這裏發佈你的工作解決方案樣本嗎? – Stealth 2012-10-24 13:21:43

+0

[WP_Reader](https://github.com/gaudulli/WP_Reader)是一個C#庫,它更進一步,並根據WP規範模擬整個文檔。它只是完成了一半,但它適用於WP中的大多數「標準」格式化功能。比OP晚六年,但終於有一些東西可以用來打開它稱爲文檔的WordPerfect幻數的鈍角結構。 – 2016-02-20 17:11:37

3

你的鏈接的相關部分是這樣的:

os.system("%s %s %s" % (WPD_TO_TEXT_CMD, "/tmp/tmpfile", "/tmp/tmpfile.txt")) 

這是做一個系統調用一個名爲「wp2txt」外部程序。谷歌搜索該計劃產生積極的命中。

+0

主動命中主要是維基百科轉儲文件的文本,我想你想:http://alter.org.ua/en/soft/win/convert/ – Tristan 2009-09-12 18:45:26