瞭解WordProcessingML標記並避免不必要的標記

我正在使用MS Word API生成.docx，其中包含從數據庫中提取的數據，其中我應用了各自的樣式，字體，符號等。如果數據從數據庫中提取是相當大的，那麼在.docx文件中顯示這些數據時會出現問題。我發現內部MS Word 2007將通過可能不需要顯示數據的標籤寫入一些內容。因此，我計算出轉換爲.xml文件時所需的MS Word標記是什麼。這樣我就可以避免不必要的標籤並只構建顯示數據所需的各個標籤。因此，我計劃寫我自己的.xml與需要的MS Word的標籤，不是從.docx文件生成.XML瞭解WordProcessingML標記並避免不必要的標記

我的查詢是： -

1）無論是正確的MS Word會生成一些標籤，在將.docx轉換爲document.xml的過程中可能不需要這些標籤？這使它沉重？如果是的話，這些標籤是什麼，這樣我就可以在用自己的.xml文件寫入時避開它們。 2）請發送鏈接瞭解MS Word標籤及其優點，需要哪些標籤，哪些不是？ 3）我的方法是寫一個類似於document.xml（.docx轉換）的新的.xml文件是否值得向前發展，以便我可以用我需要的標記來構建.xml文件，以便提高性能數據顯示？

請一些線索調查，並在此先感謝..

感謝， Rithu

來源

2010-03-11 user270066

@ user270066：只是想跟進，看看下面的答案是否回答你的問題。 – 2011-02-18 20:06:26

你想了解WordprocessingML在更detail做到這一點。這當然不是不可能的，但是從一開始就是一個學習曲線。可能最好的開始是eBook。如果你去手動路線，你需要一個壓縮技術。如果您使用的是Visual Studio，則可以使用Open XML SDK來簡化所有這些操作。

至於你對'不必要的標籤'的問題，很難相信這個文件中會有很多不必要的東西。但這取決於您認爲不需要的內容 - 例如，如果某個單詞被拼寫錯誤，則Run標籤上會出現「dirty = 1」屬性。如果您在顯示拼寫錯誤的文字方面沒問題，那麼這可能是不必要的。真的取決於你展示的內容和內容。

來源

2010-03-16 00:39:36

瞭解WordProcessingML標記並避免不必要的標記

回答

相關問題