2010-03-11 66 views
0

我正在使用MS Word API生成.docx,其中包含從數據庫中提取的數據,其中我應用了各自的樣式,字體,符號等。如果數據從數據庫中提取是相當大的,那麼在.docx文件中顯示這些數據時會出現問題。我發現內部MS Word 2007將通過可能不需要顯示數據的標籤寫入一些內容。因此,我計算出轉換爲.xml文件時所需的MS Word標記是什麼。這樣我就可以避免不必要的標籤並只構建顯示數據所需的各個標籤。因此,我計劃寫我自己的.xml與需要的MS Word的標籤,不是從.docx文件生成.XML瞭解WordProcessingML標記並避免不必要的標記

我的查詢是: -

1)無論是正確的MS Word會生成一些標籤,在將.docx轉換爲document.xml的過程中可能不需要這些標籤?這使它沉重?如果是的話,這些標籤是什麼,這樣我就可以在用自己的.xml文件寫入時避開它們。 2)請發送鏈接瞭解MS Word標籤及其優點,需要哪些標籤,哪些不是? 3)我的方法是寫一個類似於document.xml(.docx轉換)的新的.xml文件是否值得向前發展,以便我可以用我需要的標記來構建.xml文件,以便提高性能數據顯示?

請一些線索調查,並在此先感謝..

感謝, Rithu

+0

@ user270066:只是想跟進,看看下面的答案是否回答你的問題。 – 2011-02-18 20:06:26

回答

0

你想了解WordprocessingML在更detail做到這一點。這當然不是不可能的,但是從一開始就是一個學習曲線。可能最好的開始是eBook。如果你去手動路線,你需要一個壓縮技術。如果您使用的是Visual Studio,則可以使用Open XML SDK來簡化所有這些操作。

至於你對'不必要的標籤'的問題,很難相信這個文件中會有很多不必要的東西。但這取決於您認爲不需要的內容 - 例如,如果某個單詞被拼寫錯誤,則Run標籤上會出現「dirty = 1」屬性。如果您在顯示拼寫錯誤的文字方面沒問題,那麼這可能是不必要的。真的取決於你展示的內容和內容。