2011-11-02 92 views
1

我需要一個腳本(或其他代碼,C#等),它可以讀取包含某個Word 2007文檔中特定單詞的每個段落/句子,並將它們移動到一個新的Word文檔中,他們從中提取的原始(源)文檔的文件名。讀取Word文檔的代碼

+0

是在'docx'格式的文件? – KallDrexx

+0

您可以使用Office自動化或Aspose.Words。 –

+0

是的,這是一個docx(2007)文檔。 – Alex

回答

1

如何使用文檔索引器(例如dtSearch)來索引文檔(word,pdf等),然後利用它們的API來以這種方式進行獨特的搜索。從聽起來可能是實現這一目標的最快方法。像dtSearch這樣的授權索引器花費的錢(不是很多),但有時候花費的時間可能比花在編寫自己的代碼來完成同樣的事情上的時間花費更多。

,我發現,可能會導致你在正確的方向,如果你不希望使用一個索引部分文章:

http://omegacoder.com/?p=555

http://weblogs.asp.net/guystarbuck/archive/2008/05/13/automated-search-and-replace-in-multiple-word-2007-documents-with-c.aspx

編輯 要查找包含特定單詞的句子,請嘗試此鏈接http://msdn.microsoft.com/en-us/library/bb546163.aspx

+0

謝謝,傑森。最棘手的部分是抓住包含單詞的句子/段落。你如何做到這一點編程? – Alex

+1

嘿亞歷克斯,看看這個鏈接是否可以幫助你:http://msdn.microsoft.com/en-us/library/bb546163.aspx – CodeLikeBeaker

+0

正是我需要的!謝謝,賈森:) – Alex