2013-01-16 106 views
0

我有一個HTML文檔這就需要在MS Word被打開查找文本。它每頁2-3頁後都有特定字體/顏色的標題文本(可以說13.5pt &顏色代碼是#ff11ff)&我希望找到其中包含標題文本的頁碼。C#/ MS Word中 - 使用的字體大小或顏色

HTML什麼HTML標籤可以方便地檢測到MS Word環境中的特定文本的存在?據我所知,我們可以使用查找方法檢測文本,但我不知道是否有任何方法來搜索特定的'字體/字體顏色',

我需要這個創建索引頁將具有標題&的頁碼的名稱,在其上找到它們。因此,它是這樣:

  1. 查找特定的字體大小的文本。
  2. 獲取該頁面的當前頁碼。

更新: 好像我必須反覆文檔的每個文本&檢查它的字體&然後像做

Microsoft.Office.Interop.Word._Application word = new Microsoft.Office.Interop.Word.Application(); 
       Microsoft.Office.Interop.Word._Document document; 

       while (word.Selection.Find.Execute(ref findStr, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull)) 
       { 

        float fontSize = word.Selection.Font.Size; 

        if (fontSize == 13.5) 
        { 
         Range rng = word.Selection.Range; 
         int pageNp = (int)rng.get_Information(WdInformation.wdActiveEndPageNumber); 
        } 
       } 
+0

你爲什麼要問什麼range.Find.Execute確實..?你可以做一個'谷歌Search'爲http://msdn.microsoft.com/en-us/library/microsoft.office.interop.word.find.execute%28v=office.11​​%29.aspx 也不要指望我們爲你編碼這個..你有什麼自己嘗試過..? – MethodMan

+0

生活在SO上發生了變化。概念性問題可能會被關閉。 SAD :( –

+0

@ DJKRAZE-更新的問題。 –

回答

1

你有,你可以採取幾種不同的方法;就好像你忽略了微軟的Word一樣。 jQuery可以輕鬆查明特定的Html或Stylesheet標籤。

如果你想寫一個簡單的C#應用​​程序,以確定這兩個請求。你可以使用正則表達式;它們非常強大,專門用於過濾和分析大量數據。

由於缺少對您的問題的相關信息,我不能點你任何進一步的,但我希望幫助。您可以在正則表達式here上找到更多信息:該備忘單應該指出您的幾項功能。

的方法,我將採取:

  • 如果你必須使用字;利用一種方法來解析文檔。
  • 使用正則表達式方法搜索特定標籤。
  • 然後,只需定義方法以返回找到標準的當前頁面。

顯然,這是一個非常普遍的做法。但希望這可以讓你指向一個好的方向。我不熟悉你的任務或目標;所以這可能會擊中或不在頭上。

所以我道歉,如果它是模糊的,但我們不知道你的項目,所以它使應對困難。如果你不介意我問。你能用當前的迭代或方法更新你的問題嗎?所以我們可以分析代碼,也許你想要的目標?

+0

更新可能的解決方案。 –

相關問題