2011-01-24 77 views
0

最好的方式,我有一個小的文本字符串與XML喜歡裏面標籤:C# - 解析XML像文本和執行操作

<sub>A</sub>B<sup>C</sup> 

我需要解析這個文本,並執行基於標籤的行爲。所以,上面的文字看起來像在我的目標應用程序AÇ(MS Excel的 - Excel可以分析,如果我粘貼但如果我只是在一個單元格中輸入它格式化該字符串)。

什麼是解析這種類型的基於標籤的文本在性能方面的最佳途徑。格式化代碼將被非常頻繁地調用,我想盡可能地減少開銷。我能想到的下列選項:

  1. 當使用標籤開始的索引保持跟蹤的性格分析它字符/結束
  2. 使用正則表達式
  3. 其裝載到一些XML/HTML DOM解析器和遍歷節點

您認爲哪一個性能影響最小?任何其他方式我可以完成任務?

回答

4

不要重新發明輪子,特別是do not use regular expressions

使用現有的XML解析器。
您應該使用LINQ to XML。

如果你實現它,發現它太慢,你可以切換到XmlReader,這將是非常快,但惱人的工作。
記住;過早的優化是所有罪惡的根源。

+0

我真的希望我可以給你多一個+1。 – 2011-01-24 04:15:43