タグのようなxmlを含む小さなテキスト文字列があります:
<sub>A</sub>B<sup>C</sup>
このテキストを解析し、タグに基づいてアクションを実行する必要があります。したがって、上記のテキストは、ターゲットアプリケーションではA B Cのようになります(MS Excel-この文字列を貼り付けるとExcelで解析およびフォーマットできますが、セルに入力するだけではできません)。
パフォーマンスの観点から、このタイプのタグベースのテキストを解析するための最良の方法は何ですか。フォーマットコードは非常に頻繁に呼び出されるため、オーバーヘッドを可能な限り最小限に抑えたいと思います。私は次のオプションを考えることができます:
- タグがいつ開始/終了したかを追跡するインデクサーを使用して、文字ごとに解析します
- 正規表現を使用する
- それをいくつかのXML/HTML DOMパーサーにロードし、ノードを反復処理します
パフォーマンスへの影響が最も少ないのはどれだと思いますか?タスクを完了する他の方法はありますか?