restructuredtext に基づいた単純な Web ページ ジェネレーターを作成しています。このように、ドキュメントにタグを挿入したいと考えています。
=====
Title
=====
:author: Me
:tags: foo, bar
Here we go ...
私が今欲しいもの:
- ある種の文書ツリーを手に入れる
- エントリを見つけて
tags
読み取り、処理し (コマンド ラインでタグを出力するなど)、削除して、残りのツリーをレンダリングします。
したがって、私のプログラムとは異なるものでコンパイルされている場合に備えて、互換性のある再構成テキストを書きたいと思います。
誰かが私にヒントを与えることができますか?ここでこれを見つけましたhttp://svn.python.org/projects/external/docutils-0.6/docutils/examples.pyinternals
メソッドでドキュメント(したがってdomツリー)を取得する方法を示していますが、これが最善ですかまたは、正規表現ベースのアプローチ(行を見つけて削除する)の方がはるかに簡単ですか?ツリーの操作には、変換ツリー → ドキュメントなども含まれます。