XMLパーサーがエンティティツリーを生成するのと同じように、Wiki形式のテキストを入力として受け取り、エンティティのツリーを生成できるパーサーを知っている人はいますか?明確にするために、私は次のようなテキストをとる何かを探しています:
-Intro-
Textual stuff in ''italics''
--Subhead--
Yet more text
イントロをルートとするツリーを作成し、3つの子ノードを作成します。そのうちの1つ(小見出し)自体に子があります。http://meta.wikimedia.org/wiki/Help:Wikitextで説明されている「単純な」ウィキ形式を理解できるものを探しています。
Wikiテキストのレクサーはいくつか知っていますが、ツリーパーサーはありません。オープンソースでCまたはC++で書かれたものを探しています。