ここにある joksnet のプログラムの助けを借りて、探している平文のウィキペディアの記事を取得することができました。
返されるテキストには見出しの Wiki マークアップが含まれているため、たとえば、Albert Einstein の記事のセクションは次のように返されます。
==Biography==
===Early life and education===
blah blah blah
私が本当にやりたいことは、取得したテキストを関数にフィードし、次のようにすべての最上位セクションを太字の html タグでラップし、第 2 レベルのセクションをイタリック体でラップすることです。
<b>Biography</b>
<i>Early life and education</i>
blah blah blah
しかし、少なくとも関数を危険なほど素朴にしない限り、どうやって始めればいいのかわからないのではないかと心配しています。正規表現を使用する必要がありますか? どんな提案でも大歓迎です。
PS「解析」が私がここでやろうとしていることに対して強すぎる言葉である場合は申し訳ありません。