何万ものXMLファイル(小さいサイズのファイル)を含むコーパスがあり、Pythonを使用して、XMLタグの1つに含まれるテキストを抽出しようとしています。たとえば、bodyタグ間のすべてが次のようになります。
<body> sample text here with <bold> nested </bold> tags in this paragraph </body>
次に、この文字列を含むテキストドキュメントを作成し、XMLファイルのリストを下に移動します。
effbotのELementTreeを使用していますが、これを行うための適切なコマンド/構文が見つかりませんでした。miniDOMのdom.getElementsByTagNameを使用しているWebサイトを見つけましたが、ElementTreeに対応するメソッドが何であるかわかりません。任意のアイデアをいただければ幸いです。