a-tag 文字列から正しい順序で「文字列」を抽出するための美しいスープ コマンドの組み合わせを探しています。
ソース 1:
<a href="target" title="title">a-string <img alt="img-alt"> <span>span-string</span></a>
ターゲット 1: "a-string img-alt span-string"
ソース 2:
<a href="target" title="title"><span>span</span> string <img alt="alt"></a>
ターゲット 2: "span-string a-string img-alt"
「find_all()」で子要素を取得し、「get_text()」でテキストを取得するのは簡単です。
異なる「文字列」の正しい順序を取得する方法は? または、a-string 内のすべての情報を順次解析するには?