次のように、ブラウザーで表示されるhtmlのすべての単語をシェルに配置する必要があります。
ソース:
<p><strong> My source sentence</strong></p>
ゴール:
<p><strong><span>My </span><span>source </span><span>sentence</span></strong></p>
ただし、タグ、javascript などには触れないでください。
これどうやってするの?
無礼ではありませんが、これはばかげたことのように見えます。ただし、いずれにしても、HTML を解析して (ライブラリを使用して XML を解析するように)、すべての行を新しい行に置き換えることができます。
ソースが有効な XML である場合、SAX ハンドラーを記述してソースを読み取り、必要な方法で出力するのは非常に簡単です。このチュートリアルをご覧ください。
基本的に、要素に遭遇するたびに、その要素を出力ストリームに出力するだけです。テキストに出くわすたびに、正規表現 (または類似の表現) を使用して必要な部分に分割し、各部分を span 要素でラップします。しかし、これは本当に奇妙なことのように思えます。
入力ソースが有効な XML でない場合 (それで壊れる可能性のあるさまざまなものをすべて含む HTML の場合)、最初にソースを有効な XML に変換できない限り、はるかに困難になります。