input.txt
奇妙な文字、htmlタグ、便利な資料がたくさん含まれているファイルがあります。新しいファイルoutput.txtで、htmlタグのdescription
ような奇妙な文字を除いて単語の後に35文字を表示したいと思います。$$#$#@$#@***$#
助けて。よろしくお願いします。
私の最終的な目標は、単語の説明を見つけて、説明の後にHTMLタグや奇妙な文字を含めてはならない35文字を印刷することです。出来ますか?ここみたいに:
<description><p><img class="float_right"
src="http://static3.businessinsider.com/image/502ab0036bb3f7147b00000f-400-300/dnu.jpg"
border="0" alt="dnu" width="400" height="300" /></p><p>The lawn
was filled with <a class="hidden_link"
href="http://www.businessinsider.com/blackboard/goldman-sachs">Goldman
Sachs</a> Group Inc. partners dressed in pink looking out on a pink sunset.
開始したい:(The lawn is filled with
ここでもこれらのタグをスキップして続行します)Group Inc. partners
(35文字.done!)停止して、別の説明を検索します!