別のテスト/バグ追跡ツールからいくつかのデータを tfs にインポートしています。その説明を単純な HTML に変換して、HTML の「レイアウト」が保持されるプレーンな文字列に変換したいと考えています。
例えば:
<body>
<ol>
<li>Log on with user Acme & Co.</li>
<li>Navigate to the details tab</li>
<li>Check the official name</li>
</ol>
<br>
<br>
Expected Result:<br>
official name is filled in<br>
<br>
Actual Result:<br>
The &-sign is not shown correctly<br>
See attachement.
</body>
改行が挿入され、HTML エンティティが次のように変換されたプレーン テキストになります。
1. ユーザー Acme & Co でログオンします。 2.詳細タブに移動します 3. 正式名称を確認する 期待される結果: 正式名称が入ります 実結果: & 記号が正しく表示されない 添付ファイルを参照してください
現在、正規表現を使用して一部のタグを改行に置き換え、残りを取り除くことができますが、HTMLエンティティなどを置き換えると、何か(ブラウザ?)を再発明しているように見えました<ol>
。<ul>
だから、誰かが私の前にこれをやったのだろうかと思っていました。Google を使用しても見つかりません。