私は現在、大きなデータ セット (約 7000 行) の翻訳に取り組んでいます。英語のフレーズと HTML タグを含むこのデータセットは、Google 翻訳を使用してオランダ語に翻訳されています。
ただし、生成された翻訳を確認すると、Google 翻訳は HTML タグにもスペースを追加してスクランブルをかけました。翻訳済みファイルの HTML タグ内の無効な空白をすべて削除したいと考えています。例えば:
this is a test. < a href = "hello.php" >test</ a>;
なる必要があります:
this is a test. <a href="hello.php">test</a>;
これを可能にする正規表現はありますか?