2

私は現在、大きなデータ セット (約 7000 行) の翻訳に取り組んでいます。英語のフレーズと HTML タグを含むこのデータセットは、Google 翻訳を使用してオランダ語に翻訳されています。

ただし、生成された翻訳を確認すると、Google 翻訳は HTML タグにもスペースを追加してスクランブルをかけました。翻訳済みファイルの HTML タグ内の無効な空白をすべて削除したいと考えています。例えば:

this is a test. < a href = "hello.php" >test</ a>;

なる必要があります:

this is a test. <a href="hello.php">test</a>;

これを可能にする正規表現はありますか?

4

1 に答える 1

1
$text = str_replace("< ", "<", $text);
$text = str_replace("> ", ">", $text);
$text = str_replace(" <", "<", $text);
$text = str_replace(" >", ">", $text);
$text = str_replace("= ", "=", $text);
$text = str_replace(" =", "=", $text);
$text = str_replace("\/ ", "\/", $text);
于 2012-05-08T13:04:16.687 に答える