Unicodeバイト オーダー マークのコードポイントは U+FEFF です。この連結コマンドは、2 つのファイルを連結するときにすべての BOM 文字を削除します。
<concat encoding="UTF-8" outputencoding="UTF-8" destfile="nobom-concat.txt">
<filelist dir="." files="bom1.txt,bom2.txt" />
<filterchain>
<deletecharacters chars="" />
</filterchain>
</concat>
この形式のconcat
コマンドは、ファイルを UTF-8 文字データとしてデコードするようにタスクに指示します。これは通常、Java/BOM の問題が発生する場所であるため、UTF-8 を想定しています。
UTF-8 では、BOM はバイトとしてエンコードされますEF BB BF
。結果ファイルの先頭に表示する必要がある場合は、後続の連結を使用して、出力ファイルの前に再度 BOM を付けることができます。
他の UTF エンコーディングで U+FEFF にエンコードされた値は、ここにリストされています。