1

Ruby でファイルの種類とエンコーディングを検出する必要があります。

私は現在 libmagic をmagic gem で使用していますが、1 つ問題があります。BOM がない場合、UTF-16 ファイルを検出しません。これはそのようなファイルの例です。

$ file -i text_without_bom.txt
text_without_bom.txt: application/octet-stream; charset=binary

UTF-16 ファイルを適切に検出するために使用できる他のライブラリまたは方法はありますか?

PS rchardetcharlock_holmesも試しましたが、あまり運がありませんでした。

4

2 に答える 2