7

重複の可能性:
UNIX で非 ASCII 文字を grep する方法

xml データの非常に大きなファイルで非 ASCII 文字を見つける方法の答えを見つけようとして苦労しています。非ASCII文字を変換したくありません。データファイル内のどこに文字が配置されているかを特定して、ソースに値を削除するように通知できるようにしたいだけです。ASCII 以外のデータ (1 文字のように見える) が原因で、処理プログラムが失敗します。残念ながら、エラー データは、問題のある文字がファイル内のどこにあるかを判断するのに役立ちません。この XML データ ファイルにはデータ レコードが含まれており、ほとんどの場合、説明フィールドまたは名前フィールドにあります。

テキスト ツールを使用してみましたが、テキストのファイルが大きすぎて (>32MB)、圧倒されます。PSPad や TextPad などのツールで 7 ビット ASCII 文字セット以外の文字を見つけるために REGEX を実行する方法はありますか?

4

0 に答える 0