Java のバイト配列で印刷できない \x86 タイプの文字を送信する人がいます。それを us-ascii 文字列に変換すると、ASCII テキストにジャンク文字が挿入されます。
JavaでEBCDICなどのフォーマットからASCIIにデータを変換する際に、印刷できないASCII文字を処理する文字列/その他の方法のフォーマットはありますか?
それらをどのように扱いたいですか?それらを印刷可能なもの (「?」など) に置き換えますか? それらを完全に削除しますか?他のアクション?
米国または「西ヨーロッパ」 (英国、フランス、ドイツ) にいる場合、文字セットはおそらくWindows-1252です。1 バイト文字セット US-ASCII は 128 文字をカバーし、1 バイト文字セット Windwos-1252 はバイト範囲の 255 文字すべてをカバーするスーパーセットです。
最も簡単なのは、\u0080 - \u00ff の変換表です。文字列。複数の文字に置き換えたほうがよい場合もあるため、\u008c を「OE」とします。