0

Java のバイト配列で印刷できない \x86 タイプの文字を送信する人がいます。それを us-ascii 文字列に変換すると、ASCII テキストにジャンク文字が挿入されます。

JavaでEBCDICなどのフォーマットからASCIIにデータを変換する際に、印刷できないASCII文字を処理する文字列/その他の方法のフォーマットはありますか?

4

2 に答える 2

1

それらをどのように扱いたいですか?それらを印刷可能なもの (「?」など) に置き換えますか? それらを完全に削除しますか?他のアクション?

于 2012-04-13T18:05:25.417 に答える
0

米国または「西ヨーロッパ」 (英国、フランス、ドイツ) にいる場合、文字セットはおそらくWindows-1252です。1 バイト文字セット US-ASCII は 128 文字をカバーし、1 バイト文字セット Windwos-1252 はバイト範囲の 255 文字すべてをカバーするスーパーセットです。

最も簡単なのは、\u0080 - \u00ff の変換表です。文字列。複数の文字に置き換えたほうがよい場合もあるため、\u008c を「OE」とします。

于 2012-04-13T18:21:22.340 に答える