UTF-8ストリームで任意のバイナリを出力するプログラムを書いています。無効なUTF-8を回避するために、無効な文字をエスケープしています。16進数または8進数のエスケープを使用する必要がありますか?
つまり、16進数のFFFFは次のようにエスケープする必要があります。
\xff\xff
またはこれ:
\377\377
1つ目はPythonが行うことであり、2つ目はCが行うことです。決められない。
[編集]次のように、潜在的に長い文字列を処理できる必要があります。
SOMETHING SOMETHING\377\377\377\377\377\377\377\377SOMETHING SOMETHING
対。
SOMETHING SOMETHING\xff\xff\xff\xff\xff\xff\xff\xffSOMETHING SOMETHING