2

次の形式のデータを含む一連のバイナリ ファイルがあります。

i\xffhh\xffhh\xffhh\xffih\xffhh\xffhh\xffhh\xffhh\xffhi\xffii\xffjj\xffjj\xffjj\xffjk\xffkk\xffkk\xffkl\xffll\xffmm\xffmn\xffnn\xffon\xffno\xffop\xffop\xffpp\xffqq\xffrq\xffrs\xffst\xfftt\xfftt\xffuv\xffvu\xffuv\xffvv\xffvw\xffwx\xffwx\xffxy\xffyy\xffyz\xffz{\xffz{\xff||\xff}|\xff~}\xff}}\xff~~\xff~~\xff~\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x80\x80\xff\x80\x81\xff\x81\x80\xff\x81\x81\xff\x81\x82\xff\x82\x82\xff\x82\x82\xff\x82\x83\xff\x83\x83\xff\x83\x83\xff\x83\x84\xff\x83\x84\xff\x84\x85\xff\x85\x85\xff\x86\x85\xff\x86\x87\xff\x87\x87\xff\x87\x87\xff\x88\x87\xff\x88\x89\xff\x88\x89\xff\x89\x8a\xff\x89\x8a\xff\x8a\x8b\xff\x8b\x8b\xff\x8b\x8c\xff\x8d\x8d\xff\x8d\x8d\xff\x8e\x8e\xff\x8e\x8f\xff\x8f\x8f

これらは、人が歩いているときの圧力センサーの読み取り値であるはずなので、数値であると想定していますが、ASCIIに変換したいので、それらが何であるかがわかります。それらを変換するにはどうすればよいですか?それらは現在どのような形式になっていますか?

編集: ここで提供されるファイルへのリンク (リンク)

4

3 に答える 3

4

バイナリ ファイルを開くだけでは、形式を推測することはできません。その特定の圧力センサーの読み取り値のデータが保存される方法に関する情報を取得する必要があります。

もちろん、フォーマットがわかっていれば、ファイルをバイナリモードで読み込んで、意味のあるデータをすべて取得するのは簡単です。

FILE = open(filename,"rb")
FILE.read(numBytes)
于 2010-11-18T19:35:59.413 に答える
4

私は絶対にショックを受けて唖然とし、「16 進数の一部であってはならない hh のような文字がある」「最初の \x7f から意味を成し始めているようだ」などのワッフルに少なからず驚かされます。 . 誰もrepr()出力を見たことがありませんか?

\xff以下は、単なるノイズのように見える を無視して、そのようになった可能性がある方法を示しています。

>>> pressure = [120,121,122,123,124,125,126,127,128,129,130,131]
>>> import struct
>>> some_bytes = struct.pack("12B", *pressure)
>>> print repr(some_bytes)
'xyz{|}~\x7f\x80\x81\x82\x83'
>>>

それでは、ファイルから戻って作業してみましょう。

>>> guff = open('your_file.bin', 'rb').read()
>>> cleaned = guff.replace("\xff", "")
>>> cleaned
'ihhhhhhihhhhhhhhhhiiijjjjjjjkkkkkklllmmmnnnonnoopopppqqrqrsstttttuvvuuvvvvwwxwx
xyyyyzz{z{||}|~}}}~~~~~\x7f\x7f\x7f\x7f\x7f\x7f\x7f\x80\x80\x80\x81\x81\x80\x81\
x81\x81\x82\x82\x82\x82\x82\x82\x83\x83\x83\x83\x83\x83\x84\x83\x84\x84\x85\x85\
x85\x86\x85\x86\x87\x87\x87\x87\x87\x88\x87\x88\x89\x88\x89\x89\x8a\x89\x8a\x8a\
x8b\x8b\x8b\x8b\x8c\x8d\x8d\x8d\x8d\x8e\x8e\x8e\x8f\x8f\x8f'
# Note that lines wrap at column 80 in a Windows "Command Prompt" window ...
>>> pressure = [ord(c) for c in cleaned]
>>> pressure
[105, 104, 104, 104, 104, 104, 104, 105, 104, 104, 104, 104, 104, 104, 104, 104,
 104, 104, 105, 105, 105, 106, 106, 106, 106, 106, 106, 106, 107, 107, 107, 107,
 107, 107, 108, 108, 108, 109, 109, 109, 110, 110, 110, 111, 110, 110, 111, 111,
 112, 111, 112, 112, 112, 113, 113, 114, 113, 114, 115, 115, 116, 116, 116, 116,
 116, 117, 118, 118, 117, 117, 118, 118, 118, 118, 119, 119, 120, 119, 120, 120,
 121, 121, 121, 121, 122, 122, 123, 122, 123, 124, 124, 125, 124, 126, 125, 125,
 125, 126, 126, 126, 126, 126, 127, 127, 127, 127, 127, 127, 127, 128, 128, 128,
 129, 129, 128, 129, 129, 129, 130, 130, 130, 130, 130, 130, 131, 131, 131, 131,
 131, 131, 132, 131, 132, 132, 133, 133, 133, 134, 133, 134, 135, 135, 135, 135,
 135, 136, 135, 136, 137, 136, 137, 137, 138, 137, 138, 138, 139, 139, 139, 139,
 140, 141, 141, 141, 141, 142, 142, 142, 143, 143, 143]
>>>

これらの 0 ~ 254 の値を掛ける倍率を調べるには、機器のドキュメントを読む必要があります。

派生した数値が毎回 +1、0、または -1 ずつ変化することに気付くでしょう。これは、読み取りごとに 2 バイト以上ではなく、読み取りごとにわずか 1 バイトであるという仮説にうまく適合します。

別の考え: おそらく、\xffは開始または終了のセンチネルであり、2 つの値 (開始、停止) または (センサー A、センサー B) が各サイクルで報告されます。

于 2010-12-16T04:12:26.957 に答える
0

最初の部分は非常に奇妙に見えます。通常、\x8e のような数値は、16 進数の一部であってはならない hh のような文字が最初の部分にあることを除いて、16 進数のバイトであることを示す単なるコードです。

しかし、2番目の部分では、次のようなことができます:

hex_list = r"\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x7f\x7f\xff\x80\x80\xff\x80\x81\xff\x81\x80\xff\x81\x81\xff\x81\x82\xff\x82\x82\xff\x82\x82\xff\x82\x83\xff\x83\x83\xff\x83\x83\xff\x83\x84\xff\x83\x84\xff\x84\x85\xff\x85\x85\xff\x86\x85\xff\x86\x87\xff\x87\x87\xff\x87\x87\xff\x88\x87\xff\x88\x89\xff\x88\x89\xff\x89\x8a\xff\x89\x8a\xff\x8a\x8b\xff\x8b\x8b\xff\x8b\x8c\xff\x8d\x8d\xff\x8d\x8d\xff\x8e\x8e\xff\x8e\x8f\xff\x8f\x8f"
int_list =  [int(hex,16) for hex in hex_list.replace('\\', ';0').split(';') if hex != '']

255 (\xff) を除いて、常に 127 から 143 の間の数値を取得することに注意してください。

于 2010-11-18T19:59:19.353 に答える