172

私はこの文字列を持っています:Hello, World!そして、Pythonを使用して「48:65:6c:6c:6f:2c:20:57:6f:72:6c:64:21」として印刷したいと思います。

hex()整数に対してのみ機能します。

どうすればそれができますか?

4

13 に答える 13

248

文字列を整数ジェネレーターに変換できます。各要素に 16 進数の書式を適用し、区切り記号を挿入します。

>>> s = "Hello, World!"
>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:2c:20:57:6f:72:6c:64:21
于 2012-08-31T11:55:52.843 に答える
158
':'.join(x.encode('hex') for x in 'Hello, World!')
于 2012-08-31T12:00:43.777 に答える
57

Python 2.x の場合:

':'.join(x.encode('hex') for x in 'Hello, World!')

上記のコードは Python 3.x では機能しません。3.x の場合、以下のコードが機能します。

':'.join(hex(ord(x))[2:] for x in 'Hello, World!')
于 2012-12-15T12:14:58.733 に答える
26

読みやすいと思われる2行の別の回答で、文字列内の改行やその他の奇妙な文字のデバッグに役立ちます。

Python 2.7 の場合

for character in string:
    print character, character.encode('hex')

Python 3.7 の場合 (3 のすべてのリリースではテストされていません)

for character in string:
    print(character, character.encode('utf-8').hex())
于 2013-12-22T03:38:12.737 に答える
20

Fedor Gogolevの答えをいくつか補足します:

まず、文字列にASCII コードが 10 未満の文字が含まれている場合、必要に応じて表示されません。その場合、正しい形式は次のようになります{:02x}

>>> s = "Hello Unicode \u0005!!"
>>> ":".join("{0:x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:5:21:21'
                                           ^

>>> ":".join("{:02x}".format(ord(c)) for c in s)
'48:65:6c:6c:6f:20:75:6e:69:63:6f:64:65:20:05:21:21'
                                           ^^

次に、「文字列」が実際には「バイト文字列」である場合 (Python 3 ではその違いが問題になるため)、次のようにすることをお勧めします。

>>> s = b"Hello bytes \x05!!"
>>> ":".join("{:02x}".format(c) for c in s)
'48:65:6c:6c:6f:20:62:79:74:65:73:20:05:21:21'

上記のコードでは、bytesオブジェクトが「範囲 0 <= x < 256 の不変の整数シーケンス」として定義されているため、変換の必要がないことに注意してください。

于 2013-06-02T10:57:41.433 に答える
12

文字列を 16 進バイトとして出力しますか?

受け入れられた答えは次のとおりです。

s = "Hello world !!"
":".join("{:02x}".format(ord(c)) for c in s)

戻り値:

'48:65:6c:6c:6f:20:77:6f:72:6c:64:20:21:21'

受け入れられた回答は、バイト (ほとんどが ASCII 文字) を使用している場合にのみ機能します。ただし、ユニコードを使用する場合、たとえば:

a_string = u"Привет мир!!" # "Prevyet mir", or "Hello World" in Russian.

何らかの方法でバイトに変換する必要があります。

端末がこれらの文字を受け入れない場合は、UTF-8 からデコードするか、名前を使用できます (コードを貼り付けて、一緒に実行できます)。

a_string = (
    "\N{CYRILLIC CAPITAL LETTER PE}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER VE}"
    "\N{CYRILLIC SMALL LETTER IE}"
    "\N{CYRILLIC SMALL LETTER TE}"
    "\N{SPACE}"
    "\N{CYRILLIC SMALL LETTER EM}"
    "\N{CYRILLIC SMALL LETTER I}"
    "\N{CYRILLIC SMALL LETTER ER}"
    "\N{EXCLAMATION MARK}"
    "\N{EXCLAMATION MARK}"
)

したがって、次のことがわかります。

":".join("{:02x}".format(ord(c)) for c in a_string)

戻り値

'41f:440:438:432:435:442:20:43c:438:440:21:21'

悪い/予期しない結果 - これらは、Unicode コンソーシアムからの Unicode で見られる書記素を作成するために組み合わされたコード ポイントであり、世界中の言語を表しています。ただし、これはこの情報を実際に保存する方法ではないため、他のソースによって解釈される可能性があります.

別のソースがこのデータを使用できるようにするには、通常、UTF-8 エンコーディングに変換する必要があります。たとえば、この文字列をバイト単位でディスクに保存したり、html に公開したりします。したがって、コード ポイントをUTF-8のコード単位に変換するためのエンコーディングが必要です。Python 3 では、整数の iterable であるordため必要ありません。bytes

>>> ":".join("{:02x}".format(c) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

または、新しい f-strings (Python 3 でのみ利用可能) を使用して、より洗練されたものにすることもできます。

>>> ":".join(f'{c:02x}' for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'

Python 2 では、最初に渡しcますord。つまり、ord(c)より多くの例を示します。

>>> ":".join("{:02x}".format(ord(c)) for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
>>> ":".join(format(ord(c), '02x') for c in a_string.encode('utf-8'))
'd0:9f:d1:80:d0:b8:d0:b2:d0:b5:d1:82:20:d0:bc:d0:b8:d1:80:21:21'
于 2016-05-14T03:36:50.037 に答える
8

を使用できますhexdump:

import hexdump
hexdump.dump("Hello, World!", sep=":")

.lower()(小文字が必要な場合は追加します)。これは Python 2 と 3 の両方で機能します。

于 2015-10-12T17:57:14.890 に答える