169

コマンドの出力を表形式で表示します。結果ファイルからのこの出力を解析し、文字列に保存しています。1行の各要素は、1つ以上の空白文字で区切られているため、正規表現を使用して1つ以上のスペースに一致させ、分割しています。ただし、すべての要素の間にスペースが挿入されています。

>>> str1="a    b     c      d" # spaces are irregular
>>> str1
'a    b     c      d'
>>> str2=re.split("( )+", str1)
>>> str2
['a', ' ', 'b', ' ', 'c', ' ', 'd'] # 1 space element between!!!

これを行うためのより良い方法はありますか?

各分割str2がリストに追加された後。

4

4 に答える 4

203

(、を使用すると)、グループをキャプチャすることになります。単にそれらを削除すれば、この問題は発生しません。

>>> str1 = "a    b     c      d"
>>> re.split(" +", str1)
['a', 'b', 'c', 'd']

ただし、正規表現は必要ありませstr.splitん。区切り文字を指定しないと、これが空白で分割されます。この場合、これが最善の方法です。

>>> str1.split()
['a', 'b', 'c', 'd']

本当に正規表現が必要な場合は、これを使用できます('\s'空白を表し、より明確です)。

>>> re.split("\s+", str1)
['a', 'b', 'c', 'd']

または、空白以外のすべての文字を見つけることができます

>>> re.findall(r'\S+',str1)
['a', 'b', 'c', 'd']
于 2012-06-11T05:44:21.060 に答える
27

このstr.splitメソッドは、アイテム間のすべての空白を自動的に削除します。

>>> str1 = "a    b     c      d"
>>> str1.split()
['a', 'b', 'c', 'd']

ドキュメントはここにあります:http://docs.python.org/library/stdtypes.html#str.split

于 2012-06-11T05:44:17.073 に答える
8

を使用re.splitし、分割パターンにキャプチャグループが含まれている場合、グループは出力に保持されます。これが不要な場合は、代わりに非キャプチャグループを使用してください。

于 2012-06-11T05:43:00.763 に答える
2

実はとてもシンプルです。これを試して:

str1="a    b     c      d"
splitStr1 = str1.split()
print splitStr1
于 2012-06-11T05:47:01.813 に答える