python - Python で文字列内の最初の非空白文字のインデックスを見つける方法は?

Question

シナリオ：

>>> a='   Hello world'
index = 3

この場合、「H」インデックスは「3」です。しかし、文字列変数 'a' が最初の文字のインデックスを知る必要があるような、より一般的な方法が必要ですか?

別のシナリオ:

>>> a='\tHello world'
index = 1

score 8 · Accepted Answer

最初の非空白文字を意味する場合は、次のようなものを使用します...

>>> a='   Hello world'
>>> len(a) - len(a.lstrip())
3

少し楽しい別のもの：

>>> sum(1 for _ in itertools.takewhile(str.isspace,a))
3

しかし、C でのみ、本質的にこの正確なループを行うため、最初のバージョンの方が高速であることに賭けても構わないと思っています。もちろん、完了したら新しい文字列を構築する必要がありますが、それは本質的に無料です。

完全を期すために、文字列が空であるか、完全に空白で構成されている場合、これらの両方が返さlen(a)れます（これでインデックスを作成しようとすると無効になります...）

>>> a = "foobar"
>>> a[len(a)]
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: string index out of range

score 3 · Accepted Answer

使用regex:

>>> import re
>>> a='   Hello world'
>>> re.search(r'\S',a).start()
3
>>> a='\tHello world'
>>> re.search(r'\S',a).start()
1
>>>

文字列が空であるか空白のみを含む場合を処理する関数:

>>> def func(strs):
...     match = re.search(r'\S',strs)
...     if match:
...         return match.start()
...     else:
...         return 'No character found!'
...     
>>> func('\t\tfoo')
2
>>> func('   foo')
3
>>> func('     ')
'No character found!'
>>> func('')
'No character found!'

score 2 · Accepted Answer

あなたも試すことができます：

a = '   Hello world'
a.index(a.lstrip()[0])
=> 3

文字列に少なくとも 1 つの非スペース文字が含まれている限り、機能します。もう少し注意して、前にこれを確認できます。

a = '    '
-1 if not a or a.isspace() else a.index(a.lstrip()[0])
=> -1

score 1 · Accepted Answer

楽しみのための別の方法... 特別な機能を使用してください！

>>> def first_non_space_index(s):
    for idx, c in enumerate(s):
        if not c.isspace():
            return idx


>>> a = '   Hello world'        
>>> first_non_space_index(a)
3

score 0 · Accepted Answer

mgilsonの回答に従って、lstripを使用して、必要な文字を削除できます-

unwanted = ':!@#$%^&*()_+ \t\n'
a= '  _Hello world'
res = len(a) - len(a.lstrip(unwanted))

python - Python で文字列内の最初の非空白文字のインデックスを見つける方法は?

5 に答える 5

Related

Reference