python - re.findall() を使用した + と - を含む文字列内の正規表現一致単語 Python

Question

myreg = r"\babcb\"

mystr = "sdf ddabc"

mystr1 = "sdf abc"

print(re.findall(myreg,mystr))=[]

print(re.findall(myreg,mystr1))=[abc]

これまでのところ、すべてが期待どおりに機能しますが、reg と str を変更すると.

myreg = r"\b\+abcb\"

mystr = "sdf +abc"

print(re.findall(myreg,mystr)) = [] but i would like to get [+abc]

次の作業を期待どおりに使用することに気付きました。

   myreg = "^\\+abc$"

   mystr = "+abc"   

   mystr1 = "-+abc"

私の質問: 文字列を分割せずに上記と同じ結果を達成することは可能ですか?

よろしくお願いします、

ガブリエル

score 0 · Accepted Answer

2つの問題があります

単語境界

単語境界\bは、単語文字 (文字、数字、アンダースコア) と非単語文字 (または行頭または行末) の間の位置で一致します。たとえば、the+と the の間に単語境界があります。a

解決策: 自分の境界線を作る

単語文字が前にない場合にのみ一致させたい場合+abc(たとえば、の中に入れたくない場合def+abc) は、後読みで独自の境界を作成できます。

(?<!\w)\+abc

+abcこれは、「単語の文字 (文字、数字、アンダースコア) が前にない場合に一致する」という意味です。

score 0 · Accepted Answer

あなたの問題は次のとおりです。

'+'は含まれ\wていないため、空白と'+'.

\b必要なものを取得するには、パターンから最初のものを削除する必要があります。

import re

string = "sdf +abc"
pattern = r"\+abc\b"
matches = re.findall(pattern, string)

print matches
['+abc']

2 に答える 2