python - 既知の文字列の前に任意の長さの文字列を見つける

Question

次のような文字列があるとだけ言ってください。

Lecture/NNP/B-NP/O delivered/VBD/B-VP/O at/IN/B-PP/B-PNP the/DT/B-NP/I-PNP UNESCO/NNP/I-NP/I-PNP House/NNP/I-NP/I-PNP in/IN/B-PP/B-PNP Paris/NNP-LOC/B-NP/I-PNP

「/NNP/」の前に出現するすべての単語を抜き出したい。これは、私の出力が

講演会、ユネスコ、家

私は試した：

print re.findall(r'/NNP/',string) その後、逆方向に作業しますが、任意にすることはできません。単語の先頭には常に空白があり、これが役立つ場合があります。

編集：リストのエラーを削除しました。

score 4 · Accepted Answer

これを試して：

s = 'Lecture/NNP/B-NP/O delivered/VBD/B-VP/O at/IN/B-PP/B-PNP the/DT/B-NP/I-PNP UNESCO/NNP/I-NP/I-PNP House/NNP/I-NP/I-PNP in/IN/B-PP/B-PNP Paris/NNP-LOC/B-NP/I-PNP'

re.findall(r'(\S+)/NNP/', s)
=> ['Lecture', 'UNESCO', 'House']

score 2 · Accepted Answer

先読み。

>>> re.findall('(?:\s|^)[^/]+(?=/NNP/)', 'Lecture/NNP/B-NP/O delivered/VBD/B-VP/O at/IN/B-PP/B-PNP the/DT/B-NP/I-PNP UNESCO/NNP/I-NP/I-PNP House/NNP/I-NP/I-PNP in/IN/B-PP/B-PNP Paris/NNP-LOC/B-NP/I-PNP')
['Lecture', 'UNESCO', 'House']

python - 既知の文字列の前に任意の長さの文字列を見つける

2 に答える 2

Related

Reference