regex - Python 正規表現 Findall ステートメント

翻译自：https://stackoverflow.com/questions/17508944 2013-07-07T03:16:51.130

199 次

私はややアマチュアプログラマーで、このサイトは初めてです。この質問を検索しましたが、インターネットやこのサイトのどこにも見つかりませんでした。

<p>段落の開始と終了の HTML タグ ( & )の間にあるすべての単語を取得しようとしています</p>。私の findall ステートメントは、一重引用符または二重引用符がある場所を除いて、特定のオンライン記事のすべての段落のすべての単語に対して機能します。私がやろうとしていることを行うためのより良い方法があるか、またはこのステートメントを簡単に調整して引用符付きの段落を含めることができる可能性は十分にあります。どんなアドバイスでも大歓迎です！

findall ステートメント:

aText = findall("<p>[A-Za-z0-9<>=\"\:/\.\-,\+\?#@'<>;%&\$\*\^\(\)\[\]\{\}\|\\!_`~ ]+</p>",text)

regex - Python 正規表現 Findall ステートメント

2 に答える 2

Related

Reference