私はややアマチュア プログラマーで、このサイトは初めてです。この質問を検索しましたが、インターネットやこのサイトのどこにも見つかりませんでした。
<p>
段落の開始と終了の HTML タグ ( & )の間にあるすべての単語を取得しようとしています</p>
。私の findall ステートメントは、一重引用符または二重引用符がある場所を除いて、特定のオンライン記事のすべての段落のすべての単語に対して機能します。私がやろうとしていることを行うためのより良い方法があるか、またはこのステートメントを簡単に調整して引用符付きの段落を含めることができる可能性は十分にあります。どんなアドバイスでも大歓迎です!
findall ステートメント:
aText = findall("<p>[A-Za-z0-9<>=\"\:/\.\-,\+\?#@'<>;%&\$\*\^\(\)\[\]\{\}\|\\!_`~ ]+</p>",text)