0

乱雑な HTML データから情報を抽出する際に問題があります。基本的に、私がやりたいことは、特定の HTML コードから実際に表示される単語だけを抽出することです。これは私が与えられた生のHTMLデータの例です

<p>I have an app which send mail to my defined mail address "myemail@own.com". For this i create my own Custom Email View Which contains check boxes message body and other options. Now i want that when send button is pressed my app should not go to gmail view or other email client view it directly submit the data</p>

<p>String recepientEmail = "myemail@own.comm"; </p>

<p>// either set to destination email or leave empty</p>

<pre><code>    Intent intent = new Intent(Intent.ACTION_SENDTO);

    intent.setData(Uri.parse("mailto:" + recepientEmail));

    startActivity(intent);
</code></pre>

<p>but on submit it opens gmail or chooser email client view but i dont want to show gmail view</p>

そして私はそれをこれに変換したい

I have an app which send mail to my defined mail address "myemail@own.com". For this i create my own Custom Email View Which contains check boxes message body and other options. Now i want that when send button is pressed my app should not go to gmail view or other email client view it directly submit the data String recepientEmail = "myemail@own.comm"; // either set to destination email or leave empty but on submit it opens gmail or chooser email client view but i dont want to show gmail view 

<p>したがって、基本的には、各タグ内のすべてを取得して、それらを連結するだけです。私はpythonを使用しているので、おそらくBeautifulSoupがこれを行う最良の方法だと考えていますが、これを行う方法がわかりません。また、このような例をいくつか (実際には数百万) 繰り返したいと思いますが、各例には少なくとも 1 つの<p>タグが必要です。

4

3 に答える 3