HTML ベースの Web サイトからテキストを抽出する必要があります。約 3000 の URL があり、それらの html から 1 行のテキストを抽出する必要があります。必要なデータは次のようになります。
<html xmlns:og="http://opengraphprotocol.org/schema/">
<head>
<title>Pink Floyd Live Audio Feeds</title>// the line i need
...
このプロセスを自動化するにはどうすればよいですか? 私は Java が得意なので、その言語を使用した方法論が好まれます。ありがとう!