HTML ページ、具体的にはフォーラムの解析について質問があります。特定の投稿基準を含むフォーラムまたはスレッドを解析したいのですが、以前は構造テキスト形式しか解析していないため、まだアルゴリズムを定義していません。ユースケースはコピー アンド ペーストである可能性があります。各スレッドを手動でプログラムに挿入するか、http://www.forums.com/forum/showthread.php?t=46875&page=3 のような URL を挿入して 、プログラムにページを解析させます。
このすべてを考えると、私は知りたいです:
- HTML ページのフォーラム スレッドを解析することは可能ですか?
- これを行うための最良/最速/最も簡単な言語は何ですか?
- Java を好む場合、これにはどのようなツール/ライブラリが必要ですか?
- 他に考慮すべきことはありますか?