私は、Web クローラーからデータを取得し、テキスト分析を行うプロジェクトに取り組んでいます (実際の手法については、まだ議論中です)。現在、Web クロールにcrawler4j を使用しており、分析部分に Java Data Mining Package (JDMP) を使用したいと考えています。Apache Mahout などの他のパッケージを検討しました (これは表にはありませんが、特に Windows で hadoop/maven セットアップをセットアップするのは難しいことがわかっています)。いずれにせよ、JDMP の使用方法を詳しく説明するチュートリアル/コードが欲しいです。オンラインで検索しましたが、その点で役立つものは見つかりませんでした。誰かが良い JDMP チュートリアルを提案できるなら、私はそれを大いに感謝します。
ありがとう。