私は現在 Heritrix を使用しており、標準インストール (これ: http://builds.archive.org/maven2/org/archive/heritrix/heritrix/3.2.0/ ) を使用しており、正常に動作します。
しかし今、私は独自の拡張機能を作成して追加したいと考えています。たとえば、クロールする必要がある URL の優先順位を変更したり、単純なエクストラクタを変更したりします。既存のエクストラクターの Java コードを調べることはできますが、それをクローラーに追加するにはどうすればよいですか?
Java テスト プロジェクトを jar ファイルにエクスポートし、このファイルを Heritrix の lib フォルダー (他のライブラリがある場所) に配置しようとしました。さらに、ジョブの cxml ファイルに Bean を追加しました。
しかし、開始後、次のエラーが発生しました: 2014-11-07T19:51:40.296Z SEVERE Could not instantiate bean class [myModule.TestClass]: No default constructor found; ネストされた例外は java.lang.NoSuchMethodException: myModule.TestClass.(); です。Bean 'myModule.TestClass#0' を作成できません
これは、extractorHTML の名前を変更し、新しいプロジェクトに入れ、jar ファイルにエクスポートしただけです。
何が間違っているのですか?すべてのドキュメントを読みましたが、拡張機能の記述方法のみが説明されており、追加方法は説明されていません。
ご挨拶とありがとう:-)