問題タブ [crawler4j]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
570 参照

grails - src/groovy クラスからドメイン クラス プロパティに値を設定する

私はgroovyとgrailsを使ってcrawler4jに取り組んでいます。

src/groovyにBasicCrawler.groovyクラスがあり、ドメイン クラスCrawler.groovyとCrawlerController.groovyというコントローラーがあります。

BasicCrawler.groovyクラスには、urlparentUrldomainなどのプロパティがほとんどありません。

クロール中にこれらの値をドメイン クラスに渡すことで、これらの値をデータベースに保持したいと考えています。

src/groovy の下のBasicCrawlerクラスでこれを試しました

私のドメインクラスは次のとおりです。

しかし、次のエラーが発生しました。

この後、私は別のアプローチを試みました。私の src/groovy/BasicCrawler.groovy クラスでは、最初にurlプロパティとparentUrlプロパティを宣言してから、データバインディングを使用しました (初心者なので間違っているかもしれません)。

私のCrawler.groovyドメインクラスは次のとおりです。

現在、エラーは表示されていませんが、値はデータベースに保持されていません。バックエンドにはmongodbを使用しています。

0 投票する
1 に答える
353 参照

java - crawler4j での WebCrawler のパラメータ

params を WebCrawler に渡すことは可能ですか? たとえばWebCrawler.shouldVisit(WebURL url)、実行時にメソッドに新しいルールを渡したり、WebCrawler にフィールドを設定したりしたいとします。出来ますか?

0 投票する
1 に答える
645 参照

grails - Crawler4j が https URL で機能しない

私はクローラー4jを使用してgrailsアプリを開発しています。

これは古い質問であり、このソリューション hereに出会いました。

提供された解決策を試しましたが、別のフェッチャーと mockssl Java ファイルをどこに保管すればよいかわかりません。

また、https://... を含む URL の場合、これら 2 つのクラスがどのように呼び出されるのかわかりません。

前もって感謝します。