Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
1つのWebサイトのみをクロールするクローラーがあります。しかし、ウェブサイトは千ページを持つことができます。各ページは頂点であり、私はJGraphTそのために使用します。
JGraphT
しかし、私が巨大なWebサイトをクロールすると、StackOverflowErrorしばらくすると時間がかかります。
StackOverflowError
この場合、どうすれば大量のデータを処理できますか?データベースを使用する必要がありますか?データベースにこの特定の種類のデータ(頂点、エッジなど)を処理するライブラリがありますか?
ありがとう
高性能のNOSQLグラフデータベースであるNeo4jを使用することをお勧めします。
あなたはそれが役立つかもしれない以下を見てみることができます: