0
  1. データはnpm public registryにあります. JavaScript Packagenameを指定して、https://registry.npmjs.org/nameにアクセスすると、依存関係を含む情報を取得できます。

  2. この情報を neo4j データベースにインポートして、パッケージの依存関係グラフを作成します。パッケージ名expressがキューに追加された場合、次の手順を実行します。

    • https://registry.npmjs.org/pkg_nameで返されるキューでフロント パッケージの JSON ファイルを取得します 。
    • Neo4j Python Driverexpressを使用して、ファイルを解析し、neo4jの基本情報と依存関係を保存します。
    • 依存関係ごとに、 を使用してキューに追加されているかどうかを確認しますset。そうでない場合は、その依存関係グラフが neo4j で構築されているかどうかを確認してください。そうでない場合は、キューに追加します。
    • queueが空になるまで繰り返します。次に、 の依存関係グラフexpressが作成されます。
  3. 結果は次のようになります: Expressの JavaScript パッケージに対する依存関係グラフ問題は、単一のパッケージのプロセス全体が私のマシンで約 50 秒かかることです。これは長すぎます。 npmのすべてのパッケージは言うまでもなく、約 100 万です。

  4. 私が考えることができるいくつかの理由:

    • a を使用しsetてすべての pkgs を検索すると、O(nlogn) のコストがかかります。
    • ノードのクエリにかかる時間 (パッケージの依存関係グラフが neo4j にあるかどうかを確認します)。
    • ノードとリレーションシップの作成にかかる時間 (バッチ挿入を使用していないように見えるため)。

依存関係グラフの構築を高速化するためのアドバイスを誰かに教えてもらえますか?

心から感謝します!

4

0 に答える 0