Monte Carlo Samplingを使用して増分 PageRankを実装しようとしています。私のデータには、20 の異なるエンティティ間の数百万のリレーショナル データが含まれています。
Amazon DynamoDBとFlockDBは、データ ストレージとしての私のタスクに適した 2 つの候補であることがわかりました。簡単な比較はこちらです。私の PageRank タスクにどちらがより適しているか誰か指摘できますか?
Monte Carlo Samplingを使用して増分 PageRankを実装しようとしています。私のデータには、20 の異なるエンティティ間の数百万のリレーショナル データが含まれています。
Amazon DynamoDBとFlockDBは、データ ストレージとしての私のタスクに適した 2 つの候補であることがわかりました。簡単な比較はこちらです。私の PageRank タスクにどちらがより適しているか誰か指摘できますか?
私はあなたの要件について100%ではないので、この答えは健康的な量の塩で取られるべきです.
まず、最も明白なことですが、この論文は Twitter (Personilized page ran - SALSA) からのものです。ある時点で、彼らの推奨/パーソナライゼーションの責任者が、他の多くのテクニックでそれを使用したと述べたことを知っています (これは 10 月 11 日からのものです) https://fbcdn-sphotos-ba.akamaihd.net/hphotos-ak-snc7/ 300267_581958426587_2140504611_n.jpg
どちらがあなたのタスクにより適しているかという点では、FlockDB を使用します。主な理由は、コードで非常に一般的なグラフ ベースのクエリをサポートしているためです。また、エッジ情報の永続化など、明示的な永続グラフ関数もいくつかあります。