1

含まれている単語の意味的な方向性を取得するために、意見マイニング(データマイニング->Webマイニング->意見マイニング)を作成するプロジェクトに参加しています。クローラーを使用してページの意見を取得します。ここで問題となるのは、このタイプのプロジェクトでは、どのタイプのデータベース(OO、リレーショナル、階層型など)を使用するのが最適かということです。私はこれが特定の質問であることを知っています、私はすべての人の応答を期待していませんが、少なくともすでにそれをした誰かが助けになるでしょう。

よろしく!

4

2 に答える 2

0

大規模で応答性の高いものが必要な場合は、おそらくGoogleのBigTableまたはそのような性質のものを選択する必要があります。プロトタイプレベルでは、従来のリレーショナルデータベースを使用できると確信していますが、ある時点でパフォーマンスの壁にぶつかることになります。ブリューワーのCAP定理を参照してください。

于 2009-11-22T19:00:14.993 に答える
0

このような種類のシナリオでの私の経験から、リレーショナル データベースは目的を十分に果たすことができます。Web コンテンツの一部を保存するときは、特に注意する必要があります。データベースを使用して保存するか、ファイル システムと同じくらい簡単に保存するかです。BLOB は特に細心の注意を払う必要があり、メンテナンス作業が増加します。

また、プロジェクトの性質に基づいて、すでに組み込まれている多くのコンポーネントなどを使用することは確かです。その多くは、リレーショナル DB をデータ ストアとして使用するために既にサポートされているか、簡単に拡張できます。

于 2009-11-22T19:08:46.097 に答える