0

この投稿に興味を持っていただきありがとうございます。基本的に、PHP 内でさまざまなデータベース実装からのデータを操作するためのアドバイス、または PHP がこれらのタスクに適していない場合、他のアプローチに関する推奨事項を探しています。

私が達成したいタスクは、次の例で説明できます。「サーバーA」でuser_idによって編成されたユーザーに関する人口統計情報を保存するMySQLデータベースがあります。これは約200,000行になります。サーバー B では、約 3 億行まで実行される Vertica データベースに user_id と event_id によって格納されたユーザーの使用状況データがあります。

これらのデータセットを結合する方法を見つけて、「user_id」フィールドでの結合を通じて、年齢や場所などの MySQL データベースに含まれるデータによってグループ化された Vertica データベースから取得された集約されたユーザー イベントで構成される要約出力を生成できるようにしたいと考えています。 .

これは、他のサーバーにこれらのテーブルのいずれかのコピーを作成することで実現できることを認識していますが、それがなくても実現できるかどうかに興味があります。

私の質問は次のとおりです。

  • PHPはこのような操作を行うことができますか? もしそうなら、例へのリンクは大歓迎です。
  • データを配列にロードしてそこに結合する必要がありますか? データベースのテーブルのように、PHP で配列を結合できますか? PHP はこのような大きな配列を処理できますか?
  • 代わりに検討すべき他のアプローチはありますか?

助けてくれてありがとう、

ジェームズ

4

1 に答える 1

0

TALENDの使用をお勧めします!は、Mysql および Vertica コネクタが実装されたオープン ソースの ETL ツールです。TALEND がアクセスできる限り、任意の rdbms からデータ セットを集約できます。そして、必要な場所にそれらをダンプします。試してみる 。

于 2014-01-23T18:19:39.677 に答える