3

(そのタイプのすべてのエンティティを読み取るのではなく)クエリに基づいた DataStoreInputReader を構築するにはどうすればよいでしょうか。論理的根拠は、読み取り (クエリがサブセットにインデックス付けされているため) と処理時間を最小限に抑えることです。

  1. まず、これでよろしいでしょうか?それとも、クエリに基づくカスタム データストア入力リーダーを使用することで、実際の時間と処理の節約になるでしょうか。それとも、クエリ自体が mapreduce の並列処理をキャンセルしたり、他のオーバーヘッドを追加したりするのでしょうか?

  2. 第二に、それを行う方法は?*input_readers.py* を読んでいますが、これを行うために AbstractDataStoreInputReader をサブクラス化する方法が明確ではありません。おそらく誰かがこのようなものを実装するためのプロセスを説明できます.コードを読んでも明確ではないためです.(ドキュメントは古くなっているか存在しません.

カスタム datastoreinputreader 実装を示す作業コード (github など) を参照できる人をブラウニー ポイントします。

これは、AppEngine MapReduce をより開発者がアクセスしやすくフレンドリーにするのに非常に役立ちます ;-)

4

2 に答える 2

3

http://code.google.com/p/appengine-mapreduce/source/browse/trunk/python/src/mapreduce/input_readers.py DatastoreInputReader でフィルタがサポートされるようになりました。

于 2013-02-22T06:10:33.180 に答える
0

ドキュメントからDatastoreInputReader

このリーダーはフィルタリングを行いません。マッパーで必要なフィルタリングを行う必要があります。

于 2012-07-28T20:04:20.800 に答える