Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
pandas データフレームの高速メモリ ストアとして pyarrow を使用して、マルチプロセス ベースのコンシューマー プロデューサー パターンを実装する最良の方法は何ですか?
現在、私は redis pub sub を使用していますが、より効率的な (より高速な) ソリューションがあると思いますか? 例を挙げていただけますか?
リストを使用したソリューション:
Producer はリストにデータを配置し、LPUSH Consumer はRPOPor BRPOP(ブロッキング) を使用してこのリストからデータを取得します。
LPUSH
RPOP
BRPOP
制限: 1 つのコンシューマーのみがメッセージを読み取ります。2 つある場合は、そのうちの 1 つだけがメッセージを表示します。
速度: 消費者と生産者の 1 つのペアでは、同じ速度になります。(このリストまたは他のリストの) コンシューマーが多いほど、pub/sub よりも高速になります。