一致した GCS ファイル名の PCollection があり、それぞれに 1 つの圧縮された JSON BLOB が含まれています。ファイル全体を読み取り、解凍 (Gzip 形式) し、JSON でデコードする最良の方法は何ですか?
- TextIO は非常に近いですが、1 行ごとにデータを読み取ります。
- GCS API は、ファイル全体を読み取る方法の例を提供しますが、解凍を処理しないため、多くのコア機能を再実装する必要があります。
有利なスタートを切ることができる既存の API やサンプルはありますか? これはかなり一般的な使用例のようです。