現在、Cloud Dataflow での Apache Beam Pipeline の概念実証に取り組んでいます。いくつかのファイル (テキストなし、カスタム バイナリ形式) を Google Cloud バケットに入れ、これらのファイルを byte[] として読み取り、フローで逆シリアル化したいと考えています。ただし、テキスト以外のファイルを読み取ることができる Beam ソースは見つかりません。唯一のアイデアはクラスを拡張することFileBasedSource
ですが、これは非常に簡単な作業のように聞こえるため、より簡単な解決策があるはずです。
助けてくれてありがとう。