0

Dataflow プログラム (Java および Maven 実装) を作成したいと考えています。実行したい手順は次のとおりです。

  1. Dataflow は、Google クラウド ストレージから csv ファイルを読み取る必要があります。csv ファイルの形式は次のとおりです。

    商品名、画像URL、カテゴリー、説明1、説明 2 Sakura 30062 ピグマミクロンインクペン6本セット、https://images-na.ssl-images-amazon.com/images/I/71CkvpG3FEL. SY355 .jpg , アート, サイズ: #005 (0.20mm) の 1 つを含む

    CCbetter ミニホットメルトグルーガン 25本のグルースティック付き 高温溶融グルーガンキット 柔軟なトリガー DIY小さなクラフトプロジェクト&シーリングとクイック修理用 (20ワット、ブルー)、https://images-na.ssl-images-amazon.com/ images/I/61iFrMg4%2B3L. SY355 .jpg、LEDライトモード付きの安全で快適な電源スイッチ。取り外し可能で柔軟なサポートにより、ガンを安定して直立に保ちます。高品質で断熱されたノズルにより、華氏 500 度以下で長期間使用してもガンが変形することはありません。

    . . . .

  2. csv の各行について、画像の URL を選択して Vision API を実行し、上位 2 つのラベルを取得する必要があります (たとえば、最初の製品/行の Vision API からラベル L1 と L2 を取得し、2 番目の製品/行の L3 と L4 を取得します)。

  3. csv の行ごとに、製品名、カテゴリ、説明 1、説明 2 を連結して NL API に渡す必要があります。NL API の応答から、消費財カテゴリの上位 2 つのエンティティを選択する必要があります (たとえば、最初の行から E1 と E2 を取得し、2 番目の行から E3 と E4 を取得します)。

  4. 取得した応答から次の構造を作成する必要があります。

    商品名、トピックSAKURA 30062 6本入りピグマミクロンインクペンセット、L1 Sakura 30062 6本入りピグマミクロンインクペンセット、L2 Sakura 30062 6本入りピグマミクロンインクペンセット、E1 Sakura 30062 6本入りピグマミクロンインクペンセット、E2

    CCbetter ミニ ホットメルト グルーガン スティックのり25本付き 高温で溶けるグルーガンキット 柔軟なトリガー DIY 小さなクラフトプロジェクト&シーリングと迅速な修理用 (20ワット ブルー) L3 CCbetter ミニホットメルトグルーガン スティックのり25本付き 高温で溶けるグルーガンキット フレキシブル トリガー DIY 小さなクラフト プロジェクト & シーリングとクイック修理用 (20 ワット、ブルー)、L4 CCbetter ミニ ホットメルト グルー ガン 25 本の接着剤スティック付き、青)、E3 CCbetter ミニ ホットメルト グルーガン 25 本の接着剤スティック付き 高温溶融接着剤ガン キット フレキシブル トリガー DIY 小さなクラフト プロジェクト & シーリングおよび迅速な修理用 (20 ワット、青)、E4 . . . .

  5. このグリッド (手順 4 の構造) を Bigquery テーブルに書き込みたい

私は Dataflow を初めて使用するので、ヘルプ、コード スニペット、ソース コード全体、またはリファレンスを大歓迎します。

4

1 に答える 1