画像とクエリの間の距離を最小限に抑えるモデルをトレーニングしたいとします。片側からは CNN の画像機能があり、反対側からは単語から埋め込みベクトル (たとえば w2v) へのマッピングがあります。
def raw_data_generator():
for row in network_data:
yield (row["cnn"], row["w2v_indices"])
dataset = tf.data.Dataset.from_generator(raw_data_generator, (tf.float32, tf.int32))
dataset = dataset.prefetch(1000)
ここでバッチを作成したいのですが、cnn 機能の高密度バッチと w2v の疎バッチを作成したいのは、明らかに可変長であるためです (そして、safe_embeddings_lookup_sparseを使用したい)。密集にはバッチ関数、疎には.apply(tf.contrib.data.dense_to_sparse_batch(..))関数がありますが、それらを同時に使用するにはどうすればよいですか?