0

テンソルフローを使用して、事前トレーニング済みの RoBERTa モデルを微調整/トレーニングしようとしています。このために、データフレームから tf.data.Dataset を作成する必要があります。

データフレームは次のようになります。 トレインデータ

3 つのオプションはエンコードされた文字列で、答えはオプション A、B、または C に対応する整数です。

以下を使用して、これから tf.dataset を作成しようとします。

features= ['OptionA', 'OptionB', 'OptionC']

training_dataset = (
    tf.data.Dataset.from_tensor_slices(
        (
            tf.cast(train_data[features].values, tf.float32),
            tf.cast(train_data['Answer'].values, tf.int32)
        )
    )
)

ただし、次のエラーが発生するため、これは機能しません。

ValueError: NumPy 配列を Tensor に変換できませんでした (サポートされていないオブジェクト タイプ リスト)。

リストを tf.dtype として使用できないことを読みましたが、ここに「float32」を配置しました。ただし、データフレーム内のリストをフロートに変換することもできません。

誰かが私たちを正しい方向に向けることができれば、とても感謝しています! 前もって感謝します!

4

1 に答える 1