テンソルフローを使用して、事前トレーニング済みの RoBERTa モデルを微調整/トレーニングしようとしています。このために、データフレームから tf.data.Dataset を作成する必要があります。
3 つのオプションはエンコードされた文字列で、答えはオプション A、B、または C に対応する整数です。
以下を使用して、これから tf.dataset を作成しようとします。
features= ['OptionA', 'OptionB', 'OptionC']
training_dataset = (
tf.data.Dataset.from_tensor_slices(
(
tf.cast(train_data[features].values, tf.float32),
tf.cast(train_data['Answer'].values, tf.int32)
)
)
)
ただし、次のエラーが発生するため、これは機能しません。
ValueError: NumPy 配列を Tensor に変換できませんでした (サポートされていないオブジェクト タイプ リスト)。
リストを tf.dtype として使用できないことを読みましたが、ここに「float32」を配置しました。ただし、データフレーム内のリストをフロートに変換することもできません。
誰かが私たちを正しい方向に向けることができれば、とても感謝しています! 前もって感謝します!
