1

::ヘッダーがなく、フィールド区切り記号があるデータセットを操作しようとしています:

! wget --quiet http://files.grouplens.org/datasets/movielens/ml-1m.zip
! unzip ml-1m.zip
! mv ml-1m/ratings.dat .
! head ratings.dat

出力:

1::1193::5::978300760
1::661::3::978302109
1::914::3::978301968

::ファイルを dsx パイプラインにロードしましたが、区切り記号を使用して dsx でこのファイルを分割する方法がわかりません。

  • どうすればいいですか?

  • dsx ml パイプライン機能を使用して dsx でこのファイルを再形成できない場合、dsx には入力ファイル形式に関する前提条件がありますか?

アップデート:

私が使用しようとしている ml パイプライン機能は、以下のスクリーンショットから確認できます。

ここに画像の説明を入力

データ セットを追加しましたが、dsx にフィールド区切り文字を認識させる方法がわかりません。

ここに画像の説明を入力

4

1 に答える 1