::
ヘッダーがなく、フィールド区切り記号があるデータセットを操作しようとしています:
! wget --quiet http://files.grouplens.org/datasets/movielens/ml-1m.zip
! unzip ml-1m.zip
! mv ml-1m/ratings.dat .
! head ratings.dat
出力:
1::1193::5::978300760
1::661::3::978302109
1::914::3::978301968
::
ファイルを dsx パイプラインにロードしましたが、区切り記号を使用して dsx でこのファイルを分割する方法がわかりません。
どうすればいいですか?
dsx ml パイプライン機能を使用して dsx でこのファイルを再形成できない場合、dsx には入力ファイル形式に関する前提条件がありますか?
アップデート:
私が使用しようとしている ml パイプライン機能は、以下のスクリーンショットから確認できます。
データ セットを追加しましたが、dsx にフィールド区切り文字を認識させる方法がわかりません。