Coursera で機械学習のコースを行っています。コースでは、 Datoの GraphLab を使用することが強調されています。演習の 1 つで、講師は次のように、graphlab.random_split() を使用して SFrame を分割しました。
sales = graphlab.SFrame('home_data.gl/')
train_data, test_data = sales.random_split(.8,seed=0)
最初の 1 週間のコースを終了しました。クイズでは、GraphLab と SFrame を使用して問題を解決する必要があります。GraphLab をインストールしようとしましたが、64 ビット PC が必要で、私の PC は 32 ビットです。インストラクターは、必要に応じて Pandas を使用することを選択したので、私は Pandas を使い始めました。
私の問題はこれです、インストラクターは を使用しsales.random_split(.8,seed=0)
、それは彼に を与えますtrain_data, test_data
。彼はそれらをさらに分析するために使用し、その答えにたどり着きます。
ここで、まったく同じ方法でデータを分割する pandas 関数を使用しないと、私の答えが彼の答えと一致することはなく、このクイズに合格することはできません。私が使用したい pandas 関数は次のとおりです。
train_data, test_data = pandas.DataFrame.sample(frac=0.8, random_state=0)
私の質問はこれです:pandas.DataFrame.sample(frac=0.8, random_state=0)
と同じ出力が生成されsales.random_split(.8,seed=0)
ます。
私はインストラクターに手紙を書いて、彼の返事を待っています。ありがとうございました。