問題タブ [sframe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Sframe で .apply() を使用して各行の複数の列を操作する
Date1 と Date2 の列を持つ SFrame があります。
Date1 と Date2 の間の datediff を検索するために使用しようとして.apply()
いますが、他の引数の使用方法がわかりません。
理想的には次のようなもの
pandas - PandasにGraphLab SFrame.show()に相当するものはありますか?
Graphlabs SFrame.show() は、SFrame の各列の包括的なビューを表示します。Pandas に同等のものがあるかどうか疑問に思っていましたか?
df.describe() は、 sf.show() が提供するレベルの詳細を一目で提供しません。
python - エラー Sframe iPython
Coursera の ML コースに参加していますが、でファイルを開くことができませSFrame
ん。試してみると、次のエラーが表示されます。
カーネル>再起動も実行しようとしました
私はPythonが初めてです。誰か助けてもらえますか?
python - 一意の列を対応する値を持つ SFrame ヘッダーに変換する
タブ区切りのファイルがあります:
目標は、「X1」で構成された 1 つの一意の行があり、列が「X2」の値である別の SFrame を実現することです。つまり、次のようになります。
SFrameなしでやってみました:
しかし、それでも目的の SFrame が得られません。一意の列を対応する値を持つ SFrame ヘッダーに変換するにはどうすればよいですか? つまり、次のことを達成します。
これを行うには、もっと簡単な方法が必要です。ユニークな番号を想像してみてください。列要素の数は最大 1,000,000 になる可能性があり、結果の SFrame のサイズは 1,000,000 X 1,000,000 になる可能性があるため、numpy 配列やリストのネイティブ python リストではなく、SFrame または HDF のようなデータ構造が必要です。
python - GraphLab と SFrame
私はPythonが初めてで、機械学習コースを受講しています。GraphLab と SFrames の経験はほとんどありません。データが SFrame として保存されている場合に、条件付きおよび論理演算を適用する方法を知りたいです。次のコードと出力は、問題を理解するのに役立つ場合があります。
「sqft_living」という名前の整数列があります。この特定の列で 2000 から 4000 平方フィートの間にあるすべての値を見つけたいと考えています。
誰でもそれを実装する方法を提案できますか?
python - 新しい列を追加した後、SFrame 操作が遅くなる
Graphlab と sframes を使用して、ipython ノートブックでリピート注文レポートを作成しています。user_id
、、user_email
を含む約10万行のデータを含むcsvファイルがありますuser_phone
。一意の識別子という新しい列を追加しました。行ごとに、他のすべての行をトラバースして、または現在のレコードと一致するかどうかを確認してuser_id
いuser_email
ますuser_phone
。一意の識別子が空ではなく、一致する場合はuser_id
、現在のレコードから一致する各レコードの unique_identifier スロットに割り当てます。
最後に、一致するすべての注文の最も古い注文をunique_identifier
含む4 つの列を持つ SFrame を取得します。ラムダ関数を使用したメソッドをuser_id
介してこれを行っています。.apply
私のラップトップでは、プロセス全体に数秒かかります。ただし、プロセスが完了すると、SFframe は非常に遅くなり、SFrame.save が永遠にかかるように見えるポイントまで管理できなくなります。
追加のプロセスがunique_identifier
メモリを詰まらせているようです。ただし、問題は sframe サイズとは関係ありません。10 行に制限すると、問題は解決しません。私は何を間違っていますか?
これが私の方法です
dataframe - タイプの SFrame 列: 辞書
私が実行すると:
空白の列が表示されます。これは私が望んでいたものです。
しかし、私が実行すると:
予期しないデータ型を示すエラーが表示されます。
次に示すように、SFrame API はこれに対応していません。
https://turi.com/products/create/docs/generated/graphlab.SFrame.html
この時点での私の理解では、SFrame の列は辞書にすることはできません。
しかし、好奇心から私はこれを試しました:
この結果は、まさに私の以前の理解とは正反対のものでした。
私が欲しいのは辞書列で、各行には独自の辞書があり.count_words
ますimport string
.
これは双方向ですか、それとも.count_words
例外であり、そのようなデータ変換を再現できると期待すべきではありませんか?
お知らせ下さい、
ありがとうございました
アップデート
GitHub に関する関連情報は次のとおりです。
https://github.com/turi-code/how-to/blob/master/sframe_pack.py
このテクニックが私が求めているものを作成できるかどうかはわかりませんが、まだ試しています. 誰かがこれについて考えているかどうか教えてください。