問題タブ [vaex]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Vaex データ型変換
プロジェクトで Python の Vaex ライブラリを利用しています。私はまだVaexに非常に慣れていないので、これが初歩的である場合は申し訳ありません. データ型の変換に問題があります。私の列 'Paid_at' の 1 つに str のデータ型があり、DateTime である必要があります。 df_paid.info
私がこれまでに行ったことは、df から削除され、pandas の to_datetime() を使用して列を変換することでしたが、機能していません。これはpdデータフレームで機能しましたが、次のエラーが表示されるため、何か間違ったことをしています
-------------------------------------------------- ------------------------- ValueError トレースバック (最新の呼び出しが最後) in ----> 1 df_paid['Paid_at'] = pd.to_datetime (df['Paid_at']、errors='強制')
F:\Anaconda3\lib\site-packages\vaex\dataframe.py in setitem (self, name, value) 4431 self.add_column(name, value)
4432 else: -> 4433 self.add_virtual_column(name, value) 4434 else : 4435 raise TypeError(' setitemは、{} ではなく文字列のみを引数として取ります'.format(type(name)))F:\Anaconda3\lib\site-packages\vaex\dataframe.py in add_virtual_column(self, name, expression, unique) 3249
'# すべての既存の式を書き換えます (渡された式引数を含む) 3250 self._rename(name,名前が変更されました) -> 3251 式 = _ensure_string_from_expression(式) 3252 3253 名前 = vaex.utils.find_valid_name(名前, used=[] 一意でない場合は self.get_column_names())F:\Anaconda3\lib\site-packages\vaex\utils.py in _ensure_string_from_expression(expression) 764 return expression.expression 765 else: --> 766 raise ValueError('%r is not of string or Expression type, but %r ' % (式、型(式))) 767 768
ValueError: NaT は文字列型または式型ではありませんが、<class 'pandas._libs.tslibs.nattype.NaTType'> です
Paid_at 列を集計可能な DateTime にする方法について、私は少し迷っています。
python - カスタム関数を使用したpython vaex groupby
vaex DataFrameArray の groupby 関数を使用してカスタム関数をグループに適用する方法はありますか?
できます:
df_vaex.groupby(['col_x1','col_x2','col_x3','col_x4'], agg=vaex.agg.mean(df_vaex['col_y']))
しかし、パンダを行う方法はありますか:
df.groupby(['col_x1','col_x2','col_x3','col_x4']).apply(lambda x: my_own_function(x['col_y']))
python - Python vaexで重複行を削除する
私は python vaex を使用していますが、データフレームに重複した行をドロップする方法がわかりません。たとえば、パンダにはメソッドが存在しますdrop_duplicates()
。vaexに同様の機能はありますか?
python - Vaex 表示データ
10.11 GB の CSV ファイルがあり、dask を使用して hdf5 に変換しました。これは、str、int、および float 値の混合です。vaex で読み取ろうとすると、スクリーンショットに示されている数字が表示されます。誰かが私を助けてくれますか?
スクリーンショット:
python-3.x - Vaexで重複を削除するには?
ユーザーからいくつかのエントリがあり、このユーザーが私のウェブサイトで行ったインタラクションの数...
34 万行と 70 以上の列があり、Vaex を使用したいのですが、重複を削除するなどの単純なことを行うのに問題があります。
誰かがそれを行う方法について私を助けることができますか?
pandas.drop_duplicates(keep="last") 関数と同じ結果が欲しい
Vaex を使用して期待される結果は次のようになります。
python - Vaex でのフィルタリングに名前付き選択を使用する方法
2 つの名前付きセレクションを作成しました
クールです。selection
たとえば、多くの (つまり、統計的な) 関数が提供するパラメーターを使用できます。
しかし、フィルターで名前付き選択を使用する方法もありますか? 何かのようなもの